ISSN 2189-1621

 

現在地

DHM 032 【後編】

2011-08-27創刊

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2014-03-27発行 No.032 第32号【後編】 451部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【前編】
◇《巻頭言》「外国語の学習におけるICTアフォーダンス」
 (山崎直樹:関西大学外国語学部)

◇《連載》「Digital Humanities/Digital Historyの動向
      ~2014年2月中旬から3月中旬まで~」
 (菊池信彦:国立国会図書館関西館)

◇特集にあたって:「デジタル学術資料の現況から」

◇《特集》「デジタル学術資料の現況から」第1回
 ペルセウス・デジタル・ライブラリーのご紹介(1)
 (吉川斉:東京大学大学院人文社会系研究科 西洋古典学研究室)

◇人文情報学イベントカレンダー

【後編】
◇イベントレポート(1)
MLA 2014 覚え書き
 (Alex Gil:コロンビア大学)
 (日本語訳:北村紗衣・東京大学及び慶應義塾大学 非常勤講師)

◇イベントレポート(2)
公開シンポジウム+チュートリアル:
翻デジ2014:クラウドソーシングによる近デジ資料のデジタル翻刻
 (後藤真:花園大学文学部文化遺産学科)

◇イベントレポート(3)
第1回「京都デジタル・ヒューマニティーズ勉強会」
 (橋本雄太:京都大学大学院文学研究科 情報・史料学専修D1)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(1)
MLA 2014 覚え書き
http://elotroalex.webfactional.com/mla-2014-notes/
(Alex Gil:コロンビア大学)
(日本語訳:北村紗衣・東京大学及び慶應義塾大学 非常勤講師)

●到着

 極風がアメリカ合衆国まで吹き下ろす中、2014年のMLA(Modern Language
Association)年次大会が開かれた。学生、教員、図書館員、販売分野の関係者が多
数、発表論文と期待を携えて凍てついたシカゴのダウンタウンまでやって来ていた。
学会が始まる前から熱い議論が取り交わされ、大変な盛り上がりを見せていた。ど
うやったらもっともうまく北米における臨時雇用条件の問題やイスラエルの学術機
関ボイコットの問題に取り組めるかということがこうした議論の中の最重要事項だっ
た。デジタル人文学の世界についても論争がなかったというわけではなく、批評理
論の役割やその分野の広がりについての議論も激しく続いていた。

 私は一日遅れで到着した。というのも、ベイルートのCASAR(Center for
American Studies and Research)学会で論文を発表し、ベイルート・アメリカン大
学英文学科の教授であるデイヴィッド・リズリーと、中東でのデジタル人文学の可
能性を育む戦略を発展させるべく協働していたからである。MLAサブカンファレンス
[*1]に出られなかったのは残念だった。これは「自らと仲間たちのため、現状に
替わる職業的、社会的、政治的な将来の可能性の提案に向けて、新しい学会の環境
を作り出すことに関心を抱いている人文学の大学院生による、独立的かつ発展的な
グループ」によって組織される、本プログラム前の研究会である。これには出られ
なかったが、自分の最初のパネルである「新しい読み方:表面的な読みとデジタル
手法」(“New Ways of Reading: Surface Reading and Digital Methods”[*2])
の前夜に到着した。

●1月10日(金):表面的な読み:デジタルの彼方に

 「表面的な読み」(“Surface Reading”)に関するパネルは大変出席者が多かっ
た。学会でも一番大きい部屋だったが、壇上から見ると満員のようだった。理由は
明らかだ。デジタル人文学と表面的な読みをする受け手という問題意識を組み合わ
せたからである[*3]。パネルの目的はこの二つの動きをできるかぎり調和させる
ことであった。手始めとして、シャロン・マーカスとヘザー・ラヴが、デジタル人
文学の方式を秋学期の授業に組み込んだ経験を詳述した。学期中、学生達は「ベニ
ト・セレーノ」(“Benito Cereno”)を含むハーマン・メルヴィルのテキストを解
釈するために幅広くデジタル手法を利用したとのことだ。発表の間、マーカスとラ
ヴはTEIマークアップでテキストをエンコーディングすることによって生みだされる
異化効果を強調した。この発表に続いて、テッド・アンダーウッドがコンピュータ
サイエンスにもその分野特有の表面的な読みと深い読みがあり、後者は確率的潜在
モデルに近いことを指摘した。次が私の番で、ジェローム・マッガンのテキスト性
のトポロジー理論を引き合いに出し、またレーヴェンシュタイン距離によって組織
化される完全な図書館の例を用いて、テキストは「端から端まで表面」であると主
張した。

 質問と応答はとても活気があるもので、壇上からも客席からも幅広い質問が出た。
読みの実践との関連において政治的なものを考察するという問いが浮上してきたが、
これは表面的な読みとデジタル人文学がどちらも学問を非政治化していると批判さ
れていることからすると予想通りのものだった。パネリストは全員、この誤解につ
いて自分なりのやり方で応答し、解釈に使える蓄積を広げ続けることによってのみ、
より堅固な批評活動が導かれるということを明確にした。

 金曜日の午後の早い時間に、もうひとつ、デジタル人文学の重要なパネルが開か
れた。人文学コンピュータ協会(Association for Computers in the Humanities、
略称ACH[*4])が組織したパネル「デジタルを越えて」(“Beyond the Digital”
[*5])は、デジタル手法というよりは研究課題の内容のほうに注目することを目
的としていた。これを実現するため、手法に関する議論についてはイヴェントの前
にオンライン[*6]で回覧されていた。このパネルは、リサーチが副次的な意味し
か持っていないと考えてデジタル人文学を退けている人文学徒に接触しようとACHが
試みたものであった。

 「デジタル人文学の議論においては、時としてデジタル分析の結果は目的ではな
  く、むしろ目的を達成するための手段であるということが忘れられてしまって
  いる。この目的とはテキストの解釈だ」

 ジェフリー・バインダー、ライアン・コーデル、セドリック・メイ、ジェイムズ・
オサリヴァン、リサ・マリー・ローディ、ショーナ・ロスがパネリストであった。
パネルは好評で、議長のブライアン・クロックソールは巧みな司会ぶりで討議の中
心を研究課題の問題からそらさないように保っていた。パネリストたちが、デジタ
ル人文学の文脈においてリサーチを第一に置くとはどういう感じかを尋ねられたこ
とがあったが、ライアン・コーデルは雄弁に応答し研究課題が常に第一にあるのだ
ということに気付かせてくれた。パネルがうまくいったのは、例示されたプロジェ
クトが「パターン認識と解釈」へコンピュータを用いてアプローチすることに焦点
をあてていたからということもある。これはデジタル人文学のジャンルにおける伝
統的人文学研究としておそらく最もわかりやすいものだからだ。

●1月11日(土):DHを評価する

 土曜の13時45分から15時までは出席しなければいけない会合だらけだった。学会
は新情報に追いつくため同僚や協働者と実際に会って話題を交換する機会なので、
MLAとしてはとてもふつうのことだ。午後の早い時間に私は自分の二つめのイヴェン
トである「デジタルの学問を評価する:志して成功した者たちの物語」(
Evaluating Digital Scholarship: Candidate Success Stories[*7])に参加した。
このイヴェントの目的は、現在、学術機関で専門的な良い地位についているデジタ
ル人文学者の一団に、学位論文や、終身在職権獲得・昇進の過程におけるデジタル
人文学分野の業績評価がどういうものなのか話してもらうというものであった。セッ
ション前半では部屋は展示ホールのようにセッティングされ、それぞれのパネリス
トが自身の仕事について個別テーブルで紹介するということをした。私のテーブル
では、スタジオ@バトラー(Studio@Butler[*8])と図書館員発展プロジェクト(
The Developing Librarian Project[*9])の活動を紹介した。

 イヴェント後半では、パネリストが全員、ひとつのテーブルの前に再集結し、企
画者のヴィクトリア・E・サボーの質問に答えた。シェリル・E・ボール、マシュー・
K・ゴールド、アデリーン・コー、カリ・M・クラウスが私と同じテーブルについた。
パネルは図書館員と教員が入り交じったもので、英語圏におけるデジタル人文学を
いくぶんかは典型化できるような話ができた。この分野で活動する者は図書館と学
部のどちらかか、あるいは両方で職を得る可能性があるからだ。質問は、登壇者た
ちの研究実践の中ではどういうものが一番良い紹介例としてあげられるか、また今
までどういう体験をしたのかについてのものが主だった[*10]。どうやって今いる
ところまでたどりついたのか?という質問には、人文学とデジタル二つの仕事をこ
なすことだと答えた人が多かった。どうやって発展させようか?という質問には、
学位論文や終身在職権、昇進のガイドラインを改正する必要があると答えた人が多
かった。サボーからの質問セッションの終わりに、回答者のキャサリン・ヘイルズ
が、デジタル手法への理解の欠如を克服するためどの程度のことをせねばならない
のかについて簡単なコメントをした。全体として討議は含蓄に富んだものだったの
で、要約するのは難しい。パネル自体が、MLAデジタル業績評価ガイドライン(MLA
Guidelines for Evaluating Digital Work[*11])を周知するためのMLAの努力に
結びつけられている。

 自分のパネルに続き、機会をとらえて「プラクシス・ネットワーク:公の場でと
もに人文学教育を再考する」(The Praxis Network: Rethinking Humanities
Education, Together and in Public[*12])に寄った。これはカティーナ・ロジ
ャーズが組織したパネルである。私にとってはプラクシス・プログラム(Praxis
Program[*13])との再開の機会のようなもので、このプログラムのおかげで私は
人文学のためのソフトウェア開発を始められたのだ。もともとのプログラムはヴァー
ジニア大学の人文学及び社会科学の違う領域から6人の大学院生を集め、スカラーズ・
ラブ・チーム(Scholars' Lab team)からソフトウェア開発を学ぶというものだっ
た。プログラムは一年続き、一種類の共通プロジェクトを中心にしていた。この場
合は「クラウドソース解釈」のツールである「プリズム」(Prism[*14])だった。

 今ではプラクシス・ネットワーク(Praxis Network[*15])はたくさんのいろい
ろな大学からなる集団を代表しており、ほとんどの大学がパネリストを出してきて
いた。デューク大学がデイヴィッド・F・ベル、ニューヨーク市立大学工科カレッジ
がマシュー・K・ゴールド、ブロック大学がケヴィン・キー、ユニヴァーシティ・カ
レッジ・ロンドンがケリ・マッサ、ヴァージニア大学がセシリア・マルケス、ホー
プ・カレッジがウィリアム・アルバート・パナパッカー、ウェイン州立大学がドニ
ー・サッキー、という具合であった。討議はこうしたいろいろなチームが、大学院
生を訓練するモデルをどういった様々な方法でそれぞれの独自の環境の必要性や特
徴にあわせたのか、に集中していた。

●1月12日(日):DHポストコロニアリズム;批判的モノ作り

 私の最後のパネルは「DHを脱植民地化する:ポストコロニアルなデジタル人文学
の理論と実践」(Decolonizing DH: Theories and Practices of Postcolonial
Digital Humanities[*16])というパネルだった。非常に期待されているパネルで、
#dhpocoと呼ばれていた。パネルは日曜の午前8時30分という「死界」に割り振られ
ていたが、それでもかなりの人を集めることができた。アデリーン・コー、ポータ
ー・オルセン、アミット・レイ、ルピカ・リサムと一緒にパネルを実施し、アンナ・
エヴェレットの司会者ぶりもすばらしかった。アマーディープ・シンがブログに簡
潔だが良い議事要約[*17]をあげてくれているので、そこから引用する[*18]。

  アデリーン・コーが、一般的にポストコロニアルなデジタル人文学はどんなも
 のになるのか概略を述べた。コーとルピカ・リサムはこれについてウェブサイト
 [*19]を作っており、この主題に関する著作のプロジェクトも立ち上げて活動し
 ている。ポーター・オルセンも『シヴィライゼーション』、『エイジ・オブ・エ
 ンパイア』、『エンパイア』などの「文明系」ゲームにおける帝国主義言説につ
 いて大変興味深い発表をした。オルセンはこういったゲームをハックしたり改変
 したりした挑発的ヴァージョンも数例出してきていた。ゲームの通常設定よりも
 もっとたくさん奴隷に反乱の力を与えてみたらどうなるだろう?

  アレグザンダー・ギルは合衆国やヨーロッパの外からデジタル人文学のプロジェ
 クトを見て自分の仕事を描写し、「80日間DH一周」(Around DH in 80 Days(*20
 ))という興味深いプロジェクトに言及した。アミット・レイはしばしば現代の
 コンピューティングを支えている経済や企業に関わる基盤について論じ、主流の
 デジタル人文学(とくに新しく台頭してきた「モノ作り」文化)が国境を越えた
 資本主義と共謀していることをそれほどしっかり認識していないと主張した。

 発表の後に聴衆からの質問があったが、たいていは褒め言葉だった。マーサ・ネ
ル・スミスが出席していたのは注目すべきことで、パネルに出た学者たちや#dhpoco
の関係者を褒めてくれた。スミスは少なくとも20年の間、周縁性と支配についての
問いかけを唱道しており、こうした人々はそれに関心を高める役割を果たしたから
だ。最後に言うべきなのは、パネルはアデリーン・コーとルピカ・リサムの勤勉な
大業を立証するものだったということだ。二人は#dhpocoを盛り上げるためソーシャ
ルメディアに多大なエネルギーを注いでくれたし、二人がうまく活動してくれたお
かげで、こうした問いに取り組んでいる多数の若き学者やアクティヴィスト達が発
奮してデジタル人文学に関わるようになってくれた。同時に聴衆は、古参のデジタ
ル人文学者が自らの分野に多様性と平等を持ち込もうと努力しており、自分たちの
声はそれを手助けする役割を果たしているのだと認識することもできた。

 #dhpocoパネルの直後に、「デジタル人文学の批判的モノ作り」(Critical
Making in the Digital Humanities[*21])のパネルがあり、デジタル人文学のモ
ノ作り文化により、強力な形で批判的探求を行えるようになるということが明確に
示された。ロジャー・ホイットソンが組織したこのパネルには二つの協働プロジェ
クトをあわせたものだ。アマランス・ボースクとディーニー・グリガーの「協働の
モノ作りを理論化する:書くこと、プログラミング、開発の間で」(“Theorizing
Collaborative Making: Between Writing, Programming, and Development”)と、
カリ・M・クラウスとジェントリ・セイヤーズの「人文学における批判的モノ作りの
歴史に向けて」(“Toward a History of Critical Making in the Humanities”)
である。パネル中にボースクは「ページとスクリーンの間で」(“Between Page
and Screen”[*22])という発表をしたが、これは本と読者の間にヴァーチャルス
ペースを作るというものだ。まだやってみていない方には挑戦するのをおすすめす
る。カリ・クラウスは人文学における批判的モノ作りを少なくとも三つの伝統に位
置づけることで発表を始めた。この伝統とは実験考古学、形態書誌学、それとGLAM
(美術館、図書館、文書館、博物館)分野の専門職である。こうすることで、クラ
ウスはアミット・レイとはまた違った人文学におけるモノ作り文化の系譜を示して
くれた。セイヤーズがヴィクトリア大学のモノ作りラボ(Maker Lab[*23])にお
ける素晴らしいプロジェクトの成果を強調し、その全部を批判的実践に結びつけて
議事は終了した。空港に急がねばならず、質疑応答セッションまで残る時間がなかっ
たのは残念だ。

●遠くからの考察

 この覚え書きはMLAが終わった一ヶ月後に書いている。重要なことで書けなかった
ことがあるのは残念だ。読んでいる人にはこのメモにないたくさんの空隙をさらに
探求してほしい。マーク・サンプルが作った、今や公認と言っていいMLAデジタルパ
ネルリスト[*24]をオンラインでなぞって追うのは良い出発点になる。また、エル
ネスト・プリエゴによる、議事日程の「遠くからの読み[*25]」も学会内容をさら
に探求するには良いところだ。

 全体として、学会は仕事の緊張や問題に充ち満ちた年に来てよかったと思える強
烈な経験だった。アマンダ・フレンチが自分のMLA体験[*26]の後で言ったように、
今年は「デジタル人文学がもう次の新しい目玉ではなく、普通のものになり始めて
いる」年でもあるのだ。

[*1] http://mlasubconference.org/who-we-are/
[*2] http://www.mla.org/conv_listings_detail?prog_id=339&year=2014
[*3]「表面的な読み」(surface reading)への導入としては、Stephen Best and
  Sharon Marcus, "Surface Reading: An Introduction[*3-1]",
  Representations. Vol. 108, No. 1 (Fall 2009)(pp. 1-21)を参照。
[*3-1] http://www.jstor.org/stable/10.1525/rep.2009.108.1.1
[*4] http://ach.org/
[*5] http://www.mla.org/conv_listings_detail?prog_id=402&year=2014
[*6] http://ach.org/2013/12/30/methods-and-more-for-beyond-the-digital-at-mla...
[*7] http://www.mla.org/conv_listings_detail?prog_id=577&year=2014
[*8] https://studio.cul.columbia.edu/
[*9] http://www.developinglibrarian.org/
[*10]この質疑応答セッションについては、ミシェル・カッソーラが編んだ
  Storify[*10-1]でかなりのことがよくわかるだろう。
[*10-1] http://storify.com/drkassorla/mla14-dh-session-on-evaluating-digital-sch...
[*11] http://evaluatingdigitalscholarship.commons.mla.org/
[*12] http://www.mla.org/conv_listings_detail?prog_id=599&year=2014
[*13] http://praxis.scholarslab.org/
[*14] http://prism.scholarslab.org/
[*15] http://praxis-network.org/
[*16] http://www.mla.org/conv_listings_detail?prog_id=679&year=2014
[*17] http://www.electrostani.com/2014/01/mla-2014-notes-and-comments.html
[*18]ルピカ・リサムが#dhpocoの過去から現在までを追ったスライドもここ
  [*18-1]で見ることができるし、アデリーン・コーの論文「印刷からデジタル
  へ:ポストコロニアルな知識を再構成する」(“From Print to Digital:
  Reconfiguring Postcolonial Knowledge”[*18-2])もオンラインで読める
[*18-1] http://fr.slideshare.net/roopsi1/theories-and-practices-of-postcolonial-...
[*18-2] http://www.adelinekoh.org/blog/2013/12/05/from-print-to-digital-reconfig...
[*19] http://dhpoco.org/
[*20] http://www.globaloutlookdh.org/around-dh-in-80-days/
[*21] http://www.mla.org/conv_listings_detail?prog_id=708&year=2014
[*22] http://screen.com/epistles
[*23] http://maker.uvic.ca/
[*24] http://www.samplereality.com/2013/09/19/digital-humanities-at-mla-2014/
[*25] http://remoteparticipation.commons.mla.org/2014/01/22/mla-14-a-first-loo...
[*26] http://amandafrench.net/2014/01/14/the-7-best-links-to-digital-poetry-pr...

Copyright(C)Alex Gil 2014- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(2)
公開シンポジウム+チュートリアル:
翻デジ2014:クラウドソーシングによる近デジ資料のデジタル翻刻
http://www.dhii.jp/dh/zinbun/hondigi2014.html
 (後藤真:花園大学文学部文化遺産学科)

 2014年2月19日に、近代デジタルライブラリーの画像データを人間が翻刻するため
のしくみ通称「翻デジ」のワークショップが、京都大学人文科学研究所本館にて開
催された。

 「翻デジ」は、近代デジタルライブラリーの画像データを取り込んで、横にテキ
ストデータを入れ、そのテキストデータをMediaWikiに格納するというシステムであ
る。

 このワークショップは、京都大学人文科学研究所の共同研究班「人文学研究資料
にとってのWebの可能性を再探する」の研究会の一つとして位置づけられた中で行わ
れた[*1]。

 このワークショップに先立ち、人文情報学研究所の永崎氏から、「翻デジ」作成
の契機と目的について説明があった。

 永崎氏の報告は以下の通りである。

  現時点では、日本におけるデジタルデータの蓄積は多くなされてはいるものの、
 ほとんどのデータが、画像データ依存になってしまっている。画像データは、そ
 の再現性や情報閲覧のための仕組みとしては優秀であるものの、検索や解析には
 ほとんど使えないという問題点を抱えている。

  特に日本におけるテキストデータの不足は深刻である。たとえば欧米ではNARA
 (The U.S. Natinal Archives and Records Administration)[*2]や、UCL
 (University College London)によるTranscribe Bentham[*3]などの巨大プロ
 ジェクトによって、テキストデータが大量に蓄積されているが、日本ではそのよ
 うな事例がほとんどない。特に検索可能な場所にテキストデータが存在している
 例がきわめて少ない。Google Booksなどでも検索でヒットする日本の文献もごく
 わずかでしかないような状況になっている。そのため、日本にはテキストデータ
 になりうるような資料が「ないもの」として扱われるような現状がある。

  一方で、テキストデータを入力するような巨大プロジェクトは、青空文庫を除
 き、ほかにはあまり動いていない。また、テキストデータを入力するためには、
 一定の訓練も必要であり、そのコストをどこかが一方的に負担することは困難で
 ある。

  そのため、クラウドによるデータ入力モデルを考え、多くの人が時間のあると
 きにデータを入力するモデルが有益なのではないかと考えた。そこで作り出した
 のが「翻デジ」である。

  「翻デジ」では、まずは国立国会図書館の近代デジタルライブラリーの画像を
 元データとすることとした。権利関係での問題が少なく、かつ活字本であるとい
 うことも、重要な要因であった。

  この「翻デジ」が目指すことは、とにかく多くの人にデータを多く入力しても
 らい、Google、Bing、Baidu等の全文検索にヒットする日本語資料を増やすこと、
 そしてそのヒットしたページから近デジの画像にジャンプして、実際の画像を閲
 覧できるようにすることである。その目的を達成するために以下のような仕組み
 としている。

 1.新字・旧字等の用字や仮名遣いに関しては、特に縛りをもうけないことを基本
  としている。これらの用字については、原則としてタグを付すことで区別をつ
  け、処理を行う。
 2.詳細に構造化をしたい人については、TEI P5に準拠するか、もしくはそれ以外
  のルール(青空文庫形式など)である場合には根拠を示しておくものとする。
 3.誰もが認めるテキストの翻刻という発想での入力は行わない。
 4.正確なデジタル翻刻とは何かといった議論も、少なくともこの翻デジの場では
  行わない。また、統一的なフォーマットについても求めるものではない。

  上記の特徴からも、あくまでも情報検索・発見のためのデータ入力が目的であ
 ることが強調されている。

  また、元の書籍の著作権が切れているものを原則としていることもあり、入力
 者の著作権については原則として問わないものとなる。

  上記のような発想の元で作成されており、それをMediaWikiおよびOmeka、
 ScriptoベースとOCR+Crowd4U[*4]で作成している。

 以上が永崎氏の報告概要である。なお詳細なシステム等については紙幅の関係で
割愛する。

 永崎氏の主たる問題意識は日本に数多くある、テキストの文化資源がほとんど画
像データとしてデジタル化されてしまっており、その結果、検索が効果的に行われ
ず、Webの世界では「存在しないもの」として扱われてしまっているのではないか、
というところにある。

 人文系テキストの文化資源に関するデータに限ってみても、国文学研究資料館や
東京大学史料編纂所をはじめとして、多くの資料所蔵機関がデータを蓄積している
のはたしかである。上記の2館はむしろ古い時期から、テキストデータの蓄積を進め
ており、数としてはきわめて膨大なものである。しかし、これらのデータベースは、
外部の検索サービスから個別のコンテンツを見られるようには作られておらず、そ
れが、結果的に外部からの検索性を低下させてしまっているという現状があるのは
たしかである。

 永崎氏の報告ののち、参加者のコンピュータを用いてワークショップが行われた。
ユーザ登録を行うだけで、あとは特段の複雑な操作を必要とせず、参加者はおおむ
ね問題なく作業に取りかかることができた。作業に容易に取りかかることができる
というのは、入力の心理的な障壁を取り除くという点でも重要であると思われる。

 また、一部に画像が表示されないなどのバグが確認できたが、これらは今後の作
業において解決がなされるものであると理解している。

 ワークショップを挟んで休憩の後に国立情報学研究所の大向一輝氏からCiNiiにお
けるOCRによるテキストデータ蓄積と、著者同定のためのクラウドソーシングの手法
について報告が行われた。CiNiiは400万件の論文データの処理を行っているという
ことだが、このOCRによるデータ作成の諸課題が語られると同時に、広義のユーザイ
ンタフェースについての議論が中心に展開された。CiNiiは論文データベースではあ
るが、不特定多数の人が利用するということが想定されたデータベースであり、可
能な限り専門特化したインターフェースを排除したシンプルな設計になっている。
しかし、同時に著者同定などのクラウドソーシングの部分でそのシンプルさが、作
業の障壁を下げておりそれによって、同定が少しずつ進んでいくというメリットに
ついて提示された。シンプルで効果的に取捨選択されたインターフェースが多数の
利用と編集を可能にする枠組みを作っている。

 翻デジについても、そのような障壁を除くと同時に、インセンティブをどのよう
に構築するかといった点がポイントになるであろうという指摘が行われた。

 その後引き続いて青空文庫ボランティアの大久保友博氏より青空文庫の状況につ
いて報告が行われた。青空文庫では、7割が新字・新仮名遣いの作品であり、旧仮名
のような書籍については、翻刻が集まりにくいとのことであった。また、ルビ・形
式の整え方などの作業についても、心理的障壁が高く進みにくい。青空文庫で進み
にくい点などをこの翻デジによって解決できるとより望ましいとの期待が示された。

 続いては京都府立総合資料館の福島幸宏氏から報告がなされた。福島氏からは京
都府立総合資料館で公開された(シンポ当日では公開予定であった)東寺百合文書
のデータベース[*5]についての紹介がなされた。東寺百合文書の画像情報につい
ては、すべてCC BYで提供するので自由に使っていただきたいとの話であった。また
東寺百合の翻刻は東京大学史料編纂所と、京都府立総合資料館で行っているが、点
数が非常に多いということもあり(8万点といわれている)、また中世文書で読むこ
と自体に訓練が必要なものであるので、なかなか進んでいない。この翻デジのよう
な仕組みを応用して、中世史に関係する人々にクラウドソーシング的に翻刻を行っ
てもらえればという、応用可能性について、指摘がなされた。

 その後、総合討論に移り、近デジの閲覧アプリ(近デジブラウザ)などについて
の紹介が行われた後、クラウドソーシングにおけるインセンティブの作り方につい
て討論が行われ、会は終了した。

 次に、簡単にこのワークショップに参加した感想を述べておきたい。

 日本における「見つかりやすい」文化資源のテキストデータが少ないという永崎
氏の指摘は重要である。画像データはテキストデータに比べ、デジタル化の際に「
真正性」を問う場面が相対的に少なくなり、かつデータの作成が容易である点にメ
リットがある。以前であれば、精密な画像データはデータ容量の関係からもデータ
の処理速度や転送速度の問題からも使いよいデータではなかった。しかし、ストレ
ージの飛躍的な増大がデータ容量の問題を、コンピュータの性能が処理速度の問題
を、そしてインターネット回線の増強が転送速度の問題を解決した昨今、画像デー
タを避ける理由は失われつつある。そのこともあって、画像によるコンテンツの量
がテキストデータのそれを上回る勢いで作成されつつあるのは事実である。国立公
文書館のデジタルアーカイブズも画像データで作成されている。また、画像でのデ
ジタル化が、大規模な文化資源のデジタル化を推進する力になってきたことも忘れ
てはならない。困難な翻刻を行わなくてよいという事実は、大規模なデジタル化を
確実に進展させた。

 しかし、画像データは資料の解析や検索という点において、決定的に劣るのも事
実である。検索や情報発見がなされないデータは,マイグレーションの際にも不利
になる。また画像データは、コンピュータ側の画面の描画技術の進展とともに、相
対的なデータの劣化[*6]が起こる可能性も高く、結果的にはデータが長期間にわ
たって継承されないのではないかという懸念もないわけではない。

 そのように考えた場合に、画像データでのデジタル化がより容易に進むようにな
り、Linked Dataなどの手法や思考が浸透しつつある現在では、巨大なデジタル化プ
ロジェクトであれば、可能な限り画像とともにテキストの翻刻も行うべきであるこ
とがわかる。テキストの翻刻は、日本における文化資源の発見を助け、結果的に資
料の長期的なアーカイブへとつながる可能性もあるのである。また、昨今いわれて
いるような、国際的な文化情報の発信という意味でも、まずは「発見されるテキス
ト」を増大させる必要があることがわかる。

 しかし、現状としては、必ずしもテキストデータをとりまく状況は良好ではある
とはいえない。一部の新規に行われている巨大プロジェクトですら、画像データの
み(それもきわめて劣悪な画像と条件で)を入れればよしという動きも見られ、巨
大な予算に見合わずかえって文化資源全体のプレゼンスを下げているのではないか
というものすら見られる。この現状を打破するために、クラウドソーシングを応用
するという、「翻デジ」の発想は有益ではないかと考える。

 ただし、クラウドソーシングは、原動力となるものをどこに求めるか、が常に求
められるものでもある。大向氏によって報告されたCiNiiの例は、そのバランスが絶
妙であり、学ぶべき事例であることはいうまでもない。ただし、それが長期的な手
作業をともなう文字の翻刻でどのように応用可能かは、検討の必要があるであろう。
その点では、調査と入力をともないながらも巨大なテキストデータ(とあえていう
が)に発展した、Wikipediaが、どのようにインセンティブを作ってきて、この「翻
デジ」にはどのように応用可能なのかも、今後は検討をする必要があるのではない
だろうか。また、学術文献として見た場合には研究者がある程度集まる余地や「空
気」をどのように醸成するかも検討する必要があるであろう。

 そのためには、ユーザインタフェースをどのように作るかも欠かせない論点とな
るであろう。筆者も、ワークショップの中で実際に使ってみたが、まずは「入力で
きる喜び」が勝っていたため、それほど気になる場面は多くなかった。しかし、こ
の入力可能な状況が「当たり前」となってきた段階ではつらいかもしれないと思わ
れる部分がいくつかある。入力フィールドの位置や大きさなどは、今後ユーザのフィ
ードバックを受けていく部分であるように思われる。

 テキストデータから画像データに文化資源へのデジタル化の主流は移っていたが、
また改めてテキストデータの重要性が指摘される段階へと入りつつある。今後、こ
の「翻デジ」の仕組みがよりブラッシュアップされ、多くの人に使われ、そして文
化資源が発見・活用されるようになることを望むものである。

[*1]なお、この翻デジの会の様子のTwitterでのつぶやきはTogetterでもまとめら
 れているので、そちらもあわせて参考にしていただきたい(
  http://togetter.com/li/632127
[*2]The U.S. National Archives and Records Administrationのクラウドソーシ
 ング翻刻プロジェクトのページ( http://transcribe.archives.gov/
[*3]UCL Transcribe Bentham( http://blogs.ucl.ac.uk/transcribe-bentham/
[*4]マイクロボランティアプラットフォーム Crowd4u( https://crowd4u.org
[*5]東寺百合文書Web( http://hyakugo.kyoto.jp/
[*6]後藤真「永続性のある歴史資料デジタル・アーカイブへの試論 「アーカイブ
 ズ」への接近とデジタル応用の可能性」(『漢字文献情報処理研究』11号、2010
 年)で、技術の進展によって、過去のデータが「質の悪い」ものになってしまい、
 結果的に用いられなくなる状況について述べ、これを「データの相対的劣化」と
 呼んだ。

Copyright(C)GOTO, Makoto 2014- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(3)
第1回「京都デジタル・ヒューマニティーズ勉強会」
 (橋本雄太:京都大学大学院文学研究科 情報・史料学専修D1)

 2014年2月27日(木)、今回が第1回となる京都デジタル・ヒューマニティーズ勉
強会が同志社大学京田辺キャンパスにておこなわれた。本勉強会は、デジタル・ヒュ
ーマニティーズ研究の最新動向を追うため、この分野に関心のある京都周辺の学生
によって企画されたもの。

 今回は、Journal of Digital Humanities Vol.1, No.1[*1]の掲載記事を参加者
が分担して報告する形でおこなわれた。参加者とその担当記事は下記のとおり。

●上坂彩香(同志社大学文化情報学研究科 文化計量研究室D1)
 Trevor Owens, “Defining Data for Humanists: Text, Artifact, Information
 or Evidence?”
●Kyle Alexandar Thompson(京都大学大学院文学研究科 情報・史料学専修D1)
 Tim Hitchcock, “Academic History Writing and its Disconnects”
●橋本雄太(京都大学大学院文学研究科 情報・史料学専修D1)
 Chad Black, “Clustering with Compression for the Historian”

 上坂の担当したOwensのエッセイは、ビッグデータを活用した研究が一般化した現
在、人文学にとって「データ」がいかなる意味を持ち得るかを検討したものである。
Owensはこの問題を、データという概念の(1)人工物としての側面、(2)解釈可能
なテキストとしての側面、(3)機械処理可能な情報としての側面、また(4)主張
や議論を支持する「証拠」としての側面に焦点を当てて論じている。

 Thompsonの担当したHitchcockの投稿記事では、デジタル時代の歴史学における、
書籍の役割の変化が論じられている。歴史学を含む人文学一般において、印刷され
た書籍は研究資源としての絶対的な地位を享受してきた。しかし、デジタルメディ
アの普及により書籍の地位は次第に相対化され、歴史学者が扱う様々な資料形態の
ひとつになるだろうとHitchcockは予測する。

 Blackによる記事では、正規圧縮距離(NCD)を用いて歴史文書をクラスタリング
する手法が紹介されている。NCDは、2つのデータ間の類似度をデータの圧縮率にも
とづいて算出する方法である。Blackはbzip2やgzipといったデータ圧縮プログラム
を利用してNCDを計算し、17~19世紀の犯罪事例報告文をクラスタリングする試みを
おこなっている。

 初回開催ということもあり、今回は参加者の数が少なかったが、それぞれ専門を
異にする参加者のあいだで有益な情報・意見交換をおこなうことができた。今後と
も定期的に勉強会を開催し、デジタル・ヒューマニティーズに関わる研究者・学生
の交流の場にしていきたい。

 第2回の勉強会は、4月13日(日)に同志社大学京田辺キャンパスにて開催される
予定である。
(参加希望の方は、橋本 yhashimoto1984[&]gmail.com までご連絡ください)
(注)[&]を@に置き換えてください。

[*1] http://journalofdigitalhumanities.org/1-1/

Copyright(C)HASHIMOTO, Yuta 2014- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆編集後記(編集室:ふじたまさえ)
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 今号はいかがでしたか?新しく始まった特集はもちろんのこと、今号も充実した
ご寄稿をたくさんいただくことができました。ありがとうございました。

 巻頭言では、「アフォーダンス」という言葉を皮切りに、外国語の学習における
ICTについてさまざまな角度から論じていただきました。「アフォーダンス」という
言葉の意味を改めて学ぶとともに、身の回りにあるICTが「そろばん」のように使い
こなせるかは、ツールだけの問題ではなく、使う側の問題でもあるなと感じました。

 また、後編のイベントレポートに掲載した「京都デジタル・ヒューマニティーズ
勉強会」の今後がとても気になります。

 この他にも興味深い点がたくさんありましたが、全部は紹介しきれませんので、
この辺りで今月号を締めくくります。次号もお楽しみに。

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM032]【後編】 2014年03月27日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: