ISSN 2189-1621 / 2011年8月27日創刊
2018年9月9日から13日にかけて、東京の一橋講堂で2つの国際学会が開催された。JADH2018 と TEI2018 である。本メルマガの読者のなかにも参加された方が多かったと思う。今回は特に TEI2018 が東アジアで初めて開催されたとあって、会場は例年以上に大いに盛り上がったという。筆者も JADH2018 で KU-ORCAS のプロジェクトに関するポスター報告を行ったが、本号では筆者の参加したセッションやワークショップのうち、東アジアに関わるものをいくつかピックアップして紹介したい。なお、ここでいう「東アジア」には日本を含めず、専ら中国・台湾の話題になることをあらかじめお断りしておく。
Web 会議システムを利用していたことにまず驚いたこの報告は、カリフォルニア大学アーヴァイン校図書館が中心となって行われた、明代の官職をクラウドソーシングで中英翻訳するというプロジェクト “Ming Government Official Titles: A Crowd-Translation Project 明代職官中英辭典共譯共享” に関するものだった。開始からわずか1年程度で翻訳が完成したとのことで、この成果はカリフォルニア大学の eScholarship のサイトで提供されている[1]。
内容の紹介に入る前に、2つの素朴な感想を抱いたことを述べておきたい。一つは、全文の翻訳は難しいものであったとしても、重要語句だけを翻訳するという選択肢もあるということ。もう一つが、重要語句を翻訳したその成果はどういう形で「役に立つ」のだろうかということであった。
報告では、このプロジェクトのオープンアクセスでの成果を2点挙げている。一つが、クラウドソーシングの翻訳システムであり、それは GitHub でそのソースコードが提供されている。 他のクラウドソーシングシステムと異なり、資格認証や匿名でのピアレビューに加え、専門研究者が最終的に判断を下すことができるといった厳格なクオリティコントロールを可能とする点が特徴として挙げられている。もうひとつの成果が、もちろん翻訳成果物それ自体である。 報告によると、この成果は明代の研究者に対する研究支援になったのはもちろんのこと、2018年9月現在で42万件以上の中国歴代の人物情報を収録するハーバード大学のプロジェクト “China Biographical Database Project”(CBDB)[2]への貢献も著しいものがあったという。 それによると、官職名とその職階の情報が CBDB のメタデータインフラへ活用されているとのことである。また、中国研究の専門ではない欧米を対象にした研究者にとっても、東西での統治体制の比較研究に役立てられているという。
ドイツ、ハイデルベルク大学による “Early Chinese Periodicals Online”(ECPO)[3] は、清代末期から中華民国期に刊行された、特に女性雑誌や娯楽出版物を収録したデジタルアーカイブである。 これまで、ECPO に含まれている “WoMag”[4]や “Xiaobao”[5]といった個別のデジタルアーカイブを作成したり、台湾の Academia Sinica 等との協力関係のもとにデジタル化を行ったりするなどを、ドイツにおける中国資料のデジタルアーカイブの構築に努めてきた。 ここ最近は、そのデジタル化から歩を進めて、既存のデジタルアーカイブのオープンデータ化に取り組んでいるという。報告は、そのオープンデータ化の一環として行われている、デジタル化資料内の著者名やエージェント名のリスト化と、TEI によるエンコーディングが中心であった。なお、同デジタルアーカイブは IIIF にも対応しているとのことである。
最後が、台湾の DH 研究者らによるパネル報告である。途中参加であったため、パネルのすべての報告を聞けてはいないのだが、内容は DH のための研究環境を提供するプラットフォーム “DocuSky”[6]や中国仏典の研究用プラットフォーム “CBETA”[7]の各プロジェクトと、テキストデータの分析が主であったと記憶している。このうち DocuSky では、スタンフォード大の開発したビジュアライゼーションツール “Palladio” と連携している点が興味深い。
ところで、2018年6月に京都大学人文科学研究所附属東アジア人文情報学研究センターで開催された「台湾漢学講座」で、祝平次氏による “The Digital Humanities in Taiwan: Past, Present and Future” と題した講演会を聞く機会に恵まれた。その際、台湾では1970年代から「漢籍全文資料庫計畫」で、テキストデータの作成が大規模に進められてきたことを知った。このパネルでのテキストデータの分析や特に DocuSky でのデータ分析環境の整備も、台湾で続けられてきた上記のような地道なテキスト化の成果の上にあるのだろうと思う。とはいえ、KU-ORCAS にはいまだテキスト化されていない中国関係の資料が多いことから、画像データを使って翻刻をするような環境はないのかと筆者が質問したところ、DocuSky でそのような環境開発を進めているとの回答があったことも併せて紹介したい。
以上、JADH2018 での東アジア関係のセッションや報告の紹介を行った。最後に筆者の感想を述べておきたい。
本メルマガの2018年4月号(第81号)[8]でも述べたことだが、KU-ORCAS では「研究ノウハウのオープン化」もプロジェクトの射程に入っている。これは、端的に言えば、デジタルアーカイブでオープン化されたメタデータやコンテンツデータを利用した DH 研究のノウハウを共有しようというものである。 今回 JADH2018 へ参加して、既存の DH プロジェクトや研究機関の生み出したデータやツール、そして研究環境が様々な研究で利活用されていることがよく分かったが、「研究ノウハウのオープン化」では、それらの研究の研究手法だけでなく、研究成果にまとめられる前段階の Tips のような研究ノウハウも含めて、情報の集約と提供が必要となるだろう。 そのためにも、さしあたり、KU-ORCAS の提供するデジタルコンテンツに関わる IIIF 対応デジタルアーカイブの情報と、KU-ORCAS の研究テーマに関連するような他機関での DH プロジェクトや研究ツール等の情報をリストアップしていくことが、KU-ORCAS 内部の研究者だけでなく、KU-ORCAS のデジタルアーカイブのデータを利用する外部の研究者にとっても必要なことが予想できる。筆者としては、まずはこのあたりから準備を始めておきたいと思う。
なお、次回 JADH2019 は関西大学で開催されることが決定している。来年、多数の方々にご参加いただくこととともに、願わくば、KU-ORCAS が公開するデータを活用した研究成果が寄せられることを期待したい。
本誌では2018年5月よりTokyo Digital History(ToDH)メンバーによる自身のプロジェクト紹介が続いているが、本稿では少し趣向を変えて、この9月で結成1年を迎える ToDH のこれまでの歩みを簡単に振り返りたい。その上で、同月中旬に行われた JADH・TEI 2018 において ToDH が行った2つのパネル発表について報告し、今後の活動を展望したい。
改めて ToDH 結成の目的を振り返っておこう。ToDH は、歴史学系の大学院生を運営の中心に据え、歴史研究者・アーキビスト・エンジニアの協働に基づいて、デジタル歴史学の研究・教育の方法論を構築するために作られたコミュニティである。
このうち研究面に関して言えば、各地で提供されるさまざまなデータベースや、欧米でとくに盛んなデジタル研究環境構築の動きである Digital Humanities(DH)への対応が、歴史研究者として求められているという背景がある。ToDH メンバーは、日々生み出される学術資源としてのデータをどのように研究に活用し、次々に公開されていく DH 関連のツールや国際規格にどのように対応すべきか、という問題意識を共有している。
また、教育面に関して言えば、メンバーのほとんどが研究職を志しており、将来、ウェブ上の資源の利用やプログラミングに、より身近になっていく世代を指導する立場に置かれることが予想される。しかし現在、日本の大学でデジタル歴史学の教育を行うにあたって、教育方法のモデルが十分でないという問題点がある。そこで、デジタル歴史学を実践する ToDH の経験が、今後のデジタル歴史学教育の方法論を構築することに貢献できればと考えている。
これらの目的を達成するために行っている ToDH の活動内容を一文でまとめるならば、「オンライン史資料を活用する際の留意点を歴史研究に携わる者の間で議論し、共有する」ということである。 具体的には、メンバーひとりひとりが自身のプロジェクトを設定し、関連する知識や技術を、ほかの歴史研究者・アーキビスト・エンジニアと共有しながら、多分野的な活動を展開している。技術面では、人工知能やテクスト解析の分野を中心に最近注目されているプログラミング言語 Python と、人文学史資料のテクストを機械可読形式で構造化・共有するための国際的な枠組み TEI(Text Encoding Initiative)をメンバー全員が習得することを目指している。 ToDH の個人プロジェクトの進め方の最大の特徴は、個々が歴史研究者としての史料解釈能力や研究の着想に責任を持つ一方で、プログラミングをはじめとする技術の習熟度が低い場合は他のメンバーが一時的にカバーし、追って技術の習熟をサポートするという点にある。ToDH は、研究対象とする時代も地域も異なる歴史研究者が集まる場として、個々の技術力を掛け合わせ、グループで成果を生み出すことを目指している。
昨今、若手研究者問題との関連で指摘されるように、ひとりで黙々と研究に打ち込む大学院生も多いと思われるが、あえてグループ活動を展開することのメリットは、実現可能な技術の範囲を広げ、速く、着実に成果を生み出せることにある。メンバーの業績についても、この1年間で論文5本、国際学会発表14報、国内学会発表3報、招待講演・セミナー4報、と、研究成果の発信が軌道に乗り始めている[1]。さらに、このようなグループ活動は、メンバー間の競争よりも相互互助の側面が強く、大学院生のメンタルケアにも効果があり、メンバーは楽しみながら自身の専門研究とデジタル歴史学の実践を両立させている。
2018年9月に開催された JADH・TEI 合同カンファレンスは、ToDH として初めての国際学会発表の場であった。合計10人のメンバーを2つのグループに分け、JADH および TEI に1つずつパネル発表を行ったのである。
JADH パネル報告は、東京大学情報基盤センターの中村覚助教をチェアに、2018年4月に行った ToDH シンポジウムでの発表内容を発展させる形で[2]、5人のメンバーが個別発表を行った。全体のテーマは、「歴史研究におけるグループ活動の効用」である[3]。それぞれのプロジェクトの詳細については、本誌の連載でも詳述されることになると思われるため、ここでは発表順に簡潔な内容を述べるにとどめたい。
小川潤(東京大学大学院西洋史学修士課程)は、古代ローマ史研究に有用な碑文データベースの設計案について、フリーの CMS である Omeka とそのプラグイン Neatline をベースに[4]、碑文テクスト構造化の取り組み EpiDoc[5] との連携を視野に入れた構想発表を行った。 小風(山王)綾乃(お茶の水女子大学大学院西洋史学博士課程)は、日本の『百科全書』・啓蒙研究会との共同研究の成果として[6]、近世フランスの知の集大成である『百科全書』における匿名著者推定のためのツール開発について報告した。 槙野翔(東京大学大学院西洋史学博士課程)は、近世アイルランドにおける反乱被害者供述データベースである 1641 Depositions のデータ・マイニングに基づき[7]、Tableau を用いた時空間データの可視化を行い[8]、先行研究における分析対象の偏りを定量的に示すことに成功した。 本誌2018年6月号に公文録 Web スクレイピングのプロジェクトについて寄稿した福田真人(東京大学大学院日本史学博士課程)は[9]、その最新の状況についての発表を行った。 最後に山崎翔平(東京大学大学院経済史学博士課程)は、東京大学 Summer Founders Program 2018 の一環として[10]、Google Vision API を用いた明治期の統計資料を対象にした OCR ソフトの開発について紹介を行った。
これらの報告では、それぞれのプロジェクトを進める中で得られた、共同研究者からの協力に言及した。歴史研究の分野では、単著論文の割合が圧倒的に多い(※2014年に日本で刊行された西洋史学論文の実に98.5%が単一著者によって執筆されている[11])が、JADH でのパネル発表では、DH 分野の慣習に倣って共同研究者の貢献についても言及することで、学際的な研究ネットワークの広がりを体現することを目指した。
次に、TEI パネル報告は、小風尚樹(東京大学大学院西洋史学博士課程・キングスカレッジロンドン DH 修士課程)をチェアとし、「日本における TEI 準拠のデジタル学術資源の普及を促進する」ことをテーマとした[12]。
まずパネルの背景について述べたい。2016年に TEI コンソーシアム内に、東アジア・日本語の特別分科会が発足したことを受けて、今後も日本語資料の TEI マークアッププロジェクトが進んでいくと思われるが、これまで日本における TEI プロジェクトは、仏教学・言語学のものがメインで、歴史学史料を対象としたものは比較的少なったように思われる。そこで ToDH によるパネル報告では、「特定の研究関心を共有するコミュニティによる TEI マークアップのガイドライン・独自タグセットの提案」という取り組みに着目し、欧米の先行プロジェクトである EpiDoc や CEI(Charters Encoding Initiative[13])を参考にしながら、日本における歴史学的観点からのTEIプロジェクトの普及に貢献するための取り組みを紹介した。
第一報告を務めた纓田宗紀(東京大学大学院西洋史学博士課程)は、本誌でも掲載された Regesta Imperii Online で提供される CEI/XML データの分析事例を紹介した[14]。西洋史研究に携わる日本人 TEI ユーザとして、TEI の具体的な活用事例を発信することにより、TEI 準拠のデータを公開することのメリットをデータ提供者に対して働きかけることができると主張した。
第二報告では佐治奈通子(東京大学大学院東洋史学博士課程)が、石見銀山世界遺産センターとの TEI プロジェクトについて、自身の専門である近世オスマントルコのクラトヴァ銀山との多言語史料比較の観点から報告した。特に、暦や銀重量を国際標準の単位に換算して比較するためのマークアップモデルを検討した。
第三報告では小風尚樹が、国立歴史民俗博物館の研究協力者として携わってきた『延喜式』テクストの TEI マークアップ事業の中から、本パネルの趣旨に沿った主要業績を2点紹介した。すなわち、歴史的な度量衡の体系を表現するタグセット(※次の TEI ガイドライン改訂で盛り込まれる予定[15])の提案と、日本語歴史資料 TEI マークアップのためのマニュアル作成である。
第四報告では金甫榮(渋沢栄一記念財団デジタルキュレーター)が、ToDH との協働で行っている、渋沢栄一伝記資料および財団の絵引きデータベースの TEI プロジェクトについて紹介した。金は自身のアーカイブズ学的背景に基づき、TEI ヘッダーにおける充実したコンテクスト情報の記述、本文テクストの慎重な解釈とタグ選定を行っており、まさに ToDH のテーマである歴史研究者・アーキビスト・エンジニアの対話の成果が盛り込まれたプロジェクトを進めている。
これら4つの報告は、日本における TEI プロジェクトの普及に貢献することを最終目的としながらも、欧米の先行プロジェクトを参考事例とし、新しいタグセットの提案や多言語史料比較など国際的な議論に基づいたプロジェクトの成果である。TEI が持つ、共通言語・共通研究基盤としての性質を重視し、日本史・東洋史・西洋史にまたがる TEI プロジェクトを扱う ToDH だからこそできる、日本における TEI 普及のための貢献をこれからも考えていきたい。
ToDH の活動は、これまで週1回を目安としたグループ作業を基礎とし、メンバーが密に連絡を取り合うことでグループとしての統一感を出してきた。しかし今後は、メンバーの研究環境の変化によりグループ活動は新たな局面を迎えることとなる。
最大の変化は、10月以降、筆者を含む4名がイギリスのロンドン、アイルランドのダブリン、ドイツのアーヘンへの留学を開始し、メンバーの研究拠点が地理的な広がりを持つ点にある。西洋史専攻の博士課程在籍者の多い ToDH において、留学に伴って生じる時差は避けられない課題であった。直接集まって作業するというこれまでの活動形態を見直す必要があるが、このような変化は悲観するべきものではなく、ToDH の環を東京の外へと広げるチャンスである。これまでに比べて成果発信のテンポは緩やかになると思われるが、留学先での DH セミナーや学会への参加はもちろんのこと、それぞれのプロジェクトはオンラインでのデータ共有などによって進み続ける。新しいフェーズに入る ToDH 2.0は、それぞれのメンバーが実力をつける充電期間からスタートし、願わくばまた来年、今年を上回る規模で開催する ToDH シンポジウム 2019にて、成長した姿をお見せすることができれば幸いである。
来月号からは、また各自のプロジェクト紹介がスタートする。2018年4月のシンポジウムから発展したもの、まったく新しくスタートしたプロジェクトなど、様々なコンテンツをお送りしたい。
https://www.ninjal.ac.jp/event/specialists/project-meeting/m-2018/20181215-sympo/
菊池氏、小風氏の報告にあるように、9/9-13にかけて、日本デジタル・ヒューマニティーズ学会(JADH)と TEI コンソーシアムのジョイント国際会議が開催された。これまで欧米でしか開催されてこなかった TEI コンソーシアムの年次大会が初めて日本で開催されたことは、デジタル時代を迎える人文学の今後にとって様々な面で大きな意味を持ってくることだろう。 TEI は宮川氏の連載ではしばしば採り上げられてきたが、これに加えて、岡田氏が採り上げる IIIF については巻頭言の永井氏による活動紹介の中でも触れられており、日本でも徐々に普及しつつある。いずれも、人間文化研究を支える基盤となる枠組みであり、近い将来、これらが日本でも当たり前のものになっていくことを期待したい。
(永崎研宣)