人文情報学月報第173号
ISSN 2189-1621 / 2011年08月27日創刊
目次
- 《巻頭言》「知の継承としてのテキストデータ構築」
:韓国・国立ハンバッ大学 - 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第89回
「中世ヌビア文献データベース:中世アフリカ文字文化研究のデジタル基盤」
:筑波大学人文社会系 - 《連載》「英米文学と DH」第12回
「DH における英文学関連の学術誌」
:中央大学国際情報学部 - 人文情報学イベント関連カレンダー
- 編集後記
- 「デジタル研究基盤としての令和大蔵経の編纂―次世代人文学の研究基盤構築モデルの提示」ニューズレター第3号(本誌「特別付録」として隔月配信)
《巻頭言》「知の継承としてのテキストデータ構築」
1. 危機の中の体系化
1603年、長崎。関ヶ原の戦いから三年が過ぎ、キリシタンに対する禁教の圧力が高まりつつあったこの時期に、イエズス会によって『日葡辞書』[1]が刊行された。約32,000語におよぶ当時の日本語語彙を体系的に記録したこの大部の辞書は、日本語史研究における記念碑的な資料である。フランシスコ・ザビエルの来日から50年余りの歳月が過ぎ、日本の言語や文化に対するカトリック宣教師の理解は深まっていたはずであり、質・量ともに高い水準を誇る辞書の出現自体は、驚くべきことではないかもしれない。しかし、彼らが置かれていた状況を鑑みれば、この編纂事業の特異性は際立つ。いつ追放されるかもわからぬ不安定な情勢下で、彼らはなぜこれほど精緻で膨大な記録を残したのか。
それは、自分たちが去った後も、あるいは布教が断絶した後も、いつか再びこの地を訪れるであろう後継者たちが、日本語を学ぶためのよすがとするためであった。「いつか来る後人のために」ーーその明確な目的意識こそが、未曾有の辞書編纂を支えていたのであろう。実際、それは鎖国下の日本について研究する欧州日本学を支え、19世紀の開国以降はキリスト教の再布教を志す欧米人に資することとなった。それはまさに、『日葡辞書』の編者たちが望んだ未来だったはずだ。
2. 翻刻の限界と TEI の可能性
私は日本古辞書や東アジアの漢字文献を対象に、TEI[2]や IIIF[3]といった国際的な枠組みを用いたテキストデータの構築に取り組んでいる。その原点は、平安時代末期に仏教界で成立したとされる図書寮本『類聚名義抄』[4]の研究にあった。行草体の交じる本文を判読して異体字などを同定し、意味の不確かな記号に対して自分なりの判断を書き留める日々であった。当初は古文献の見た目の再現も意識してノートに手書きで翻刻していたが、修正の利便性からパソコン入力へと移行した。しかし、見た目の忠実な再現を諦めると、かえってテキストに潜在する真の構造へと目が向くようになり、プレーンテキストやワープロソフトでは表現しきれないことに気がついた。そこでたどり着いたのが XML であり、さらにそれを人文学の文脈で高度に体系化した TEI ガイドラインであった。
TEI を採用することの意義は、単なるマークアップの便利さにとどまらない。それは、世界中の研究者が長い時間をかけて議論し、練り上げてきた「テキスト解釈の知恵」を共有することに他ならないからだ。私一人の恣意的なタグ付けではなく、国際的に共有された語彙を用いて記述することで、東アジアの漢字文献は初めて、世界のデジタルヒューマニティーズの海へと漕ぎ出すことができる。もっとも、そのための作業自体は、一文字一文字と向き合う地道で根気の要る営みである。テキストの構造を解釈し、タグとして記述していく過程は、かつての手書きの翻刻作業と本質的に違いはないように思えた。
3. 「翻訳」としてのデータ構築
このような作業は究極的に何を目指すものなのか。研究の細分化・分業化が進む中で、日本古辞書を専門とする者として自分に課せられた役目だと思って始めたデジタルな記述作業であった。しかし、この分野の研究を志す人々が年々減りつつある実態を前にすると、この辞書の本文をテキストデータとして記述していく作業は、いつかこの文献を必要とするかもしれないーーあるいは存在するかどうかも定かではないーー「誰か」のための作業ではないかと思うようになった。それはかつて宣教師たちが行った辞書編纂にも比すことができよう。日本語という未知の体系をラテン語文法の枠組みを用いて「翻訳」し記述した彼らの偉業には及ぶべくもないが、現代の私たちもまた、人間が読むためのテキストを、機械が処理可能な構造化データへと「翻訳」しているのである。
特に東アジアの漢字文献においては、文字コードの羅列だけではこぼれ落ちる情報が多い。字形の揺らぎ、訓点の位置、割り注の階層構造。これらは単なる視覚的特徴ではなく、文献が成立した背景や受容の歴史を示す重要なメタデータであり、マークアップすべき対象である。これらを構造化データとして記述することは、資料が物理的なアクセスを失ったり、技術的なプラットフォームが変化したりしても、その知識の本質を未来へ維持するための「箱舟」を作ることに他ならない。
4. 未来の技術への信頼
イエズス会士たちが残した『日葡辞書』は、400年の時を超えて、現代の言語学者にとって欠かせない一次資料となった。彼らの丹念な記述は、当時の彼らには想像もつかなかったであろう未来の研究を支えている。同様に、私たちが構築している人文学テキストデータも、今の私たちには予測できない未来の技術によって再解釈される日が来るかもしれない。昨今の AI 技術の進展は目覚ましいが、どれほどアルゴリズムが高度化しても、学習元となるデータの質と構造が確かでなければ、出力される知見の信頼性は揺らぐ。私たちが今、どれだけ精緻で文脈を保持したデータを構築できるかが、未来の知の体系が東アジア古典文献を正しく継承できるかの鍵を握っているのではないだろうか。人文学の立ち位置が脅かされる昨今の情勢の中、存亡の危機に際してデジタルヒューマニティーズに託す思いは報われるだろうか。たとえそうは行かずとも、私たちはテキストデータを作っていくしかないのではないか。あの時のイエズス会士がそうであったように。
5. 時空を越えた知の連帯
私は現在、韓国の大田(テジョン)にある大学で研究と教育に従事している。海を隔てたこの地から、数百年の時を遡って自らが対象とする日本の古辞書や東アジア漢字文献を見つめ直すとき、それらが国境や年代を越えて共有されてきた知のネットワークの産物であることを改めて実感する。かつてイエズス会士たちが異郷の地で日本語の体系化を試みたのも、異なる文化を理解し、記述しようとする普遍的な知の営みであった。彼らが四百年前に示した、未来を見据えて知を記録するという意志を、今度は私たちが自らの研究対象において引き継ぎ、デジタルという新たな技術を用いて次の時代へと接続していく。画面上のデータ構築という静かな作業は、そうした長い歴史の連なりの中に確かに位置づけられるものである。
執筆者プロフィール
《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第89回
「中世ヌビア文献データベース:中世アフリカ文字文化研究のデジタル基盤」
はじめに
ナイル川中流域、現在のエジプト南部アスワンからスーダン北部にかけての地域では、6世紀から15世紀にかけてキリスト教ヌビア王国が繁栄した。ノバティア、マクリア、アルワ[1]という三王国は、543年頃のキリスト教改宗以降、ビザンツ帝国やコプト・エジプトとの文化的紐帯を維持しながら、独自の文字文化を発展させた。652年のバクト条約によりエジプトのイスラーム政権との平和共存が約600年間続き、特に850年から1050年頃がヌビア・キリスト教文明の最盛期とされる。
中世ヌビアでは、ギリシア語、コプト語、アラビア語とともに、古ヌビア語(Old Nubian)で文献が書かれた。古ヌビア語はナイル・サハラ語族東スーダン語派に属し、現代のノビーン語(エジプト・スーダンで約69万人が使用)の古い段階である。メロエ語をのぞけば、ナイル・サハラ語族において中世から連続的な文字記録を持つ唯一の土着言語であり、その文献群は中世アフリカ史研究における極めて貴重な一次史料である。しかし、これらの資料は大英博物館、カイロ・エジプト博物館、ベルリン国立博物館群など世界各地に散逸しており、体系的な研究基盤の構築が長年の課題であった。この状況を変革したのが、ワルシャワ大学の Grzegorz Ochała 氏が主導する Database of Medieval Nubian Texts(DBMNT)[2]である。

プロジェクトの経緯
DBMNT は2011年に公開された。当初は Ochała 氏の博士論文『Chronological Systems of Christian Nubia』[3]の付随資料として、年代情報を含む733件のテキストを収録していたが、20年以上にわたる継続的な拡張により、現在では4,518件のテキストレコードを擁する包括的データベースへと成長している。Ochała 氏はこのプロジェクトを「ヌビアの Trismegistos」と位置づけ、キリスト教ヌビアの文字史料に関する究極の知識源となることを目指している。
重要な転換点は2012年の Trismegistos との統合である。Trismegistos はルーヴェン大学が運営する古代世界の文献資料ポータルであり、80万件以上のデータを収録するパピルス学・碑文学における国際標準である[4]。この連携により、各ヌビア・テキストには Trismegistos の一意識別子が付与され、地中海世界の広範な学術ネットワークに組み込まれた。
その後、2016年から2018年のポーランド国立科学センター助成「What's in a name?」プロジェクト[5]では人名データベースが構築され、1,738の名前、2,576の異綴り、3,725人の個人情報が体系化された。2019年から2021年の EU Horizon 2020マリー・キュリー・アクション助成「IaM NUBIAN」プロジェクト[6]では8,538件のアイデンティティ標識データが追加された。こうして DBMNT は、単なるテキスト目録から社会史・人名学・プロソポグラフィ研究の統合プラットフォームへと進化した。データは CC BY 4.0ライセンスで公開され、Zenodo からも取得可能である。
データベースの構造
DBMNT は FileMaker Pro 16で設計されたリレーショナル・データベースである。主要構成要素は、DBMNT Texts(4,518件)、DBMNT Names(1,738件)、DBMNT People(3,725件)、DBMNT IM References(8,538件)である。
各テキストレコードには、出土地(ノバティア、マクリアなどの王国区分を含む)、現在地、媒体(パピルス、羊皮紙、石碑、陶片等)、技法、言語(古ヌビア語、ギリシア語、コプト語、アラビア語など)、年代、ジャンルといった詳細なメタデータが付与される。年代学的情報については、ディオクレティアヌス紀元、世界創造紀元、ヒジュラ暦、インディクティオなど中世ヌビアで併用された複数の暦法が体系的に記録され、相互参照が可能になっている。
古ヌビア語には Unicode が活用される。古ヌビア語の文字体系は、コプト文字を基盤としつつメロエ文字に由来する3つの固有文字 ⳡ(/ɲ/)、ⳣ(/w/)、ⳟ(/ŋ/)を加えたものであり、それぞれ専用コードポイントを持つ。データは XML、CSV、Excel 形式でエクスポートでき、Trismegistos 経由で REST API や OAI-PMH にも対応している。

収録資料の多様性
収録資料は言語・媒体・ジャンルにおいて多様性を示し、中世ヌビアの多言語社会の実態を反映している。言語面ではギリシア語、コプト語、古ヌビア語、アラビア語およびその併用テキストが含まれる。媒体としては石碑(991件)、壁面碑文(977件)、写本(324件)、陶片(79件以上)などがある。ジャンル別には典礼文書、聖人伝、聖書翻訳、法文書、行政記録、書簡、墓碑銘など多岐にわたる。主要出土地としては、最大の資料源であるカスル・イブリム、ファラス、旧ドンゴラ(マクリア王国首都)、ガザーリ修道院などが挙げられる。
DBMNT の学術的貢献は多方面に及ぶ。歴史言語学では古ヌビア語の体系的研究が可能となり、SOV 語順や膠着的形態論といった類型論的特徴の分析、現代ノビーン語との比較による歴史的変化の解明が進んでいる。社会史研究ではプロソポグラフィ・データを活用した社会構造・教会組織の分析が行われている。
具体的成果として、Ochała 氏によるファラス出土壁面碑文の再解読により、ナイル渓谷で初めて女性助祭の存在を示す証拠が発見された。また、人名データベースを用いた検証により、従来誤読されていた多数の「幽霊人名」が訂正された。さらに、写本の物質的痕跡から聖なる文字を摂取する宗教的実践(インクの舐め取り、ページの切除)が明らかにされるなど、物質性の歴史への新たなアプローチも開拓されている。

おわりに
DBMNT は、周縁化された文化のデジタル可視化、長期的データ構築、国際標準への準拠という点でデジタル人文学の模範的事例である。古ヌビア語テキストは連続印刷すれば100ページにも満たない小規模コーパスだが、厳密なデジタル基盤が新たな研究を可能にすることを実証している。日本においても、琉球諸語やアイヌ語など消滅危機言語のデジタル・アーカイブ構築において、DBMNT の方法論は参照に値するだろう。
DBMNT は、散逸した中世ヌビアの文字遺産をデジタル空間上で再統合し、万人にアクセス可能なものにした。Ochała 氏が構想する「ヌビアの Trismegistos」への発展が実現すれば、アフリカ史とキリスト教史の交差点に新たな地平が切り拓かれることになろう。
《連載》「英米文学と DH」第12回
「DH における英文学関連の学術誌」
前回までの連載で一連の DH 批判をみた。2020年代に入ると、コロナ禍や生成 AI の普及により社会が様変わりしたためか、あるいは DH 批判への応答としての学問的なアクションであるのかはわからないが、英文学の学術誌で DH の特集が以前よりも見受けられるようになった。今回は、DH の学術誌の概観をしつつ、DH の特集を組んだ英文学の学術誌の紹介をしたい。特に文学を専門としていた研究者や学生が DH に取り組む際に、資料を探す道案内となることを願いたい。本稿では英文学を主に扱うが、英文学以外の文学の分野においても、各自の専門の分野で同じように資料探しができることと思われる。
DH 特集
DH や英文学の学術誌(学会や大学やケンブリッジなどの大学出版会から出版されるもの)は、年間三巻以上発行されるものもあり、その場合毎年テーマを決めてテーマに沿った論文を多く掲載する特集号が発行されることが多い。これは学術誌の運営側からすれば、その年当該分野で関心が高まっている学術動向を拾い上げ、あるいは動向を作り上げることにもなるだろう。また特集によってある程度の論文数が確保されるため、公表した頻度通りに学術誌を発行するというトムソン・ロイターが定める学術誌としての基本条件にも貢献すると思われる[1]。特集は公募の場合もあれば、担当する編者を定めて該当する研究者に原稿を依頼する場合もある[2]。伝統的な英文学の学術誌に DH の特集が組まれるのは、社会の要請や時事的な話題として時代を反映しているとも考えられるし、英文学の側に受け入れられる素地が十分にあるともいえるし、あるいは DH の側から積極的に他の領域に働きかけが試みられたということかもしれない。デイビッド・ロッジは英文学の学者の世界を舞台とする彼の小説で、構造主義やポスト構造主義などの文学批評が、その起こり始めの頃にはイギリスの英文学の学会からそっぽを向かれていたという様子をコミカルに描写しているが[3]、称賛と反発が同時に起こりながらも次第に異なる分野を取り入れてきたのが英文学の学問領域の特徴といえる。
DH と英文学の分野の違い
今異なる分野と述べたが、文学と DH はそれほどまでに違うのだろうか。現状では、文学とそれ以外の人文社会科学系学問には、形式および研究方法のデザインや手続きの点で違いがあるように思える。文学研究者や文学を専門とする学生が、DH の研究を行おうとして最初に越えなければならない山が、この形式、デザイン、手続きを人文社会科学系学問の枠組みに合わせるところである。論文の形式を例にとると、文学の論文はエッセイであって、目的、結果以外は論文や研究発表の形式は内部の論理に従う。ある程度、書くことで研究が進められるというところがある。一方、教育学や応用言語学も含め、文学以外の人文社会科学系学問は、はじめに、目的と背景、先行研究およびリサーチ・クエスチョン、方法、分析、議論、おわりにという定まった形式をもつ。研究は論文用紙の外側で進められ、文書として書く際にはある意味ですでに終えられている[4]。
学術誌の種類分けと資料探しの方法
しかしここでは、DH 系の学術誌、専門領域としての文学全般の学術誌、英文学の特定の領域の学術誌に分けて紹介を行いたい。資料探しをするには、最新の関連する文献の注を逐一たどる方法、関連分野の主要な学術誌の最近の数年に出版された論文をすべて調べる方法、ProQuest や EBSCOhost、JSTOR などの学術関連データベース(図書館データベースや図書カード、Google Scholar を含む。検索結果を数百件に絞り、タイトルをスキミングして重要と思われる論文をすべて抽出する)から検索する方法、あるいは生成 AI を使用した検索などの方法が教授されていることと思う。その際、次に述べるような学術誌を参考にしていただければと思う。ただし、すべてを網羅しているわけではないし、重要なトップジャーナルが抜けている可能性もある。あくまで参考である。
DH 関連の学術誌
はじめに、DH、計量文体論(Stylometry)、DLS(Digital Literary Studies)、CLS(Computational Literary Studies)等の名称で呼ばれる領域の学術誌である。DH は人文学の幅広い領域を扱うが、そのうちの一つである文学の領域を特に取り上げる学術誌を示す。これらの学術誌では人文社会科学の論文で求められる客観性と、実証的な完結性が求められているようである。
- -Digital Scholarship in the Humanities [5]
- -DHQ (Digital Humanities Quarterly) [6]
- -Digital Studies / Le champ numérique [7]
- -Journal of Computational Literary Studies [8]
- -Computational Humanities Research [9]
『デジタル・スカラシップ・イン・ザ・ヒューマニティーズ』は各地域・各言語の DH 学会の連合組織である ADHO(Alliance of Digital Humanities Organizations)と EUの EADH(European Association for Digital Humanities)が共同編集するあらゆるデジタル研究にかかわる学術誌である[10]。同様に、DHQ は ACH(Association for Computers and the Humanities)と ADHO が出版する人文学のデジタルメディア全般の学術誌であり[11]、『デジタル・スタディーズ/ル・シャン・ヌメリク』は CSDH/SCHN(Canadian Society for Digital Humanities/Société canadienne des humanités numériques)およびオープン・ライブラリー・オブ・ザ・ヒューマニティーズが出版する DH 全般の学術誌である。一方、ダルムシュタット大学およびヘッセン州立図書館より出版されている『JCLS: ジャーナル・オブ・コンピュテーショナル・リテラリースタディーズ』および2025年に開始された CHR(Computational Humanities Research)カンファレンスの学会誌『コンピュテーショナル・ヒューマニティーズ・リサーチ』は、より専門的な文学関連の計量的分析に関する学術誌と考えられる。
文学全般の学術誌
次に、文学全般を扱う学術誌である。主に英米文学や歴史学が主体となるが、特定の時代や作家に限定せず全般的に文学および関連する領域が扱われるという意味で載せている。特に DH 特集を実施した欧米圏におけるの学術誌としたため、日本の学術誌は省略している。誌名の次のタイトルと出版年、号数は特集のタイトルと特集が掲載された学術誌の情報を示す。
- -PMLA (Publications of the Modern Language Association of America) [13] 「デジタル・ヒューマニティーズの多様性」2020, 135(1)
- -New Literary History [14] 「文化、理論、データ」2022, 54(1)
- -English Literary History [15]
- -Modern Language Quarterly [16] 「尺度と価値」2016, 77(3)
- -Poetics Today [17] 「AI 革命」2024, 45(2)
- -Journal of Cultural Analytics [18]
- -Critical Inquiry [19] 「過剰なデータ」2022, 48(2)
PMLA はアメリカの文学・言語・教育関連の主要な学術団体の一つである米国現代語学文学協会が発行する学会誌である。2020年に「デジタル・ヒューマニティーズの多様性」と題する特集を組んでいる[20]。また特集ではないが、2024年の第139巻第3号の理論と方法のセクションは、AI 関連の論文が9本掲載されている。これは特に言及はないが、時期的に米国現代語学文学協会の2023年大会の研究が論文として掲載されたものと思われる。『ニュー・リテラリー・ヒストリー』はジョンズホプキンス大学出版会から出されている理論、方法、解釈といった文学批評や文学史に関する学術誌である。2022年にテッド・アンダーウッド等編集による「文化、理論、データ」の特集が組まれている[21]。同じくジョンズホプキンス大学出版会の「ニュー」ではない旧来の伝統的な文学史の学術誌『ELH: イングリッシュ・リテラリー・ヒストリー』では、特集こそないものの、データやアーカイブ、文学史などの DH の論文が時折掲載されている[22]。デューク大学出版会からは、文学史の学術誌『MLQ: モダン・ランゲージ・クオータリー』と体系的な文学研究を行う『ポエティクス・トゥデイ』が出版されている。MLQ では2016年に「尺度と価値: 文学史の新しくデジタルなアプローチ」と題する特集を[23]、『ポエティクス・トゥデイ』では「AI 革命: 作者、教育、職業の未来についての考察」と題する特集[24]を掲載している。『ジャーナル・オブ・カルチュラル・アナリティクス』はプリンストン大学デジタル・ヒューマニティーズ・センターが出版する文化や人文科学、社会科学、コンピュータ科学の交差点を研究する学術誌である[25]。内容は文学テクストの計算や分析に関する論文が多い。『クリティカル・インクワイアリー』はシカゴ大学出版会より出ている文学批評、現代批評と文化に関する学術誌である[26]。ナン・Z・ダの DH 批評[27]を2019年に掲載した学術誌であるが、2022年には「過剰なデータ」と題する特集を組んでいる[28]。
英文学の特定の領域の学術誌
より細かな文学の専門領域に分化した学術誌でも DH の特集が組まれている。例えば、以下の学術誌が挙げられる。
- -Studies in Romanticism [29] 「ロマン主義とデジタル・ヒューマニティーズ」2024, 63(3)
- -The Wordsworth Circle [30] 「ロマン主義とデータ」2022, 53(3)
ジョンズホプキンス大学出版会より出版されている『スタディーズ・イン・ロマンティシズム』は1961より続くロマン主義研究の伝統的な雑誌であり、1750年から1850年のロマン派の世紀を主に研究対象の時代とする[29]。2024年に「ロマン主義とデジタル・ヒューマニティーズ」と題する特集が組まれた[31]。また『ワーズワス・サークル』は1970年より続く国際的な学術誌であり、1770年から1850年という欧米ロマン主義の時代の伝統的な研究を掲載している学術誌である[32]。2022年に「ロマン主義とデータ」と題する特集が組まれた[33]。
今回の連載では DH 特集が組まれた文学の学術誌を中心に、英米文学という専門分野における DH 研究をリスト化した。DH 研究が浸透している学術誌もあれば、特集という形で DH 研究が紹介される場合もある。読者もそれぞれの専門分野に照らし合わせて、DH の特集を組んだ学術誌や、専門分野の研究とは手法や学問形態が大きく異なるものの DH の手法を取り入れた論文も掲載している学術誌を調べてみる価値はあるだろう。次回は、閑話休題として DH と教育を取り上げる。その後は最近の DH 研究について考察していきたい。
人文情報学イベント関連カレンダー
【2026年1月】
-
2026-1-8 (Thu), 13 (Tue), 22 (Thu), 27 (Tue)
TEI 研究会於・オンライン -
2026-1-16 (Fri)
立教大学共生社会研究センター主催オンラインセミナー「デジタル保存入門-はじめの一歩を踏み出そう」https://www.rikkyo.ac.jp/research/institute/rcccs/news/2025/mknpps000003difa.html
於・オンライン
【2026年2月】
-
2026-2-5 (Thu), 10 (Tue), 19 (Thu), 24 (Tue)
TEI 研究会於・オンライン -
2025-2-1 (Sun)
第140回人文科学とコンピュータ研究発表会於・アートホテル石垣島
【2026年3月】
-
2025-3-2 (Mon)
国際シンポジウム”Cross-Border Dialogues in Digital Humanities × Public History― Doing Digital Public History & Public-Facing Digital Humanities”https://www.nijl.ac.jp/news/9720/
於・国文学研究資料館およびオンライン -
2026-3-5 (Thu), 10 (Tue), 19 (Thu), 24 (Tue)
TEI 研究会於・オンライン
Digital Humanities Events カレンダー共同編集人
◆編集後記
今月は DH 関連のイベントづくしで、大変盛り上がった一ヶ月でした。特に、12/13–14に九州大学で開催された人文科学とコンピュータシンポジウム(じんもんこん)2025 https://jinmoncom.jp/sympo2025/index.html では、60件以上の発表が集まり、熱心な議論が展開されました。人文系や情報系の様々な分野から、色々な手法を用いた研究発表があり、海外大学からの発表もあるなど、この分野の幅が一層広がりつつあることを感じさせてくれました。生成 AI をどう活用するか、というテーマが徐々に見られるようになってきており、研究としての生成 AI の扱い方が模索されているようでした。筆者もこれについては色々な取組み試行しておりまして、近いうちにまた成果を皆さんにお見せできればと思っております。
手前味噌で恐縮ですが、12/20–21に東京国際フォーラムで開催された仏教学と DH 国際シンポジウム https://buddhist-dh-sympo2025.dhii.jp/ は、「DX-AI 時代における人文学の意義と研究基盤の構築」というテーマで、AI を全面的に採り上げたシンポジウムとなりました。AI に関わるところで言えば、生成 AI の高度な活用手法を提供するプロジェクトからデータ基盤をより高度に整備する取組みに AI を活用する事例など、様々な発表が集まり、海外招待研究者から6件の口頭発表、国内の DH 関連研究組織から24件のポスター/デモンストレーション発表があり、大変盛りだくさんなものでした。基調講演をつとめたエディンバラ大学の Melissa Terras 先生からは、2010年に開始されたクラウドソーシング翻刻プロジェクトTranscribe Bentham https://blogs.ucl.ac.uk/transcribe-bentham/ や手書き文字認識プラットフォーム Transkribus https://www.transkribus.org/ など、Terras 先生による国際的に著名な取組みについての発表があり、なかでも、200以上の組織によって Transkribus の運用を支える国際的な協働組合組織としての READ-COOP https://readcoop.org/ は、研究助成金が終了した後に人文学のためのデジタルサービスを持続的に運用していくための大規模な取組みとして、とても貴重な事例でした。また、さらに手前味噌なことで大変恐縮ですが、筆者としても、ちょうど、14000件の学術論文を用いた仏教研究支援の RAG システム、「バウッダ AI」 https://agni.dhii.jp/bd-rag/ が、Gemini 3.0対応のための改修が間に合いましたので、紹介させていただくことができ、ありがたいことでした。
このような一連の様々な話題のなかでやはり気になったのは、生成 AI をはじめとする近年の AI 活用の潮流における日本の人文学にとっての課題です。たとえば Humanitext https://humanitext.ai/ja/ のように、ギリシャ・ローマの古典においては長い時間をかけて高度に整備された TEI 準拠のテキストデータを公開しているプロジェクト(https://www.perseus.tufts.edu/hopper/)があり、それを踏まえた生成 AI を用いた先の展開を様々に考えることができますが、まだ基礎となる信頼性の高いデジタルデータがあまり多くない分野ではそれを用意するところから取り組まなければなりません。日本文化研究における多くの分野もまたその典型であり、その部分を迅速にカバーしなければ生成 AI を適切に活用することもできません。換言すると、生成 AI に問い合せても適切な情報が出てこないか,あるいはそもそも存在しないことになってしまうことになります。そのようにして見過ごされやすくなる可能性が高くなってしまうことを考えると、ここで基礎的なデータをきちんと整備するという地味な仕事こそが喫緊の課題となっているように、改めて実感したところでした。ここにもまた、国立国会図書館がリリースする古典籍向け OCR ソフト https://lab.ndl.go.jp/news/2024/2024-11-26/ のように、AI を活用することで作業を大幅に効率化することが可能ですので、そういった可能性をより広く深く探っていくこともまた、日本文化研究においては大きな課題となっていきそうです。
2025年は、そのようなことで、AI が大きく全面に出てくる年になりました。2026年は、さらにその方向が強まるのか、あるいはさらにまた別の方向性が出てくるのか、近年の情報技術の進展には圧倒的なものがあり、今後どうなるかなかなか見通せないところですが、当メールマガジンとしては、今後もなるべく色々な動向にキャッチアップしていければと思っております。来年もよろしくお願いします。