ISSN 2189-1621

 

現在地

DHM 133 【前編】

人文情報学月報/Digital Humanities Monthly


人文情報学月報第133号【前編】

Digital Humanities Monthly No. 133-1

ISSN 2189-1621 / 2011年08月27日創刊

2022年08月31日発行 発行数952部

目次

【前編】

  • 《巻頭言》「国文学研究資料館の調査カード:未来にむけた集成と利用
    幾浦裕之人間文化研究機構国文学研究資料館古典籍共同研究事業センター
  • 《連載》「Digital Japanese Studies 寸見」第89回
    米国現代語学文学協会(MLA)、言語文学分野における社会参加型人文学の評価方法についてのガイドラインを公表
    岡田一祐北海学園大学人文学部
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第50回
    TEI Lex-0および CLLD / CLDF による辞書・語彙資源のデジタル化
    宮川創人間文化研究機構国立国語研究所研究系

【後編】

  • 《連載》「デジタル・ヒストリーの小部屋」第8回
    イギリス女性参政権運動のコーパス分析と Gale Digital Scholar Lab:デジタル・ヒストリーと新聞史料(3)
    小風尚樹千葉大学人文社会科学系教育研究機構
  • 人文情報学イベント関連カレンダー
  • イベントレポート「機械は“史料的限界”を越えられるか:The Digital Humanities Conference 2022イベントレポート
    太田(塚田)絵里奈東京外国語大学アジア・アフリカ言語文化研究所
  • 編集後記

《巻頭言》「国文学研究資料館の調査カード:未来にむけた集成と利用

幾浦裕之人間文化研究機構国文学研究資料館古典籍共同研究事業センター特任助教

私は鎌倉時代の中世和歌を専門としているが、次第に和歌の詠み手や、和歌に限らない書物の生産者、享受者であった人々が、中世や近世にどのように居住して暮らしていたのかに関心をもつようになった。偶然にも近年の日本史学では、都市空間としての中世京都をめぐる一般向けの書籍の刊行が相次いでおり、藤田勝也『平安貴族の住まい 寝殿造から読み直す日本住宅史』(吉川弘文館 2021年)、桃崎有一郎『「京都」の誕生 武士が造った戦乱の都』(文藝春秋 2020年)などがある。私は研究上、古典籍の最後に書写者が書く「奥書」という漢文体の部分、どのような写本をどこから手に入れたか、いつどこで書写したか等の履歴に特に注目している。ここから作品の成立年だけでなく、書写者の年齢や官職が分かる場合もあり、何より信頼できる日付や場所が書かれていれば、そのとき書写した人物が、書き物をしていたことが確実なため、居住する空間でその書物を書写していた、その人の姿が想像されるのである。

そもそも近世以前の日本にはどれくらいの人口が居住していたのだろうか。歴史人口学を日本に導入したのは速水融(1929~2019)である。近年遺稿をもとにした新書『歴史人口学事始め 記録と記憶の九〇年』(筑摩書房 2020年)が刊行された。その研究手法は、フランスのルイ・アンリが教区簿冊から国勢調査開始以前の17~19世紀フランスの人口指標を得る方法に感銘を受け、それを留学以前に慶應義塾大学で整理していた日本の寺院の宗門改帳に応用したものである。ヨーロッパの教区簿冊も近世日本の宗門改帳も、当初は人口統計を得るために記録され始めたものではなかった。信仰の確認や、他宗教・宗派への信仰の禁止を徹底させるために行ったもので、歴史学がそれを人口史料として利用したものである。速水は、最初は列車の時刻表にヒントを得た BDS シートに手書きで記入して家族復元を行ったと回想しているが、ある集積されたデータが史料として整理されることで、本来想定されていなかった研究に応用可能となるという点で、今日のデータ駆動型研究を先取りしたものともいえるのではないだろうか。

歴史人口学が江戸時代以前の人口を知ろうとする学問領域であるとすれば、江戸時代以前の、日本人が作者である日本の書物は、全部でいったいどれくらいあったのか。それを知ろうとしたのが、岩波書店刊行の『国書総目録』であったといえる。最終的に完成したのは国書の所在情報を掲載した目録だが、当初は一〇万点の国書についてその解題を執筆するという『国書解題』という企画として始まった。成立経緯については、熊田淳美『三大編纂物 群書類従・古事類苑・国書総目録の出版文化史』(勉誠出版 2009年)が詳述している。編纂事業が第一に着手したのは、解題の対象となる書目の採集と選択である。そのために全国の主要な図書館、文庫の蔵書目録を集めてカード化が行われた。当時、公刊された目録は少なく、そもそも全国にどのような本、資料が、どれくらいあるのか、という調査が必要となった。「古文書・日記・帳簿から語録・抄物の草稿まで、凡そ巻冊をなす限りは、明治以前に日本人の手に成った書き物のすべて」が対象となった。戦時中に空襲を避けるために貴重書は疎開されたものも多く、戦後には戦前に収集したカードの点検が行われるなど、刊行されるまでには複雑な経緯があった。モノとしての古典籍としては一つのものが、戦中戦後に売却、購入されて短期間に複数の所有者の手を経たため、複数の項目として掲載されている例も中にはある。この『国書総目録』を継承し、国書の所在情報を公開しているのが、国文学研究資料館の日本古典籍総合目録データベース、新日本古典籍総合データベースである。

国文学研究資料館では現在でも全国の古典籍の調査収集事業が行われているが、マイクロフィルムによる撮影が行われていた時代から、撮影の前段階として書誌カードによる調査が実施された。この書誌カードはマイクロフィルムの撮影にあたって必要な情報(特に撮影枚数など)を、記載事項の統一されたカードによって確実に知るために記入、集積されたものであり、当初の時点において、マイクロ資料目録との連結は想定されていなかった。収集された調査カードは非公開の状態が長く続いていたが、現在では国文学研究資料館のウェブサイトの「日本古典資料調査記録データベース」で調査カードとその記載情報が公開されている。調査カードに記載された「所蔵者名」「作品名」「編著者名」「蔵書印等」「序・跋・刊記・奥書等」の各項目の検索が可能であり、調査カードのスキャン画像も確認することができる。新型コロナウィルスの感染拡大以降、調査が困難な期間はこのデータベースを利用して、研究対象の古典籍の調査者にしか分からない形態情報を確認することも多かった。なによりデータベースとなったことで、ジャンルを問わない刊記と奥書のデジタルテキストのデータベース(勿論完全なものではない)が完成したのであり、ここで自分が調査しているのと類似の奥書がないかどうかも検索できるようになった。機械可読なデータとして抽出することができれば、かつてない規模で日本の書物の歴史を可視化することもできるし、所在情報や、中には書写時点の書物の所在情報も地図上に示すことが可能であると考えられる。私が興味深いと思うのは、調査カードの収集開始時、このような奥書や刊記のデータベースが実現されることは想定されていなかったことである。調査カードの記載情報がデジタルテキストとなり、集成され、検索可能となることで、当初想定されていなかった利用が可能となったのであり、今後も機械可読のための処理を行うことで、調査カードの資源としての価値は高まると考えられる。むしろ長年にわたり全国の調査員によって行われた調査活動の成果を十分に活用するために、利用しやすいデータのかたちにすることが、今後ますます必要になる。

和歌、物語を中心とする日本の中古中世文学の書誌学的研究の解説書として、橋本不美男『原典をめざして 古典文学のための書誌』(笠間書院 1974年、新装普及版2008年)がある。写本を見比べる校合の方法なども解説していて、人間文化研究機構国文学研究資料館編『古典籍研究ガイダンス 王朝文学をよむために』(笠間書院 2012年、第2版2013年)の刊行以前は、この『原典をめざして』が日本古典籍を文学研究に活かす数少ない教科書的な本だった。今後、この本に代わる日本古典籍の書誌学的研究の解説書が必要となるだろうが、それはもはや紙媒体での研究成果の公開を念頭においたものでは不十分である。また、『原典をめざして』という書名が示すような、作品成立時点の、ある始原の一点へと遡及するために行われる研究を想定したものとはならないと思う。たとえいわゆる善本の写本ではなくとも、その写本がいまも存在していることや、ある写本がかつて存在したこと、それを生産し、享受した人間がいたことを、もれなく反映するような方法、それを実現するための本である。近時刊行された一般財団法人人文情報学研究所(監修)石田友梨・大向一輝・小風綾乃・永崎研宣・宮川創・渡邉要一郞(編)『人文学のためのテキストデータ構築入門 TEI ガイドラインに準拠した取り組みにむけて』(文学通信 2022年)は以上のような関心からも、とても有効な先行例を示す本だと思う。

執筆者プロフィール

幾浦裕之(いくうら・ひろゆき)。人間文化研究機構国文学研究資料館資料整理等補助員、同館国際連携部機関研究員を経て現職。専門は中世和歌文学、女房文学、日本古典籍書誌学。中世和歌の表現のジェンダーや古典籍の移動や蒐集など享受史についての研究を行っている。早稲田大学教育学部、鶴見大学文学部の非常勤講師を兼務。
Copyright(C) IKUURA, Hiroyuki 2022– All Rights Reserved.

《連載》「Digital Japanese Studies 寸見」第89回

米国現代語学文学協会(MLA)、言語文学分野における社会参加型人文学の評価方法についてのガイドラインを公表

岡田一祐北海学園大学人文学部講師

2022年8月17日、米国現代語学文学協会(Modern Language Association of America: MLA)は、「言語文学分野における社会参加型人文学の評価方法についてのガイドライン」(Guidelines for Evaluating Publicly Engaged Humanities Scholarship in Language and Literature Programs、以下本ガイドライン)を公表した[1][2]。MLA の公表する研究評価指針は、ほかに「デジタル人文学およびデジタルメディアの成果に対する評価方法についてのガイドライン」(2000年、2012年改訂)[3]、「学術としての翻訳の評価方法:同僚評価方法についてのガイドライン」(2011年)[4]があり、3点目ということになる。

今回のガイドラインは特設委員会が起草したもので、委員長名は明記されていない。委員は基本的に米国内の文学およびメディア芸術研究者から選ばれている。

いわゆるエグゼクティヴ・サマリーとしては、このガイドラインは社会参加型人文学を評価する際の問いを与えるものだとし、また、社会参加型人文学は社会、二・多言語社会ととくにかかわるものであるとして、倫理的問題への示唆を強調したという。また、人文学と密接にかかわる成果公表形態として、英語やその他の言語で学術界の外にまで波及する媒体である商業誌やブログ、新聞の論説、講演、ポッドキャストなどの評価が必要であることに触れている。そのうえで、評価を考える際、プロジェクトのねらいや意義、流通形態、現状の成果と今後の射程、協同の性質と範囲が重要であることが述べられている。つまり、どちらかといえば、研究者が社会に入ることが想定されるのであって、いわゆるクラウドソーシング型の研究はここでは埒外となることは、読解の上で注意しておかなければならないかもしれない。

MLA の本ガイドラインの特徴は、倫理的・民主的な社会への参加を研究者に促し、研究機関に対してその過程を明確にし、それによって公正な評価を受けるべきだとする点にあるように思われる。もちろん、いかなる社会においても無視できないことであるにせよ、ここまでの強調は、アメリカという地の特殊性が強く影響しているように思える(日本では、北海道に同様の側面があるが、その他の地域ではどうだろうか)。あまりに強調するあまり、社会参加の多様性の把握がおろそかになり、それ以外の観点からの社会参加の評価という論点がないがしろにされてしまっているように思える。たとえば、大英博物館の漫画展は、本ガイドラインにいう社会参加の一形態のはずであるが、このような大型プロジェクトがひとりの力でできないのは自明であるものの、そのような項目はなく、本ガイドライン制定者が、このようなものをどう評価させたいのかいまいち摑みかねるところがある。

これは、アメリカ歴史学協会が「終身在職権審査、昇格審査と社会参加型歴史研究者」(2010年、2017年改訂)[5]において述べたものと比較するとより顕著になる。アメリカ歴史学協会のガイドラインでは、よりじっさいの評価を意図して、既存の評価軸に組み込めるものとなることが意識されているように思われる。それと比べると、本ガイドラインは、被評価者への問いかけもされるなど、研究倫理の側面から、あるべき人文学の姿を説いているようにも見える。補完しあう側面もあるのだろうが、いささか根源的過ぎて実践的ガイドラインという印象はあまり持てない。

アメリカ歴史学協会のガイドラインにせよ、本ガイドラインにせよ、独自の評価軸を強く求めていく姿勢が明白なのは興味深い。日本や欧州であれば国や EU の方針への対応がまったくなされないことはないだろう。また、「研究評価」全体への言及もない。本ガイドラインからアメリカ歴史学協会のガイドラインが参照されることもない。その点、自治を強く冀求するアメリカ社会のありかたによるもののように思われるところである。

原理的側面の考察が大きいということは、現実に流されがちなときに、自分を見直すよい鏡となるということでもある。社会参加の評価ガイドラインの改訂の折などに読むと発見があるといった類いのものに思われた。

[2] News from the MLA MLA Publishes New Guidelines on Evaluating Publicly Engaged Humanities Scholarship https://news.mla.hcommons.org/2022/08/17/mla-publishes-new-guidelines-on-evaluating-publicly-engaged-humanities-scholarship/.
[4] Evaluating Translations as Scholarship: Guidelines for Peer Review | Modern Language Association https://www.mla.org/Resources/Advocacy/Executive-Council-Actions/2011/Evaluating-Translations-as-Scholarship-Guidelines-for-Peer-Review.
Copyright(C) OKADA, Kazuhiro 2022– All Rights Reserved.

《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第50回

TEI Lex-0および CLLD / CLDF による辞書・語彙資源のデジタル化

宮川創人間文化研究機構国立国語研究所研究系

Coptic Dictionary Online[1]は、世界最長の書記記録期間を持つエジプト語の最終段階であるコプト語の辞書ウェブアプリであり、2019年の Best DH Tool or Suite of Tools にも選ばれたツールである[2]。このツールは、コプト関連の DH プロジェクトの共同研究を促進するアンブレラプロジェクトである KELLIA プロジェクト[3]の一環として作成されたものである。KELLIA プロジェクトは、米国人文科学基金(NEH: National Endowment for the Humanities)とドイツ研究振興協会(DFG: Deutsche Forschungsgemeinschaft)のジョイントプロジェクトである。このプロジェクトには、ゲッティンゲン大学のシェヌーテ『第6カノン』デジタル化プロジェクト(DFG 助成)[4]とゲッティンゲン科学アカデミーのコプト語旧約聖書デジタル・エディション・プロジェクト[5]、コプト語コーパス Coptic SCRIPTORIUM プロジェクト(NEH 助成)、ベルリン自由大学の「コプト語におけるギリシア語借用語のデータベースと辞書」(DDGLC)プロジェクト(DFG 助成)[6]、ベルリン・ブランデンブルク科学アカデミーの「エジプト語シソーラス」プロジェクト(TLA: Thesaurus Linguae Aegyptiae)[7]、サピエンツァ・ローマ大学の PAThs プロジェクト(欧州研究評議会 (ERC) 助成)[8]、ミュンスター大学の新約聖書本文研究所[9]などが参加している。

図1:Coptic Dictionary Online のユーザインターフェース[10]

助成金は、2015年から2018年の三年間だけであったものの、現在でも共同作業は続いている。現在も進化し続けている KELLIA 発のプロジェクトの一つが Coptic Dictionary Online である。辞書データは、コプト語最大の辞書で、著作権も切れている Walter Ewing Crum の A Coptic Dictionary(初版は1939年)のコプト語本来語の語彙データと DDGLC プロジェクトのギリシア語からの借用語の語彙データをベースとしながら、英語・フランス語・ドイツ語の他のコプト語辞書の参照情報も付記し、さらに語義意味には英語だけでなくドイツ語訳とフランス語訳も付している。

この Coptic Dictionary Online のデータは、TEI XML の辞書データの標準に従って作成された。作成者は、ベルリン・ブランデンブルク科学アカデミーの TLA のメンバーを中心とするが、一部、ゲッティンゲン大学のコプト語訳旧約聖書デジタル・エディション・プロジェクトのメンバーが関わっている。

この TEI データの作成時の初期の頃に、TLA の研究者たちは、コプト語の最初の文字であるアルファとその次のベータで始まる単語について、Crum のデータの全ての方言形や派生形を記述していたが、ガンマから、方言形を省略するようになった。また、Crum の辞書にある例文を全て省略している。これら、欠けている情報を補うのが Coptic Dictionary Online の緊急の課題となっている。

例文がないという欠点を一時的にも補うために、KELLIA チームは、コプト語多層コーパスである Coptic SCRIPTORIUM コーパスから、例文を自動で取得するシステムを追加した。それと同時に、Coptic SCRIPTORIUM 上でも、テキストの単語一つ一つに付されているレンマをクリックすると、Coptic Dictionary Online 上でその意味を確認することができる。さらに、Coptic SCRIPTORIUM 上での頻度及び、その語彙と共起が多いほかの語彙のリストも、Coptic Dictionary Online 上で表示できるようになっている。

Coptic Dictionary Online は、TEI Guidelines P5の第9章 “Dictionaries”[11]に従って作られた辞書データを、学者や学習者にとって有用であるように、ウェブアプリにして、様々な機能を追加した例であると言える。TEI に準じた辞書データの構築方法としては、Laurent Romary 氏と Toma Tasovac 氏が率いる DARIAH Working Group on Lexical Resources が作成した TEI Lex-0[12]で非常に詳しい説明が読めるほか、TEI Lex-0のワークショップ/チュートリアルの資料集では、様々な練習を行うことができる。TEI Lex-0で作成した辞書データは、tei2ontolex というプログラムを用いると[13]、現在、辞書データのリンクトオープンデータ(LOD)の標準となりつつある OntoLex-Lemon[14]に容易に変換することができる。

これら TEI による辞書のデジタル化とは別に、言語学の一分野である言語類型論の立場から辞書や言語類型のデータベースの標準を作ろうとする動きがある。Cross-Linguistic Linked Data(CLLD)は、マックス・プランク進化人類学研究所(ライプチヒ)[15]が開発しているプラットフォームであり、この CLLD は、独自の Cross-Linguistic Data Formats(CLDF)[16]という形式を用いている。このプラットフォームは、現在18のウェブデータベースで用いられている[17]。例えば、言語類型(例えば、動詞の前に主語が来る類型の言語 vs. 動詞の後に主語が来る類型の言語など)の最大のデータベースである World Atlas of Language Structures[18]のオンライン版はこの CLLD を用いている。言語の一覧である Glottolog [19]でもこの CLLD が用いられている。その他、辞書では、スー語族比較辞典[20]や世界の様々な言語での借用語辞典[21]などがある。この CLDF 形式を用いると、地図へのマッピングや、例文の各単語のインターリニアグロス(行間語釈)の作成も非常に容易に行うことができる。

CLLD / CLDF を用いた World Loanword Database(WOLD)の一例[22]

今回、TEI と CLDF という2つの標準的な辞書の構造化・機械可読化方式を探索した。どちらも様々なプロジェクトで用いられており、分析やウェブサイト化のための様々なツールを適用させることができる。どちらでも対応できるよう、TEI を CLDF に、CLDF を TEI に変換できるが望ましい。TEI を OntoLex-Lemon に変換するツールはあるが、CLDF を直接 TEI に、もしくは OntoLex-Lemon に変換するツールは、管見では現在のところ存在しない。TEI、OntoLex-Lemon、CLDF を相互に変換することができるツールの開発が待たれる。

[1] Coptic Dictionary Online, accessed August 19, 2022, https://coptic-dictionary.org/.
[2] “DH Awards 2019 Results,” Digital Humanities Awards Highlighting Resources in Digital Humanities, accessed August 19, 2022, http://dhawards.org/dhawards2019/results/#:~:text=Best%20DH%20Tool%20or%20Suite%20of%20Tools&text=GLAM%20Workbench%20https%3A%2F%2Fglam,%3A%2F%2Fprosody.princeton.edu%2F. なお、ノミネート時には Online Coptic Dictionary という名前でノミネートされている。
[3] KELLIA (the Koptische/Coptic Electronic Language and Literature International Alliance), accessed August 19, 2022, http://kellia.uni-goettingen.de/.
[4] RESEARCH - B INTERPRETATIONS, SFB1136, accessed August 19, 2022, http://www.sfb1136.uni-goettingen.de/en/program/b-interpretations.html.
[5] Digital Edition of the Coptic Old Testament, accessed August 19, 2022, https://coptot.manuscriptroom.com/.
[6] Database and Dictionary of Greek Loanwords in Coptic (DDGLC), accessed August 19, 2022, https://www.geschkult.fu-berlin.de/en/e/ddglc/index.html.
[7] Thesaurus Linguae Aegyptiae, https://aaew.bbaw.de/tla/servlet/TlaLogin.
[8] PAThs. An Archaeological Atlas of Coptic Literature, accessed August 19, 2022, https://atlas.paths-erc.eu/.
[9] WWU Institut für neutestamentliche Textforschung, accessed August 19, http://egora.uni-muenster.de/intf/.
[10] “ⲅⲣⲁⲫⲉⲓ,” Coptic Dictionary Online, accessed August 19, 2022, https://coptic-dictionary.org/entry.cgi?tla=C8691.
[11] “9 Dictionaries,” P5: Guidelines for Electronic Text Encoding and Interchange, accessed August 19, 2022, https://www.tei-c.org/release/doc/tei-p5-doc/en/html/DI.html.
[12] TEI Lex-0 — A baseline encoding for lexicographic data, accessed August 19, 2022, https://dariah-eric.github.io/lexicalresources/pages/TEILex0/TEILex0.html.
[13] “tei2ontolex,” GitHub, accessed August 19, 2022, https://github.com/elexis-eu/tei2ontolex.
[14] “The OntoLex Lemon Lexicography Module Final Community Group Report 17 September 2019,” https://www.w3.org/2019/09/lexicog/.
[15]CLLD: Cross-Linguistic Linked Data, accessed August 19, 2022, https://clld.org.
[16] Cross-Linguistic Data Formats, accessed August 19, 2022, https://cldf.clld.org/.
[17] “Published datasets,” CLLD: Cross-Linguistic Linked Data, accessed August 19, 2022, https://clld.org/datasets.html.
[18] The World Atlas of Language Structures Online, accessed August 19, 2022, http://wals.info/.
[19] Glottolog 4.6, accessed August 19, 2022, http://glottolog.org/.
[20] Comparative Siouan Dictionary, accessed August 19, 2022, https://csd.clld.org/.
[21]The World Loanword Database (WOLD), accessed August 19, 2022, https://wold.clld.org.
[22] “Sekai,” World Loanword Database, accessed August 19, 2022, https://wold.clld.org/word/61223170512597810.
Copyright(C) MIYAGAWA, So 2022– All Rights Reserved.


Tweet: