ISSN 2189-1621

 

現在地

DHM 155 【後編】

人文情報学月報/Digital Humanities Monthly


人文情報学月報第155号【後編】

Digital Humanities Monthly No. 155-2

ISSN 2189-1621 / 2011年08月27日創刊

2024年6月30日発行 発行数1110部

目次

【前編】

  • 《巻頭言》「隔たりをおどるスタイル
    藤田郁比治山大学現代文化学部
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第71回
    パリンプセスト文献へのデジタル・ヒューマニティーズ的アプローチ:マルチスペクトラル・イメージングが照らし出す多言語・多文化の世界
    宮川創筑波大学人文社会系

【後編】

  • 《連載》「仏教学のためのデジタルツール」第19回
    インド学仏教学論文データベース INBUDS
    朴賢珍一般財団法人人文情報学研究所
  • 《特別寄稿》「Joris van Zundert による「5. Barely Beyond the Book?」(『Digital Scholarly Editing: Theories and Practices』所収)の要約と紹介
    塩井祥子早稲田大学大学院文学研究科
  • 人文情報学イベント関連カレンダー
  • 編集後記

《連載》「仏教学のためのデジタルツール」第19回

仏教学は世界的に広く研究されており各地に研究拠点がありそれぞれに様々なデジタル研究プロジェクトを展開しています。本連載では、そのようななかでも、実際に研究や教育に役立てられるツールに焦点をあて、それをどのように役立てているか、若手を含む様々な立場の研究者に現場から報告していただきます。仏教学には縁が薄い読者の皆様におかれましても、デジタルツールの多様性やその有用性の在り方といった観点からご高覧いただけますと幸いです。

インド学仏教学論文データベース INBUDS

朴賢珍一般財団法人人文情報学研究所研究員

インド学仏教学論文データベース INBUDS(Indian and Buddhist Studies Treatise Database)は、日本印度学仏教学会が構築・運用しているインド学・仏教学に関する論文データベースである。主として日本国内で発行された定期刊行雑誌、記念論文集、一般の論文集等の中から、インド学・仏教学に関する論文を抽出し、その書誌情報および地域・時代・分野・文献・術語に関するキーワードを収録している。

特にキーワードについては、協力機関へ依頼するとともに、同学会データベースセンターが中心となって採取したものだけではなく、キーワード同士の距離を自動的に測り、距離の近いものを関連の強いキーワードとして表示する機能を開発・実装しており、より緻密な論文検索が可能となっている。

このデータベースの構築は、1984年、当時の日本印度学仏教学会・平川彰理事長のもと、学会誌『印度學佛教學研究』の創刊号から1984年に至るまでの諸号について、キーワードを抽出して実験的に入力したことから始まる。キーワードの選択は、平川理事長自身がすべて行ったという。1988年には、学会に「コンピュータ利用委員会」を設置し、今後、インド学・仏教学におけるコンピュータ利用の可能性を検討していくとともに、INBUDS の作成を決定し、翌年(1989)に学会データベースセンターを開設、本格的にこのデータベース構築事業に乗り出した。その後、科学研究費の補助を継続的に受けながらこんにちまで継承されている。構築作業にあたっては、2008年からは研究者による Web 上での協働作業を行う独自システムを開発し、それを通じて毎年数千件のデータが追加され続けている。

INBUDS ホームページ(https://www.inbuds.net/)の検索画面には、入力欄、検索対象(タイトル、著者名、雑誌名、キーワード、すべて)、1ページあたりの表示件数、検索ボタンがある。検索結果ページで「本文」の項目に「あり」または「複数候補」が表示されている場合、論文そのものを閲覧することができる。

図1 「INBUDS で「華厳経」を検索した結果(一部)」

検索結果ページ上部には、「関連キーワード(共起数 / キーワード登場数)」が表示され、各キーワードをクリックすると、関連論文情報を検索できる。

表1 「論文のキーワードの例」

共起数 / キーワード登場数については、表1のように、「華厳経」や「華厳宗」は論文A, B に共通するので、各々のキーワード登場数は2回、それ以外のものはすべて1回であり、論文 A につけられたキーワード群をもとにして、「「インド」と「中国」」の共起回数が1回、「「インド」と「華厳経」」の共起回数が1回、……「「華厳宗」と「法蔵」」の共起回数が1回となる。また論文 B をはじめとした、他のすべての論文についても同様にカウントをおこなう。すなわち、上の図1のように、INBUDS で 「華厳経」を検索した際に表示される関連キーワード「中国(772 / 18582)」は、INBUDS に収録されている論文のうち、「中国」をキーワードとして登録しているのは18,582件であり、そのうち772件は「中国」とともに「華厳経」をキーワードとして登録したという意味である。

また、論文情報の詳細ページでは、以下の図2のように、より多様なキーワードが表示される。

図2 「ある論文のキーワードの例」

「この論文のキーワード」は、同学会データベースセンターが中心となって採取したものであり、「この論文のキーワードに関連の強いキーワード」は、キーワード間の関係の取り方を拡張し、直接には共起していないキーワード間の関係の値も測る、INBUDS 独自に開発した機能によるものである。2016年には、収録論文に対する検索キーワードの出現率をグラフ表示する機能を開発し公開している(検索ツールの「キーワード統計」)。

また、論文詳細情報の表示画面は、Zotero等の論文管理ソフトによる文献情報追加機能に対応しており、クリック一つで論文の書誌情報を論文管理ソフトに追加可能である。

以上のように、INBUDS は、独自のキーワード検索システムを備えたデータベースとして、より精度の高い検索が可能であると同時に、入力した検索語だけではなく、それと関連があるキーワードや論文の情報が幅広く検索されるので、専門の知識や知見を広げるうえでも極めて有益なものであると言える。

*本記事は、INBUDS および日本印度学仏教学会のウェブサイト(https://www.jaibs.jp/association/history)、そして、下記の論文を参考にして作成した。
[1] 平川彰他1986「東洋学におけるコンピュータ利用の一例および問題点と展望」『早稲田大学情報科学研究教育センター紀要』3: 80–84. Accessed June 10, 2024. https://www.inbuds.net/contents/198603doc.html.
[2] 相場徹・生出恭治1998「インド学仏教学論文データベースINBUDSを用いた術語間関係の大きさの推定について」『人文科学とコンピュータ』37(2): pp. 7–14. Accessed June 10, 2024. http://id.nii.ac.jp/1001/00055316/.
[3] 下田正弘・永﨑研宣2019「デジタル学術空間の作り方―SAT 大蔵経テキストデータベース研究会が実現してきたもの―」下田正弘・永﨑研宣編『デジタル学術空間の作り方―仏教学から提起する次世代人文学のモデル―』文学通信, pp. 17–140.
Copyright(C) PARK, Hyunjin 2024– All Rights Reserved.

《特別寄稿》「Joris van Zundertによる「5. Barely Beyond the Book?」(『Digital Scholarly Editing: Theories and Practices』所収)の要約と紹介

塩井祥子早稲田大学大学院文学研究科博士後期課程

Joris van Zundert よる本章[1]は『Digital Scholarly Editing』の理論篇の第4章に位置し、デジタル学術編集版(以下 SDE)の観点から、テキスト研究とコンピュータ科学分野間での方法論的相互作用について検討するものであり、その現状に対する批判と発展すべき方向について検討するものである。

著者はデジタル人文学について「コンピュータ技術と学問の領域の技術と理論が交差する学際的」な分野であり、そこは相互作用が生じ、革新的な力が獲得される場であると指摘する。しかし、著者は PC における GUI(グラフィカル・ユーザー・インターフェース)を例に挙げ、異なる分野間の境界面(インターフェース)は、技術的・方法論的知識をただ交換するだけの場所ではなく、「科学や研究に内在する社会的側面が顕著に前面に押し出される場」でもあり、場合によっては、新しい技術をユーザーにとって既知のパラダイムの表現に変換することによるパラダイムの後退が起き、それが新しい可能性と相互作用の障壁になり得ることを指摘している。

では、デジタル人文学の場合はどうか。著者は「取引場(trading zones)」という言葉で、異分野の交差点を表しながら、そうした場では「ピジン」が発生し、「クレオール」にまで発展することを述べ、「新たに出現した語彙の中に方法論的クレオールの形成を確認できるかどうか」について注意を払っている。ここで著者は『デジタル人文学の手引き (A Companion to Digital Humanities)』(ブラックウェル社、2004年)のタイトルをめぐる出版者と編者らのやり取りを取り上げ、著者らが「人文学コンピューティング(Humanities Computing)」を提示したのに対し、出版社側が「より難しくない言い回し を選ぶことで、概念の魅力を拡げるために」新しい用語である「デジタル人文学(digital humanities)」を提示したことを指摘する。著者はこれを「極めて重要な出来事である」と述べ、「デジタル人文学が方法論的ピジン」ではあると認めつつも、「「人文学コンピューティング」という言葉が、計算機的活動に重点を置いた2つの分野の対等な相互作用や関係を示唆するのに対し、「デジタル人文学」は(意図的かどうかにかかわらず)そのバランスを人文学の領域に押し戻し、計算/デジタルの側面を人文学の部分的な性質として従属させる」ことから、「パラダイム的後退」であることを指摘している。続けて著者は、デジタルテキスト研究の場の1つ―オランダのホイヘンス研究所で開発された eLaborate で起こったインターフェースのパラダイム後退を取り上げる。eLaborate は web ベースの環境でテキスト研究者が SDE を作成し、出版することが出来る。IT 開発者とテキスト研究者の共同で行われたこのプロジェクトでは、従来の編集版には不可欠であった「索引」がなくなり、それに「全文検索」が取って代わるという方法論的な変化が見られた。しかし、コサイン類似度を用いて文書同士の類似性をはかる「関連性ランキング」の実装については、テキスト研究者側の反応が悪く、現在のバージョンでは消失するというパラダイム後退がおこったことを述べ、これは「IT 開発者とテキスト研究者が克服することが出来ない知識交換に対する障壁を見つけたという強力なシグナルである」とする。「インターフェースとモデルは SDE の構成要素であり、知的主張の一部」である。そのため、ここで使われる方法論はコンピュータ科学の「技術を解釈し理解するスキルを持たないテキスト研究者には、事実上アクセスできない」のである。

このように隔絶しているかに思えるテキスト研究とコンピュータ科学は歴史を紐解いてみると、密接な関係にある事実に突き当たる。著者はワールドワイドウェブの技術であるハイパーテキストとポスト構造主義が、単に同じ時期に発展したというだけでなく、どちらも「印刷された本と階層的な思考という現象に対する不満から生じている」ことをGeorge P. Landow の言葉を借りながら述べている。「デジタルテキスト研究、特に SDE は、インターネットとハイパーテキスト・プロトコルの発展によってもたらされた技術に依拠しており」、知識、情報、文書の本質を「高度に相互に関連させ、参照し合い、あるいは絡み合い、横断的であると見なす理論に根差している」。そして、「より相互作用的で変動的な編集版に関する概念」は、「本の表カバーと裏カバーで覆われて縛られた不変の形としてのテキスト」から脱却し、テキストの変動しやすさを強調し、「テキストの不安定性とテキストの過程」に目を向けさせる。こうした部分は、「出版後に何が起こるかという編集版の使用という観点から、テキスト研究と学術編集の実践にとって重要なものである」と著者は主張する。

つまり、「デジタル技術とテキスト研究の相互作用によって、テキストの不安的で流動的な側面と、テキストの過程的な側面の両方に、方法論の焦点が置かれるのである」。そしてそれは Paul N. Edwards が言うようにハイパーテキストは「知識の表現と習得を情報空間の定義と検索の問題として捉え、これらの空間と検索方法が、特定のユーザーの目的と能力によって異なることを見るのである」。しかし、現実の SDE は大きく異なり、例えば現在のデジタル編集版では「証拠資料のリストを年代順に表示することもでき」、「リストの順序は、デジタル編集版アーカイブの基礎となる相関的なデータベース内のメタデータプロパティである「日付」または同様のものに基づいている可能性が高い」。つまり、「ハイパーテキスト表現ではなく、個々のメタデータの単なるリストであり」、「人間の消費のための文書表現のレベルに留まっている」。

著者曰く、ハイパーテキストは「学術コミュニティによって、テキストを表現し、それをSDEという形で提示する技術として、自己完結した文書の書類整理棚に過ぎないものとして形成されてきた」。そして、インターネット上のほとんどの SDE は「その編集版の責任者である研究者がもっている特定の考え」、すなわち本の再表現でしかない。また、現在の SDE の共通語である TEI-XML そのものが、「テキスト中心指向とともに、印刷テキストのパラダイムと階層構造に焦点をあて、文書としてのテキストを表すものとしてのデジタル編集版という見方を常に再確認させるものである」[2]と批判する。そして著者は目指すべき方向として、「テキスト理論の担い手とコンピュータ科学の実務家の双方が方法論的な言説を強化し、テキストの流動性とテキストの関係を真に表現するハイパーテキストの形式を学術的に実現可能で、コンピュータ的に扱いやすい方法で実装するための技術を明らかにしなければならない」という提言で論考をまとめている。

以上、論考の表現を借りながら要約と紹介を行った。本稿はハイパーテキストに着目し、現在の SDE に批判的な眼差しを向けている。ここで主張される程の徹底的なハイパーテキスト性を SDE が兼ね備えるべきなのかどうかは更なる議論が必要だが、目指すべき方向の純粋理論を示しているという点で興味深い。また、論考はテキスト研究とコンピュータ科学の対立が「この2つの断層を飛び越えることを躊躇した途端に起こる」と Jan Christoph Meister の言を引いて示しており、「デジタル人文学」という用語の歴史や eLaborate の事例を踏まえると、テキスト研究すなわち人文学側のコンピュータ科学への理解不足を戒めているのも注目すべき点である。

[1] Driscoll, M. J., Pierazzo, E. (Eds.). (2016). Digital scholarly editing: Theories and practices. Open Book Publishers, pp.83–106.
[2] Joris は TEI についてここで批判しているが、現在ではデータ同士の連結を意識した要素も実装されており、彼が指摘する問題点は解消されている部分もある。
Copyright(C) SHIOI, Sachiko 2024– All Rights Reserved.

人文情報学イベント関連カレンダー

【2024年7月】

【2024年8月】

【2024年9月】

Digital Humanities Events カレンダー共同編集人

佐藤 翔同志社大学免許資格課程センター
永崎研宣慶應義塾大学文学部/一般財団法人人文情報学研究所
亀田尭宙人間文化研究機構
堤 智昭筑波大学人文社会系
菊池信彦国文学研究資料館

◆編集後記

7月21日(日)、TEI協会東アジア/日本語分科会(TEI Consortium, East Asian/Japanese Special Interest Group) による久しぶりの対面シンポジウム、「図書資料の構造化:研究データとしてのテキストデータ構築」が慶應大学三田キャンパスにて開催されます。

このイベントの主な内容としましては、日本でもこのところようやく徐々に広まりつつあるTEIガイドラインの普及活動を支えてきた同分科会による近年の活動報告と、 日本古典書誌学の大家である慶應大学斯道文庫の佐々木孝浩先生による基調講演、それに続いて約20件のTEIガイドラインやテキストデータの構造化に関する国内の事例報告がポスター発表として提供されるという流れになっています。

人文学のためのデータ構築のフォーマットであるTEIガイドラインは、今のところは主に西洋のものということになりますが、古典籍等の書誌学的な要素に対応するために1章を特別に設けるなど、力を入れて対応してきています。日本でも、昨年の2月には、ケンブリッジ大学図書館から、詳細な書誌情報を対象としたTEIガイドラインの活用に専門的に取り組む方々に来日していただいて、東京外国語大学アジア・アフリカ言語文化研究所や国文学研究資料館で講演会が開催されました。その後は徐々に古典籍の書誌情報にTEIガイドラインを適用してみようという流れができてきています。今回の佐々木先生による講演では、書誌学の立場からそうした書誌学のデジタル化・構造化の流れに期待できること・したいことをおうかがいできると期待するところです。

一方、ポスター発表では、TEIガイドラインやテキストデータの構造化に関する取組みの報告が行われます。個人的な萌芽的取組みから息の長く大きなプロジェクトの事例まで、そして、古辞書や訓点、和歌や宗教文献、黄表紙や人物記、財務資料やビデオゲームのクレジットなど、多種多様な史資料を対象とする様々な発表を聞ける貴重な機会になります。また、研究者によるものだけでなく、図書館職員が中心の取組みも2件含まれるなど、この方向の活動の広がりをうかがえるものになっています。

このところ、国内外の学術政策の動向として、研究データ管理プラン(DMP)が科研費で求められるようになるなど、研究データ管理ということが一つの大きな話題になりつつありますが、本イベントでは、人文学系においてその研究データ管理の対象となる研究データの様々なタイプを一望できる機会になりますので、そのような関心をお持ちの方にも楽しめるものとなっていると思います。

イベントの共催には、人文情報学研究所と東京大学人文情報学部門に加えて、慶應義塾大学の図書館・情報学専攻やミュージアムコモンズ、九州大学のライブラリーサイエンス専攻と人文科学研究院も参画しており、この点からもTEIガイドラインをはじめとするテキストデータ構築の広がりを感じさせるものになっています。

この方面に関心をお持ちで参加可能な方は、ぜひお誘い合わせの上ご参加ください。参加費無料・要参加申込みということで、こちらのフォームから参加申込みできるようになっております。

(永崎研宣)


Tweet: