ISSN 2189-1621

 

現在地

DHM 155 【前編】

人文情報学月報/Digital Humanities Monthly


人文情報学月報第155号【前編】

Digital Humanities Monthly No. 155-1

ISSN 2189-1621 / 2011年08月27日創刊

2024年6月30日発行 発行数1110部

目次

【前編】

  • 《巻頭言》「隔たりをおどるスタイル
    藤田郁比治山大学現代文化学部
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第71回
    パリンプセスト文献へのデジタル・ヒューマニティーズ的アプローチ:マルチスペクトラル・イメージングが照らし出す多言語・多文化の世界
    宮川創筑波大学人文社会系

【後編】

  • 《連載》「仏教学のためのデジタルツール」第19回
    インド学仏教学論文データベース INBUDS
    朴賢珍一般財団法人人文情報学研究所
  • 《特別寄稿》「Joris van Zundert による「5. Barely Beyond the Book?」(『Digital Scholarly Editing: Theories and Practices』所収)の要約と紹介
    塩井祥子早稲田大学大学院文学研究科
  • 人文情報学イベント関連カレンダー
  • 編集後記

《巻頭言》「隔たりをおどるスタイル

藤田郁比治山大学現代文化学部言語文化学科国際コミュニケーションコース講師

私は 19 世紀ヴィクトリア朝桂冠詩人の Alfred Tennyson(1809–1892; 以下 Tennyson)の韻文作品を対象に計量文体論 (Stylometry) の手法、いわゆる機械学習や統計学に基づいた定量的な手法をあてがった研究をしています。イギリス文学研究において、デジタルヒューマニティーズ(以下 DH)や定量的研究手法はさほど主流ではなく、ことに詩の研究においては研究者の精読に基づく質的な研究が国内外を問わず主流です。Tennyson 研究も例外ではなく、そのほとんどが質的研究に基づいています。Moretti [1]の著書のタイトルにもなっている distant reading(遠読)は、文学作品研究に一般的そして不可欠な close reading(精読)に対し、定量的手法を用い、文学作品を「読む」ことを指します。定量的手法は英文学作品研究において主流ではないものの、研究者の間では distant reading の認知が拡がっているように思います。2019年に出版された Tennyson Echoing Wordsworth の冒頭で、筆者 Jayne Thomas は “the study examines in a series of close readings the echoes or borrowings from Wordsworth that these poems contain and the transformative part they play in his poetry.” (下線筆者)と書いています [2]。もし、研究手法として定量的な手法が文学作品研究で用いられていないままであったなら、わざわざ著書や論文で「本研究は精読に基づき」と言及することはないと考えます。Thomas のこの一文は、close reading 以外の研究手法の存在があってこそではないかと考えています。

定量的手法を用いた文学作品研究をしておりますと、コンピュータは詩や文学作品を「読める」のか?というご質問を頂戴することがあります。文学研究では、単に字面を追えば良いのではなく、研究者自身が「読む」、つまり close reading によって作品とその裏にある作者の心理や意識を理解していく「読み」に重きを置いています。この従来と同等の、人間が行う「読み (reading)」をコンピュータができるのか、というご質問には、現状ではできない、とお答えする他はありません。では、人間のような「読み」を行えないコンピュータに作品を解釈(分析)させようという distant reading の試みは、これまでの精読に基づく文学研究を蔑ろにしているかというと、そうではありませんし、distant “reading” という表現が不適切かというと、そうではないと考えます。

close/distant reading は、形容詞の close と distant がいわゆる対義であるというだけではなく、reading が意味する範囲が実は異なっているのではないでしょうか。前者は「解釈する」まで含意しているのに対し、後者は、与えられている意味がより軽く、「見る」や「文字列を追う」程度の意味にとどまっているのではないかと考えます。普段我々が close/distant reading という言葉を使用する際に、ここまで意識して用いていることはないと思いますが、それでも潜在的あるいは無意識に reading の持つ意味の違いを認識しているのではないでしょうか。つまり、distant reading のアプローチをとっている私も、コンピュータが詩を「読める」、「解釈できる」とは(今のところは)考えていません。ここでのコンピュータ、定量的手法はあくまで手法であり、分析結果を人間が読み、考察して結論を導き出しますし、分析結果を提示しただけでは考察や結論はうまくいきません。分析の対象である作品やテクストを読み込み、解釈し、熟知しているからこそ、分析で提示された数値等の結果に意味を持たせることができると考えます。人間とコンピュータがそれぞれできること、長けていることは比較的排他的な関係にあるのではないでしょうか。人間は文学作品を「解釈する」ことはできますが、その解釈は主観的なものであり、再現可能性は低くなります。また、人間が一度に読める文字や語の数には限りがありますし、作品を読むにも相応の時間がかかります。一方コンピュータは「解釈する」ことはできませんが、人間の解釈を担保する客観的な結果を提示することができ、研究結果の再現可能性を高めることが可能です。加えて、コンピュータは一度に多くの何千、何万、何億といった文字や語を扱うことができ、そのスピードと量は人間の比ではありません。人間とコンピュータそれぞれに長所と短所、向き不向きがあり、互いに補い合うことによって、より研究と論の精度と質を高めていけるのではないでしょうか。定量的手法を普段から使われている方からすると、言を俟たないと思われるやもしれませんが、close/distant reading の読みの違いや、定量的手法を使用した研究は質的研究に真っ向から対立するものではなく、むしろ互いに補完しあって研究の質を押し上げていけるものであるということを、より広くアピールしていきたいという所信表明をさせていただきました。

新しい変化や進化というのは得てして逆風にさらされるもので、それは19世紀も今の時代も大きく変わらないように思います。Long は The Values in Numbers の中で、今でこそ当たり前のように数値が使われている医学分野でも、当初は様々な批判があったことを例にあげています [3]。私の研究対象である Tennyson の生きた19世紀は産業革命やダーウィンの進化論等により文化、生活が大きく変化した時代でした。産業や科学の発展は、日々の生活だけではなく、それまで人々の心の拠り所であった信仰にも大きな影響を与えたと言われています。Tennyson は、産業・科学の発展、それまでの宗教文化のどちらをも強く否定することなく、人間の本質などの内的なものを大切にし、光をあてつつ、文化や科学等外的な要素の新しい知見を詩行の中に散りばめていた詩人です。時代、生活の変化に大きく抗うことなく、迎合しながら自分の作品に落とし込んできた Tennyson は、現代の時代や技術の変化を目の前にしても大きく抗うでも、伝統に固執するでもなく、目の前にいる人を慈しみながら広い視野を持って受け入れてくれる気がします。

少し話はそれますが、 “Save the Last Dance 2” という映画があります。シリーズものの第2弾で、ダンスの中でもクラッシックバレエに焦点を当てています。この “Save the Last Dance 2” では、主人公が名門バレエアカデミーに所属しつつも、別のダンスのジャンルにも興味をもち、バレエのプロとして生きていくか、バレエを捨てるのか、という選択を迫られます。最終的に、このどちらでもない選択をする主人公は、ストーリーを通し、二兎を追うもの一兎も得ず、は真かもしれないが、かといって唯一の解ではないことを見出していきます。何か一つの物事を極めることはもちろん素晴らしいことですが、かといって、一つの物事しか追求できない謂れはありません。むしろ、異なる(ジャンルの)ものを合わせることで、新しい化学反応が起き、これまでになかった良いものを生み出せる可能性を秘めています。二兎を追っていると思っていたら、気づいたら追っているものが龍だったり、蛇だったり、一周回って虎だった、なんてこともあるかもしれません。この映画のラストのダンスシーンで使われている曲に、“Take a little bit of this / Mix it with a little bit of that / It’s called bridging the gap” [4] という歌詞があります。少しのこれと、少しのあれを混ぜて…研究では「少し」では足りないですが、英文学と英語学を混ぜて…文体論が出来上がり、文体論と定量的手法を掛け合わせて計量文体論、あるいは DH が出来上がります。分野横断的学術領域である DH は、様々なご専門の研究者を橋渡す、bridging the gap(s) の分野であると言えます。それぞれのご専門・研究対象は様々ですが、これとあれとを混ぜ合わせ、化学反応を起こし合いながら DH という共通言語でコミュニケーションをとりながら切磋琢磨し合えるのは、DH という分野ならではの醍醐味だと考えます。

[1] Franco Moretti. Distant reading. Verso, 2013.
[2] Jayne Thomas. Tennyson echoing Wordsworth. Edinburgh University Press, 2019. p. 2.
[3] Hoyt Long. The values in numbers. Columbia University Press, 2021. pp. 1–18.

執筆者プロフィール

藤田郁(ふじた・いく)。比治山大学現代文化学部言語文化学科国際コミュニケーションコース講師。専門は計量文体論、19世紀イギリス文学(Alfred Tennyson)。博士(言語文化学)。三重大学人文学部特任講師等を経て現職。
Copyright(C) FUJITA, Iku 2024– All Rights Reserved.

《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第71回

パリンプセスト文献へのデジタル・ヒューマニティーズ的アプローチ:マルチスペクトラル・イメージングが照らし出す多言語・多文化の世界

宮川創筑波大学人文社会系准教授

パリンプセストとは、一度書かれた文書を削り取って別の文書を上書きした写本のことである。中世ヨーロッパやイスラーム世界では羊皮紙の再利用が盛んに行われ、その結果、様々な言語・文化が混在した多層的なテキストが生み出されてきた。

近年、このようなパリンプセストを解読するために、デジタル・ヒューマニティーズの手法が威力を発揮している。特にマルチスペクトラル・イメージング(multi-spectral imaging; 日本語では、マルチスペクトル・イメージングと呼ばれることが多い)と呼ばれる撮影技術は、肉眼では見えない下層の削り取られた文字の残滓を鮮明に可視化することを可能にした。さらに、IIIF と呼ばれる国際的な画像共有フレームワークを用いることで、世界中の研究者が高精細画像を共有・相互運用し、協働で研究を進められるようになったのである。

その先駆けとなったのが、「アルキメデス・パリンプセスト」(Archimedes Palimpsest)[1]の解読プロジェクトである。この写本は、13世紀に古代ギリシアの数学者アルキメデスの著作の上に、祈祷書が上書きされたものである。下層テキストの存在は20世紀初頭から知られていたが、その解読は困難を極めた。

ところが1990年代に、パリンプセストがデジタル技術で分析可能なことが明らかになる。米国のイメージング専門家たちは、マルチスペクトラル・イメージングと自動処理アルゴリズムを駆使して、アルキメデスの著作を浮かび上がらせることに成功した(図1)。

図1 アルキメデス・パリンプセストをマルチスペクトラル・イメージングで撮影して合成したものの一部[2]

これは、単なる文字の復元にとどまらない、文化史的にも画期的な発見であった。判読されたテキストからは、これまで知られていなかった新しいアルキメデスの著作も見つかったのである。これにより、古代ギリシア数学に関する従来の定説が大きく塗り替えられる可能性が出てきた。パリンプセストという「知の遺産」の中に、失われた古代の叡智を見出す。アルキメデス・パリンプセストの研究は、デジタル・ヒューマニティーズの大きな可能性を示す象徴的な事例と言えよう。

マルチスペクトラル・イメージングの基本は、光の波長による物質の反射率の違いを利用することにある。可視光は電磁波の一種であるが、それ以外にも紫外線や赤外線など、様々な波長の光が存在するのである。例えば、インクと紙では、可視光の反射率は似ていても、赤外線だと大きく異なることが多い。そこで、可視光では見えない下層の文字も、赤外線や紫外線など様々な波長の光を当てることで浮かび上がるというわけである。

マルチスペクトラル・カメラは、特殊なフィルターを用いて、光を細かい波長帯に分割して撮影する。可視光を10前後、赤外線をさらに数バンドに分けるのが一般的なのである。照明にも工夫が必要で、LED やフィルター付きストロボを使い、狙った波長だけを照射するのである。こうして各波長で撮影した多数の画像を、コンピュータで統合処理することになる[3]。

その際、主成分分析という統計手法を用いて、データを圧縮しつつ本質的な情報を抽出するのである。また、赤外線の反射率が高い部分を疑似カラーで強調表示するなど、様々なデジタル処理を駆使する。こうして不可視の情報が可視化されることで、肉眼やカメラでは捉えきれなかった対象の姿が浮かび上がるというわけだ。まるで、デジタル画像の「考古学」とも言えよう。

パリンプセストの場合、表面の文字(上書き)の下に、削り取られた古い文字(下書き)が隠れているのである。そこで、表面インクとは反射特性の異なる光を使い、マルチスペクトラル撮影を行うのである。さらに、インクに含まれる金属元素を検出する蛍光X線分析などと組み合わせることで、かすかな痕跡からも文字を復元できるのである。それは、まるでパズルを解くように、パリンプセストの「隠された層」を一枚ずつはがしていく作業と言えるだろう。

このパリンプセストのためのマルチスペクトラル・イメージングは、Jubilees Palimpsest Project のウェブサイトが、ユダヤ教の文献である『ヨベル書』のパリンプセストの実例で示しながら、その方法を解説している[4]。

このようなマルチスペクトラル・イメージングの成功は、他のパリンプセスト解読にも大きな刺激を与えることとなった。例えば、ケンブリッジ大学図書館の Mingana-Lewis パリンプセストからは、9~10世紀のアラビア語のキリスト教説教集の下層から、7~8世紀のクルアーンの断片が発見された。標準的なウスマーン版クルアーンとは異なる読みを含むこの資料は、イスラーム初期のクルアーン伝承の多様性を物語る貴重な証拠となっている。[5]

また、エジプト・シナイ山のカタリナ修道院からは、コーカサス・アルバニア語で書かれた聖書のパリンプセスト断片も見つかっている。コーカサス・アルバニア語はコーカサス地方の死語で、その文字体系は謎に包まれていた。バルカン半島のアルバニアとは関係がなく、言語的にもインド・ヨーロッパ語族に属するアルバニア語とは全く関係がない。この言語はコーカサス・アルバニア文字という独自の文字を使い、アゼルバイジャンを中心とした、旧コーカサス・アルバニア王国で用いられていた言語だ。これまで少数の碑文しか発見されておらず、全てが解明された言語ではなかった。だがマルチスペクトラル・イメージング技術による新たなテキストの発見とそれらのテキストの言語学的な分析により、このコーカサス・アルバニア語が、北東コーカサス語族に属し、現在アゼルバイジャンで主に話されているウディ語の古い形であることが判明したのである[6]。

さらにイエメンのサナア大モスクからは、下層が古い読みを含む初期クルアーン、上層が標準的なウスマーン版クルアーンという、ユニークな「二重写本」が発見された。この「サナア・パリンプセスト」は、イスラーム初期におけるクルアーン校訂の過程を生々しく伝える第一級の史料である[7]。

こうしたパリンプセストの高精細画像は、Archimedes Palimpsest Project に見られるようにリポジトリなどで公開されている場合もあるが、近年では、IIIF という国際規格に準拠し、Web 上で公開されている。世界のどこからでも自在にアクセスし、複数の画像を並べて比較したり、特定領域を拡大したりできるのである。

例えば、Mingana-Lewis パリンプセストは、ケンブリッジ大学デジタル・ライブラリーで IIIF で公開されている[8](図2)。これはケンブリッジ大学図書館の Mingana-Lewis Palimpsest project の成果である[9]。このプロジェクトは、昨年度にケンブリッジ大学デジタル・ライブラリー・ユニット長、デジタル人文学コーディネーターである Huw Jones 氏とともに来日したケンブリッジ大学図書館中近東部門長の Yasmin Faghihi 氏も参加している[10]。デジタル化されたイスラーム写本を横断検索できる Fihrist[11]とも提携している。

図2 Mingana-Lewis パリンプセスト (MS Or.1287) の通常の画像(左)とパリンプセストの文字を浮き出させた画像(右)を IIIF ビューワである Mirador で比較したもの

こうしたオープンで相互運用可能なデータ共有の仕組みにより、世界中の研究者が所蔵機関の垣根を越えて共同研究を進められるようになった。それは正に、デジタル技術と人文知の「協働」の理想を体現するものと言えよう。

このように見てくると、デジタル・パリンプセスト研究は、人文学の新しいフロンティアを切り拓く挑戦だと言えるかもしれない。最先端技術を駆使して、テキストの層に分け入り、そこに刻まれた異文化の痕跡をたどって散逸したフラグメントをつなぎ合わせ、失われた古代の言語や思想を復元する。そうした知的探究と思いがけない発見—セレンディピティ—を通じて、文化の多様性と学問の可能性を再発見していく。デジタル時代の人文学に求められているのは、そのような「越境」の精神なのかもしれない。様々な専門家の「協働」によるテキストの「解放」を旗印に、人文知の新たな航海に乗り出す。パリンプセストのデジタル研究は、そのような希望に満ちた冒険なのである。

[1] “The Archimedes Palimpsest,” OPenn, accessed June 13, 2024, https://www.archimedespalimpsest.net/. アルキメデス・パリンプセストのウォルターズ美術館での展覧会については、http://www.archimedespalimpsest.org/(閲覧日2024年6月27日)で閲覧できる。
[2] “0000-100r_Arch53v_Sinar_pseudo_no-veil.jpg,” “The Archimedes Palimpsest,” OPenn, accessed June 13, 2024, https://www.archimedespalimpsest.net/Data/0000-100r/0000-100r_Arch53v_Sinar_pseudo_no-veil.jpg.
[3] “Guide to Creating Spectral RTI Images,” The Jubilees Palimpsest Project, accessed June 13, 2024, https://jubilees.stmarytx.edu/spectralrtiguide/.
[4] “Jubilees Palimpsest,” The Jubilees Palimpsest Project, accessed June 13, 2024, https://jubilees.stmarytx.edu/.
[5] “Mingana-Lewis Palimpsest,” Cambridge Digital Library, accessed June 13, 2024, https://cudl.lib.cam.ac.uk/collections/minganalewis/1 を参照。
[6] Gippert, Jost. "The application of multispectral imaging in the study of Caucasian palimpsests." Bulletin of the Georgian National Academy of Sciences 175 (2007): 168–179.
[7] Cellard, Éléonore. "The Ṣanʿāʾ Palimpsest: Materializing the Codices." Journal of Near Eastern Studies 80.1 (2021): 1–30.
[8] “The large Qur’ānic leaves from the Mingana-Lewis Palimpsest (MS Or.1287),” Cambridge Library Collection, accessed June 13, 2024, https://cudl.lib.cam.ac.uk/view/MS-OR-01287-LARGE/1.
[10] 「講演会「インターフェースを越えて:デジタル人文学のためのデータとしての TEI」」東京外国語大学、2024年6月13日閲覧、https://www.tufs.ac.jp/event/2022/230218_2.html
[11] “Fihrist: Union Catalogue of Manuscripts from the Islamicate World,” Fihrist, accessed June 13, 2024, https://www.fihrist.org.uk/.
Copyright(C) MIYAGAWA, So 2024– All Rights Reserved.


Tweet: