ISSN 2189-1621

 

現在地

DHM 158 【後編】

人文情報学月報/Digital Humanities Monthly


人文情報学月報第158号【後編】

Digital Humanities Monthly No. 158-2

ISSN 2189-1621 / 2011年08月27日創刊

2024年9月30日発行 発行数1116部

目次

【前編】

  • 《巻頭言》「訓点資料とテキストデータ
    蛭沼芽衣九州大学人文科学研究院
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第74回
    引用などを自動で検出するテキスト・リユース探知ソフトウェア Passim
    宮川創筑波大学人文社会系
  • 《連載》「仏教学のためのデジタルツール」第22回
    浄土真宗聖典全書オンライン検索システム
    井上慶淳浄土真宗本願寺派総合研究所

【後編】

  • 《特別寄稿》「Krista Stinne Greve Rasmussen による「7. Reading or Using a Digital Edition? Reader Roles in Scholarly Editions」『Digital Scholarly Editing:Theories and Practices』所収)の要約と紹介
    塩井祥子早稲田大学大学院文学研究科
  • 人文情報学イベント関連カレンダー
  • イベントレポート「DH2024と文学分野の研究発表
    橋本健広中央大学国際情報学部
  • イベントレポート「DH2024参加記(前半)
    大知聖子名城大学理工学部
  • 編集後記

《特別寄稿》「Krista Stinne Greve Rasmussen による「7. Reading or Using a Digital Edition? Reader Roles in Scholarly Editions」『Digital Scholarly Editing:Theories and Practices』所収)の要約と紹介

塩井祥子早稲田大学大学院文学研究科博士後期課程

Krista Stinne Greve Rasmussen よる本章[1]は『Digital Scholarly Editing』の理論篇の最後に位置しており、「我々はテクストをその本来の印刷媒体である本で読むが、テクストや作品は、デジタル媒体に存在する編集版で研究する」という Hans Walter Gabler の言葉を手がかりとしながら、学術編集版において想定される3つのタイプの読者がデジタル学術編集版(以降 DSE)とどのように関わり得るかについて議論するものとなっている。

著者曰く、上記の Gabler の言葉は現代の学術編集版における3つの重要な要素を示しており、その要素とは「印刷媒体からデジタル媒体への移行、テクストと編集版の関係、読むことと研究することの関係」である。これらは「テクスト研究の概念に影響を与えるもの」ではあるが、充分に認識されているとは言い難い。であるため、以下で行われるように、テクストと作品の概念、メディアの変化、読者の役割を整理する必要がある。

著者は作品とテクストの関係を説明する際に、「作品とは、あるタイトルのもとに分類されるすべてのテクストの集合体として機能する非物質的な存在である」という言葉を引用し説明している。そして、私たちは「その作品を読み解くための基礎となるテクストを通じてのみ、その作品にアクセスすることが出来る」。「学術編集版として出版されるために改訂されるのは、まさに作品ではなくテクストである」ことから「テクストという概念は学術出版の中核をなすもの」なのである。

次に著者はメディアの変化について、「学術編集版が出版された作品のテクストをどのように表現するかという概念にも変化をもたらしている」と評する。印刷版とデジタル版の違いを説明する際、Gabler の意見を採用し、前者を「書籍の中のコレクションを順次並べて構成した」情報サイトと言い、後者を「「関係性」を持ち「創造的参加型知性」を表現する」知識サイトであると述べている。知識サイトは「開かれていて」、「動的で」、「相互的なものであり」、「作品のテクストと作品に関連する他のテクストとの関係をより明確にする」。加えて「それらは未完成の研究環境を表し、終りの無い読書を促進し」、「ユーザーを中心とした自由な知識の交換に研究者がより個人的に関わることが出来るようになる」ようなものである。そもそも、学術編集版とは「複製された作品の研究を促進する」ためのものであり、これまでも様々な読者を想定する必要があったが、メディアの変化によって「ユーザーとしての読者」も意識する必要も出て来たのである。

最後に、著者は読者の役割について以下の3つのモデルを提案することで、学術編集版内の文学作品の読解モードの理論化を試みようとする。①読む人としての読者は、テクストを通じて作品を解釈し、理解しようとするものであり、その幅は一般的な読者のレベルから専門的な読者までさまざまである。②ユーザーは、「より間テクスト的な文脈で、作品の多数のテクストやバージョン間の関係」等、「個々のパーツをどのように使用するかに重点が置かれる」。③共同作業者は、「ユーザーや読者の役割を超えて、学術事業に積極的に貢献しようとするものであり」、「これらの読者の役割は、決定的でも排他的なものでもなく」、同時に兼ねることが出来る。そして、読者の役割は「編集版のテクストをどのように操作し、解釈するかの機能であり、それぞれの役割を果たすためには、操作のレベルと解釈のレベルの2つのレベルでの行動が必要である」。「印刷された本の場合、物理的な操作は文化的習慣として組み込まれているため」言語化されることはないが、メディアの変化によってその問題が前景化する。そして同時に「新しいメディアは、新しい方法で物事を行うことを可能にする」。例えば、著者はハイパーリンク構造によって、別のものによって与えられたテクスト間のつながりを素早く簡単に移動することができることを挙げている。しかし、デジタルテクストの世界が単に読者をユーザーに変えてしまうということではない。著者は既に述べた2つのレベルを Bertrand Gervais の提案する三つのレベル(操作、理解、解釈)に拡張し、読者は常にこの3つのレベルで行動しなければならないが、学術編集版との関係の中で読者が前述の3つの読者の役割のいずれかを担った場合、読む人としての読者、ユーザー、共同作業者がそれぞれ注目するのは、主に作品、そのテクスト、編集版(またはウェブサイト)であることを指摘している。例えば、読む人としての読者は、「編集版に貢献する機会があるかどうか、(…)追加資料を含むかどうかは問題ではなく、(…)そのような機能が読書の邪魔にならないかどうか」が重要であることを挙げ、それぞれの役割で重視する点が違ってくることを問題としている。加えて、ハイパーリンクの構造が、「リンクによってもたらされる娯楽を思い求める心理的な必要性」により、「テクストへの没入を困難にしている」ことから、知識サイトとしてのデジタル学術編集版は「没入感が損なわれ、解釈学的な考察の可能性が制限される可能性がある」という意見を紹介している。また、Peter Robinson の調査から、テクストのファクシミリ、転写などを確認しようとする読者は実際にはごく少数であり、ユーザーの役割を担い、利用可能なリソースを活用することに関心を持つ読者はわずかであることが確認されている。「読者は、テクストを読むことができる単一の対象を必要とする」が、「ユーザーは、テクストを探索し、それらを互いに、場合によっては他のテクストと関連付けることが興味深い」のであり、「作品を読むというより、作品を研究する」。「共同作業者は、その編集版を収容するウェブサイトの総合的な知識生産に参加する」。デジタル編集版を読むのか、それとも使うのか?著者の結論は、両方である。続けて「学術編集版制作の出発点として、明確な対象読者を特定することは有益だが、読者が異なる役割でどのように編集版と関わり合うのかについても考慮する必要がある」ことの重要性を指摘する。というのも、「作品がオーディエンスにどのようにアクセスできるのかということは究極的にはどのようにテクストがそれぞれのオーディエンスと関係するのかという問題であるからである」。もし「デジタル編集版が未完成でオープンであるならば、作品のテクスト間の関係もまた未完成でオープンなものになり」、「この事実は、ユーザーにとっては有益だが、読者にとっては必ずしもそうではない」のである。

以上、論考の表現を借りながら要約と紹介を行った。これまで理論篇では、DSEが兼ね備えるべき特徴とそこからの発展形の可能性が論じられてきた。しかし、この章では DSE が読者に与える恩恵と弊害について論じられており、特に論文中で紹介されるハイパーリンク構造の事例は、「クリックしたい衝動」により、今読んでいるテクストから注意が逸れてしまうという弊害はデジタル社会を生きる人間ならば誰しも経験があることである。ただ、同時にそれは自分の認識とは異なる文脈を呼び込む強力で有用なツールとして機能することもまた事実である。であるからこそ論文でも示唆されているように、DSE を作成する際は、その仕様がどのような読者や使い方を想定するのか、それによって得られる効果について充分な検討が必要となるだろう。

[1] Driscoll, M. J., Pierazzo, E. (Eds.). (2016). Digital scholarly editing: Theories and practices. Open Book Publishers, pp.119–133.
Copyright(C) SHIOI, Sachiko 2024– All Rights Reserved.

人文情報学イベント関連カレンダー

【2024年10月】

【2024年11月】

【2024年12月】

Digital Humanities Events カレンダー共同編集人

佐藤 翔同志社大学免許資格課程センター
永崎研宣慶應義塾大学文学部/一般財団法人人文情報学研究所
亀田尭宙人間文化研究機構
堤 智昭筑波大学人文社会系
菊池信彦国文学研究資料館

イベントレポート「DH2024と文学分野の研究発表

橋本健広中央大学国際情報学部教授

DH (Digital Humanities) の研究分野において文学はどのように研究されているだろうか。このような漠然とした興味をもって、2024年8月DH2024に参加した[1]。対面では初参加である。今年の文学分野の傾向は、大規模言語モデル(以下LLM)とテクスト分析研究であった。

文学分野の研究

文学分野の研究発表は、例えば『フランケンシュタイン』の異本コーパスや、著作権保護期間内の著作物を使用した研究用コーパスの作成と分析、トピック・モデリングを用いた遠読などが随所にみられた。分析を行う研究の多くはLLMを使用していた。ある研究発表ではなぜLLMを使わないのかという質問が出たくらい LLM は文学のテクスト分析研究に浸透しているようである。全体としては、既存のDHの手法を駆使して文学テクストの解釈を試みる発表が増えてきた印象がある。ここでは印象に残った四つの研究を振り返りたい。これらは若手の研究者による秀逸な研究であり将来の研究が期待できる。

一つ目はリーによる歴史的テクスト検索研究である[2]。リーはダーウィンの『種の起源』が同時代の出版物に与えた影響をLLMを通してたどった。『種の起源』等の文書を、自然科学や政治学など同時代の様々な分野にまたがる大量の文書と比較して類似文書を検出し『種の起源』との影響関係を調べている。『種の起源』前後の文書との関連を可視化することで影響を明確に示していた。

二つ目はハベラルズ等のトピック・モデリングを使用した英詩の研究である[3]。この研究では中世から20世紀にかけての文学技法の書籍を対象とし、詩学上の用語や概念およびそれらの特徴や言説の変遷を可視化していた。例えば19世紀ビクトリア朝のイギリス詩人アルフレッド・テニソンの語句が「アメリカの」という語句とともに用いられるトピックでは、おそらく19世紀後半アメリカでテニソンが人気を博し詩学の書籍に取り入れられ、盛衰と再評価を経てその後詩学の規範として定着していく様子が察せられ、興味深い変遷を示していた。

三つめはシャーマン等による、19世紀イギリス・ビクトリア朝の小説に表された家庭空間の言説の特徴をLLMを用いて示した遠読の研究である[4]。大量の文書に対し二段階のLLMを経てテクスト検索を行うことで家庭空間を示す文を抜き出し、用語を質的に精査することで、ビクトリア朝における家庭の言説を明らかにしていた。LLM以前の研究と同様の語群を導くことに成功していると聴衆から驚かれていた。

最後にサスロブの登場人物分析と感情分析の発表をあげたい[5]。モリー・パンター・ダウンズが短編小説で描く第二次世界大戦期の戦争表現を、性別による登場人物分析と会話および地の文の感情分析から読み解いていた。女性の登場人物の割合が同時代の女性作家より高く、会話および地の文の感情分析の差が他と比較して大きいことから、パンター・ダウンズが戦争に対する感情を抑制し、戦争前の平和な時代が続くかのような物語世界を試みたことを数値で明確に示していた。人間の頭ではなんとなくはわかるがはっきりと説明できないことを、機械による分析で明確に示した例といえる。

研究者交流

ADHO (Alliance of Digital Humanities Organizations) の目的の一つでもあるが、DH2024は研究者交流の機会が多く設けられていた。ADHO の紹介をする ADHO フォーラム、SIG 別ワークショップや新 SIG 準備会としてのミートアップ、思わぬ人に出会うコーヒーブレイク会場、長めに取られた昼休憩や公式・非公式の懇親会である。個人的には、永崎先生に誘っていただいたヴォワイヤン・コンソーシアム[6]の懇親会で、ヴォワイヤン・ツールの作者の一人ジョージ・ロックウェル先生にお会いできたことが得がたい経験であった。また自分の現在の研究と関連の深い研究をこの目で間近に見、その研究者と話をし、連絡先を交換し合うことができたことは意義深い。学会終了後、ロックウェル先生からヴォワイヤン・コンソーシアムの目的は互いに助け合うことであると教えていただいたが、これは ADHO 主催の DH 学会にも共通する理念ではないかと思う。

DH2024では文学分野の研究動向のほかにも、DH 分野の研究者の層の厚さや若手の研究者の堅実な育成がみてとれた。DH の国際学会が研究分野の醸成と研究者の育成を支えていることが感じられ、熱気にあふれる国際学会であったと思う。

[2] Lucian Li. (2024, August). Tracing the genealogies of Darwinian ideas with LLM embeddings. In Paola Peratello (Chair), Unpacking the power of language: From science and history to ethics and culture. Session conducted at DH2024, George Mason University, Washington, DC.
[3] Wouter Haverals and Meredith Martin. (2024, August). Charting the evolution of topics and ideas in the Princeton prosody archive. Poster presented at DH2024, George Mason University, Washington, DC.
[4] Alexander Sherman et al. (2024, August). A home without a 'house': Modelling domestic space in nineteenth-century British fiction. In Elizabeth Tran (Chair), Words and meaning: Mapping the intersections of language, space, and culture. Session conducted at DH2024, George Mason University, Washington, DC.
[5] Artem Suslov. (2024, August). Sentiment analysis and computer-assisted criticism: Revelation of war-effacing strategies in Mollie Panter-Downes' short stories. Poster presented at DH2024, George Mason University, Washington, DC.
[6] https://voyant-tools.info/. なおヴォワイヤン・ツールは現在トラフィックが急増しているため、ミラーサーバーを使用するか自組織内にヴォワイヤン・サーバ-を設置して利用するとよいとのことである。
Copyright(C) HASHIMOTO, Takehiro 2024– All Rights Reserved.

イベントレポート「DH2024参加記(前半)

大知聖子名城大学理工学部教養教育准教授

国際デジタル・ヒューマニティーズ学会連合(ADHO, Alliance of Digital Humanities Organizations)の年次国際学術大会、DH2024は2024年8月6~9日にワシントン D.C.にて開催された。『人文情報学月報』第157号の編集後記で示されているように、主催者発表によれば、発表は400件であった。今年の特徴として、2022年11月に発表された ChatGPT の影響を受け、大規模言語モデル(LLM)の発表が増えたことがあげられる。筆者は全日程に参加し、発表も行った。本稿ではその経験を元に、筆者が興味関心を持った二点について、前半後半に分けて感想を述べたい。

筆者がまず関心を持ったのは、今大会テーマである Reinvention & Responsibility(再発明と責任)である。三つの基調講演は特にこの問題にフォーカスしたものであった[1]。この他の個別の報告の中で大会テーマに関連した重要な指摘を行っていたのは、インド工科大学のアルジュン・ゴーシュ氏による“Challenging new hegemonies:Developing digital tools for the South”(新たな覇権への挑戦:グローバルサウスのためのデジタルツールの開発)であった。そこでは、近代以降、覇権的な西洋の認識論は非ヨーロッパの思考様式を疎外しており、新たに登場したAIなどのデジタルツールでも欧米の解釈が規範となっているため同様の問題が起きていることが示され、公平なアクセスを確保するには、グローバルサウスの言語で技術を開発する必要があると述べられていた。世界は生成AIブームで盛り上がっているが、氏の指摘するような英語ベースで作られたデジタルツールによる非ヨーロッパ的思考の疎外は忘れ去られてはいけない問題である。ただ、重要な報告にもかかわらず、フロアーおよびオンラインでの参加者数がとても少なかったのが残念であった。

DH2024の大会運営の面でもゴーシュ氏の指摘と同様の問題が残されているように感じた。ADHO にはコミュニティの多言語・多文化性を尊重する目的のため、多言語・多文化主義常設委員会 (MLMC)が設けられており[2]、募集要項(CFP)にはADHO は、多言語会議を行う多言語組織であると明記されているが、実際には ADHO の標準言語は英語・フランス語・ドイツ語・イタリア語・スペイン語と欧米言語に限られており、計画書作成および報告はこれらのいずれかで行われる必要がある [3]。これは人類の多言語・多文化性の尊重からは程遠いものであり、ヨーロッパ中心主義であるとの批判を受けても仕方のない制度であろう。DH に限った問題ではないが、英語が母語でない研究者が研究活動を行う際に、英語ネイティブ話者に比べ重大な不利益が存在することを定量的に示すデータがあるように[4]、学術会議への計画書や学会発表が欧米言語に限定されている現状には大いに問題があると感じている。査読者の確保など様々な難題があり、実現に多大な困難が伴うことは理解できるが、非覇権的言語の思考様式が疎外され続けていることはそれよりも一層重大な問題であり、あらゆる困難を排して克服する価値のある課題であろう。

なお開催地については、1990年の開始から欧米で開催されてきたが、DH2015はシドニー、DH2018はメキシコで開催され、2015年以降は欧州・米国・それ以外の地域というローテーションとなっている[5]。ただ、シドニーもメキシコも植民地支配により公用語が英語およびスペイン語であるという問題がある。例えば、DH2018メキシコ大会では、英語と現地語であるスペイン語のバイリンガルで発表の提案が募集されており、査読者がいる他の言語(ドイツ語、イタリア語、フランス語、ポルトガル語)でも募集されていたが、その中でポルトガル語は開催地域の重要な言語であると説明されている[6]。このように南米で開催しても結局、植民地支配を行った宗主国の言語である欧米言語が開催地域の言語となってしまう。そのような中、DH2022は東京で開催され、DH2026は韓国で開催予定であり、アジア圏の参加者も増加傾向にある。募集要項では世界的に話者数の多い中国語・アラビア語・ヒンディー語等の言語は採用するべきではないだろうか。

ただし、誤解がないように付け加えておくと、ADHO および DH 研究者は非ヨーロッパ言語の問題を完全に無視しているわけではなく、いくつかの有意義な試みも行われている。例えば、DH2014ではボランティア通訳のスタッフの募集が行われ、多言語対応に取り組んでいた[7]。また、DH2018では先住民の言語についての基調講演があった[8]。そして、今年の DH2024のプレカンファレンスイベントでは、Multilingual DH(多言語 DH)という英語以外の言語でデジタル人文学ツールと研究方法を使用している学者のためのワークショップが開催された[9]。そもそも国際学会では、多言語を尊重するための委員会の設置自体が行われておらず、現在もなお募集や発表は英語のみを当然とする場合が多い。例えば、言語や多様性が主要な研究テーマとなる世界社会学会議 International Sociological Association (ISA) の現在の募集要項では言語についての言及はなく、英語を当然のものとしている[10]。また研究委員会の中で、特に言語について専門的に扱う「言語と社会」分科会の細則でも、多言語対応については全く言及されていない[11]。設置委員会については、先住民やグローバルサウスや多様性に関する委員会は見られるが、多言語対応をメインとした委員会は設置されていない[12]。このように国際学会が英語での発表を当然視する中で、ADHO は多言語対応の委員会を設置し、具体的な対応を実施している点は、先駆的な取り組みと言える。今後はこのような合理的調整が更に進展することを期待したい。

[4] Tatsuya Amano et al.“The manifold costs of being a non-native English speaker in science”, PLOS Biology July 18, 2023 DOI: https://doi.org/10.1371/journal.pbio.3002184.
Copyright(C) OCHI, Seiko 2024– All Rights Reserved.

◆編集後記

今回は、デジタル・ヒューマニティーズの最大級の国際会議、DH2024@米国に関する報告を2名の方々にご執筆していただきました。現場の様子が少しでも伝わるようですと大変ありがたいことです。記事中で、多言語対応に関する紹介をいただいていますが、この問題は、それぞれの言語において安定的に対応してくれる DH の査読者のグループを確保する必要があることや、組版の難しさの問題(これはダイレクトに費用と関わってきます)をはじめとして様々な課題があり、また、集まった人達が共通で議論できる言語が必要であるということもあり、多言語をより推し進めていくことはなかなか一朝一夕にはいかないようです。DH2024を運営したデジタル・ヒューマニティーズ学会連合 (ADHO) は、運営のレベルでも多言語の問題に長く取り組んできていますが、日本側もまたそうした取組みについて応分の負担を常に求められる一方で、国際学会での学会運営活動は日本ではほとんと評価されないということもあり、具体的なアクションにつなげることはなかなか難しいという状況です。ADHO の活動への参加は比較的オープンなものであり、問題を感じた人が自ら解決への取組みを進めるための門戸は開かれていますので、そういった取組みに日本からも参加してくださる人がいらっしゃるとありがたいところです。

今月は、日本デジタル・ヒューマニティーズ学会の年次学術大会が東京大学本郷キャンパスで開催されました。開催は実行委員会を中心にボランティアの大学院生の方々も多く参加してくださり、COVID-19によるオンライン化以降、初めての対面開催となりましたが、うまく運営されていて、ありがたいことでした。海外からの対面参加も、2つの基調講演はそれぞれポーランドとオランダから対面参加してくださった先生方が行ってくださいました。そして、一般発表でも、ドイツやフランス、ブラジル、米国な、カナダなど、様々な国からの参加がありました。ようやく国際的な研究活動も戻ってきたような感じですが、円安で海外渡航が難しくなってしまっているため、この JADH2024のように、海外から日本に集まっていただくようなスタイルも今後は広げていきたいところです。

(永崎研宣)


Tweet: