ISSN 2189-1621

 

現在地

DHM 110

人文情報学月報/Digital Humanities Monthly


人文情報学月報第110号

Digital Humanities Monthly No. 110

ISSN2189-1621 / 2011年8月27日創刊

2020年9月30日発行発行数603部

目次

  • 《巻頭言》「上座部仏教文献研究におけるデジタル化の問題点:コンコーダンスとデジタルテクストに注目して
    青野道彦一般財団法人人文情報学研究所
  • 《連載》「Digital Japanese Studies寸見」第66回
    「植民地朝鮮の日本人宗教者」データベース公開
    岡田一祐北海学園大学人文学部
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第27回
    文化遺産のデジタル化がマイノリティ・コミュニティにもたらすもの:少数民族ヌビア人と Nubia Fest2020
    宮川創関西大学アジア・オープン・リサーチセンター「KU-ORCAS」
  • 人文情報学イベント関連カレンダー
  • イベントレポート「「第124回人文科学とコンピュータ研究会発表会」参加報告
    北﨑勇帆高知大学人文社会学部
  • 編集後記

《巻頭言》「上座部仏教文献研究におけるデジタル化の問題点:コンコーダンスとデジタルテクストに注目して

青野道彦一般財団法人人文情報学研究所研究員

文献研究において、テクストのどの箇所にどの語句があり、それがどの様に用いられるのかを知ることはきわめて重要である。コンコーダンス(語句索引)とは、それを知るためのツールの一つであり、厳密な文献研究の土台となっているものである。

コンコーダンスと言えば、聖書のそれがよく知られており、これまでに原典及び各国語訳について数多くのものが作成されている。その影響は上座部仏教文献[1]の研究にも及んでおり、例えば、上座部仏教の聖典である三蔵[2]のコンコーダンスPāli Tipiṭakaṁ Concordance は『欽定英訳聖書』に対する Alexander Cruden のCruden’s Concordance to the Holy Scripturesを模範として作成されたとされる[3]。しかし、近年、聖書学の分野ではデジタルテクストを搭載した Accordance や Logosなどのデスクトップアプリケーションが開発され[4]、コンコーダンスの代替機能がそこに取り込まれたことで、研究者がコンコーダンスを参照する機会は殆どなくなったという[5]。

勿論、これは上座部仏教文献研究においても窺える傾向ではあるが、聖書学とは異なり、デジタルテクストが従来のコンコーダンスの学術的価値を無化してしまう状況には至っていない。この背景には、上座部仏教文献のデジタル化の沈滞があることが明らかである。以下では、デジタルテクストとコンコーダンスの現状を分析しつつ、上座部仏教文献研究が抱えるデジタル化の問題点を指摘し、望まれる解決のあり方について私見を述べたい。

デジタルテクストの現状

上座部仏教文献研究では Pali Text Society(PTS)版、タイ王室版、スリランカ版二種(Simon Hewawitarne Bequest(SHB)版、及び、Buddha Jayanti 版)、ビルマ第六結集版という五種の版本が主に用いられる。これらのうち PTS版は学術的利用を目的に作成された唯一の版本であり、研究上の標準テクストとなっている。しかし、校訂作業及び校正作業に問題があるため、タイ王室版以下の諸版本と比較して、異読を確認することが定石となっている。

これらの諸版本のうち、SHB 版を除く四種の版本についてデジタルテクストが作成されており、以下でそれらの現状について簡単に説明したい。先ず、PTS版のデジタルテクストは、インド学仏教学関連のデジタル資料のプラットフォーム Göttingen Register of Electronic Texts inIndian Languages(GRETIL)で公開され[6]、Text in original PTS layout, withnotes(原資料のレイアウトを保ち、アパラタスが載るもの)と Plain floating text, withoutnotes(行末のハイフネーションは解除され、アパラタスが省略されたもの)の二種類のデジタルテクストをダウンロードすることができる。全文検索をする上でより有用なのは後者であるが、検索時には、文字の表記法がテクスト毎に異なる点、更に同一テクスト内でも一貫していない点に留意する必要がある。例えば、「サンガ」(仏教教団)は“saṅgha” と “saṃgha” の二通りに表記され、“api” と “ekacce” の連声形は “appekacce”, “appekacce”, “app’ ekacce”の三通りに表記される。これらは紙媒体で出版された原資料に由来するものであるが、この点を考慮しなければ、検索漏れが生じることになる。ただし、三蔵だけで56冊にのぼる PTS版の表記法の揺れを網羅的に把握することは容易ではない。また、PTS版の一部テクストには誤字、脱字、衍字、誤植等が散見され、それらによっても検索漏れは生じる。そのため、検索結果に誤差が生じることを承知の上で利用するのが安全である[7]。

次に、タイ王室版のデジタルテクストは84000.orgで公開されている[8]。パラグラフの構成が1920年頃に出版された第二版と同じであることから、それをデジタル化したものであると推定される。専用のデスクトップアプリケーションやウェブアプリケーションは用意されておらず、ウェブブラウザー上で数パラグラフ分のデジタルテクストを表示できるのみであり、全文検索の機能もない。

続いて、Buddha Jayanti 版のデジタルテクストは METTANET-LANKAで公開されている[9]。デスクトップアプリケーションやウェブアプリケーションは用意されておらず、ウェブブラウザー上でテクストの一部分のデジタルテクストを表示できるのみで、全文検索の機能もない。

最後に、ビルマ第六結集版のデジタルテクストは、インドの Vipassana Research Institute により作成され、デスクトップアプリケーションとしてChaṭṭha Saṅgāyana Tipiṭaka ver.4.0が整備されている[10]。ワイルドカードまたは正規表現を選択し、検索対象のテクストを絞り込むなどすることで、細かい検索ができる[11]。また、原資料の表記法が全体的に統一されており、全文検索を効率的に行うのに適している。この様な利点があるため、上座部仏教文献の研究者の多くがこのアプリケーションを日常的に用いている。しかし、論文での引用参照時には、研究上の標準テクストであるPTS 版に立ち返ることが必要となる。

以上のデジタルテクストは上座部仏教文献研究において欠かせない資料となりつつあるが、紙媒体の原資料に取って代わる段階には未だ至っていない。その大きな要因の一つが誤入力である。例えば、ビルマ第六結集版のデジタルテクストでは、ビルマ文字で似通っている“k” と “t”が入れ違っている場合がまれにある。デジタルテクストが原資料に完全に取って代わるためには、どのくらい原資料に忠実であるのか、その点に関する実証的な調査が必要であろう。

コンコーダンスの現状

上座部仏教文献のコンコーダンスは全て PTS 版に基づくものである。テクスト毎に作成され、用例の出現する巻数、頁数、行数が示される。PTSまたは中央学術研究所より出版され、中央学術研究所から出版された分については PDF を研究所のホームページからダウンロードすることができる[12]。

コンコーダンスの作成は100年以上前に始められたが、コンピュータで生成されるようになったのは1995年以降である。インデクシングはこれまでより大規模かつ正確に行われるようになり、新たに作成されたコンコーダンスにより旧来の網羅性を欠くものは徐々に駆逐されていった[13]。

ところで、この新しいコンコーダンスが作成され始めた頃、デジタルテクストも整備が急速に進められていた。中でもタイ王室版は早くも1988年に入力が始められ、1994年にはBudsir on CD-ROM: The Buddhist Scriptures Information Retrieval(Bangkok:Mahidol University Computing Center, 1994)として出版されている。続いて、PTS 版のデジタルテクストが1996年にPalitext Version 1.0: CD-ROM Database of the Entire Buddhist PaliCanon(Bangkok: Dhammakaya Foundation, 1996)として出版され、翌年にはビルマ第六結集版のデジタルテクストがChaṭṭha Saṅgāyana Tipiṭaka CD-ROM(Igatpuri:Vipassana Research Institute, 1997)として公開されている。

この様にデジタルテクストが相次いで公開される状況において、新たにコンコーダンスの作成が始まったのであるが、当時、コンコーダンスとデジタルテクストとが競合する状況は顕在化しなかった。それは、デジタルテクストが日本語版Windows に標準対応していなかったり、Unicodeに対応していなかったりして、使い勝手がまだ悪かったためであると考えられる。しかし、その後、デジタルテクストの抱える問題が徐々に解消されていき、利便性が高まった。また、それを用いる研究者の方も世代交代が進み、デジタルテクストの価値を積極的に認める傾向が強まった。その結果、デジタルテクストの利用が進み、コンコーダンスはかつてほど使われなくなった。

しかし、上座部仏教文献研究において、コンコーダンスの存在意義はまだ失われていない。1995年以降に出版されたコンコーダンスは、原資料の翻刻であるデジタルテクストの全文検索では見落としてしまう用例も挙げているからである。例えば、原資料において誤植により“āgacchanti” が “agacchanti”となっている例では、デジタルテクストもそれを受け継いでいるため、前者を全文検索しても、後者はマッチしない。しかし、新たに作成されたコンコーダンスにはその様な用例も加えられており、単純な全文検索ではマッチしない用例についても見出すことができるのである[14]。

コンコーダンスとデジタルテクストの連携の必要性

上座部仏教文献研究においてコンコーダンスは未だに有用であるが、その利用には大きく二つの課題が存在する。

一つは、コンコーダンスがユーザーフレンドリーなものでない点である。コンコーダンスはテクストの該当箇所を確認するために用いるものであり、最終的にはテクストを参照することが必要となる。KWIC索引であれば、気になった一部の用例についてのみテクストを確認すれば済むであろうが、現在のコンコーダンスには用例の所在しか示されていないため、全ての用例についてテクストを直接確認する必要がある。しかし、その作業量は語句によっては膨大なものとなる。現在、三蔵を網羅したコンコーダンスの作成が進められており[15]、それを利用する場合、より一層の負荷がかかるであろう。三蔵の総索引ができるという喜びと共に、その予想される膨大さに身の縮む思いがする。宝の持ち腐れにしないためには、それを利用する負荷を軽減する仕組みを作ることも必要であろう。

もう一つは、コンコーダンスが依拠するテクストの多くが再校訂を必要とするものである点である。言うまでもなく、コンコーダンスの価値は収集対象のテクストの評価に大きく依存している。テクストが学術的に高く評価され、研究者の信頼を得ている場合、それに基づき作成されたコンコーダンスも価値の高いものとなる。一方、テクストの信頼性が低い場合、コンコーダンスの価値も低いものとなる。PTS版のテクストで学術的評価の高いものは Oskar von Hinüber と K. R. Norman が校訂した Dhammapada(Oxford:PTS,1995)などわずかである。多くのテクストは一部の国・地域に伝わる、わずかな写本に基づいて制作されており、また、一部のテクストはアジアの版本の折衷版であったり、アジアの版本のローマ字転写版であったりする[16]。将来的に再校訂を必要とする版本ばかりであるが、現在のコンコーダンスはそれらに基づき作成されたものである。現在、テクストの再校訂が少しずつではあるが進められており、その進展に伴い既存のコンコーダンスは劣化していくことになる。テクストの更新と同時にコンコーダンスも更新される仕組みが求められよう。

以上の様な課題が現在のコンコーダンスにはあるが、これらを解消する上で最も有効な方策は、コンコーダンスとデジタルテクストとを連携させることであると考えられる。

デジタル知識基盤の整備の必要性

デジタルテクストとコンコーダンスの連携の必要性について述べたが、本来、この連携は PTS 版のデジタルテクストを適正化することで自ずと実現されるものである。しかし、過去20年間、PTS版のデジタルテクストの適正化はまったく進展していない[17]。この間、聖書学においては、Accordance や Logosなどのデスクトップアプリケーションが整備され、そこにギリシア語新約聖書の標準テクストであるネストレ・アーラント版の最新版が搭載され[18]、写本・辞書・文法書・二次文献などとの連携もなされた。恐らく、これを模範として、標準テクストであるPTS 版を搭載した上座部仏教文献のデジタル知識基盤が整備されるべきなのであろう。現在、研究者の間では ChaṭṭhaSaṅgāyana Tipiṭaka ver.4.0が全文検索システムとして広く用いられ、また諸辞書を搭載し、テクスト解読をアシストするツール Digital PāliReader[19]の利用が進んでいるが、その背景には上述の様なデジタル知識基盤の整備を求める声の高まりがあるものと筆者は考える。

[1] 上座部仏教とは、スリランカ及び東南アジアの諸地域に伝わる仏教である。その聖典及び注釈文献は中期インド・アーリヤ語に属するパーリ語で記されている。
[2]三蔵は律蔵・経蔵・論蔵の三部分からなる。ビルマ第六結集版に基づくと、律蔵は2,260頁、経蔵は782頁、論蔵は4,941頁であり、三蔵全体で7,983頁である。1頁あたりの単語数は200強であり、仮に1頁の単語数を200として数えると、総単語数は約159万である。その数はギリシア語新約聖書の少なくとも11倍である。
[3] 佐々木現順「英国Pāli Text Society の近業素描:特に Pāli TipiṭakaṁConcordance」(『大谷学報』33 (4)、1954)68–71を参照)。なお、PāliTipiṭakaṁ Concordance の編纂事業は1984年に第3巻第6部が出されたのを最後にとん挫した。
[4] Accordance 及び Logos については、宮川創「聖書学とデジタル・ヒューマニティーズ:聖書研究ソフトウェアの現状」(『人文情報学月報』85(前編)、2018年8月)を参照。
[5]本稿を執筆するにあたり、ブランダイス大学で聖書研究をしている知人の金聖天氏(博士候補生)に聖書研究におけるデジタルテクストとコンコーダンスの現状について伺った。
[7] 最近、東京大学史料編纂所の渡邉要一郎特任研究員が、GRETIL で公開されているパーリ語テクストを用いて、Pali Text Searcherという検索システムを開発した(https://scrapbox.io/utdh/Pali_Text_Searcher [accessed 19 Aug.2020])。検索対象の語句が載る一文が提示されるので、文脈を把握するのに有用である。詳細については、渡邉要一郎・永崎研宣・大向一輝・下田正弘「Pali TextSociety 版パーリ語文献を対象としたテキスト検索システムの構築」(『研究報告人文科学とコンピュータ(CH)』2020-CH-124 (4)、2020)1–4を参照されたい。
[8] https://84000.org/tipitaka/ [accessed19 Aug. 2020].
[9] http://metta.lk/tipitaka/index.html [accessed 19 Aug. 2020].
[10] https://www.tipitaka.org/cst4[accessed 19 Aug. 2020].
[11] このアプリケーションは Windows OS にのみ対応している。
[12] https://www.cari.ne.jp/MyanmarPJ/EngH.html [accessed 19 Aug. 2020].
[13] ただし、一緒に収録されている固有名詞等のインデックスは未だ有用であるので、現在も旧来のコンコーダンスは販売されている。
[14] 山崎守一「PTS テキストの陥穽:ヴィナヤの語彙索引作成を通して」(『印度学仏教学研究』45 (1)、1996)394–390及び K. R.Norman, “Review of Index to the Vinaya-piṭaka, compiled by Y. Ousaka, M. Yamazaki, K. R. Norman” (Buddhist Studies Review 14 (2), 1997)188–189を参照。
[15] 西康友・逢坂雄美「全パーリ聖典総語彙索引作成の研究:パーリ文献協会編纂文献に基づいて」(『中央学術研究所紀要』47、2018)137–149を参照。計画では2020年度中に完成する予定とあるが、既に2019年4月に Word Index to the Pali Tipitaka andOther Pali Texts(ver 1)が中央学術研究所のホームページ(https://www.cari.ne.jp/MyanmarPJ/EngH.html [accessed 19 Aug.2020])で公開されている。
[16] K. R. ノーマン(山崎守一訳)「パーリ研究の現状と今後の課題」(『中央学術研究所紀要』24、1995)9–13を参照。
[17] 20年以上前に DhammakayaFoundation がデジタルテクストを作成しているにもかかわらず、PTS はそれを土台にした上座部仏教文献研究のデジタル知識基盤の整備についてこれまで何ら有効な指針を示してこなかった(下田正弘・永﨑研宣「デジタル学術空間の作り方:SAT 大蔵経テキストデータベース研究会が実現してきたもの」下田正弘・永﨑研宣編『デジタル学術空間の作り方:仏教学から提起する次世代人文学のモデル』(文学通信、2019)134 (n. 8) を参照)。

執筆者プロフィール

青野道彦(あおの・みちひこ)。東京大学大学院人文社会系研究科博士課程修了、博士(文学)。2020年4月より現職。専門は上座部仏教文献、特に戒律文献の研究。
Copyright(C) AONO, Michihiko 2020– All Rights Reserved.

《連載》「Digital Japanese Studies寸見」第66回

「植民地朝鮮の日本人宗教者」データベース公開

岡田一祐北海学園大学人文学部講師

今回は、前回[1]の補足と、標題のデータベースの紹介を行いたい。

前回取り上げた「1945ひろしまタイムライン」は、NHK広島放送局の対応の問題や、そもそもの取り組みが構造的に抱える問題が執筆後もさまざまに指摘されており、ひとこと触れておくべきであろう。

「1945ひろしまタイムライン」がどのように運用されていったのか、前回の連載では説明が不足していた。朝日新聞の取材によれば[2]、これらの tweetの内容は、複数名の高校生と協力して案文されたものであるという。また、同紙によれば、NHK広島放送局の主張と異なり、日記の書き手からこのような手法に対してじゅうぶんな理解を得られていなかったこと、本人の考えとも異なることが明らかになっている[3]。tweetを使って、再現劇として行うことは新鮮であるという指摘もあるが[4](なお肯定的なもののみではない)、[2]の北村紗衣氏の指摘にもあるように、再現劇としての編成がじゅうぶんであったか考える余地は十二分にあるように思われる。

そこでの NHK 広島放送局の対応の問題は、そのような構造的問題などを認めない、表面的な謝罪に終止する点である。なお、NHK広島放送局は、なんらかの対応を行うとの発表はしたものの、現在も問題の tweet に直接の対処を行っていない。

つづいて、金泰勲氏が、おそらく2020年9月14日から、「植民地朝鮮の日本人宗教者」というデータベースを公開している[5][6]。これは、氏が代表者である科学研究費プロジェクトの成果物のひとつで、標題のとおり、日本植民地時代朝鮮半島に渡って、行政に届け出をした日本人宗教者について網羅的に取り上げたもののようである。

解説のたぐいはなく、網羅性やデータベースとしての完成度については不明であるが、各種デジタルライブラリなどで公開されている資料をもとに宗派・宗教者ごとに整理し、それぞれ行政で記録された内容と、出典との対応を記録している。また、神社や祠の一覧、布教活動拠点一覧、年表、布教活動拠点の現況調査や、韓国国家記録院所蔵の朝鮮総督府宗教関係文書の細目へのリンクも備える。

まだ公開されたばかりで、まだまだ記載は増えてゆくものと思われるのであるが、2020年9月18日時点での更新では、29宗派(真宗のみ各派まで分かれる)、法相宗などのひとりのみのところから、天理教の618人まで、計3149人ほどが登録されている。現状公開されているのは行政での記録であるため、基本的には届け出の内容に限られる。天理教の則元菊次郎という人物を例に取ってみると[7]、布教届が出されたのはいつで、住所はどこか、また出典[8]がなにかなどのことがらがことこまかに記載されている。規模といい、詳細さといい、植民地時代朝鮮での日本人宗教者布教史としては逸せないデータソースとなることであろう。

ただし、データベースとしての作りに難がないとはいえない。データベースソフトが用いられていないことはそこまでの問題ではないが(ただ、これ以上大きくなったときに管理が大変になるだろうとは思われるところである)、情報の相互リンクが不十分であることや、布教活動拠点一覧が電子テキストではなく画像であるのは残念なことである。また、これはデータベースソフトを用いないゆえの限界でもあろうが、せっかく情報源が明記されているのにデジタル・コレクションで公開されている原資料へのリンクがなかったり、ページごとの構成がすこしずつ変わってしまっていて、情報処理が複雑になってしまうなどのことがある。これらの点は一個人に望むこととして望外のことではあろうが、このような点に注意していくことで使い勝手や今後の展開の可能性が大きく変わってくるのではないかと思うのである。

いずれにせよ、伝統的な人文学研究における蓄積の力をおおいに感じさせてくれるデータベースである。

[1] 拙稿「過去とデジタル展開」(『人文情報学月報』109号)。
[2] 戦争企画、複眼的視点でこそ「差別助長」と批判、NHK 広島の SNS が問うもの:朝日新聞デジタル https://digital.asahi.com/articles/DA3S14623402.html
[3] 「シュン」の日記主、NHK に不信感 認識に食い違い:朝日新聞デジタル https://digital.asahi.com/articles/ASN956TL5N91PITB01J.html
[4] ひろしまタイムライン、趣旨は新鮮だが…安田菜津紀さん:朝日新聞デジタル https://digital.asahi.com/articles/ASN9G5HD9N8TUCVL01W.html
[5] 植民地朝鮮の日本人宗教者 https://www.jrpkc.org/
[6] 週刊アップデート項目|植民地朝鮮の日本人宗教者 https://www.jrpkc.org/%E9%80%B1%E5%88%8A%E3%82%A2%E3%83%83%E3%83%97%E3%8...
[8]ここでは『朝鮮総督府官報』が出典とされ、1292-2という番号が示される。号数とページ番号かと思うが、リンク先に示される韓国国立中央図書館デジタルコレクションの操作方法が分からないので、確かめられなかった。
Copyright(C) OKADA, Kazuhiro 2020– All Rights Reserved.

《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第27回

文化遺産のデジタル化がマイノリティ・コミュニティにもたらすもの:少数民族ヌビア人とNubia Fest 2020

宮川創関西大学アジア・オープン・リサーチセンター「KU-ORCAS」ポスト・ドクトラル・フェロー

エジプト最南部・スーダン北部のナイル河谷は古来ヌビア地方と呼ばれ、牧畜民であるヌビア人が暮らしている土地である。彼らは、エジプトにファラオを頂点として君臨する王国があった時代からこのヌビア地域に住んでいる。ヌビア人たちは、ナイル・サハラ語族という主にアフリカの中央部分に分布する諸言語の一つであるヌビア諸語を話す。諸説はあるが、古代のこの地方に君臨し、一度はエジプト第25王朝としてエジプトを支配したクシュ王国、そしてメロエ王国は、このヌビア諸語を話す民族、もしくはそれに近い民族が担い手となっていた可能性が高い。実際、メロエ語学者の Claude Rilly は、メロエ王国を中心にメロエ文字で書かれたメロエ語はヌビア諸語の傍系だとする[1]。中世には、キリスト教化され、中世ヌビア3王国、すなわちノバティア王国、マクリア王国、アロディア王国がこの地に君臨した。彼らは、自分たちの言語であるヌビア語を、キリスト教の布教とともに入ってきたコプト語のコプト文字にメロエ文字3文字を足したヌビア文字で書いた。彼らの言語は古ヌビア語と呼ばれ、様々なキリスト教文献を残した。彼らのほとんどはその後イスラーム化されたが、彼らは現代のエジプト・スーダンで少数民族として暮らしている。

1970年、彼らのうち北部地域に住む人々に大打撃を与える事件があった。アスワンハイダムの建設によるナセル湖の形成である。これによりその地に住んでいた多数のヌビア人たちは住む場所を追われ、コム・オンボやカイロやアレクサンドリアやスーダンの一部地域などに移住した他、エジプト政府が急ごしらえで近隣につくった村に移住させられたものも多い[2]。このナセル湖の形成で水没したヌビアの遺跡は数知れず、ダム建設直前の緊急発掘で保護されたものもあるが、大量の古ヌビア語の文献が失われたものと思われる。例えば、カスル・イブリームは、数多くの文献が出土した遺跡だが、現代はそのほとんどが水に浸かり、頂上部分だけが湖面から突出しているに過ぎない。パピルス文書、オストラカ文献、羊皮紙文献およびそれらの上に文字を書いたインクは水に弱く、未出土の文献はほとんどがもう文字の判別が不可能な状態に陥ってしまっていると思われる。

図1:Nubia Fest 2020の Facebook ページ[3]。ここでほとんどのセッションの録画を視聴することができる。

9月13日から19日にかけて Nubia Fest が開催された[4]。これは全てウェブ上で行われ、Facebook(図1)やYouTube[5]でライブでおこなわれ、録画もアーカイブされ、いつでも視聴できる。ライブ配信で用いられたブロードキャストプラットフォームStreamYard[6]は、ニュース番組のようにテロップを使うことや画面にロゴを入れることができ(図2)、非常に臨場感あふれる中継ができるようである。Zoom 画面をStreamYard を通して各種メディアに配信を行うこともできる。日本ではあまり知られていないかもしれないが、使用が広がるのではないかと思う。

図2:StreamYard を使用した配信の例。Nubia Festで中世ヌビア関連のデジタルプロジェクトについてインタビューを受けている筆者。インタビュワーは主催者の1人で米国在住のヌビア人 Mazin Elyas。

主催者は、米国に住むヌビア人、エジプトに住むヌビア人とヨーロッパのヌビア学者である。ヌビアの歴史、ヌビアのデジタルプロジェクト、ヌビア人の人権、社会、政治、経済など様々な観点からのセッションが行われた。ヌビア人は大部分のエジプト人よりも肌が黒く、アメリカ合衆国の人種概念で言えば黒人であり、現代エジプト社会でも偏ったステレオタイプがもたれ、差別がある。現代アメリカ合衆国を中心に活発になっているBLM(Black Lives Matter)運動は、アメリカに移住したヌビア人はもちろん、エジプトで差別を受けているヌビア人に影響を与えており、今回の Nubia Festでもこの運動と関連してヌビア人の人権に関する活発な議論があった。その他、現代のエジプト映画におけるヌビア人のステレオタイプ(大抵は同じような名前の召使の役)に関するセッション、ケニアにおけるヌビア人に関するセッションなど様々なセッションがあった。このフェストでは、事前にホームページを通して申請すれば、誰でも自由にセッションが開くことができ、非常にパブリックに開かれたものであった。

筆者は古代末期および中世のエジプトとヌビアのデジタルヒストリーに関連したコプト語および古ヌビア語文献のデジタル化に関する発表を行った。現在中世ヌビアやその歴史を調べるには、地名ならPleiades[7]、文献カタログなら Trismegistos[8]がある。しかしながら、古ヌビア語には、コプト語テクストの多機能ツール付きコーパスである CopticSCRIPTORIUM[9]、ギリシア語・ラテン語テクストのコーパスであるPerseus[10]のようなウェブ・コーパスがない。しかし、最近、筆者の古ヌビア語のコーパス作成を含む研究計画が科研費の「研究活動スタート支援」に採択された(2020–2021年度)。この計画の中で、筆者は、古ヌビア語研究の第一人者のVincent van Gerven Oei[11]の協力のもと、古ヌビア語コーパスを作成する予定である。テクストの方は、van Gerven Oei が2020年 Peetersから出版する予定の古ヌビア語文法のために、大部分はデジタル化されている。語釈や品詞などをマークアップし、ウェブ上で視覚化する予定である。

最初は Coptic SCRIPTORIUM のようにベルリン・フンボルト大学が開発したウェブコーパスのプラットフォームであるANNIS[12]を用いる予定であったが、ANNISは言語学者向けに特化しており、コーパス分析や検索には特別なクエリ言語を覚えないと十分に活用することはできない。そのため、まずは、誰でも使うことができるようなシンプルなウェブコーパスを作成する予定である。古ヌビア語は、コプト文字に3つのメロエ文字を足したヌビア文字で書かれているが、この新しい古ヌビア語コーパスでは元資料の文字と共にラテン文字による転写も表示する。また、leizpig.jp[13]などを使って、LeipzigGlossingRules[14]を用いた言語学で一般的なグロスも表示する予定である。一般に、ヌビア人は、アラビア語に押されつつある現代ヌビア諸語の復興運動、そして古ヌビア語の保存に熱心であり、インタビューでこの計画を話したところ、SNSなどで非常にたくさんの賛同の声が聞かれた。

古ヌビア語の文献は第一に、ヌビア人の文化遺産であり、主に欧米を中心とする学者に見てもらうためにウェブコーパスを作るのではなく、文化遺産の継承者であるヌビア人を第一の顧客として、ウェブコーパスを作るべきであることを学んだ。協力者のVincent van Gerven Oei は元々そのような態度であり、彼のコーパスをウェブで誰もが使いやすい形でパブリックに開かれたコーパスにすることに賛成している。今回のNubia Fest では、DH関係では他に、ヌビア地域の修道院をバーチャルに再現するプロジェクトの発表もあった。これも、専門家の研究に資するだけでなく、誰でも見て楽しめるようなプロジェクトであった。今回のNubia Fest は、誰のために文化遺産をデジタル化するのか、という問いに対して明確な答えを見つけられた良い機会であった。

[1] Claude Rilly, “Meroitic,” UCLA Encyclopedia of Egyptology 1, no. 1 (2016),accessed September 18, 2020, https://escholarship.org/uc/item/3128r3sw.
[2] 「エジプトのヌビア人、再定住はかなうか」National Geographic, 最終閲覧日2020年9月18日, https://natgeo.nikkeibp.co.jp/nng/article/news/14/8851/.
[3] “Nubia Fest @nubiafest2020,” Facebook, accessed September 18, 2020, https://www.facebook.com/nubiafest2020.
[4] “Nubia Fest 2020,” accessed September 18, 2020, https://nubiafest.unionfornubianstudies.org/.
[5] “NubiaFEST 2020,” YouTube, accessed September 18, 2020, https://www.youtube.com/channel/UCBWvuYvOFqtkQpfEWgHF2Hw.
[6] StreamYard, accessed September 18, 2020, https://streamyard.com/.
[7] Pleiades, The Stoa Consortium, accessed September 18, 2020, https://pleiades.stoa.org/.
[8] “Trismegistos Home,” Trismegistos, accessed September 18, 2020, https://www.trismegistos.org/index.php/.
[9] “Coptic Scriptorium: Digital Research in Coptic Language and Literature,” CopticSCRIPTORIUM, accessed September 18, 2020, https://copticscriptorium.org/.
[10] Perseus Digital Library, accessed September 18, 2020, https://www.perseus.tufts.edu/hopper//.
[11] Vincent W.J. van Gerven Oei, philologist at large, accessed September 18, 2020,http://www.vangervenoei.com/.
[12] ANNIS, corpus-tools.org, accessed September 18, 2020, https://corpus-tools.org/annis/.
[13] “Leipzig.js: Interlinear glossing for the browser,” Ben Chauvette: Full stackdeveloper at XL, accessed September 18, 2020, https://bdchauvette.net/leipzig.js/.
[14] “Leipzig Glossing Rules,” Department of Linguistics, Max Planck Institute forEvolutionary Anthropology, accessed September 18, 2020, https://www.eva.mpg.de/lingua/resources/glossing-rules.php.
Copyright(C) MIYAGAWA, So 2020– All Rights Reserved.

人文情報学イベント関連カレンダー

【2020年10月】

  • 2020-10-17 (Sat)~2020-10-18 (Sun)
    デジタルアーカイブ学会第5回研究大会
    於・東京都/東京大学本郷キャンパス

    http://digitalarchivejapan.org/5230

【2020年11月】

【2020年12月】

Digital Humanities Events カレンダー共同編集人

小林雄一郎日本大学生産工学部
瀬戸寿一東京大学空間情報科学研究センター
佐藤 翔同志社大学免許資格課程センター
永崎研宣一般財団法人人文情報学研究所
亀田尭宙国立歴史民俗博物館研究部情報資料研究系
堤 智昭筑波大学人文社会系
菊池信彦関西大学アジア・オープン・リサーチセンター

イベントレポート「「第124回人文科学とコンピュータ研究会発表会」参加報告

北﨑勇帆高知大学人文社会学部講師

2020年9月5日、第124回 人文科学とコンピュータ研究会発表会(CH研究会)が、6月開催の第123回に引き続き、オンライン(Zoom)で開催された。参加者は入れ替わりで常に30~40人程度がオンライン。これも前回と同様の規模である。

今回の研究会は、口頭発表が5件と企画セッションが1件。まず、口頭発表5件の概要を紹介しておく。

北本朝展・村田健史「歴史的行政区域データセット β版をはじめとする地名情報基盤の構築と歴史ビッグデータへの活用」は、曖昧性を必然的に内包する「地名」をベースとして情報を統合する方法を検討し、市区町村 IDと代表点を付与することでその解決を図る、「歴史的行政区域データセット β 版」[1]の事例を提示する。

中村覚ほか「源氏物語本文研究支援システム「デジタル源氏物語」の開発における IIIF・TEI の活用」は標題システム[2]構築の事例報告である。IIIF、Omeka S、くずし字OCRなどの既存サービスを組み合わせて「くずし字を読めない研究者にもできる作業」を作ることで「くずし字を読める研究者にしかできない作業」を効率化するという、協同的研究の実践の好例であった。

安岡孝一「形態素解析部の付け替えによる近代日本語(旧字旧仮名)の係り受け解析」は、現代日本語の係り受け解析手法をうまく適用できない近代日本語資料に対して、係り受け解析の前提となる形態素解析部を近代語UniDicなどの現代語以前の解析用辞書に付け替えることにより、解析の最適化を目指す[3]。表記を除けば近代口語が実質的に現代口語とさほど変わらず、近代文語がそれ以前の文語とさほど変わらないことを踏まえると、むしろ、UniDicが関与しない前処理(踊り字や濁点無表記箇所)の扱いの方が課題になるのかもしれない。

渡邉要一郎ほか「Pali Text Society版パーリ語文献を対象としたテキスト検索システムの構築」は、「電子検索が可能なテキストが最善のテキストではない」という、提供される技術と研究の実情との間のズレを解消するために、当該テキストを対象とする検索システムの構築を行う。「使えるもの」と「使うべきもの」が、権利上の問題によってジレンマを生じ得るという点、分野の異なる筆者にも大いに共感するところがあった。

永崎研宣ほか「仏教研究におけるテキスト検索の現状と課題」は標題が示す通り、「SAT大正新脩大藏經テキストデータベース」のこれまでの約10年の総括を行い、研究者向けのデータベース構築特有の問題とその課題について検討する。データベースの構築はその時々の技術に大きく左右されるが、得てして過去の不自由は忘れられがちであり(そういえば、PDFがブラクラ扱いされていたのも遠い過去である)、そういった状況下にあって、このような振り返りの機会は貴重である。

そして、企画セッション「新型コロナ禍における CH研究会研究者の活動:2019年度末から2020年度前期を振り返る」もまた、あっという間に過ぎていったこの半年の記録を、各々の登壇者の立場から振り返る企画であった。

本セッションの登壇者7名は、都市圏から地方まで、情報系から人文系まで、着任初年度から組織の中核まで……と、複数の要素にグラデーションを持つ。そのため、バックグラウンドの異なる研究者が会する研究会ならではの、対照的な所感が見られた。例えば、必修の体育や舞踊研究など、対面的な要素なしでは到底行い難い教育・研究がある(亜細亜大・鹿内菜穂氏)一方で、PCさえあれば研究にはほぼ困らないという場合も多い。PC 購入を新入生に課しているために環境導入にそれほど困らなかった大学がある(高知大・北﨑)一方で、新入生用の推奨PC の調達が間に合わなかったという事例もあった。教員間の情報共有の密度の高さや士気に関して、Microsoft Teams上に20チャネル以上が設けられた支援チームの事例(筑波大・堤智昭氏)や、「情報系の教員が大部分のため、全体的には大変だができなくはないかなという雰囲気」(はこだて未来大・村井源氏)があったという報告は、人文系学部で孤独な戦いを強いられた筆者には心強く、また、内心羨ましくも感じられた。

各人の立場に基づく差異は枚挙に暇なく、言われてみれば当たり前ということも、同僚や、同分野の同年代の研究者と話しているだけではなかなか見えてこないものである。こうした差異に気付かされる一方で、異なるバックグラウンドの中にも共通する問題意識が垣間見えた。以下、2点にまとめて紹介する。

1つは、「オンライン化によって取り残され得る人にどのように対処するか」といった問題。障害学生への情報保障として、従来式のノートテイキングが行えない中で学生スタッフによる文字通訳のシステムをオンライン化した事例や、触覚教材による対応事例(同志社大・阪田真己子氏)が紹介され、その対応の迅速さときめ細かさに舌を巻いた。また、学生支援策(企業協力のもとでZoom 視聴用端末を貸し出すなど)を備える一方で、全教室に Webカメラを設置する、トラブル対応デスクを設けるといった教員サポートも手厚く行うという事例(桜美林大・耒代誠仁氏)もある。桜美林大は当初から対応や情報公開の手際が見事であり、宜なるかなといったところであった。

現状、オンラインにおけるユニバーサル化は模索・途上の段階であり、学習に取り残される学生は見えにくくなって、以前よりもサポートを要する状況になっている。個人的な実感としては、「出ない学生」は以前よりも出てこなくなったし、入学早々躓いている新入生も昨年より多い。多かれ少なかれどの大学も似た問題を抱えているようであったが、特にプログラミングの授業においてはTA の増員で乗り切ったというケースもあった。

一方の教員側にも、オンライン化に対応できる教員とできない教員の間に技術の溝が生まれている。この点、「教員が互助的にサポートすることでなんとか半期が回った」(もしくは回らなかった)という大学が多かったのではないかと推察するが、これは手弁当に頼る限りは、ある種のブラックな性質も孕んでいる。9月初旬現在、後期に向けて、オンラインと対面のハイブリッド型への移行も視野に入れる動きがあるが、その負担のあり方については一度立ち止まって考える必要があるように思う。関連して、非常勤講師の「辛さ」についても多く言及があった。教える側の立場としては、大学との調整や慣れないシステムへの順応に時間を割かれ、招く側の立場としては、非常勤までカバーする形で教員対応を行ったという報告もあったが、多くは「非常勤までは(もしくは常勤も含めて)対応の手がうまく回らなかった」というのが概ねの状況だったのではないだろうか。

もう1つは「オンライン化によって失われるものと新たに得られるもの」について。「大学のオンライン化」についての書かれ方はその多くがセンセーショナルで、現状、大学への風当たりは強いようにも見えるのだが、学生が本当に必要としているのは大学の提供する「場」の方であって、「授業をオンラインでやること」そのものはそれほど無理のあることではない、というのは多くの教員の共通認識であろう。今年度の上半期はどうしても「対面の代替物としてのオンライン」をやらざるを得ないところがあり、それを半期続けるだけでも精一杯であったが、学習の自由度は対面授業に比して高く、(無論、十分なクオリティが担保されていればの話ではあるが、)それと表裏して、内容そのものの理解も対面以上に良いということもある。そこで、「代替物」から一歩進んで、「オンラインならでは」の教育はできないだろうか。北﨑はこの観点から、文献講読の演習において、発表資料の「粗探し」を受講者に先行してフォームに打ち込ませ、それを参照しながら発表を進行するという体裁を取ることで、対面以上の教育効果が得られた事例を紹介した。千葉大・小風尚樹氏は、この状況下で不可能となった全員留学を代替するプログラムとして、学外公開までを見据えたDH の動画コンテンツの作成を行っているという。これもまた、オンラインならではの取り組みと言えよう。

研究面においても、地方大学からは研究会に参加しやすい/学生を参加させやすい、開催側になった研究会の参加者も多いという地方ならではのメリットがあることが挙げられた(村井氏)。Gather[4]上で行われた懇親会では「当日に複数の研究会をハシゴした」という声が聞かれたし、前出の小風氏は同日に発表をもう1件こなしており、タフである。本来、今回の研究会は筆者の勤務校である高知大学で行われるはずだったから、現地開催が叶っていたならハシゴはまず無理であっただろう。参加者をこの地でおもてなしすることができなかったのは大変惜しまれるものの、学会・研究会の開催においてもやはり、必ずしもデメリットだけというわけではないようである。

こうした情報共有と振り返りを行うことによって初めて、半年間をかけて頭に蓄積してきた、ただただ雑多な感触を、教育・研究・大学業務、メリットとデメリット、個別的な問題と普遍的な問題といった種々の側面から整理し、改めて認識し直すことができたように思う。刻一刻と近付く下半期のことを思うとつい顔をしかめてしまいそうになるが、それにしっかりと向き合うための、よい機会が得られたセッションであった。

Copyright(C) KITAZAKI, Yuho 2020– All Rights Reserved.

◆編集後記

今回はオンライン研究会のイベントレポートを一つご寄稿いただきました。この秋にはオンラインでの学会開催もあちこちで行なわれるようになり、もう珍しいことではなくなっているように思われます。研究プロセス全体が徐々にデジタル化へと進むなかで、急にイベント開催の部分だけがデジタルに移され、他のプロセスとどのようにかみ合わせていくのかが大きな課題になってきています。折しも、日本学術会議より「学術情報流通の大変革時代に向けた学術情報環境の再構築と国際競争力強化」という提言が出され、成果の公開・共有の部分がデジタルインフラに移行していくであろうことが示されています。国際ジャーナルの高額化とそれへの対抗としてのオープンアクセスという流れには、自助努力を基本としてきた日本の人文学はやや取り残されてきた感がありますが、そろそろ何らかの形でこういった流れにも対応すべく検討を進めていかねばならない状況になってきているように思います。

(永崎研宣)



Tweet: