ISSN 2189-1621

 

現在地

DHM 107

人文情報学月報/Digital Humanities Monthly


人文情報学月報第107号

Digital Humanities Monthly No. 107

ISSN2189-1621 / 2011年8月27日創刊

2020年6月30日発行 発行数602部

目次

  • 《巻頭言》「人文情報学教育を掲げる卓越大学院プログラム
    石田友梨岡山大学大学院社会文化科学研究科
  • 《連載》「Digital Japanese Studies寸見」第63回
    “Making itcountable”—あるいは、積み上げられるべき成果について
    岡田一祐北海学園大学人文学部
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第24回
    ドイツにおけるデジタル・パブリック・ヒストリーとしてのコロナ・アーカイブの発展
    宮川創関西大学アジア・オープン・リサーチセンター「KU-ORCAS」
  • 特別寄稿「中国・石刻史料のデータベース紹介
    大知聖子:名城大学理工学部教養教育
  • 人文情報学イベント関連カレンダー
  • イベントレポート「オンライン TEI ワークショップ参加記
    王雯璐東京大学東京カレッジ
  • 編集後記

《巻頭言》「人文情報学教育を掲げる卓越大学院プログラム

石田友梨岡山大学大学院社会文化科学研究科特任助教

2019年度に採択された卓越大学院プログラム「アジアユーラシア・グローバルリーダー養成のための臨床人文学教育プログラム」のことをご存知でしょうか。今回の巻頭言では、岡山大学拠点の運営に携わる筆者が本プログラムの紹介をさせていただきます。詳細につきましては、日本学術振興会が公表している本プログラム調書様式1および2(https://www.jsps.go.jp/j-takuetsu-pro/data/saitaku/r1/r1takuetsu_chousho2.pdf)をご参照くださいませ。

本プログラムの掲げる「臨床人文学教育」は、人文学と人文情報学(Digital Humanities2.0)を二本の柱としております。「臨床」という言葉には、人文知を実社会に寄り添うものに刷新するという意味が込められています。一言でいえば、「新しい人文科学を創り、実社会で活躍できる文系博士を輩出していく試み」となるでしょうか。本プログラムには、現代社会の諸課題にリーダーシップを発揮しながら対応できる人材を養成し、これまで研究者養成に特化してきた人文科学の大学院教育の改革を促すという側面があります。社会に役立つ人材となるためには、専門である人文学の深い知識は当然のこととして、その知識を社会に応用できる俯瞰性も必要になってきます。そこで鍵となるのが人文情報学教育です。従来の人文学的手法による史資料調査やフィールド調査に基づいて文化の襞にまで分け入る微視的な視点と、大量のデジタルデータから現れる社会潮流を把握する巨視的な視点を併せもつ人材の養成が目指されています。

さて、本プログラムにおいて習得する人文情報学の基本技法は、社会調査統計分析、多言語対応テキストマイニング、GIS(地理情報システム)の3つです。統計分析やテキストマイニングによって社会動態の傾向を予測する技法を、GISによって可視化される環境変動と社会空間を読み解く技法を身につけることになります。具体的には、博士前期課程において SPSS、R 言語、KHCoder、Python、QGIS を学びます。統計学的知見と統計分析ソフトの使用法の習得、対象言語でのテキストマイニングによる対象地域の社会文化動態の可視化、衛星観測データを R言語等によって直接処理する技法の習得が到達目標となっております。リサーチ・ペーパー(修士論文)提出後、語学能力試験、人文科学の基礎教養と専門知識についての試験、研究計画についての面接審査からなるゲート審査に合格すれば、博士後期課程において統計分析、テキストマイニング、GISの3つのうち2つを利用した研究を行うことになります。それに加え、原則として6か月以上の長期海外滞在型調査と、外国語による成果報告が課せられ、審査されます。これら2回のゲート審査を経て学位請求論文を執筆し、最終公開審査にも合格すればプログラム修了となります。

本プログラムの代表校は、数理・データサイエンス教育の推進校である千葉大学です。そこに長崎大学、熊本大学、総合研究大学院大学、そして本学が連携し、5大学の大学院生が遠隔授業や合同コロキウムによって同時受講していく形となります。さらには、各大学の協定校から海外研究者を招聘した集中講義や、産業界との協働も予定されています。イオン株式会社、JTB総合研究所、千葉銀行などから、寄附講演の提供や海外調査の支援を受けたり、統計分析やテキストマイニングを使用した実際の市場調査を学んだりすることができます。

ここまでお読みいただき、どのような感想をおもちになったでしょうか。大学院生としてプログラムを受講したいという方もいらっしゃれば、うまくいくのだろうかと心配になられた方もいらっしゃることでしょう。筆者自身も期待と不安が入り混じる毎日を過ごしています。新型コロナウイルス感染症の拡大により、プログラム受講生の募集期間と本学の閉鎖期間が重なってしまった時にはどうなることかと気を揉みましたが、記念すべき本学受講生第一号は漢詩を専門とする学生さんとなりました。筆者の専門はイスラーム思想史ですので、漢詩についての専門知識はありませんが、ペルシア語詩との比較という点から一緒に研究できるのではないかと思っております。異なる専門分野とのつながりは、人文情報学の魅力のひとつといえるでしょう。以上、簡単な紹介となりましたが、次回はプログラムの実施状況について報告できればと思います。みなさまには本プログラムを温かくお見守りいただき、ご助言やご支援をいただけましたら幸いです。

執筆者プロフィール

石田友梨(いしだ・ゆり)。京都大学大学院アジア・アフリカ地域研究研究科博士課程修了。博士(地域研究)。専門はイスラーム思想史。思想家たちの学問遍歴を分析する手法として、人文情報学に興味をもつようになる。
Copyright(C) ISHIDA, Yuri 2020– All Rights Reserved.

《連載》「Digital Japanese Studies 寸見」第63回

“Making itcountable”—あるいは、積み上げられるべき成果について

岡田一祐北海学園大学人文学部講師

アジア研究協会(AAS)のブログにおいて、イェール大学の東アジア研究協議会に属して日本近代史を専攻するトリスタン・R・グルノウ氏が2020年6月9日に投稿した内容が話題である[1]。内容としては、北米大陸におけるアジア研究や大学を取り巻く環境という文脈に依存するところがあり、すべてがすんなりと入ってくるわけではないのだが、新型コロナウイルス感染症(COVID-19)の世界的流行に伴う社会的機能の停止の巻き添えをもっとももろに食らうかたちとなった学校を中心とする社会にとっての、デジタル、いな、ネット資源へのこれまでにない依存を受けての論である。グルノウ氏は問う——オンラインに移行した学術の場を支えるネット資源を学術への貢献と認識できているか、と。そもそも、デジタル資源への貢献を十分にわれわれは数えられているのか、と。はたして、10件程度しかダウンロードされていない紙の論文が1000件のリツイートに影響力やパブリック・エンゲージメントで優るのか、と。

それに先だって、やはりイェール大学に属して日本史(中世)を専攻するポーラ・R・カーティス氏がオンライン上で展開していた「日本研究の蘇生」ラウンドテーブル[2]がこのブログ投稿のひとつの契機だったかもしれない(このラウンドテーブルは、2019年の AAS 大会で行われたラウンドテーブル「日本研究の死」をふまえて2020年の AAS 大会で行われるはずだったものを、オンラインで開催したものとのことである)。このラウンドテーブルでは、発起人のエッセイが提示され、それに対して、期間を区切ってコメントを呼びかけ、応答し合ったものである。5月1日から行われ、第2ラウンドまでで終結する予定であったが、このような状況下で十分な時間を取れない参加希望者のために第3ラウンドが設けられ、6月14日に終結した。これじたいは、日本研究の未来のことであるから、デジタル資源の研究評価について触れるコメントも多かったとはいえないが、グルノウ氏の投稿もふまえたカーティス氏による総括では、若手研究者の死活問題として認識されてはいる[3]。

デジタルメディアの研究評価が問われる背景には、ちょうどアメリカにおいて Black lives matter(「黒人の生命も大事」)運動があらためて問われる課題となっているように、研究においても、マジョリティに偏ったものであることへの反省がある。それゆえに、グルノウ氏も言及する AHA のガイドラインには、媒体の如何を問わず、「学術とは、消えることなき結果に関する事柄をめぐる、記録され規律された対話なのである」とされるのである[4]。それゆえに、グルノウ氏は、あまり前提をおかず、Twitter やブログ投稿を業績に数えることを提案し、グルノウ氏は、研究業績にこのブログ投稿をさっそく数え入れている[5]。

東アジア以外では、日本研究が(東)アジア研究の一部に過ぎず、それゆえに文学部日本文化学科なんていうものも日本以外で目にすることはなく、彼我の文脈の差を適切に理解できていないかもしれない。かれらを取り巻く事情もさりながら、「日本研究の蘇生」ラウンドテーブルそのものも、日本にはない討論文化のように思える(それは、日本であまり学術的ブログが成立していないことをあるていど説明するのだろう)。それゆえにこそ、単にマイノリティが正しく評価されるためだけにでなく、Twitter やブログ投稿が業績として評価されうるのだろうと思われる[6]。ひるがえって、日本の現状を思うに、研究成果に対するある種の純粋主義から、翻刻やその他の学術的貢献が貢献とされず[7]、特定の国際雑誌索引を過剰に評価してそこに採録される雑誌への論文投稿数などを競うなどの愚を重ねつつある。抗弁はあろうが、いずれにせよ、他人の貢献を受け止めて学術を発展させていく、そのような対話に乏しい。

そのいっぽうで、デジタル資源を数えられるものにする努力は、すくなくとも日本では、あまり進んでいないように思えるし、今年の DH Awards ノミネート作品を見ても、数えられるように引用形式を整えるものこそ多かったが、それによってデジタル資源である意義を殺いでいるものは少なくないように思われた[8]。Twitter の議論を業績にというのもそうである。反響が価値ならば、トランプ大統領がいちばん価値のある言論をしていることになってしまう。そのような議論の尻馬に乗って、弱者はいつ公平さの利益に浴するのであろうか。Twitter が構造的に10000件のリツイートがあろうとも、10件のダウンロード数の論文にオープンさにおいて欠ける点もやはり目を逸らし得ない。先行研究を尊重した叙述の難しさ、一部のツイートの一人歩き、斜め読みによる議論の交錯など、学術的な対話の場として Twitter には限界がそもそもあり、また、都合の悪い説をかんたんにブロックして終らせられるのは決定的な問題点である。ハラスメントをした著者をコミュニティの成員として追放するのは、その罪科に応じて行われるべきであるが、持説への挑戦を退けるのはそのようなこととは異なるのである[9]。対話の重視があいまいな「全人的評価」を肯定することだけになっても、やはりそれは不幸の再生産だろう。

いずれにせよ、業績と認められるためには、業績として数えあげられるようにしなければならない。その点、さいわいなことにデジタル資源はトレーサビリティを高めやすい。共同研究であれば、編集履歴が GitHub であれ、なにかべつの形であれ、可視化されることがその第一歩なのだろう(なお、ライセンスでいえば、オープンデータは CC BY でも使いにくいという問題があり、引用数を確実に当てにする方法がないことが了解される)。もちろん、非定型的なメディアをどのように評価するかという問題は残るが、それがどう貢献といえるのかは申告者の説明責任の領域であり、それを受けて今後の発展がどう期待できるかをコミュニティとして考えればよいことではあるのだろう。

デジタル資源を業績としてかならずしもカウントしてこなかったのは、けして悪いことばかりでもなかったとは思う。それゆえの自由さはあったであろうから。しかし、それは恵まれた一部の人間のざれ言でもあったのだろう。前職でもデジタル資源に注力する評価方法がとくになかったのは、そのぶん道楽である度合いを高めはしても低めはしなかった(一部の職責のある立場を除いて)。AHA の指針にあるように[4]、責任ある立場の人間がデジタル技術の最前線を注視するよう動かしていくのが、唯一の手段ではあるのだろう。そのためには、デジタル資源をあらためて数えられるものにしなくてはなるまい。

[1] “Making it Count”: The Case for Digital Scholarship in Asian Studies | Association for Asian Studies https://www.asianstudies.org/making-it-count-the-case-for-digital-scholarship-in-asian-studies/.
[2] Embracing the Rebirth of Japanese Studies | Association for Asian Studies https://www.asianstudies.org/embracing-the-rebirth-of-japanese-studies/.
[3] Virtual Roundtable: The “Rebirth” of Japanese Studies, Closing Remarks | Paula R. Curtis http://prcurtis.com/events/AAS2020/PC/.
[4] “[S]cholarship is a documented and disciplined conversation about matters of enduringconsequence.”
Guidelines for the Professional Evaluation of Digital Scholarship byHistorians | AHA https://www.historians.org/teaching-and-learning/digital-history-resources/evaluation-of-digital-scholarship-in-history/guidelines-for-the-professional-evaluation-of-digital-scholarship-by-historians.
[5] https://yale.academia.edu/TristanGrunow.
ただし、これがデジタルでの対話を業績として数えたのか、パブリック・エンゲージメントとして数えたのかは定かではない。
[6] Instructions for Contributors | Association for Asian Studies https://www.asianstudies.org/asianow-blog/instructions-for-contributors/.
AASのブログでは投稿要件を定めて博士号を持った編集者が管理をしている点、学術性は担保されていると言ってよいのだろう。
[7]日本学ではないが、古典ギリシア語資料の本文校訂というきわめて学術的に高度であるはずの積み重ねについて、「貢献が分りにくい」という指摘があったよし、博士論文の審査要旨に記載があった。その本文校訂の質の如何を問う審査能力を持たない審査委員がいたのではないかという危惧もさりながら(まあじっさいそうだったのだろう)、論点のオリジナリティへの冀求という隘路の奥底にたどり着いてしまったことを感じさせもする。
戸田聡(主査)、山田貞三、近藤智彦(副査)「大中幸乃「ゴルギアス『ヘレネ賛』に関する文献学的研究:序文、校訂本文及び注釈」学位論文審査の要旨」 http://hdl.handle.net/2115/54657.
[8] 岡田一祐「DH Awards 2019受賞決定」『人文情報学月報』104(2020年3月)。
[9] David F. Labaree, “The growing and disturbing tendency of grad students to fall into one of twocategories: academic technician or justice warrior (opinion)” | Inside Higher Ed https://www.insidehighered.com/advice/2020/06/18/growing-and-disturbing-tendency-grad-students-fall-one-two-categories-academic.
Copyright(C) OKADA, Kazuhiro 2020– All Rights Reserved.

《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第24回

ドイツにおけるデジタル・パブリック・ヒストリーとしてのコロナ・アーカイブの発展

宮川創関西大学アジア・オープン・リサーチセンター「KU-ORCAS」ポスト・ドクトラル・フェロー

今月は先月から毎週続いているハイデルベルク・デジタル・パピルス学ウェビナーの報告をする予定であったが、今月のウェビナーでの作業も先月報告した内容とあまり変わらなかった。その代わりに、今月は現在発展中のコロナ・アーカイブ、特に、そのうちドイツにおいて最大のものである coronarchiv について、筆者のコロナ危機下のドイツでの経験を挟みながら紹介する。

パブリック・ヒストリーの分野で、現在、新型コロナウイルス感染症である COVID-19が猛威をふるう中での一般の人々の日々の記録のデジタル・アーカイブ化が注目されている。世界各国の取り組みの諸例については、国立国会図書館のカレントアウェアネス・ポータルの記事「国際パブリックヒストリー連盟(IFPH)、世界各国の新型コロナウイルス感染症に関する記録収集の取り組みを Google マップへマッピングするプロジェクトを実施中」(https://current.ndl.go.jp/node/40857[1])を参照いただきたい。筆者が現在勤務している関西大学アジア・オープン・リサーチセンター(KU-ORCAS)も「コロナアーカイブ@関西大学」(https://www.annex.ku-orcas.kansai-u.ac.jp/covid19archive)を運営しており、関大構成員とその家族からの投稿によって、コロナ禍での人々の暮らしの変化の記録が集積されてきている。

筆者は3月までドイツでドイツ研究振興協会の研究員として働いていたが、4月から関西大学アジア・オープン・リサーチセンターでポスト・ドクトラル・フェローの職に就くために、フランクフルト国際空港から、アムステルダム・スキポール[2]空港経由で、関西国際空港行きの便に搭乗した。航空会社は KLM で、3月30日の便を買っていたが、フライトが減らされている現状から早い方が良いと判断し、ちょうど特例で便の変更が可能だったので、28日の便を用いた。

ドイツでは、2月下旬のカーニバルの後、特に西のノルトライン・ヴェストファーレン州で感染爆発が起き、その後も感染者は急増していった。3月の中旬から Corona-Krise「コロナ危機」という状態に陥り、筆者が住んでいたドイツ北西部のニーダーザクセン州最南部にあり、ドイツの地理的中心に近い大学街ゲッティンゲンでも様々な施設がストップし、人々は在宅勤務を余儀なくされていった。

このコロナ危機が引越しの準備と重なったために、非常に苦労を重ねなければならなかった。不動産会社の管理人は筆者の退去に際して、以前の入居者が設置した戸棚や二段ベッドなどを取り除くことを筆者に求めた。通常、市の廃品回収サービスを利用すれば、廃品回収は無料である。しかし、コロナでそのサービスがストップしたため、管理人は半ば強引に不動産会社の子会社の廃品回収業者を雇い、筆者は比較的高額な廃品回収料金を支払った。

3月初旬にケンブリッジで学会もあり、実際にいろいろ引越しにむけて作業ができるようになったのは3月中旬からであった。しかし、実際には様々な施設で手続きすべきものも特例でメールや電話で手続きできたので、その分は時間が省けた。特に、引越し前の1週間以内に行うべき市役所での転出届は全てメールで行え、転出届が必要な電気の解約やスポーツジムの解約なども全てメールと電話で行えた。

筆者は、引越しの準備でホームセンターやスーパーマーケットに行く以外は、自宅から出なかったが、3月中旬から街の店は多くが休業しているようであった。大学も3月17日から封鎖された。ただし、いくつかの料理店でデリバリーサービスが利用でき、大変重宝した。このような非日常の経験は筆者だけでなく、ドイツのほとんどの住民が経験している。このようなコロナ危機で余儀なくされた日々の暮らしの変化をパブリック・ヒストリーとして記録するアーカイブがドイツの様々な機関で運営されている。

その中でも、最も大きなドイツのコロナ・アーカイブはハンブルク大学、ギーセン大学、ボーフム大学が共同で運営している、coronarchiv(https://coronarchiv.geschichte.uni-hamburg.de/)である。coronarchiv はカタカナで書くと「コロナルキーフ」で、Corona コロナと Archiv アルキーフ(アーカイブ)の造語である。ウェブサイト自体は、ハンブルク大学のサーバー上にある。組織的には、このウェブサイトは、ハンブルク大学の人文科学部[3]の歴史学科のうちのパブリック・ヒストリー部門に属している。ホームページのデザインは凡庸なもののシンプルであり、「Karte」からユーザの投稿を見ることができる。2020年6月18日23時18分現在、coronarchiv には、2330の投稿が閲覧できる。ドイツからの2238件の投稿が最多だが、他の国からも投稿があり、日本からも大阪から1件の投稿がある[4]。本稿では、ドイツの投稿から一例を取り上げる。

図1の投稿[5]はこの coronarchiv に投稿されたオブジェクトの一つで、投稿者 Casey の8歳の娘である Elin の在宅授業の「自由記述」の宿題とのことで、新型コロナウイルスと正義の怪物 Quadi が対決し、Quadi がコロナを倒し世界を守る漫画が描かれている。この投稿にはクリエイティブ・コモンズの CC BY-SA 4.0のライセンスが付与されており、適切なクレジットを表示すれば二次利用が可能である。

図1 ハンブルクに住む8歳の少女 Elin による「自由記述」の宿題の coronarchiv に寄せられた投稿(CC BY-SA 4.0, 作成者Casey, https://coronarchiv.geschichte.uni-hamburg.de/projector/s/coronarchiv/item/4702)。

この写真の下には、タイトル、写真に関する説明、ライセンス情報などが書かれ、最後に写真が撮られた場所が地図上に表示されている。

ドイツ語の説明部分の日本語訳は以下である。

説明:我が家の8歳の娘は、ホームスクーリングで「自由記述」という講座にコロナの話題で取り組みました。最初はコロナのことをいろいろたくさん考えていたそうで、祖父母や心臓病の叔母のことを心配していたそうです。だから私たちの会話はいつもコロナの倒し方の話でした。そしてある時、彼女は漫画のようなものを描いていました。

coronarchiv のトップページの結びには「シェアすることはケアすることだ—歴史の一部になろう!」とユーザへ投稿を促す呼びかけがある。coronarchiv は TikTok を含む主要 SNS での広報も盛んに行っており、その結果3ヶ月程で2000以上の投稿が寄せられている。この投稿数は目を見張るものであり、半年後には膨大な数の投稿を有するアーカイブになっているだろう。

coronarchiv 以外にもドイツ語圏では数多くのコロナ・アーカイブが運営されており、https://de.wikipedia.org/wiki/Coronarchiv のページの Ähnliche Projekte und Sammlungsaufrufe のセクションではそれらの内の多くが記述されている。

以上、ドイツのコロナ・アーカイブの先進的な事例に関して述べてきた。コロナ危機で受ける影響は人により様々であり、coronarchiv はそのトップページで「現在を文書化し、後世のために保存することで、この多様性を捉えたいと思います」と述べる。Cornarchiv が主張するように、歴史の転換点となりうる目下の感染症拡大における市井の人々の日常のアーカイブ化は、後世の歴史研究の基盤と大いになり得る。このことはコロナ・アーカイブの重要性を示している。日本でも関西大学の「コロナアーカイブ@関西大学」の例などがあるが、コロナ危機下の日常のアーカイブ化の重要性の認識が日本でも浸透し、今回紹介したようなデジタル・パブリック・ヒストリーの活動が全国的に発展していくことを願っている。

[1] 以下、本稿の全ての URL の最終閲覧日は2020年6月15日である。
[2] 現地語のオランダ語では Schiphol で読み方はスヒップホルに近い。
[3] Fakultät der Geisteswissenschaften.直訳すれば、「諸精神科学の学部」。精神科学(Geisteswissenschaft)はジョン・スチュワート・ミルの『論理学体系』の独訳に端を発し、ヴィルヘルム・ディルタイなどが19世紀前半に広めた用語で、自然科学に対置される、人文学・神学・経済学・法学など、自然科学以外のいわば「文系」の学問を包括する用語である。しかし、Geisteswissenschaftを名称にもつ組織で、人文学の学科のみ、もしくは人文学と神学の諸学科だけを有している場合が、ドイツでは実際に見られる。
[4] Christoph, Leo, Max という3人の投稿者によって投稿された「Bericht aus Osaka, Japan」(日本の大阪からの報告)という名前の音声ファイルである(https://coronarchiv.geschichte.uni-hamburg.de/projector/s/coronarchiv/item/4834)。このうちMax は大阪在住者であり、日本のコロナ危機の状況を伝えている。“Zwei Jahre Ferien” という名前の新型コロナウイルス関連のポッドキャストの一部であり(http://zweijahreferienpodcast.de/)、Christoph とLeo はこのポッドキャストのホストのようである。
[5] Casey という投稿者によって投稿された「Freies Schreiben Hausaufgabe」(自由記述の宿題、https://coronarchiv.geschichte.uni-hamburg.de/projector/s/coronarchiv/item/4702)。
Copyright(C) MIYAGAWA, So 2020– All Rights Reserved.

特別寄稿「中国・石刻史料のデータベース紹介

大知聖子名城大学理工学部教養教育助教

1.はじめに

中国史に関する史料のデータベース化は近年、国内外を通じて活況を呈している。今回は陸続と発見・出版される石刻史料(墓誌・造像銘・石碑など石に刻まれた文字史料)のデータベースについて紹介し、その利点や問題点について、中国・北朝期(4~6世紀)を専門とする筆者が実際に使用した率直な意見を述べたい。

2.中華石刻数拠庫[1]

中国・中華書局の石刻史料データベース。2019年から石刻史料のデジタル化を進め、次々とデータベースを公開している。史料の出土状況・現在の所在・著録などを簡単に紹介し、史料を文字起こしした録文および語釈・校勘などの文字情報と、拓本や原石の写真画像を載せる。このデータベースは著作ごとに4つのパートに分かれる。

2-1.漢魏六朝碑刻数拠庫[2]

石刻史料研究の大家である毛遠明(1949~2017年)の遺著により構成されている。氏は生前に『漢魏六朝碑刻校注』(全10冊、線装書局、2008年)を出版している。これは2007年までに発見された漢魏六朝の石刻史料約1400点を収集するが、その後、新たな石刻史料を増補・改訂して『漢魏六朝碑刻集釈』(2016年)を著した。この遺著は紙媒体では出版されておらず、2466点の石刻史料と3000余りの拓本の画像を収録するデータベースとなっている。画像は拡大縮小のみならず文字の反転機能も備える。

2-2.三晋石刻大全[3]

劉沢民・李玉明など主編。三晋(戦国時代の趙・魏・韓。山西省の別称)地区に現存する、もしくは既に散逸した石刻史料を収録する。原則として山西省の各県ごとに一巻作り、別に山西博物院や五台山などの巻を設け、総計125巻、17242件の石刻史料を網羅する。形式は、簡単な史料紹介・碑文を記載し、拓本・原石の画像を掲載する。誌文の校勘は行っておらず、注釈も無い。画像の反転機能は無い。

2-3.唐代墓誌銘数拠庫[4]

彭興林主編。隋唐五代にわたる墓誌を文献史料や出土史料から集め整理し、12500件以上集めたデータベース。画像の機能は漢魏六朝碑刻数拠庫と同様であるが、誌文の校勘や注釈は無い。

2-4.宋代墓誌銘数拠庫[5]

李偉国主編。五代から元朝までの墓誌について、文献史料では約5000点、金石図書や蔵書家の拓本が約1000点、新しく出版された図書が約1500点、筆者自らが買い集めた拓本が約1300点、計8800点あまりのデータベース。画像の機能は漢魏六朝碑刻数拠庫と同様であるが、誌文の校勘や注釈は無い。

3.中華石刻数拠庫の利点と問題点

このデータベースの最大の特徴は、全文検索により石刻史料の文章や注釈など内容について検索可能になった点である。例えば北朝墓誌の内容について調べる場合、従来は梶山智史編『北朝隋代墓誌所在総合目録』(明治大学東アジア石刻文物研究所、2013年)にて収録先を確認し、図録・論文を購入もしくは図書館などを利用しデータを取るという手法が一般的であった。このデータベースを利用すれば上記の手間が省けるという利点は大きい。もちろん当該時期の全石刻史料を網羅している訳では無いが、目録に掲載されている大部分の史料がカバーできることになる。

ただし問題点も多い。データの流出・盗用防止のためセキュリティを高めており、それが使い勝手を大変悪くさせている。たとえば文字をコピーする場合、まずコピーしたい範囲を選択した後に「複製」を選び、別枠に表示された文字しかコピーできない仕様となっている。この手順を省略してコピー&ペーストすると文字化けする。その範囲選択が一回につき200文字程度、さらに一日にコピーできる上限は5000文字程度と、実用に堪えないほど制限が厳しい。この上限は4つのデータベース各々の文字数ではなく、中華石刻数拠庫内を通しての制限である。そもそも有料アカウント以外から石刻史料のデータ自体が見られないため、ここまで厳しい制限を設ける必要があるのか疑問である。

また、石刻史料を扱う場合、録文は製作者のミスや誤読がある可能性が排除できないため、精読する際には原石の実見調査を行う必要がある。しかし現地調査にはなかなか行けない上に原石は非公開の場合もあるため、次善の策として拓本・原石の画像を参考にする。従って画像の解像度は重要な要素となってくるが、中華石刻数拠庫は画像の解像度が低く、文字の識別に堪えないものもある。また2-2.三晋石刻大全以外は画像の拡大縮小・文字の反転を使い細かく文字が見られる機能を備えているにも関わらず、画像データを変化させる度に一旦バラバラの画像データを読み込んだ後に再構成されるという仕組みになっており、結果として閲覧に時間がかかってしまっている。なお画像を直接コピー&ペーストするとシャッフルされた正しくない画像が表示される。ここでも盗用を恐れる余り、非常にストレスフルな仕様になっている。

以上、石刻史料を使った研究には必須のデータベースであるにも関わらず、使い勝手が悪い点が大変遺憾である。

4.おわりに

中華石刻数拠庫は有用なデータベースではあるが、電子テキストの全文検索ができるだけに留まっており、従来の手作業を代替する便利ツールの範囲を出ていない。これを改善する方向性としては、京都大学人文科学研究所所蔵・石刻拓本資料の無料公開サイト[6]が参考になる。このサイトでは文字拓本ページの文字検索の機能を使えば、ある漢字が実際の石刻史料ではいかなる字形か一覧表示して比較できる。しかも漢字1文字表示だけではなく2文字以上の熟語にも対応している。結果を表示するのに必要な時間も短いうえ、画像データも鮮明である。石刻史料は現在の常用漢字のように字形が統一されていないので異体字を比較検討する作業が必須であるが、この機能を使えば字体が一目瞭然であり非常に有用である。惜しむらくは石刻史料の数量が少ない点である。例えば南北朝時代では846点のみである。仮にこの機能が中華石刻数拠庫にあれば、石刻史料間での字体の比較検討ができ、そのことによって偽刻(偽物の石刻史料)の字体についても明らかにできる可能性も出てくるだろう。

また今後のデータベースの発展としてはメタデータの付与がキーになってくると考えられる。たとえばメタデータを付与して石刻史料の出土地や人物の出身地・年齢・性別などで分析できるツールがあれば、より付加価値の高いデータベースになるだろう。

[1] http://inscription.ancientbooks.cn/docShike/.
中華書局古聯(北京)数字伝媒科技有限公司中華石刻数拠庫。有料アカウントを取得する際には固定 IP アドレスが必要となる。
[2]データベースは日本で申し込む場合、同時アクセスが2つまでの海外特別価格は約60万円、同時アクセスを10までに増やすと約100万円かかる(2020年6月現在、亜東書店調べ、以下同様)。なお書籍の『漢魏六朝碑刻校注』は日本で購入しても15万円前後で入手可能である。
[3]書籍は日本で購入する場合、1冊1万5千円~2万5千円前後となり、全巻揃えると100万円を優に超える。データベースは海外特別価格で約150万円、同時アクセスが10の場合は約250万円かかる。
[4] 書籍は無く、データベースのみ存在する。海外特別価格は約250万円、1ユーザー追加するごとに約5万円かかる。
[5] 書籍は無く、データベースのみ存在する。海外特別価格は約85万円、同時アクセスが10までになると約145万円かかる。なお「宋代墓誌銘数拠庫編制説明」では李偉国自身が詳細にデータベース紹介を行っている。
http://inscription.ancientbooks.cn/docShike/shikeNewsView.jspx?id=1441252.
Copyright(C) OCHI, Seiko 2020– All Rights Reserved.

人文情報学イベント関連カレンダー

【2020年7月】

【2020年8月】

  • 2020-08-31 (Mon)~2020-09-02 (Wed)
    AAS-in-Asia 2020
    於・兵庫県/神戸国際会議場及びオンラインによる開催

    https://aasinasia.org/

Digital Humanities Events カレンダー共同編集人

小林雄一郎日本大学生産工学部
瀬戸寿一東京大学空間情報科学研究センター
佐藤 翔同志社大学免許資格課程センター
永崎研宣一般財団法人人文情報学研究所
亀田尭宙国立歴史民俗博物館研究部情報資料研究系
堤 智昭筑波大学人文社会系
菊池信彦関西大学アジア・オープン・リサーチセンター

イベントレポート「オンライン TEI ワークショップ参加記

王雯璐東京大学東京カレッジ特任研究員

2020年の3月末から5月上旬にかけて、フランス国立科学研究センター(Centre national de la recherche scientifique, CNRS)の Marjorie Burghart 先生の呼びかけで開催されたオンライン TEI ワークショップを受講しました。このエッセイは、参加に至る経緯、ワークショップの内容、そして参加した感想を書きとめたものです。

1. 参加に至る経緯

当初は、2020年6月上旬に、イタリアのベニスで開催される「Digital Scholarly Editions: Manuscripts, Texts, and TEI Encoding」をテーマとするサマースクールに参加する予定でした。コロナウイルスの感染拡大によって世界中でさまざまな活動が中止となり、このイベントもあいにくキャンセルすることとなりました。なお、3月17日の中止通知が送られた二日後、主催者の Burghart 先生からもう一通のメールが届きました。「皆が家に閉じ込められているので、オンライン TEI ワークショップをやりましょうか」とのことでした。この企画は、本来サマースクールに参加する予定の方々のみではなく、広い範囲で参加者を募集していました(Burghart 先生がご自身のツイッターでも情報を共有しています)。

ワークショップに使用する主要な学習材料は、すでに公開されているオンライン講義 “Digital Scholarly Editions: Manuscripts, Texts and TEI Encoding”(https://teach.dariah.eu/course/view.php?id=32)です。参加者は講義動画を視聴し、エクササイズをした上に、週一回オンライン討論会で質疑応答を交わす形式となります。期間は、3月23日から5月1日までの総計6週間で、オンライン討論会は、毎週木曜日パリ時間の夕方6時に予定されていました。「パジャマ姿で、TEI を用いて歴史資料をエンコーディングしましょう」というメールの文言は印象深いものでした(講義動画を視聴する時にはパジャマでも構いませんが、オンライン討論の時はさすがにパジャマの人はいませんでした)。

この頃、私はちょうどアメリカにいました。3月上旬に到着した際には、コロナ情勢はむしろ日本の方が深刻でした。中旬になると、アメリカの感染状況が悪化し、政府は急遽大学閉鎖、外出自粛等々の命令を出しました。日本への帰国はまだ先でしたが、本来の予定や調査研究はすべてできなくなり、時間がだいぶ余るようになりました。実は、その前の2019年度秋学期に東京大学大学院人文社会系研究科で開講された「人文情報学研究」を受講しており、勉強した内容を復習しようとインターネットで検索した上記の講義動画を、その頃ちょうど視聴していました。このように、このワークショップの開催は私にとっては絶好なタイミングでしたので、さっそく参加登録しました。

2. 講義動画

講義動画は六週間の MOOC の形式で構成されています。それぞれの週の内容は、下記の通りです。

  • Week 1 – Introduction
  • Week 2 – Manuscript Transcription
  • Week 3 – Critical Editions and the TEI
  • Week 4 – Critical Editions: Advanced Features
  • Week 5 – Optional Module: Encoding Images
  • Week 6 – Optional Module: XSLT

大部分の内容、とりわけ四週目までのものは、すでに秋学期に受講した授業で触れたので、全体的にフォローしやすい感じでした。講義は、エンコーディングの必要性、XML や TEI とはなにか、といった極めて基礎的なテーマから始まりましたが、個人的にはやはり少し基礎知識のある方に向いていると思いました。講義で取り上げられる例やエクササイズは英語やラテン語のものがほとんどですが、エンコーディングの方法の理解を妨げるものではありませんでした(自分の研究で、ヨーロッパ言語の史料や先行研究を多く利用しているためかもしれませんが)。

私は最初から、講義で指定されたエクササイズではなく、自分の研究で取り扱っている資料を使って課題に取り組みました。17世紀初頭から少なくとも1世紀ほど継続的に出版された、中国語版のキリスト教教理書群『天主教要』です。この題名の書は多数存在しており、しかもすべてに出版年代が明記されているわけではないため、文献間のテキスト相違を明らかにすることや出版時期の前後を判定することが課題となっていました。テキストの間の異同を明らかにするには、校訂テキスト(critical apparatus)のマークアップ手法は有用です。私の目的は、複数の手稿から一つの学術編集版(scholarly edition)を作るわけではなく、むしろ諸テキストの間の異同を明らかにし、その変化のルートを明確にすることでした。そのため、positive apparatus、negative apparatus、そして neutral apparatus の使い分けを説明する一節はとくに役立ちました。結果的に、私は、neutral apparatus のマークアップ方法を使用し、各テキストに見られる相違をエンコーディングすることにして、現在もなお作業を継続しています。

このエッセイを書くために、もう一度講義動画を最初から見直したところ、全体の長さは6時間弱でした。1、2日の集中ワークショップの材料としても使えそうだと思いました。そして、この講義は、音声は英語ですが、フランス語、イタリア語、チェコ語、ロシア語、そして日本語(!)の字幕が付いています。また、無料でアクセスできるデジタル教科書もあります。これらの情報の詳細は、すべて上述の講義動画リンクから確認できます。

3. オンライン討論会

Burghart 先生のメールによれば、今回のオンラインワークショップには約250名の方々が参加していました。世界中から参加者を募集したので、皆それぞれ言語の背景も異なります。そのため、討論会は、イタリア語、フランス語、英語の三つのグループに分けられており、私は英語グループに参加しました。3月26日パリ時間夕方6時(日本時間では3月27日午前2時)に初回のオンライン討論会が行われました。初回には、50~60名の方々が参加したようです。英語グループの参加者は、共有の Google document で書かれている自己紹介をみますと、アメリカやイギリスの機関に所属する方々が半分以上を占めています。アイルランド、ドイツ、デンマーク、イタリア、スペイン、クロアチア、ギリシア、イスラエルからの参加者もいました。八割は博士学位を持つ方または現在博士課程に所属する方ですが、図書館勤めの方やアーキビストの方もいました。

学習者側以外に、担当者の Elena Pierazzo 先生(グルノーブル・アルプス大学)のほか、Elisa Eileen Beshero-Bondar 先生(ピッツバーグ大学)、 James Cummings 先生(ニューカッスル大学(英国))等が、サポーターとして参加されていました。他の回には、随時 TEI や DH 分野で活躍している先生方が「出演」していました。たとえば、最終回では、ピッツバーグ大学の David Birnbaum 先生が参加されました。

議論の進行は、討論会のその場で質問してもいいですし、事前に共有の Google document に書き込むこともできます。Google document に書かれた質問は、随時先生方に返答して頂けますが、重要な質問に関しては、討論会の際に再度提起し話し合うことも多くありました。

先ほど述べた通り、私は講義動画で指定された課題ではなく、博士課程の研究で取り扱う17世紀の中国語キリスト教文献を、講義動画で紹介された方法を使ってマークアップを行っていました。そのため、討論会で課題について議論されると、よくわからないという不便さがありました。ただ、基本的にどんな質問でも聞けますので、自分がマークアップする際に困ったことを、投げてみたりもしました。重要なポイントとして議論で取り上げた質問は、自分がマークする際に使ったエレメントが可視化ツールでうまく反映されない場合、どうすべきかというものでした。私は「note」としてマークしたものが、TEI Critical Apparatus Toolbox(http://teicat.huma-num.fr/index.php)で表示されないので、「note」の代替となるエレメントがあるかと、質問をしました。先生方は、私が既存のツールに合わせようと、エレメントの規定を無視していると誤解されましたため、逆に重要な質問として取り上げられました(さらに、「note」はテキストの一部ではないと強調しましたが、私が「note」としてエンコーディングしたのは割注(割書)の部分なので、漢文圏の資料においてはテキストの一部とみなされます)。結論から言いますと、既存のツールでうまく可視化されるように、セマンティクス(エレメントのルール)を拡大解釈してしまうことは非常に危険であるとのことでした。自分がマークしたものをコミュニティのほかの人と共有する際に、意味が歪められたり、通じなくなったりするからです。最善の策は、自分が適切なツールを作成するか、もしくは、既存のツールに対して修正を加えることです。

また、さまざまな議論を通じて、TEI のエレメントは使うコミュニティの需要に合わせて作られ、そして柔軟に変更を加えられていくものだと実感しました。討論会では、Pierazzo 先生が提案した「Metamark」が話題になり、そして「lb」エレメントを line break から line beginning という説明に変える、という現在進行中の議論も先生方によって紹介されました。

4. その他の雑感

ワークショップの参加は、DH も TEI も素人の私にとって、勉強を続けていくための動機付けを与えてくれました。このワークショップのおかげで、以前から実践してみようと思っていた自分のテキストのマークアップにようやく着手することができました。わからないことはまだ多いのですが、これからも引き続き色々なリソースを利用して勉強していきたいと思っています。

4月の下旬より、勤務先での仕事が段々忙しくなり、時差の関係で夜中の開催もあったため、第4週と第5週のオンライン討論会には参加できませんでした。Zoom の録画をオンデマンドにしてくれたので、後になっても見られたことはありがたく思っています。先生方からはこのようなワークショップは今後も引き続き開催したいと伺いましたが、ぜひ東半球の方の参加者にも配慮して、我々が参加しやすい時間帯にセッティングして頂けたら嬉しいです。

そして、今回のワークショップの参加者については、上述した通り、欧米の研究機関に所属する人がほとんどで、扱う資料も英語やラテン語、ケルト語派のものが多いです(アッカド語、ギリシア語、ヘブライ語、サンスクリット語を扱う方も一人ずついましたが)。講義で取り上げる資料もこれらの言語によるものが多かったため、ほかの言語、とりわけ東アジア言語に応用する際の課題等に関する議論は、ほとんどなされていませんでした。もちろん、これらの言語の資料を扱う方々との交流も重要ですが、東アジアの言語の資料を扱う参加者がもっといれば、あるいは、東アジアの言語の資料に特化したワークショップであれば、さらに議論を深められるのではと思いました。

Copyright(C) WANG, Wenlu 2020– All Rights Reserved.

◆編集後記

今回は海外でのオンラインイベントの参加記をご寄稿いただきました。オンラインなら技術的にはどこでも問題なく参加できるようになる…と思いきや、 むしろ時差の壁は大きく立ちはだかるようになってきているように思えます。東アジア・オセアニアなど、タイムゾーンが近いところは 大丈夫ですが、欧州・中東・アフリカや、アメリカ大陸等は相当の時差があります。現地に移動すれば、そこの時間で活動することについて、日照時間としても 周囲への説明としてもあまり無理なく行なえますが、住んでいるところにいたままでタイムゾーンの大きく異なる会合に参加すると、勤務時間外、さらに 言えば、深夜・早朝に参加することにもなりかねず、しかし、日常生活のリズムをあまり崩すわけにもいかず、ということでかなり難しい状況に なってしまいます。いわゆる三交代勤務をしている人達には常識的なことだと思いますが、 日中は生活音が意外と多く、日中に安眠するには相応の環境を準備する必要があり、また、そのようにして休んでいる時間は自分の仕事は 完全に止まってしまいます。そして、そのようにしてずれた生活リズムを通常に戻すのも、人によってはなかなか難しいことになるでしょう。 また、同居している人がいる場合は、寝ているところを起こさないようにする環境と配慮も必要です。

結局の所、たとえオンラインイベントであっても、海外のイベントに参加するのであれば時差ぼけや睡眠のための休業を考慮せざるを得ず、 航空運賃はかからないものの、もしかしたら、自分や同居人がお互いに安眠するためのホテル代くらいは支出した方がよいのかもしれません。 筆者自身の経験としても、1~2時間程度のオンラインミーティングであれば以前から深夜にもよく参加していて比較的慣れはありましたが、学会の ような比較的長時間の集中を要するイベントには、一度、シカゴ大学での土日2日間のワークショップにご招待いただいて オンラインでフル参加した折に完全に体調を崩してしまって 数日苦しんだことがあり、それ以来、ピンポイントでしか参加しないようになってしまいました。なにしろ、初日と二日目の間に睡眠を取るためには 昼に寝なければならず、2日目(日曜)が終わった時には、もう日本では月曜の朝で、すぐに仕事のメールが飛び交い始めてしまうのです。 もちろん、メールをくださる方々の多くは、こちらが朝まで仕事をしていたことは知りません。こちらとしても、急ぎの仕事のメールが来るかもしれないと 気が気でないので、安心して寝ているわけにもいかない、ということになってしまい、「時差ぼけ」から回復するのに数日を要してしまったのでした。

このような状況を打開し、海外イベントに安定的に参加するためには、勤務体制や参加する環境・睡眠の環境についての 周囲のコンセンサス、そして、それを制度的にフォローするための仕組みが必要になるでしょう。具体的に考えるなら、たとえば、 海外イベントには近所のホテルから参加してホテル代は経費として(科研費からでも)支出する、 土日、自宅からの参加であっても(つまり、ずっと自宅にいたとしても)公務として出張手続きに類する手続きを行ない、代休をきちんととる、といったことに なるでしょうか。すでにそのように体制を組んでいるところもあろうかと思いますが、このようになってくると、オンラインでの国際学会のようなものは、 オンラインだからクリックするだけで距離も関係なく手軽に参加…というオンラインイベントのイメージとはかなり異なったものになりそうです。 今後、雇用する組織の側でもオンライン国際イベントを開催する側でも色々な試みがなされていくのではないかと思いますので、 状況に注目していきたいところです。

(永崎研宣)



Tweet: