ISSN 2189-1621

 

現在地

DHM 099 【後編】

人文情報学月報/Digital Humanities Monthly


人文情報学月報第99号【後編】

Digital Humanities Monthly No. 099-2

ISSN 2189-1621 / 2011年8月27日創刊

2019年10月31日発行 発行数536部

目次

【前編】

  • 《巻頭言》「人文情報学とその先の「何か」へ
    大向一輝東京大学大学院人文社会系研究科
  • 《連載》「Digital Japanese Studies 寸見」第55回
    デジタル、縦書き、そして人文学
    岡田一祐国文学研究資料館古典籍共同研究事業センター
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第17回
    PROIEL: インド・ヨーロッパ語族における古層の諸言語のインターリニア・グロス付きテクスト・コーパスとツリーバンク
    宮川創ゲッティンゲン大学
  • 人文情報学イベント関連カレンダー

【後編】

  • イベントレポート「18世紀研究における DH の広がり:第15回国際十八世紀学会(ISECS 2019)に参加して 第3回:各種ウェブコンテンツの紹介(2)
    小風綾乃お茶の水女子大学大学院人間文化創成科学研究科
  • イベントレポート「JADH2019参加報告(後編)
    小川潤:東京大学大学院人文社会系研究科
  • イベントレポート「TEI2019参加報告(前編):デジタル校訂版出版と関連ツールの利用可能性
    小川潤:東京大学大学院人文社会系研究科
  • 編集後記

イベントレポート「18世紀研究における DH の広がり:第15回国際十八世紀学会(ISECS 2019)に参加して 第3回:各種ウェブコンテンツの紹介(2)

小風綾乃お茶の水女子大学大学院人間文化創成科学研究科博士課程

1. はじめに

2019年7月14日(日)から19日(金)にかけて、エディンバラ大学にて第15回国際十八世紀学会(International Society of Eighteenth-Century Studies)大会が開催された。筆者は18世紀研究におけるデジタル・ヒューマニティーズ(以下、DH)の広がりを概観すべく、8月号より、本大会の参加報告を連載している[1]。

前回に引き続き、本稿では、18世紀研究に役立つウェブコンテンツには現在どのようなものがあるか、学会にて紹介されたプロジェクトに限定した情報を提供する所存である。第2回では印刷物のオンラインコレクションやデジタルライブラリを中心に紹介したが、第3回はそれ以外のウェブコンテンツ、すなわち書簡など非印刷物のデータベースや分析用アプリケーション、ピアレビューサイトについて紹介する。

2. 18世紀研究に役立つウェブコンテンツ(2)

2-1. 書簡を対象とするオンラインコレクション:EE と Correspondence and Other Writings of Six Major Shapers of the United States

書簡を対象としたオンラインコレクションとしては、EE(Electronic Enlightenment)[2]と Correspondence and Other Writings of Six Major Shapers of the United States[3]が紹介された。EE は、ヨーロッパ、アメリカ、アジアの人々を結ぶ、近世期の書簡のオンラインコレクションである。対象時期は17世紀初頭から19世紀半ばで、10232名、79254通の書簡・文書を含み、思想家や学者、政治家、外交官のみならず、肉屋や商人、主婦や召使の考えや関心を見ることができる[4]。一方、Correspondence and Other Writings of Six Major Shapers of the United States は、アメリカ独立期の6名の政治家[5]とヨーロッパ・アメリカに広がる文通相手とに関連する文書、計18.3万件以上を対象に、注釈付きで検索可能なテキストを提供している。

2-2. アレゴリー、自然法のデータベース:Erdteilallegorien, Natural Law 1625–1850

18世紀研究のために紹介されたウェブコンテンツには、これまで紹介してきたように、広く普及していた印刷物やルネサンス以来活発であった書簡ネットワークを明らかにすることを企図したものが多いという印象を持った。印刷物や書簡は、図書館やアーカイブズとの繋がりが深く、デジタル化へのハードルが低いということも理由のひとつであるように思える。

しかし、印刷物・書簡に限らず、デジタル化の波は押し寄せているようだ。学会において紹介された他のデータベースとしては、バロック時代の中・東欧のアレゴリーを集めた Erdteilallegorien[6]や、1625–1850年の自然法学者の生物書誌学的プロフィールをまとめた Natural Law 1625–1850: Database[7]が挙げられる。前者の Erdteilallegorien はマップ、索引、タイムラインからアレゴリーの画像と解説を検索できるようになっている。筆者にとってアレゴリーの読解は専門外のため本データベースの有用性について言及することは避けるが、知識を持ち合わせない人にとって、解説付きで画像を閲覧できることはありがたい。ドイツ語だけでなく、英語にも対応すればユーザはより広がると感じた。なお、本データベースにはサイト運用者が独自に撮影したアレゴリーを掲載しているため、ダウンロードや引用を希望する場合には運用元への連絡が必要な点には注意が必要である。後者の Natural Law 1625–1850 は自然法に関する国際的共同研究の成果物として、各国ごとに担当者が作成したページを集めたウェブサイトである[8]。公開されているデータベースではドイツ語圏の法学者12名のプロフィールを参照できるが、担当者によってデジタル化の方法と範囲に差があるため、現状ではまだ充実しているとは言えないだろう。今後、データが追加され、充実していくことを期待したい。

2-3. 分析の機能を備えたウェブアプリケーション:FBTEE, Commonplace Cultures

テキストや画像、メタデータを提供するウェブコンテンツに対し、分析のツールとしての性格が強いものでは、FBTEE(The French Book Trade in Enlightenment Europe: Mapping the Trade of the Société Typographique de Neuchâtel, 1769–1794)[9]と Commonplace Cultures: Digging into 18th-century Literary Culture[10]が挙げられる。まず FBTEE は、1769年から1794年まで経営されたスイスの出版社 Société Typographique de Neuchâtel(以下、STN)の取引をマッピングしたウェブアプリケーションである。アプリケーション上では、STN の複式簿記を利用して、ヨーロッパ中、約40000冊の流通を対象に、ほぼすべての取引が再構築されている。そのため、STN が取引した著者、タイトル、発行者、主題、ジャンル、期間など、さまざまな区分で絞り込んで調べることができる[11]。次に Commonplace Cultures: Digging into 18th-century Literary Culture は、18世紀の出版物に一般的であった文章の借用・再利用例を検索するためのアプリケーションで、ARTFL[12]とThe Oxford eResearch Centre[13]による共同研究の成果として公開されている。ECCO[14]から抽出された4000万件以上のテキストデータを対象に、ユーザは複数の出版物の間で文章が借用・再利用されている例を検索できる。

2-4. Palladio によるデータ可視化例を提供するウェブサイト:Mapping of the Republic of Letters

分析結果を可視化した例を提供するサイトもある。Mapping of the Republic of Letters[15]では、Publications メニューからヴォルテールやベンジャミン・フランクリン、ジョン・ロックの書簡ネットワーク研究の成果物を見ることができる。本サイトの興味深い点は、分析段階において Palladio[16]で作成されたマップや Breve[17]で作成されたデータスキーマを操作可能な状態で提供している点である。そのため、それらのマップやデータスキーマをユーザが試用でき、データ自体もダウンロードできる。データの二次利用に役立つだけでなく、可視化による分析を研究に取り入れたい人文学研究者にとっても、モデル研究として参考になるのではないだろうか。

2-5. ピアレビューを集めたウェブサイト:18thConnect

最後に18thConnect[18]というサイトを紹介しておきたい。18thConnect は、18世紀研究に関するデジタル・コンテンツのピアレビュー・システムである。19世紀研究を対象にした NINES[19]と共同で制作した独自のガイドライン[20]に基づいた査読に通過したコンテンツが掲載されている。フランス ENS(高等師範学校)の調査結果からもわかるように、DH プロジェクトの場合には、DH の専門教育を受けていない人文学者が独学で実践に至る場合も多い[21]。18世紀研究のための史資料は多岐にわたるため、世界中で多くの研究者が DH に関心を寄せ、それぞれの史資料を用いたウェブコンテンツのプロバイダになっていくことが望まれる一方で、質の担保、情報の拡散も重要なポイントになるだろう。DH の恩恵を受けるユーザにとっても、18thConnect はオンライン上に溢れる情報を整理するサイトとして機能してくれるはずである。

3. おわりに

前号から2回にわたって紹介してきたウェブコンテンツは、第15回国際十八世紀学会で紹介され、かつ筆者が発表の場に居合わせたものに限定されているが、それでもなお豊富なコンテンツが作成されていることが伝わるのではないかと思う。実際には、上記で取り上げたものの他にも多くのコンテンツが作成され、各分野の専門家の間で共有されていることだろう。本大会でも新たなDHプロジェクト立ち上げのサポートや教育手法の提案を目的としたパネルセッションがいくつか開かれており、その盛況ぶりを見た限りでは、今後もこのようなウェブコンテンツは充実していくことが予想される。本連載の第4回では、これら DH の発展を後押しするような内容の発表を紹介することとしたい。

[1] 小風綾乃「18世紀研究における DH の広がり:第15回国際十八世紀学会(ISECS 2019)に参加して 第1回:個別発表にみるデータ可視化」『人文情報学月報』第97号。同「18世紀研究における DH の広がり:第15回国際十八世紀学会(ISECS 2019)に参加して 第2回:各種ウェブコンテンツの紹介(1)」『人文情報学月報』第98号。
[4] 一部のコレクションの閲覧には所属機関のサブスクリプションまたは個人での登録が必要である。データベースの使い方は以下を参照のこと:https://www.e-enlightenment.com/info/about/tours/.
[5] 対象となっている6名は、ジョージ・ワシントン(1732–1799)、ベンジャミン・フランクリン(1706–1790)、ジョン・アダムズ(1735–1826)(とその家族)、トマス・ジェファソン(1743–1826)、アレクサンダー・ハミルトン(1755–1804)、ジェームズ・マディソン(1751–1836)である。
[11] 使用方法については動画チュートリアルを参照:http://fbtee.uws.edu.au/main/tutorials/".
[12] ARTFL(American and French Research on the Treasury of the French Language)は、幅広いフランス語コーパスの編集(12–20世紀)と、研究者が容易にアクセスできるシステムの作成を目指すプロジェクトである。https://artfl-project.uchicago.edu/
[14] ECCO(Eighteenth Century Collections Online)は、「18世紀に英国およびその植民地で刊行されたあらゆる印刷物と、それ以外の地域で刊行された英語印刷物を収録対象とするオンライン版アーカイブ」(https://myrp.maruzen.co.jp/book/ecco/)である。公式サイトは以下。https://www.gale.com/intl/primary-sources/eighteenth-century-collections-online.
[16] Palladio はスタンフォード大学が開発したデータ可視化ソフトである。ブラウザ上で動き、CSV ファイルまたはスプレッドシートを読み込ませるだけで容易にマッピング、ネットワーク図、表、ギャラリーを生成できる。http://hdlab.stanford.edu/palladio/.
[21] 2018年末に発表されたレポートによれば、ENS 内の DH 実践者67名のうち、専門的な DH の初期教育を受けた者は2名にとどまり、大部分は組織内の研修または独学で DH を学んだと回答した。詳しくは調査結果の3) Métiers et outils des acteurs en humanités numériques à l’ENS を参照:https://digithum.huma-num.fr/enquete/.
Copyright(C) KOKAZE, Ayano 2019– All Rights Reserved.

イベントレポート「JADH2019参加報告(後編)

小川潤東京大学大学院人文社会系研究科博士課程

さて、趣旨に関しての考察が長くなってしまったが、ここからは個々の研究報告について述べたいと思う。先述のように、すべての報告に言及することはできないので、学会の趣旨および筆者自身の興味・関心に沿って主な論点を以下の二つに限定し、それを軸に内容紹介と所感を述べることとしたい。

  1. 研究と教育のためのオープン・プラットフォームの構築
  2. 社会的関係性の記述と人的ネットワークの表現

まず、一つ目の論点であるオープン・プラットフォームの構築に関しては、今回の JADH において最も活発な議論が交わされていたように思う。開会直後、最初の報告が台湾・国立政治大学のチームによる DH 教育のためのプラットフォーム構築に関するものであり、e ラーニングシステムを用いた人文・社会科学分野における DH 教育の取り組みを紹介した。そのシステムにおいては、Moodle も活用しつつ種々のオンラインコースが提供されることはもちろん、DH 教育のための素材や、経験豊富な教育者たちとのノウハウ共有・議論の場、そして DH 分野の研究者に関する情報も提供される。

こうしたプラットフォーム構築を進める彼らの問題意識はおそらく、DH の教育モデルが定まっていないがゆえに必然的にその学習も困難になり、人文・社会系研究者のこの分野への参入が進まない点にあるのであろうが、このような問題意識は日本の DH 教育においてもまた、当てはまるのではないだろうか。「受講者」として DH を学ぶ環境自体は、筆者も受講する東京大学のプログラムをはじめとして国内でも整備されてきており[1]、さらに時間面や金銭面の都合がつくのであれば、海外の大学・機関が提供するオンラインコースやサマースクールなどを活用することができる[2]。しかし今後、我々の世代が「教育者」としてDHに関わる可能性が高いことを考えると、一抹の不安が拭えない。今後、DHの裾野を広げていくためにはある程度共通の教育モデルを構築する必要があるはずだが、現状におけるDH教育の在り様を巡っては、教育のメソッドやノウハウの蓄積がいくつかの有力機関に偏っており、その上、それが十分に共有されていないような印象がある。これを踏まえれば今後、DH教育のモデル化を模索するにあたって台湾の教育プラットフォーム構築は意義深いものであり、大いに参考にすべきであると感じた。

教育と並んで、研究活動そのものに寄与するプラットフォームの構築も重要なテーマである。これに関して、DocuSky という興味深いツールに関しての報告が、KU-ORCAS 国際シンポジウムと JADH のパネルセッションにおいて、台湾大学のチームによって行われた[3]。DocuSky は個々の研究者のニーズに合わせたデータベース構築・分析システムを提供するものである。発表者によれば、既存のデータベースの多くは「閉じた」システムであり、研究者のニーズに合わせた可変性が必ずしも高くない点が問題であるという。これに対して DocuSky は、MARKUS によってタグ付けされた DocuXML ファイルさえ作成すれば[4]、各研究者が独自のデータに基づいてデータベースを作成し、分析を行うことを可能にする。確かに、既存のデータベースが提供するデータの過不足は往々にして悩ましい問題であり、個々の研究者の研究課題、所持データに最適化されたデータベース構築と分析が可能になれば、研究活動に大きく資することになるだろう。

二つ目の論点にあげた社会的関係性と人的ネットワークの表現に関しては、Neo4j を用いた両班の婚姻ネットワーク可視化を扱った発表が印象に残った。Neo4j は、オープンソースで利用できる代表的なグラフデータベースであり、Cypher というクエリ言語を用いてネットワークの分析・表示を行うことができる[5]。発表者は、朝鮮の王朝記録から抽出した人物と、その関係性に関するデータを Neo4j に取り込むことで、10万件以上に及ぶ膨大な人物データに基づくネットワークを可視化した。歴史学において、個々の人物の来歴に着目し、詳細に検討するプロソポグラフィーは重要な研究手法の一つであり、その中には当然ながら親族関係や交友関係といった人的ネットワークの分析も含まれる。この点において、データベースとネットワーク可視化ツールを兼ねる Neo4j を導入することは有益であり、これからのプロソポグラフィー研究においても積極的に活用されるべきであると思う。

しかしながら、いくつか気になった点も指摘しておきたい。まず、今回のプロジェクトを通して発表者が、どのような点で新たな知見を得ることができたのかが明確に示されていなかったように思う。むろん、データベースを構築し可視化を行うだけでも大きな意義はあるが、その結果としてどのような知見を引き出すことができるかという点も非常に重要であろう。しかし、人文学の研究成果として公表するに足る具体的な知見を得るためには、統計的な手法に基づくグラフ理論にある程度通じている必要があり、人文系の研究者にとってこれは容易なことではない。今後、人文系研究者がグラフネットワークを用いて単なる可視化以上の具体的な成果を求めるのであれば、厳密な計算を行う必要は必ずしもないにしても、中心性の種類やクラスタリングの基準といったグラフ理論の基本概念は把握しておく必要があると感じた。次に、元データの取得・作成に関してであるが、ネットワークの核とも言うべき関係性(グラフで言えばエッジ)に関する情報の取得は大きな問題である。人物や地名のデータ(グラフ中では往々にしてノード)はテクストに内在するものであり、それを抽出することは比較的容易である一方、関係性はテクスト内部で言及されるとは限らず、他のテクストや、複数のテクストの参照によってはじめて明らかになることが多い。それゆえに、関係性の抽出と記述は、人名・地名データに比して困難であると言える。複雑な(ときに大量の)関係性のデータをどのような基準で、どのように取得するのかは、研究課題や史料の性質に則して慎重に検討される必要があるだろう。

加えて、関係性を記述するための語彙も大きな問題である。というのも、特定の関係性を表す語彙が統一されていなければ、複数のプロジェクト間の互換性を保つことはできず、データの共有も困難になる。この点に関しては、中国の歴史人物のプロソポグラフィーを扱うデータベースである CBDB(China Biographical Database Project)についての発表に言及したい。ハーヴァード大学が主導するこのプロジェクトはプロソポグラフィー、すなわち人物の来歴や人的ネットワークを記述するための語彙を詳細に定義している[6]。この中には例えば、「~の家庭教師」といった関係を表すものもあり、かなり詳細な定義が行われていると言えるだろう。CBDB は中国に関する事例であるが、どこまで詳細に関係性を記述するのか、またどのような関係性があり得るのかは分野によって異なる。それゆえ、各分野ごとにこうした共通語彙を設定していく必要があるだろう。その際には、人物や共同体の地位や役割を概念化し、その関係性をプロパティとして定義するRDFスキーマやドメイン・オントロジーの構築も選択肢の一つとなり得る[7]。

以上、簡単にではあるが、二つの論点から JADH2019を振り返ってみた。ここにあげた研究発表やプロジェクトは全体のごく一部であり、他にもポスターセッションやショートペーパーにおいて多様な報告が行われていた。前編冒頭にも述べたように、全体としては東アジアにおける地域研究や研究コミュニティ形成に関する報告が充実していた印象であり、このことは、グローバル規模で共有され、蓄積される DH の知見をどのように地域研究に還元し、地域ごとの特殊性・個別性を捨象することなく適用していくかという試みを示しているように感じた。そして、このような地理空間的な対象の問題とも関連して、前編で考察したような、研究における巨視的・全体的な視点と微視的・個別的な視点の間を行き来し、両者を架橋する手段としての DH の意義についても考えさせられる学会であった。

[1] いくつか例をあげれば、東京大学人文情報学拠点、同志社大学文化情報学部、立命館大学文化情報学専修などがある。
[2] 大規模なサマースクールとしては、イギリス・オックスフォード大学における Digital Humanities at Oxford Summer School、カナダ・ヴィクトリア大学における Digital Humanities Summer Institute などがあるが、他にも世界各地で開催されている。オンラインコースに関しては差し当たり、ハーヴァード大学の Introduction to Digital Humanities と DARIAH-EU による Digital Humanities Course Registry をあげておく。
[3] KU-ORCAS 国際シンポジウムは厳密には JADH2019とは別個の学会であるが、同地開催の上に参加者の大部分も重なり合っていたため、本報告に含める。
[4] MARKUS は、主に中国古典テクストにおける人物・地名などの自動・半自動マークアップを実現するためのプラットフォームである。沿革や機能について詳しくは https://dh.chinese-empires.eu/markus/ を参照。
[5] Neo4j に関しては、以下のドキュメントを参照:https://neo4j.com/docs/.
[6] 関係性記述の構造について、https://projects.iq.harvard.edu/cbdb/structure-cbdb を参照。
[7] 歴史学分野におけるドメイン・オントロジー構築の動きは進んでおり、文化資源を扱う際に問題となる諸概念や関係性についての基礎的な構造化語彙を提供する CIDOC CRM や、プロソポグラフィーを記述するための Factoid Prosopography Ontology(FPO)は汎用性の高い語彙体系である。一方、より分野に特化した語彙として、例えば筆者の専門である古代史の分野では Standard for Networking Ancient Prosopographies(SNAP)や An ontology for Linked Ancient World Data(LAWD)が設計されている。
Copyright(C) OGAWA, Jun 2019– All Rights Reserved.

イベントレポート「TEI2019参加報告(前編):デジタル校訂版出版と関連ツールの利用可能性

小川潤東京大学大学院人文社会系研究科博士課程

2019年9月16日から20日にかけて、オーストリア・グラーツ大学で開催された TEI2019: What is text, really? TEI and beyond に参加した。TEI(Text Encoding Initiative)は、人文社会科学におけるデジタルテクスト校訂のための共通規格を提供するための国際共同プロジェクトの名称である。TEI カンファレンスは年に一回、欧州や北米を中心に開催されるもので、XML の詳細な技術論から、TEI ガイドラインに掲載される記述モデルの提案と議論、さらには人文社会科学における実際の応用例まで幅広く扱う学会である。報告者は昨年の TEI2018にも参加しているが、これは東京で開催され[1]、さらには JADH との合同開催であったこともあり、TEI カンファレンス独自の雰囲気を味わうことはなかった。それゆえ報告者の実感としては、本格的に TEI カンファレンスに参加したのは今回が初めてである。

まず全体として、個人的にはこれまでに参加した DH 関連の学会の中でも相当に高度な内容を扱っていたように感じた。TEI が現状では XML を技術的基盤として有している以上、XML 関連の込み入った技術論が議論されるのはもちろん、人文社会系のテクストを扱うという TEI の性質に鑑みて、「そもそもテクストとは何か?」といったようなテクスト論にまで踏み込んだ議論が行われる。つまり、XML や TEI の技術に関する知識と、テクストに対する深い人文学的洞察の双方が、高いレベルで要求されるのである。すべての議論が英語で行われたことも相まって、報告者の理解が十分に及んでいない議論もあるだろうが、ここでは、今回の TEI2019で行われた議論の一端を紹介したいと思う。

まず、16日と17日はワークショップに参加した。今回参加したのは Schematron と eXist/TEI Publisher に関するもので、いずれもデジタル校訂の出版・公開に関わるものである[2]。Schmatron は XPath を用いたスキーマ言語であり、DTD や RELAX NG といった独自文法に基づくスキーマ言語に対して補完的な役割を担う[3]。定義したパターンの有無によって妥当・非妥当の判定を行うことができるのはもちろん、拡張機能である QuickFiX を用いれば、クリック一つの簡単な操作でドキュメントの修正を行うこともできる。Schematron のようなスキーマ言語は、個人の作業よりは大規模なコミュニティに基づく編集作業に適していることは間違いなく、実際、ワークショップの参加者のうちにも、プロジェクトの一環としてすでに Schematron を用いているという者が多かった。日本ではまだあまり活用されていないように思われるが、今後、日本を拠点とするデジタル校訂プロジェクトが増えれば、その存在感は高まってくるだろう。一方、eXist/TEI Publisher は[4]、TEI 準拠の XML ファイルに ODD を適用することで、自動で公開アプリケーションを構築することのできるソフトウェアである[5]。比較的容易な操作によって地図表現、外部データベースとの連携、IIIF 規格を含む画像処理などを実現することが可能で、TEI のエンコーディングさえできれば、最低限のウェブ公開を行うことができる。ただし、プロジェクトごとに種々のカスタマイズを施そうとするならば ODD を独自に記述する必要があり、この点は、GUI で編集可能になっているとはいえ、技術を専門としない身には少々ハードルが高いように感じた[6]。プロジェクトベースでの利用ならば、この点は人文系研究者というよりは、技術系のメンバーが主に担うことになるのではないだろうか。

デジタル校訂の出版・公開に関しては、ワークショップに参加した Schematron と eXist/TEI Publisher に加えて、報告者個人の関心にも関わるいくつかの試みについて言及しておきたい。まず、残念ながら今回参加することが叶わなかったワークショップとして、CETEIcean を扱ったものがある。これは、従来の XSLT を用いた XML 文書変換に代わる選択肢として、TEI/XML ファイルを変換することなく直接ブラウザ上で表示することを可能にする JavaScript のライブラリである[7]。これにより、TEI で記述したテクストの構造を損なうことなく、CSS や各種の behavior を用いてブラウザ上での操作が可能になる[8]。また、開発チームの一員である Hugh Cayless 氏によれば、いくつかの TEI サブセットのための自動変換ツールも現在開発中であるという[9]。この技術は殊に、XSLT や XPath、XQuery をはじめとした XML 関連技術が欧米と比して普及していない日本において、TEI/XML 文書公開のための有力な手段たりうるのではないだろうか。 もう一つは、筆者の専門である西洋古代史の文脈に寄ってしまうが、EFES(EpiDoc Front-End Services)というツールについてである。これはその名の通り、EpiDoc に準拠して作成された TEI/XML ファイルのための検索閲覧プラットフォームであり[10]、ウェブ上での検索・公開を容易にするという点ではすでに言及した eXist/TEI Publisher に似通ったものである。しかし EFES は、特定の既存サブセットに特化して設計されており、より分野密着型であるといえる。これはすなわち、ファイル作成に際して EpiDoc に準拠してさえいれば、TEI Publisher では事実上必要であった ODD の記述といった過程をさえ省略することができるということである。このような分野密着型のツールが用意されていれば、必ずしも技術に通じているわけではない人文系研究者であっても、容易に自らの研究やデジタル校訂の成果を公表することができるようになるだろう。さらに EFES は、XML で記述された人物や地名に関するオーソリティーファイルをもとに自動で RDF トリプルを取得して、ファセットを作成する機能も備えており、これによって各プロジェクト間の連携を可能にするという利点も有している。後編で述べるように、TEI におけるセマンティック記述という問題は昨今盛んに議論されており、それを踏まえても有益な機能といえるのではないか。

このように、デジタル校訂版の出版・公開に関しての技術やツールは発展を続けるとともに、様々な広がりを見せているということを、ワークショップや参加者との対話を通じて実感することができた。とくに、XML 関連技術に通じているわけではない技術者や研究者がいかに容易に、そして効果的にデジタル校訂版の公開を行い得るかという問題に関して、最低限の知識があれば利用できる TEI Publisher や EFES、さらには XML 関連技術に依らずに TEI/XML 文書を扱うことができる CETEIcean のような技術の更なる発展は、今後ますます期待されるところである。

[2] Schematronに関しては、専ら出版に関わるものであるというわけではなく、むしろマークアップの過程において活用される場合が多いものと思われる。
[3] DTD は、SGML および XML のためのスキーマ言語であり、RELAX NG もまた XML のためのスキーマ言語である。
[4] eXist 自体は XML データベース管理システムであり、TEI Publisher はそのプラグインとして位置付けられる。
[5] https://teipublisher.com/index.htmlにおいて体験版を利用できる。
[6] GUI で編集を行うに際しても、XPath と XQuery の知識が要求される。
[7] Hugh Cayless, and Raffaele Viglianti, “CETEIcean: TEI in the Browser.” (presented at Balisage: The Markup Conference 2018, Washington, DC, July 31 - August 3, 2018), in Proceedings of Balisage: The Markup Conference 2018. Balisage Series on Markup Technologies, vol. 21 (2018): https://doi.org/10.4242/BalisageVol21.Cayless01.
[8] 個々の要素に behavior を定義することで、クリックイベントや hover イベントといった動的インタラクションを付与することが可能となる。
[9] これは正式な報告ではなく、現地での個人的な会話を通して得た情報である。報告者が専門とする西洋古典学の分野では、史料の翻刻に際して Leiden-style という特定の書式を用いるが、EpiDoc ではこの書式への変換スタイルシートが用意されており、利用者が自らスタイルシートを記述する必要はなかった。しかし現状、CETEIcean ではこのような変換ツールは用意されておらず、すべて自ら記述する必要がある。この点に関して質問した際の Hugh Cayless 氏の返答が本文の内容である。
[10] EpiDoc は、古代史分野における史資料、殊に碑文史料を効果的にマークアップすることを目的として設計された TEI のサブセットである。メタデータの記述モデルはもちろん、破損や摩耗によるテクストの欠落や、銘文独自の省略法などの記述にも対応している。詳しくは https://sourceforge.net/p/epidoc/wiki/Home/ を参照。
Copyright(C) OGAWA, Jun 2019– All Rights Reserved.

◆編集後記

人文情報学の世界に、新たな局面が訪れました。今回巻頭言をいただいた大向一輝氏は、2009年の CiNii 大改革をはじめとして学術情報流通における様々な重要事業を成し遂げてこられた人であり、私自身も、あの CiNii の大改革に感動してその Web API をさっそく使って新たな学術サービスを開発した一人でした。その大向氏が、このたび人文情報学の最前線の一つに参戦されたのです。巻頭言を拝読して、これからの人文情報学の展開がますます楽しみになっているところです。

(永崎研宣)




Tweet: