ISSN 2189-1621 / 2011年8月27日創刊
研究の最初のつまずきは「資料がどこにあるかわからない」という初歩的な問題だった。 卒論のテーマを近世期の春画・艶本と定めた時は、運良く春画研究の第一人者であった林美一のコレクションが立命館大学アート・リサーチセンターに寄贈された頃で、その整理をしながら論文を書き上げることができた。 しかし、院に進みさらにテーマを深める中で、上記の問題に突き当たった。『国書総目録』には所在情報が載っていない。林をはじめ、様々な研究者が作成した春画・艶本目録にもその情報は皆無だった。
その問題を少しでも解消するため、国内外の博物館・図書館に足を運び、一つ一つ情報を拾いながら、時には自分で撮影もしながら構築したデータベースが「近世期絵入百科事典データベース」である[1]。 もちろん全てが自分の調査に基づくものではなく、所蔵先の DB などで公開されている情報も収集した。 どの資料にもいえることだが、ジャンルによって、あるいは形式によって資料には特有の癖がある。例えば、多くの艶本には作者・絵師・版元名はおろか、刊年の明記がない。 好色本の類いは出版を禁じられていたためである。 しかし、絵師は艶本の中に自分の正体を暗示する情報をちりばめている。 それらを拾いながら、絵師を同定し目録を作っていく必要がある。そのため、艶本目録の作成には考証の経験と知識が必要となる。(もちろん、自分の場合はそれがないところからのスタートであった。)
その次に構築した「西川祐信総合作品目録データベース」も根本の問題意識は同じもので、多岐に亘って祐信が手がけた絵画・書物の全体像を知るために、肉筆・絵本・春画・浮世草子の挿絵などを網羅することを目指したものである[2]。
さて、2015年より人間文化研究機構広領域連携型基幹研究プロジェクト「異分野融合による「総合書物学」の構築」に関わることになった。日文研ユニットのテーマは「キリシタン文学の継承」であったが、同時に古典籍の図像に関するデータベースの構築も課題の一つであった。
国文学研究資料館の歴史的典籍NW事業の本格的始動という動向を踏まえた上で、これまで画像 DB を数多く構築し、運営してきた日文研ならではの DB を作れないかというところから模索が始まった。今後、何万点という単位で古典籍の画像が公開されていくなかで、その中から図像・挿絵を吸い上げてどのようなデータベースを作るのか。
浮世絵の場合、「浮世絵検索」というデータベースがある[3]。 国内外の美術館・図書館などが公開している浮世絵データを検索することが可能で、2019年4月現在22万点をこえる浮世絵が登録されている。本 DB の場合、画像で検索することも可能であり、画中の文字情報が読み取れない、あるいは含まれていない場合でも22万点という膨大な量のデータから同じ絵を探し当てることができる。 また、探したい絵をスケッチして画像を検索するデータベース「KOTENSEKI SKETCH SEARCH」もある[4]。国立情報学研究所と国文学研究資料館によって開発された本 DBでも、テキストによらない検索が可能である。
画像 DB を構想する上で、一つの方向性として上記のような数多くの画像の中から「図」で探すという DB も参考にしつつ、多くの示唆を受けたのが渋沢栄一記念財団情報センターの「絵引データベース」であった[5]。 「絵で事物を調べる」という「絵引」の考え方を種として、近世期に多数の読者を想定して出版された「絵入百科事典」的書物の DB を作るという着想を得た。 DB の核となるのは寛文6年(1666)の序文をもつ『訓蒙図彙』、京都の儒学者中村惕斎(てきさい)によって編纂された書物である。その情報源は日本の古辞書だけではなく、中国の書物や宣教師がもたらした文物も含まれており、和漢洋の情報が詰まっている。『訓蒙図彙』には事物の名称と姿形が記されている。天文、地理、人物、動物、植物など収載項目は幅広い。
惕斎は制作動機を自分の子供の啓蒙と語っているが、多くの大人たちにも、またシーボルトや在外の宣教師などの外国人にも便利な書物として広く読まれ、数多くの「訓蒙図彙もの」を生み出した。 武具、仏像、建築、歌舞伎、立花、中国など多様なテーマの絵入百科事典が出版され、明治に入ってなお『泰西訓蒙図解』などヨーロッパの事物などを扱った「訓蒙図彙」がいくつも作られた。 これらの書物を対象として収載項目の翻刻を行い、日文研所蔵の資料に限らず、国文研、国会図書館などオープンデータとして公開している画像データからサムネイルを作成して DB を構築し、ひとまず2017年より試作版として「近世期絵入百科事典データベース(試作版)」の公開をスタートした[6]。 キーワードで検索することはもちろん、デフォルトでサムネイルを全件表示させることで、あるいは「天文」などの分類で絞り込みを行うことで現段階では目視に限られるが図からもある程度の検索が可能である。
当初は一人で作業を行っていたが、現在はユニットの RA である院生2名と共に翻刻・メタデータ入力・画像処理を行っている。入力者の条件はくずし字が読めること。時代や専門性に厳格な限定を設けていない。 これまで私が構築してきた DB は、作品目録の性質が強く、かつ研究者の専門性が資料からどのような情報を引き出すかという点に強く影響を与えるものであった。 冒頭で挙げた二つの DB は、構築だけでなくデータの追加作業についても私自身が関与し続けなければ継続運用が難しいものである。しかし今回構築する DB は「特任」として有期的に関与するという前提の上で、比較的専門を限らず資料の選定とメタデータを入力できることを可能とすることで継続的な運用ができることも構想の視野に入れた。
それは結果として、多様な分野の研究者に有用な検索ツールとなると考えている。 また、森羅万象の事物を言葉と図で知ることができる書物が、当時の幼児や外国人にも重宝されたのであれば、現代の一般ユーザーにとっても近代以前の文化へ接続できる良い入口となるのではないかとも考えている。
日文研では、2018年度に IIIF による画像公開についてのワークショップが開催され[7]、導入の検討が始まっている。 また、今年度より総合書物学の日文研ユニットのテーマも「文化・情報の結節点としての図像」に変更となり、より絵入百科事典 DB の活用・展開に重点を置くことになった。 現在公開中の DB は試作版の段階であるが、近世期に記録された絵・言葉と私たちを繋ぐためにどのような設計が最も有用なのか、様々な可能性を模索しながら確定版の2020年度の公開を目指している。
2019年5月からの日本のあたらしい元号が2019年4月1日に発表された[1]。 今回の件は、前後の騒動も含めて、いくつかのデジタル・アーカイブにとって、市民とどう対するかに関する試金石となったのではないか[2]。 そのような反応を記録するとともに、対応について考察しておきたい。
まず、昨今一般的となった文学館や図書館の Twitter アカウントでどのような反応があったかといえば、気付いた範囲でいえば、5館程度に留まった[3]。 しかも、Twitter での告知に留まったり、広報ページを設けていても所蔵本の簡単な紹介に留まったりするなど、力を入れているところは見当たらない。これは、各地の文学館や図書館が新元号特集展示をこぞって行ったのと対照的である[4]。 デジタル・アーカイブにおいては、そこにデータがなければいかんともしがたいところはあり、複製本やありふれた本を展示することにはなる(足利学校の関係者が同様のコメントをしており[5]、有名な元暦校本を所蔵する東京国立博物館なども、当該の巻を所蔵しないからか、静観一方のようである)。 それでも、各地の文学館や図書館のように関連資料や、解説を示して、この絶好のコミュニケーションの機会を得ようという動きがあまりに乏しいし、そもそも、データを有するところも本の解説すらせず、画像を見せておしまいになってしまっているのは残念なことであった。
また、データがなかったとしても、『万葉集』の注釈やそこから展開した文学など、接点はいくらでもあったのではないかと思うが、最近はウェブ展示というものも低調気味であるためか、新年度の忙しさに忙殺されてか、いい機会とはならなかったようである。 また、注記3で例示したもののうち、国文研のデータベースは、Twitter で紹介された以外にもいくつか当該の巻を有する写本・刊本もあるようであり[6]、他機関に所蔵されるものもふくめて諸本の違いについて触れながら、データベースの利点を訴求する機会だったのではないかとも思う。
個人の方で、これらのデータベースを活かして解説に及んだものもあまり目にすることができなかった[7]。 ただし、触れられたものは半端な触れ方ではなく、写本を具体的に解説して異文について触れたり、あるいは『万葉集』の扱いの難しさについて説いたりするなどの内容が、親しみやすく書かれていて興味深かった。 ここにもっと多様な解説があればなおよかったことは言うまでもない。
これがなおざりにしてよいことではないのは、たとえば、昭和の複製本を取材に行ったり[8]、ありふれた刊本を発見として全国報道してしまったり[9]という事故が相次いだからである(相変わらずといったことはいまは措く)。 そこに込められたはずの知を現代に繋ぐことがデジタル・アーカイブの使命としているのであれば、Twitter で1回限りの告知に加えたなんらかのコミュニケーションをしてゆくべきなのではなかろうか。
前回は、コプト語文献を有するデジタルアーカイブとしてバチカン図書館の例を紹介した。日本でも多くのデジタルアーカイブが IIIF を導入している。 東京大学デジタルアーカイブズ構築事業によれば、2018年5月時点の情報として、日本国内で18箇所の図書館、博物館、プロジェクトなどのデジタルアーカイブが IIIF 対応で画像を公開している[1]。 例えば、国立国会図書館デジタルコレクション(http://dl.ndl.go.jp/)、 京都大学貴重資料デジタルアーカイブ(https://rmda.kulib.kyoto-u.ac.jp/)、 東京大学附属図書館アジア研究図書館上廣倫理財団寄付研究部門 U-PARL 漢籍・碑帖拓本資料(https://iiif.dl.itc.u-tokyo.ac.jp/repo/s/uparl/page/home)、 国立歴史民俗博物館 総合資料学情報基盤システム khirin(https://khirin-ld.rekihaku.ac.jp/)、 国文学研究資料館 新日本古典籍総合データベース(https://kotenseki.nijl.ac.jp/)、国立国語研究所 日本語史研究資料(https://dglb01.ninjal.ac.jp/ninjaldl/)、国立情報学研究所ディジタル・シルクロード・プロジェクト『東洋文庫所蔵』貴重書デジタルアーカイブ(http://dsr.nii.ac.jp/toyobunko/)、 大蔵経テキストデータベース研究会 SAT DB 2018(SAT2018)東京大学総合図書館所蔵 万暦版大蔵経(嘉興蔵)デジタル版(https://dzkimgs.l.u-tokyo.ac.jp/kkz/)などである。
Unicode の開発を統括し推進させていくのが Unicode Consortium であるように、IIIF にも IIIF Consortium(https://iiif.io/community/consortium/)がある。 この IIIF に関しては、日本語で多数の解説記事が公開されている。人文学オープンデータセンターの解説「IIIFを用いた高品質/高精細の画像公開と利用事例」(http://codh.rois.ac.jp/iiif/)や永崎研宣氏による artscape の記事「つながる世界のコンテンツ──IIIFが描くアート・アーカイブの未来」 (2017年10月15日、http://artscape.jp/study/digital-achive/10139893_1958.html)やブログ記事「今、まさに広まりつつある国際的なデジタルアーカイブの規格、IIIF のご紹介」(2016年4月28日、http://digitalnagasaki.hatenablog.com/entry/2016/04/28/192349)がわかりやすい。 IIIF の導入の仕方は、永崎氏のブログ記事「今まさに広まりつつあるデジタルアーカイブの国際規格 IIIF の導入の仕方」(2016年5月16日、http://digitalnagasaki.hatenablog.com/entry/2016/05/16/030851)を参照いただきたい。 また、IIIF 対応で画像を公開することの意義については、永崎氏の「IIIF 対応で画像を公開することの意義を改めて:各図書館等の事例より」(2018年4月9日、 http://digitalnagasaki.hatenablog.com/entry/2018/04/09/053545)がわかりやすい。
フランス国立図書館(Bibliothèque nationale de France, 略称: BnF)は、1367年にシャルル5世によって設立されたルーブル宮殿の王室図書館を起源とし、フランス革命の際に国立図書館と改称したが、帝政期に帝国図書館(Bibliothèque Impériale)となった。 しかし、その後、1994年にフランス国立図書館に名称が戻されている。フランス国立図書館は、その蔵書の多さと多様さで知られており、コプト語の貴重な写本や手書き文献も多数保管している。 筆者の博士論文で取り上げている、4–5世紀の上エジプトの修道院長・アトリペのシェヌーテの『第六カノン』は、写本のページが様々な博物館や図書館に分散されて保管されているが、それらのページの半数以上がこのフランス国立図書館にある。 筆者は職場のプロジェクト(ドイツ学術振興会特別研究領域/共同研究センター1136「古代から中世または古典イスラーム期にかけての地中海圏とその周辺の諸文化における宗教と教育」)で同僚と PI とともにこの『第六カノン』のデジタル・エディションを作成している。このテクストの写本の一部は、Gallica というフランス国立図書館が運営するデジタルアーカイブで公開されている。
Gallica も画像の IIIF Manifest を公開しており、それを利用して、より簡便に画像の閲覧・検索を行えるウェブサイトを作ろうとする動きがある。その一つとして Biblissima を紹介する。
バーチャルライブラリーを標榜するウェブポータルの Biblissima(http://beta.biblissima.fr/fr/)の一企画である IIIF Collections -Manuscripts & Rare Books(https://iiif.biblissima.fr/collections/)は、Gallica、大英図書館、ボドリアン図書館、Europeana Regia、 フランス国立科学研究センター(CNRS)のテクスト学・テクスト史研究所(Institut de recherche et d'histoire des textes)の BVMM(https://bvmm.irht.cnrs.fr/)、 スイスの e-codices(https://www.e-codices.unifr.ch/de)などの IIIF 画像を公開しているデジタルアーカイブの IIIF Manifest を利用して、それらの IIIF 画像をより検索・閲覧しやすくしたウェブサイトである。 IIIF 対応のビューワーで画像を閲覧することができる。管見では、コプト語の写本は、Gallica の12件しかないが、今後増えていくものと思われる。
以上、IIIF 対応のコプト語文献の画像を公開しているデジタルアーカイブの例と IIIF を二次利用したウェブサイトの例を見た。次回は、パピルス文献の翻刻のためのウェブ・プラットフォームである Papyri.info について述べる。