ISSN 2189-1621

 

現在地

《連載》「Digital Japanology寸見」第1回 「『笠間索引叢刊』が一部国文学研究資料館で公開に」

◇《連載》「Digital Japanology寸見」第1回
「『笠間索引叢刊』が一部国文学研究資料館で公開に」
 (岡田一祐:北海道大学大学院文学研究科専門研究員)

 本号から、日本学におけるディジタル・ヒューマニティーズ(DH)的な話題に関
する時評をしていくことになった。日本学といっても幅広い分野であるし、全体を
覆おうとしたところで不勉強が露見するだけである。はばかりながら、題に掲げる
とおりの寸見に留まることをお許しねがいたい。稿者はふだん語学的な文献学をこ
ととしているが、西洋における日本学史にも感心がある。そこで、この連載では、
そのような関心から管見に入ったものを中心に、この半年ほどの話題から考えたこ
とをお伝えしたいと思っている。

 第1回めは、『笠間索引叢刊』の一部が国文学研究資料館で公開された件[1]を
取り上げたい。この『笠間索引叢刊』がインターネット上で公開されたことは、非
常に意義深いことだと思うが、それについては少々解説が必要かもしれない。まわ
りみちであるが、お許し願いたい。

 日本学の研究資料は、これまでインターネット上で利用できるものは非常に限ら
れていた。この3月、インターネット上で英語で利用できる日本研究・日本の人文学
の研究資料の概観を掴むために作成されたEnglish Resource Guide for Japanese
Studies and Humanities in Japan( http://www.nihu.jp/sougou/kyoyuka/japan_links/
人間文化研究機構)が公開された。稿者はその編纂におおきく係わったが、インタ
ーネット上で・英語で利用可能な資料の量が内容の選定におおきく影響した。もち
ろん、英語で利用できる研究資料に限定すると集められるものがぐっと減ってしま
うことは、英語でおもに研究が行われてきた分野でなければ珍しいことではなかろ
うし、それじたいとりたてて問題ではない(それぞれの研究資料の提供者の方々が、
英語で研究資料を利用できるようにすることに関して、どのように考えているのか
は、いずれ考えたいことではある)。興味深い点は、ここにあげられた諸資料が、
日本学における蓄積と対照して、どのていどの厚みがあるかである。そのように見
ると、諸学の伝統的な研究雑誌で、インターネット上で利用可能な資料が多々引用
される分野と、ほとんど紙媒体しか引用されない分野とに分れるのではないだろう
か。

 日本語学・日本文学はどちらかといえば前者に属すものであった。日本語学、そ
して出自上研究資料を多く共有する日本文学における研究資料としては、まず言語
資料の本文が挙げられる。第二次世界大戦後、古典文学の校訂本文の作成が進み、
『日本古典文学大系』(岩波書店)、『日本古典文学全集』(小学館)などを筆頭
とする古典文学全集なども編まれた。これらを「生データ」とすると、研究用に加
工したものが総語彙索引である。索引といえば、術語や要語を便利に引くためのも
のを想像するが、総語彙索引(総索引)では、一般名詞からテニヲハにいたるまで、
本文中のあらゆる語を一覧できるようにしたものである。総索引は数多く編まれて
おり、1970年に創刊した『笠間索引叢刊』をはじめ、『索引叢書』(和泉書院)、
『古典籍索引叢書』(汲古書院)などの索引叢書があるほどで、とくに笠間索引叢
書は127点を数える一大叢書である。全集類に漏れる文献などでは、総索引を作成す
るために校訂本文を作成することも珍しくはない。しかしながら、本文にせよ、総
索引にせよ、これまでインターネット上で利用することはほとんどできなかった。
紀要論文の形態で出版されたものが機関リポジトリから利用可能になることがあっ
たほか、『日本古典文学大系』が国文学研究資料館により( https://base3.nijl.ac.jp/
)、『日本古典文学全集』を引き継いだ『新編日本古典文学全集』(小学館)が現
在JapanKnowledge( http://japanknowledge.com/ )で利用可能となっているが、
利用上の制約もあって研究に使いやすいとは言えない。書籍として出版されたもの
は大半が画像データとしてすら電子化されておらず、まして、英語で使えるものは
皆無に等しいので、ガイドではあまり多くを挙げることができなかった。

 日本語学にかぎらず、言語研究はディジタル・データの利用が古くから盛んな部
類であった。とくに日本語学は、世界でも最古級の統計的言語研究に関する学会で
ある計量国語学会があり、コンピューターの利用にも当然長年の蓄積があるものの、
索引と本文の作成が中心で、英語研究などのように本文データベース(コーパス)
作成などにはなかなかいたらなかった。歴史言語のコーパスはどの言語でも現代語
ほどには進んでいないとはいえ、たとえば英語学ではヘルシンキ・コーパスを筆頭
に複数の研究用ディジタル・コーパスが作成されている。これらの研究用コーパス
では、単なる本文データベースと異なり、単語ごとに品詞や文法的な関係などが分
析してあり、それをふまえた用例の抽出が可能となっている。それに対して、日本
語学では、近年ようやく国立国語研究所によって「日本語歴史コーパス」が作成さ
れるにいたった段階で( https://maro.ninjal.ac.jp/ 平安時代の仮名文学と室町
時代の狂言のデータが収録されている)、まだ複数の選択肢があるにはいたってい
ない。

 それゆえに、今回の索引の電子化は重要であろうと思われるのである。総索引は
品詞認定などに基づいて作成されるものであるから、コーパス的な利用があるてい
ど可能である。これは、既存のコーパスの欠を補うものとも見なしうる。総索引の
公刊は、「校訂本文」が提供されるという点でも意義が大きい。実際、今回公開さ
れた『唐物語』『源氏物語引歌索引』『類字名所和歌集索引』『「隆達節歌謡」全
歌集』『近世流行歌謡』の5点のなかで、『類字名所和歌集索引』以外は校訂本文も
同時に公開されている。これらは全集類にかならずしも含まれるものではなく、し
かもテキスト検索が可能になったことは、多くの研究を促進するものとなろう。

 もちろん、今回はCC-BY-NC-NDでの公開ということで、利用条件に制約があり、DH
的研究を推進するものとなるかは今後の展開次第である。DH的に利用していくこと
と、コンピューターで扱いやすい形式にしていくことは不可分であるように思われ
る。たとえば、研究用コーパスからは、他動詞が主語を取る例がどれくらいあるか、
形容詞がどれほど出てくるか、音便を記した例と見られるものは何件あるかなどと
いうことがかんたんに抽出できるが、たんに既存の資料を提供するだけでなく、あ
たらしい研究資料の礎となれば、またそこからあらたな展開が生まれよう。

 インターネット上でおおくの「オリジナル」や雑誌掲載の研究論文が公開される
なか、かつて「オリジナル」や研究論文と利用者をつないできた校訂本文の存在は
見えにくくなっている。しかし、素人がいきなり「オリジナル」に立ち向かっても
無力なことは言うまでもなく、陸続と公開されていく「オリジナル」を活かすうえ
でも、このような研究資料の公開は重要な取り組みであろうと思うのである。いか
ほど厳正な校訂本文であろうと、単一の研究資料に依拠するのは健全な姿ではない。
複数の資料が使えるよう、さらなる索引や本文の公開が期待される。

[1]http://kasamashoin.jp/2015/04/27413.html
https://kokubunken.repo.nii.ac.jp/index.php?action=pages_view_main&activ...

Copyright(C)OKADA, Kazuhiro 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

DHM 045 【前編】

Tweet: