ISSN 2189-1621

 

現在地

DHM 064 【前編】

2011-08-27創刊                       ISSN 2189-1621

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2016-11-29発行 No.064 第64号【前編】 647部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

【前編】
◇《巻頭言》「資料来て我照らすか」
 (阿児雄之:東京工業大学博物館)

◇《連載》「Digital Japanese Studies寸見」第20回
「国文学研究資料館のデータベース利用規程改定で古典籍画像データが一挙に
オープンに」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

【後編】

◇人文情報学イベントカレンダー

◇イベントレポート「第112回人文科学とコンピュータ研究会発表会」参加報告
 (永崎研宣:人文情報学研究所)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《巻頭言》「資料来て我照らすか」
 (阿児雄之:東京工業大学博物館)

## 井の中の蛙大海を知らず

 人文情報学月報の読者の方々はご承知のことと思われますが、歴史的資料が続々
とデジタル化、公開・提供されてきています。資料がデジタル化されたことにより、
様々なデジタル情報技術を駆使した調査・研究も盛んになっています。この人文情
報学月報が刊行されていることも、これら活動が活発に展開され、注目を浴びてい
る証左ではないでしょうか。

 さて、私が面白いと感じていることをテーマにして執筆くださいと、この巻頭言
の依頼を受けました。歴史的資料をデジタルデータとして発信することや、デジタ
ル化された資料をコンピュータを用いて処理・分析することなど、興味深いテーマ
はたくさんあります。アナログとデジタル、人的処理と機械的処理の話が多く語ら
れる分野です。しかし、私が現在、最も興味を惹かれているのは、これら技術適用
の前段階の話です。「資料はいつ資料となったのか」、「情報化されることの意味
はなんなのか」といったことに、時折、頭を悩ませています。ただの手紙やスナッ
プ写真が後世に残ったことにより貴重な資料となります。また、物質的な見た目は
なんら変わらないモノ同士であっても、それぞれが辿ってきた経緯が違えば別々の
資料として取り扱います。近年の罹災資料は、その典型例です。

 何が気がかりかと言いますと、これら資料をいかにして資料として見出すのかと
いう考えがやや希薄になってきているように時折感じることです。デジタル化の恩
恵を受け、物理的制限が低くなり、溢れんばかりの資料を簡便に研究材料として利
用することが可能な時代です。多少、ひねくれた考えかも知れませんが、それ故に
与えられた材料のみにて満足していませんでしょうか。与えられた材料を如何に上
手く調理するかが命題のようになっていませんでしょうか。もっと根本的な、資料
を見つけ出していくこと、整理・分類・体系化していくこと、資料の新たな一面を
照らし出すことへの挑戦が人文情報学の中で起きづらくなっていませんでしょうか。

## 雨垂れ石を穿つ

 人文情報学とは何かということを改めて問うことはしませんが、人文と情報を辞
書で調べてみました。新明解国語辞典[1]によれば、

 人文:人類の文化に関する事柄。
 情報:ある事柄に関して知識を得たり判断のよりどころとしたりするために不可
欠な、何らかの手段で伝達(入手)された種類の事項(の内容)。

と説明されています。

 人文資料は人類の文化の痕跡として存在し、資料情報とは人類文化に関しての知
識や判断のよりどころとなるものと捉えることができます。もちろん、人類の文化
の痕跡はその一部しか形として残りませんし、残せません。また同時に、意図的に
残すものを選択することもできれば、偶然残ってしまうこともあります。もし、現
存する資料の在り方のみを参照して、現在の私たちの文化を資料化していくだけで
すと、歴史学をはじめとする学問がどんどん先細っていきます。

 人文情報学の果たす役割のひとつとして、資料化の新しい視点を見出すことが挙
げられると考えます。私は大学において、埋蔵文化財を科学的手法を用いて調査・
分析する文化財科学を専攻していました。在学中、遺跡発掘調査にも従事していま
した。発掘調査はまさに過去の人類文化の痕跡を探しだすものです。発掘調査で発
見されるものとして、一般的には住居跡や石器・土器を想像されると思います。し
かし、遺跡には人間の目では検出できない、花粉や虫の卵なども残っています。土
壌に含まれている花粉の種類から当時の植生を推定したり、寄生虫卵の存在から便
所の位置や食生活を推定できたりします。これら分析の成果が広く知られるように
なると、発掘調査者の観察点も変わり、花粉や寄生虫卵の存在をも意識した調査へ
と発展してきました。

 これと同様に、新しい視点で資料化していくことが、人文情報学においても可能
と考えています。人的処理では到底扱えない量の資料を計量的に検索・分析したり
[2]、画像処理技術を応用して資料を擬似的に復元する[3]など、新しい資料の
扱い方が生み出されてきています。そして、その試みが積み重ねられていくことに
より、人文資料自身が発展していくと信じています。

## 先ず隗より始めよ

 これまで大きな理想ばかり述べてしまった感じがありますが、それに向かう行動
はすぐにでも始めることができます。研究に携わっている方であれば、調査・整理
した資料の一覧や論文・発表資料を、機関リポジトリなど広く多くの方が利用でき
る場所に登録・公開しましょう。文書など紙資料を対象に研究している方は、各地
の史料ネット活動[4]に参加し、資料化する過程を身につけるのはいかがでしょう。
開発した情報処理・分析手法については、GitHub[5]やQiita[6]などを通じて公
開してみてはどうですか。これらはすべて今の私たちの活動を記録するものであり、
意識的に残そうとしているものです。量としては個人から発せられるものですので、
わずかかもしれませんが、最初の一歩がなければ歩みも始まりません。

 そして、社会が日々生み出している法人文書においては、電子作成・決済が進ん
できており、その法人文書全てを保存し続けることも不可能ではなくなってきまし
た。しかし、全部残る世の中になると、人間とは面白いもので残さない方向へ注力
し始めます。不用意な発言や行動を記録しないとも限りません。「いかに記録し、
資料として残ったものをどう読み解くか」が王道ですが、これとは道を違える、
「何が記録されなかったのか、資料として残らなかったのか」ということも同時に
考えていかねばなりません。

 時代・地域・社会は違うけれど、人類文化の痕跡として残った資料を通じ、同じ
人類という立場から彼らを知るという行為はとても面白く、さらにその行為の結果
を先の誰かが知るというというのは、また興味深いですね。

[1]山田忠雄ほか編. (2012). 『新明解国語辞典 第七版』. 三省堂.
[2]村上征勝・金明哲・土山玄・上阪彩香著. (2016).『計量文献学の射程』. 勉
 誠出版.
[3]立命館大学アート・リサーチセンター. http://www.arc.ritsumei.ac.jp/
 (2016.11.18アクセス)
[4]歴史資料ネットワーク. "各地の史料ネット". http://siryo-net.jp/%E3%83%AA%E3%83%B3%E3%82%AF/
 (2016.11.18アクセス)
[5]GitHub. https://github.com (2016.11.18アクセス)
[6]Qiita. http://qiita.com (2016.11.18アクセス)

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
阿児雄之(あこ・たかゆき)東京工業大学大学院情報理工学研究科修了。博士(学
術)。奈良教育大学教育学部在籍時より文化財科学を専攻し、文化財を対象に理工
学的手法を用いた調査・研究に従事する。東京工業大学博物館においては学芸業務
と併行して、博物館資料(史料)情報の整備活用研究に携わる。アーカイブ関連と
して、「博物館・美術館にデジタル・アーキビストは必要か?」(『これからのア
ーキビスト-デジタル時代の人材育成入門』, 勉誠出版,2014)、「トリセツの取
説 製品取扱説明書のオープン・アクセス化はありえるか」(『DHjp』, No.4, 勉
誠出版, 2014)など執筆。

Copyright(C) AKO, Takayuki 2016- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《連載》「Digital Japanese Studies寸見」第20回
「国文学研究資料館のデータベース利用規程改定で古典籍画像データが一挙に
オープンに」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

 11月に入って大々的に公開された日本古典籍データセットの更新[1]とはちがい、
明確な発表はなかったものの、2016年10月1日付で国文学研究資料館のデータベース
利用規程が変わったことは注目に値する出来事であった[2]。あたらしいデータベ
ース利用規程によれば、オープンデータとはつぎのようなものである。

 「「オープンデータ」とは、人間文化研究機構国文学研究資料館の画像データの
オープン化に関する指針に基づき、当館データベースにおいて公開する館蔵原本資
料及び別に定める資料の画像データをいう。」[2]

 すなわち、国文学研究資料館(および許諾のあった機関等?)で公開される、同
館所蔵の資料画像のみがオープンデータの対象ということであろう(「画像データ
のオープン化に関する指針」についても公開されていれば拝見したかったが、され
ていないようである)。永崎研宣氏が指摘するように書誌データは対象外であって、
この点、日本古典籍データセットとは棲み分けがあるのかもしれない。

 ライセンスはクリエイティブ・コモンズ表示-継承(CC BY-SA 4.0)と呼ばれる
もので、国文学研究資料館に画像の著作権があることを示し、かつ、派生した著作
物にも同じ表示-継承のライセンスを適用する必要がある(引用であれば必要では
ない)。CCは、所定の条件を満たせば著作権上の制約は設けない、というものであ
り、表示-継承はその条件のなかの一種類である。派生作品とは、たとえば、小説を
翻訳したようなものをいい、この小説にも同じCC BY-SAでライセンスすることを求
めるのが継承の意味である。

 画像の活用に関しては、永崎氏がIIIFを通じて画像の閲覧およびダウンロードの
サービスを開始なさっているほか[3]、後藤真氏が提供者から見たこの規程改定と
永崎氏サービスの意義についてまとめておられるので[4]、本稿で扱うべきことが
らもあまりないのだが、いささか驥尾に付して(デジタル)日本学においてどのよ
うに活用することができるか漫然としたものではあるが考えてみたい。

 まず、オープン化が進んでいることを喜びたい。これまでも画像はデータベース
を通じて公開されていたとはいえ、一時期はウォーターマークが画像を隠すほどに
入っていたなど、サービスプロバイダーとして考えたときの所蔵機関と利用者の関
係は対等ではなく、つねに方針転換の不安がつきまとっていた。このたび、利用規
程の改定をうけて、安心して画像を使えるようになったことはとてもありがたいこ
とで、永崎氏が指摘するように、感謝し、かつ、支えてゆくべきことであろう。

 オープン化により、翻刻等の許可も不要になったものと思われる。翻刻の手続き
等は、公共機関であれば所定の手続きを踏むことで済むことではあり、また、これ
からも学術の基本として、出処などはきちんと明記すべきところであって、利用の
便が大きく増したということでもなかろうが、研究者の良心に信頼を受けたという
ことでもあり、喜ぶべきことであろう。ただ一節ばかりの引用をするのに事前申請
というのも煩わしく、任意の事後報告でよくなったというのは、いささか怠惰な姿
勢ではあるが、助かるところである。なお、データベースで画像が公開されていな
いものを直接拝見・調査して、翻刻等利用するには、これまでどおりの手順が維持
されているものと思われる(このあたりは国会図書館も同様で、バランスがどのよ
うにあるべきか一度考えてみたいところである)。

 今回のものについては、画像データのみのオープン化であり、附随するデータは
オープン化の対象とは示されていないので、データセットのような活用方法は難し
いかもしれない。あくまで、個々の資料を個別に扱うのが簡単になったというべき
であろう。その点で、デジタル処理を中心にした研究対象としては、オープンデー
タセットの価値はまったく下がっていないものと思われる。オープンデータセット
として整備することは、すくなからぬコストを要することであり、容易ではないの
で、このような二本立てになるのは理解できることである。

 一研究者としては、データセットの選に漏れるような対象を中心としていること
もあり、個人的に注目していた資料が分析しやすくなったのはありがたいはなしで
ある。文字画像に基づくデータベースを作るのは、これまでなにかと制約が多く、
使えるものでやりくりをするのに頭を悩ませていたが、今後は選べるものが多すぎ
て時間のやりくりに頭を悩ませるようになるものと思う。

 最後に、後藤氏の論考にも係わるところもあろうが、国文学研究資料館が古典籍
画像のオープン化という流れのなかで、どのようなロールモデルを果たそうとして
いるのかは興味深いところである。国文研では、文書や資料のURLといえるDOIを各
資料に設定して、データ引用の便を図るなどしている。それじたいは国会図書館も
していることではあるが、一般の大学図書館や公共図書館が古典籍のデータベース
公開を自館でしていく際には、規模が大きすぎて参考にならないところが多かった
かも知れない。国文研はその点、古典籍総合データベースなどの蓄積によって各図
書館の古典籍部門との関係も深いだろうし、古典籍画像のオープン化のリーダー格
ともなればおもしろい。そして、古典籍総合データベースがオープン古典籍画像の
総合検索サイトにでもなれば……というのは夢想が過ぎるだろうか。

[1] https://www.nijl.ac.jp/pages/cijproject/images/20161110_news.pdf
[2] 文書単独の永続的URIがなくリンクしにくいが、
http://www.nijl.ac.jp/pages/database/ に掲載されている。
[3] 国文研館蔵和古書画像400万コマ近くがオープンデータに!-
digitalnagasakiのブログ http://digitalnagasaki.hatenablog.com/entry/2016/10/23/181351
[4] 後藤真「文化資源のデジタルデータ流通に突きつけられた課題-国文学研究
 資料館のオープンデータ公開と永崎研宣氏による公開から考える」『リポート笠
 間』61。つぎのURIでオンライン公開されている(ここではオンライン版による):
  http://kasamashoin.jp/2016/11/post_3796.html
 なお、この論考を受けた議論がつぎにまとめられている:「文化資源のデジタル
 データ流通に突きつけられた課題-国文学研究資料館のオープンデータ公開と永
 崎研宣氏による公開から考える」(後藤真・国立歴史民俗博物館)に寄せられた
 関連ツイートまとめ-Togetterまとめ http://togetter.com/li/1044603

Copyright(C)OKADA, Kazuhiro 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 続きは【後編】をご覧ください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM064]【前編】 2016年11月29日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【 ISSN 】2189-1621
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: