ISSN 2189-1621

 

現在地

DHM 066 【前編】

2011-08-27創刊                       ISSN 2189-1621

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2017-01-31発行 No.066 第66号【前編】 654部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

【前編】
◇《巻頭言》「大学図書館はデジタル人文学に貢献できるのか」
 (石田栄美:九州大学附属図書館研究開発室)

◇《連載》「Digital Japanese Studies寸見」第22回
「ボランティアによるコラボレーションのありかた 『みんなで翻刻』リリースに
寄せて」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

【後編】

◇人文情報学イベントカレンダー

◇イベントレポート
「デジタルアーカイブの再設計~資料の利用のために何をすべきか/何ができるか~」
 (永崎研宣:人文情報学研究所)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《巻頭言》「大学図書館はデジタル人文学に貢献できるのか」
(石田栄美:九州大学附属図書館研究開発室)

 今回、巻頭言の執筆依頼をいただきました。私の専門分野は図書館情報学のため、
人文学やデジタル人文学を真正面から研究しているわけではありません。ただ、ち
ょうど、大学図書館はデジタル人文学にどのような貢献ができるのだろうかと考え
ていました。関心のあるテーマについて自由に書いてよいとのことでしたので、そ
の思いを少し書き留めておきたいと思います。なお、ここに書くことは、私が所属
する図書館の意見でもなく、また客観的な根拠に基づいたものでもなく、あくまで
私の個人的な経験をもとに書くものですので、ご了承ください。大学図書館におけ
るデジタル人文学の状況については、永崎氏により、きちんとまとめられたものが
ありますので、そちらをご覧ください[1]。

 ちょうど2年ほど前に学内の競争的資金(つばさプロジェクト)の支援を受け、
「デジタル人文学における研究資源オープン化と研究プラットフォーム構築に向け
た基盤的研究」という研究プロジェクトを始めました。プロジェクトの目的は、主
に大学図書館が所蔵する貴重な研究資料をオープンにし、研究資源として有効活用
してもらおう、また、それらの資料を活用できる研究環境を構築していこうという
ものです。これは、オープンサイエンスの一環として、近年、注目されているオー
プンデータの動きとも符合するものです。オープンデータとは、無料で何の利用制
限もなく、誰もが使えるように、研究データを提供しようとするものです。地球科
学や生命科学など、すでに共有のデータリポジトリ基盤が整いつつある分野もあり
ますが、人文学分野ではまだ確立されていません。このような状況の中、人文学分
野の貴重な資料を豊富に所蔵している図書館がそれらの研究資源をオープン化する
ことには意義があると考えたからです。このプロジェクトでは、九州大学附属図書
館が所蔵する春日政治・和男文庫の一部資料のデジタル化・公開[2]、オープンデ
ータを促進するためのデジタル展示の試み[3]などを行いました。これらの実践も
まだまだやることがありますが、以下では、2017年3月に米国の大学図書館における
オープンデータの現状調査とこのプロジェクトの一環として2018年1月に開催したシ
ンポジウム「オープンデータとデジタルヒューマニティーズ」の経験を通して、大
学図書館が貢献できることについて、私が個人的に感じたことを少し書きたいと思
います。

 1月のシンポジウムでは、イリノイ州立大学のStephen J. Downie教授の講演があ
り、HathiTrust リサーチセンターにおけるオープン・クローズドデータを利用した
デジタルヒューマニティーズの研究事例の紹介がありました。HathiTrustでは、著
作権の制限があり、全文が提供できないテキストに関しては、それを単語に分割し、
それらの情報を使うためのツールを数多く提供することで、テキスト・データを利
用した研究ができる環境が用意されています。たとえば、小説で使われる単語の変
化を200年に渡って分析した事例やある事柄に関する言及の分析を長い期間に渡って
行おうとする研究の紹介がありました。一つの大学図書館が自館の資料をデジタル
化、テキスト化し、オープンにしたとしても限界はあります。少ない資料をオープ
ンにしても意味がないのではと考える方もいるかもしれません。ただ、これらの事
例からは、大量の資料が利用可能な状態にあるということが、新たな研究をもたら
すことがわかります。日本でも、国文学研究資料館の歴史的典籍のプロジェクト[4]
を始めとして研究資源のオープン化に向けた動きはありますが、個々の大学図書館
でも眠っている貴重な資料をオープンにしていくことが重要という認識を持ちまし
た。様々な大学が自館の資料をオープンにし、それらがまとめて使える環境が整え
ば、いずれ、HathiTrustのようなことが可能になるのでしょう。

 図書館の貢献という話になると、どうしても、資料やデータ、またそれらを使う
ためのシステムへの支援といった側面に注目が集まりがちですが、本当の貢献とい
う意味では人的支援の側面が不可欠だと感じています。2017年に実施した米国の大
学図書館訪問調査では、イリノイ大学にあるResearch Data Service、カリフォルニ
ア州立大学バークレイ校を訪問しました。それぞれ、研究データに関係する方々と
話をしましたが、研究者の中でも、人文学の研究者、とりわけ、ポスドク、大学院
生等の若手研究者へのサポートの必要性を感じているということでした。積極的に
セミナーやワークショップを開いているとのことでしたが、個別にコンサルもやっ
ており、いくつか事例を聞きました。大学院生の場合、サイズの大きいExcelファイ
ルが開けなくて困っている、大きなデータから自分の研究だけに必要なデータだけ
を取り出したい、統計ツールを使いたいが使い方がよくわからないといったような
ことで、研究がなかなか進まないことが起こっているようです。もし、それで本当
に研究がストップしてしまう、または方針を変更せざるを得ないという事態になっ
たら、その大学院生の可能性をつぶすことにもなりかねません。人文学の研究者で
あっても、研究者自身が実際にデータを扱えるようになることもこれからの時代に
は特に重要であり、それに対して、データを提供している側や図書館が積極的に支
援するということが必要なのだと感じました。

 人的支援に関しては、そういった支援をする人材を育成することも、また、その
ような人材を図書館や研究データセンターのような場所に配置できるようにするに
は、時間もお金もかかることですし、実現までの道は遠いです。ただ、お話を聞い
た方々と熱意には並々ならぬものがあり、私も情報専門職の教育にも携わる身です
ので、このようなことに貢献できる人材育成をしなければならないと強く思いまし
た。難しいからといってあきらめるのではなく、可能性のあるところから少しずつ
でも、何とかしていきたいなという思いを新たにしました。

 研究者にとっては、研究資料がどのようなフォーマットであれ、比較的簡単に手
に入れることができ、また、それらを扱うための手厚い支援や便利なツールがあり、
自分のしたい研究がすぐにできるという環境が理想的ではないかと思います。この
ような世界が早く実現しないかと妄想をしながら、とりとめのない文章ですが終わ
りにしたいと思います。

[1]永崎研宣. 大学図書館とデジタル人文学. 大学図書館研究, 1-10, 2016.
[2]九州大学附属図書館. 九大コレクション『春日政治・和男文庫』
https://www.lib.kyushu-u.ac.jp/ja/collections/kasuga
[3]Emi Ishita, Tetsuya Nakatoh, Kohei Hatano, Michiaki Takayama. 2016.
An Attempt to Promote Open Data for Digital Humanities in Japanese
University Libraries. Then 18th international conference on Asia-pacific
digital libraries (ICADL2016), p.269-274.
[4]国文学研究資料館. 日本語の歴史的典籍の国際共同研究ネットワーク構築計画.
https://www.nijl.ac.jp/pages/cijproject/

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
石田栄美(いした・えみ)慶應義塾大学大学院文学研究科後期博士課程満期退学。
修士(情報学)(図書館情報大学)。国立情報学研究所COE研究員、駿河台大学を経
て、2011年4月から九州大学附属図書館研究開発室・統合新領域学府ライブラリーサ
イエンス専攻・准教授。専門は図書館情報学。テキストの自動分類、情報検索の研
究に従事。最近は、内容分析のプロセスの一部を自動化する研究にも従事。

Copyright(C) ISHITA, Emi 2017- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《《連載》「Digital Japanese Studies寸見」第22回
「ボランティアによるコラボレーションのありかた 『みんなで翻刻』リリースに
寄せて」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

「みんなで翻刻」が2017年1月10日にリリースされた[1]。これは、京都大学古地
震研究会の設置したものであり、地震関係史料未翻刻史料をボランティア・ベース
で翻刻を進めようというものである。当面の目標として、東京大学地震研究所の石
本文庫の翻刻を行うものという。マスメディアからの注目も著しく、大きく取り上
げられている[2][3][4]。石本文庫は、東大地震研第2代所長石本巳四雄の蔵
書が寄贈されたもので、災害に関する史料を集めたものであるという。

なお、この小文は、2017年1月16日現在の内容であって、その後加えられた変更は反
映されていない。開発者の橋本雄太氏がTweetしているように[5]、機能等の追加
や改善は随時行われるものと思われるので、この内容には拙速なものも少なからず
あろうかとは思われる。速報を意識した、俄仕立てのものであることはご承知のう
えお読みいただきたい。

「みんなで翻刻」は、地震を中心に、災害関係の未翻刻史料をボランティアの手を
借りて翻刻して、史料の発掘と有効活用を目指すものである。現在は石本文庫の史
料を用いているが、将来的にはもっとおおくの史料の翻刻を目指すとのことである。
参加者は、Google+、Facebook、Twitterのいずれかのアカウントを通じてログイン
することが求められる。現状では、原史料の画像は「みんなで翻刻」内での利用に
限られているが、できた翻刻文に関しては、クリエイティブ・コモンズライセンス
によって自由に利用できるようになっている(CC-BY-SA 2.1JPと古いものであるが、
意図があるのだろうか)。

史料の翻刻入力画面やガイドラインのほか、KuLA[6]との連携によって、初心者に
もできるかぎり開いたプロジェクトにしようとしている。KuLAとログインのデータ
ベースが共通のようで、KuLAにすでに登録しているひとは、そのアカウントでその
まま参加が可能になる。これは、「みんなで翻刻」というプロジェクトの名を実質
化する試みで重要であろう。利用者がどれほど使っているか興味が持たれるところ
である。

翻刻入力画面には、常用の記号類などのショートカットがあり、使い慣れなかった
り打ち方が分らなかったりする記号にも対応している。ノートが各コマに用意され
ており、翻刻上の問題点等について議論できるようになっている。翻刻は履歴管理
がされており、変更点を逐うことができる。翻刻を更新する際には、コメントを付
すことができる。最新の更新は随時反映され、初心者が疑問点をコメントに書いて
いるのを上級者が見つけて修正を加えるという光景もまま見られるが、いちど埋も
れてしまうとなかなか見つけにくいうらみがあるようである。また、翻刻を一通り
終えると翻刻完了というチェックをすることになるが、編集し直すと外れてしまう
など進捗管理がいまのところ直感的ではないなど、出発したばかりゆえの問題点は
皆無ではない。今後の開発が期待されるところであろう。

本プロジェクトをボランティアに史料を翻刻してもらうプロジェクトとして考えれ
ば、この発想じたいにあたらしさがあるわけではない。対象とする時代と分野は異
るが、青空文庫[7]を筆頭に、Project Gutenberg[8]などの似たような目的のプ
ロジェクトはすでにいろいろ続けられている。スミソニアン博物館では翻刻プラッ
トフォームを設けて、同様のプロジェクトを多数運営しているそうである[9][追
記]。青空文庫などは、ボランティアによってのみ運営されており、対して、スミ
ソニアン博物館では同博物館の監修の作業が進められているという相違がある。コ
ミュニティの形成ということを考えたときに、なんらかのかたちで先行プロジェク
トの形態に学ぶところはあるかと思うので、印象論ではあるが、比較を行ってみた
い。

このようなプロセスの差は、最終的な責任のありようとも係わり、先行プロジェク
トでも絶えず議論されてきたものと思われる。いずれのプロジェクトでも、翻刻の
対象・方法・掲載までの流れなどの手順やスタンダードが定められ、プロジェクト
としての質を確保しようとしている。Project Gutenberg[10]や青空文庫[11]な
どでは、翻刻を行うボランティアがプロジェクトのありかたにまで決定権を持ち、
中心となる人々の合意によって(Wikisourceのように[12]、運営財団がサービス
プロバイダーと割り切って方針決定にまったく関与しないものもある)。スミソニ
アン博物館のプラットフォームでは、プロジェクト実施者が情報の正当性にまで係
わることによって、運営にボランティアに携わる範囲が制限されている[13]。

さきほど「みんなで翻刻」の進捗管理について触れたが、進捗管理のありようを決
めることは、ボランティアがどこまでプロジェクトに関わるのかということと無関
係ではない。「みんなで翻刻」というプロジェクトにとっては、京大古地震研究会
が、運営者として運営方針や内容にどこまで関わっていくのかということである。
相互レビューや管理者を置くという予定もあるとのことであるから[14][15]、
すくなくともスミソニアンほど伽藍的ではなく、かつWikisourceほどバザール的で
もなく、中間的なものになるのだろうとは思うが、そのためには、参加者相互のコ
ミュニティ形成が欠かせず、フォーラムや履歴確認機能などの、いまは不足してい
る機能を通じて技術的・人的に支援していくこととなるのであろう。

日本学のほかの分野の資料の翻刻プロジェクトを実施していくにあたっても、たん
に「見たまま」に翻刻をしていけばいいのではなく、それぞれの分野の事情が影響
してくるものと思われる。日本語学の立場から翻刻を見たとき、「見たままの翻刻」
とはなにかということはつねに気にかかるところである[17]。文学研究にはまた
ちがった翻刻の流儀や目的もあろう。「みんなで翻刻」がどのように参考にできる
か、注目されるものと思う。

[1]Webアプリケーション「みんなで翻刻【地震史料】」の公開 -市民参加で地震]
 史料を後世に残し、新たな史料発掘へ-京都大学
http://www.kyoto-u.ac.jp/ja/research/research_results/2016/170110_1.html/
[2]地震古文書みんなで解いて 京大がアプリ開発、参加募集:朝日新聞デジタル
http://www.asahi.com/articles/ASK1674LMK16PLBJ00Z.html
[3]みんなで翻刻:古文書、地震読み解け 京大の研究会、市民参加へサイト-毎
 日新聞 http://mainichi.jp/articles/20170111/ddf/041/040/005000c
[4] 古い地震史料のくずし字をユーザーがテキスト化する「みんなで翻刻」、京
 大・古地震研が公開-INTERNET Watch http://internet.watch.impress.co.jp/docs/news/1038501.html
[5] https://twitter.com/yuta1984/status/820284453368926208
[6]KuLAは、本連載第11回でも言及した、古文献手書き文字学習アプリである。
[7]青空文庫 Aozora Bunko http://www.aozora.gr.jp/
[8]Free ebooks by Project Gutenberg - Gutenberg https://www.gutenberg.org/
[9]Smithsonian Digital Volunteers https://transcription.si.edu/
[10]DP: FAQ Central https://www.pgdp.net/c/faq/faq_central.php
[11]工作員手帳 http://eunheui.sakura.ne.jp/aozora/
[12] https://ja.wikisource.org/
[13] https://transcription.si.edu/instructions
[14] https://twitter.com/yuta1984/status/819341965007294464
[15] https://twitter.com/yuta1984/status/820111775257403396
[16] https://twitter.com/yuta1984/status/820113977053065216 開発者も募集
 する可能性が示唆されている。
[17] 池田証寿(2003)「包摂と分離-多漢字文献翻刻の問題-」(『情報処理学
 会研究報告』2003-107)を参照。

[追記]永崎研宣氏より米国国立公文書記録管理局(NARA)が「市民アーキヴィスト」
 のためのポータルにおいて翻刻事業を行っているよしご教示いただいた。
 Transcribe | Citizen Archivist | National Archives
https://www.archives.gov/citizen-archivist/transcribe
 NARAでは、この事業を検索結果向上のためと位置づけているようで、翻刻のチェ
 ックプロセス等にはとくに定めがなく、またタグ付けを推奨している点でもほか
 のプロジェクトと違った目的を持つものといえよう。コミュニティ形成という面
 では、「翻刻者コミュニティ」というものがもっとも成立しにくいもののようで
 はあるが、翻刻のためのヒントなどが充実している点、違ったおもしろさがある。
Transcription Tips | National Archives https://www.archives.gov/citizen-archivist/transcribe/citizen-archivist/...
永崎氏に感謝申し上げる。

Copyright(C)OKADA, Kazuhiro 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 続きは【後編】をご覧ください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM066]【前編】 2017年01月31日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【 ISSN 】2189-1621
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄