ISSN 2189-1621

 

現在地

集合知で読む歴史史料-SMART-GSが実現するグループリーディング

集合知で読む歴史史料

SMART-GSが実現するグループリーディング

橋本雄太(京都大学大学院文学研究科 博士後期課程)*

史学研究の現場では、個人では手に負えない規模の歴史史料に対してチームベースで研究を行う事例が増えつつあります。本稿ではそうした史料研究をサポートするデジタルツールとして、歴史文献研究支援ソフトウェアであるSMART-GSを紹介します。

歴史史料のグループリーディング

 人文学研究者にとって「書物を読む」行為は、もっとも基礎的かつ重要な活動であるということに異論を唱える人は少ないのではないでしょうか。文学研究者であれば文芸作品を、歴史研究者であれば歴史史料を読むことなしに研究は成立しません。

 今日、書物を読むという行為は他者の介在しない個人的作業として考えられています。しかし読書史・書物史を紐解くと、私達の現在の読書形態、つまり黙読が一般に普及したのは中世以降のことであったと言われています[1]。古代ヨーロッパにおいては読書とは、公共の空間で文章を朗々と読み上げ、その内容を周囲の人々と共有するために行われた、コミュニケーション的性質の強い営みであったようです。黙読を実践する人々の例も紀元前後から確認することができますが、それは多くの場合特別な目的を持って行われる、例外的な行動として捉えられていました。たとえば4〜5世紀に生きた聖アウグスティヌスは、有名な『告白』の中で、読書家であった聖アンブロシウスが黙読する姿に接した際の驚きを次のように記しています:

かれが書を読んでいたとき、その眼は紙面の上を馳せ、心は意味をさぐっていたが、声も立てず、舌も動かさなかった。しばしば、わたしたちがかれのもとにいたとき――だれでもはいって差し支えなく、来客を取り次ぐ習わしではなかったので――かれはいつもそのように黙読していて、そうしていないのを見たことは一度もなかった 。[2]

無言で書物の世界に没入するアンブロシウスの姿は私達にとっては当たり前のものですが、アウグスティヌスにとっては相当に異様な光景として映ったようです。

 音読が読書の一般形態であったのは西洋に限られた話ではなく、日本国内においても明治期に至るまでは読書といえば音読のことを意味していました。明治維新後に設置された日本初の官立図書館では、利用者が皆書物の内容を声に出して読み上げたために、静粛を保つのに大変な苦労をしたという逸話が残されています[3]

 現代では公共の空間で書物を音読する機会はそう多くはありません。しかしながら、書物の内容を複数人で同時に共有する活動、たとえば、テキストの講読や輪読といった活動は、人文学研究の現場で日常的に実践されています。グループによって書物を共有する読書活動には一種の集合知的な効用があり、 複数の人間がテキストの解釈に参与することで致命的な誤読の発生を防ぐとともに、テキスト内容に関する議論を通じて個人の読書行為では得られなかった知見を参加者にもたらすことができます。

 同様のことは、歴史史料の読解や翻刻についても言うことができます。とりわけ歴史史料は、読み手と書き手の間にある時代的隔たりのために、あるいは史料自体の経年劣化や破損のために、訓練を積んだ専門家でも読解が困難なものが少なくありません。そうした史料の読解・翻刻にあたっては、複数人のコミュニケーションを通じて読解内容の妥当性を担保するグループリーディングが有効です。

 ただし、グループで行う歴史史料の読解・翻刻はそう簡単な作業ではありません。従来、こうしたグループリーディングは紙に印刷した史料を参加者に配布する方法で行われてきましたが、この方法では各参加者が史料に施した注釈やコメントを一箇所に集約し、共有することが困難です。また、史料の翻刻文を作成する場合には、翻刻文の共有と保存の方法も問題になります。これらの課題を克服し、チームベースの史料読解をスムーズに進行するためには、何らかのデジタルツールの補助が必要になります。

 本稿で紹介する”SMART-GS”というソフトウェアは、そうした歴史史料をグループで読解する作業を支援するツールとして、数年にわたり史学研究の場で活用されてきました。以下にその詳細を述べたいと思います。

歴史文献研究支援ソフトウェアSMART-GS

 SMART-GSは、主としてデジタル化された手書き歴史史料の読解をサポートするため、2006年に私の指導教官である京都大学の林晋教授によって設計・開発されました。以来、林教授を中心として数名のプログラマーと史学研究者によって継続的に開発が行われています。SMART-GSはプログラミング言語のJavaで構築されており、Windows、OS X、 Linuxなどの主要プラットフォーム上で動作します。現在はオープンソース・プロジェクト化され、SourceForge.jp上でソースコードと実行用ファイルを自由にダウンロードすることができます[4]

 SMART-GSの開発が始まって今年で8年になりますが、歴史文献の翻刻・分析用ツールとして、これまで以下に挙げる6件の歴史研究プロジェクトに採用されてきました(括弧内はプロジェクトの主導者):

  • 数学者ダーフィト・ヒルベルトの手稿研究(京都大学・林教授)
  • 哲学者田邊元の手稿研究(京都大学・林教授)
  • 倉富勇三郎日記翻刻プロジェクト(京都大学・永井和教授)
  • 内海忠司日記翻刻プロジェクト(近畿大学・近藤正巳教授)
  • テルグ語インド古典文献研究(京都大学・志田泰盛助教)
  • ガリレオ手稿研究(京都大学・伊藤和行教授)

上記プロジェクトの他に、国立科学博物館に収蔵されている物理学者・長岡半太郎の遺稿や、同じく物理学者のヴィルヘルム・オストヴァルトの書簡の分析にSMART-GSを使用する計画が現在進んでいます。

SMART-GSの諸機能

 SMART-GSは、デジタル化した史料画像についての研究をサポートするために、種々の機能をサポートしています。以下ではそのうちの代表的な機能を紹介します。

①画像とテキストのマークアップ機能
 SMART-GSはデジタル化された史料画像を取り込み、史料画像中の任意箇所にコメントや強調などの付加情報(マークアップ)を付加することができます 。図1は、インド古典学研究者の志田泰盛氏が、8-10世紀に成立した『プラカラナ・パンチカー』(Prakaraṇapañcikā)というテキストの分析にSMART-GSを使用している模様のスナップショットです。画面上部に史料画像が、その下に史料の翻刻テキストが表示されています。史料画像上に表示されている青色の枠線や黄緑の矩形に囲まれたコメント文は、志田氏が史料読解の補助のために付加したマークアップです。

 また、SMART-GSはHTMLエディターを内蔵しており、史料画像の翻刻テキストをHTMLデータとして保存することができます。このため、リストやテーブルなどHTML要素を利用して画像と同様に翻刻データをマークアップすることが可能です。

 画像マークアップ情報と翻刻テキストは、史料画像とは独立に軽量なXMLデータとして保存されます。したがって、このXMLファイルを共有すれば複数人で史料画像に対するコメントや解釈を共有することができます。


図 1: SMART-GSでマークアップされたインド古典『プラカラナ・パンチカー』
②マークアップ間のリンク作成
 前項で述べたマークアップの間に何らかの関係性がある場合は、 その間にリンクを作成することができます。リンクは任意のマークアップ間に作成することができるため、図2のように、史料画像の特定箇所と翻刻文の間にリンクを張って両者を対応付けることも可能です。HTMLとは異なり、SMART-GSは単一のマークアップから複数のマークアップにリンクを作成する一対多型のリンクをサポートしています。さらに、マークアップ間のリンクの関係をグラフィカルに表現する俯瞰図を作成する機能もSMART-GSには付属しています。図3はこの俯瞰図を史料中のテキストの執筆年代の推定に使用したものです。この機能はリンクで紡がれたウェブによって史料に関する推論を支援するという意味で、Reasoning Webと呼ばれています。


図 2:史料画像と翻刻文の間に張られたリンク


図 3:Reasoning Webによるテキストの執筆年代推定

③手書き文字サーチ
 SMART-GSは、画像の類似度に基づいた手書き文字の検索機能をサポートしており、史料画像中の任意の文字列を指定すると、それと似た形状の文字列を史料画像中から検出することができます[5]。図3は、京都学派の哲学者・田邊元の手稿から「Scheler」というドイツ人哲学者の名前を検索した結果です。検索結果の上位4件に「Scheler」という文字列が表示されています。

 SMART-GSの手書き文字サーチは、画像処理研究者の寺沢憲吾准教授(公立はこだて未来大学)が開発したサーチエンジンを利用したもので、画像の類似度に基づいて検索を行うため、検索対象の史料が書かれた言語に関わらずに検索を実行することができます 。史料中に出現する特定のキーワードを列挙する際や、判読不能な文字列の意味を文脈から推測する際には非常に強力です。

 また、検索結果一覧から正解画像のみを人間が選択し、それらを再び検索クエリとして使用することで、再帰的に検索の精度を高めていくことができます。


図 4:SMART-GSの手書き文字サーチ機能

SMART-GSを利用した集合知による史料読解

 長々とSMART-GSの解説を述べてきましたが、 冒頭で述べた「集合知を駆使した史料読解」をSMART-GSがいかに実現するのかについて話題を進めます。といっても、実はSMART-GSは林教授個人の数学史研究を支援するためのツールとして設計されたもので、本来複数の人間で利用されることは意図されていませんでした。SMART-GSをグループで利用する方法を発案したのは、近現代史の研究者である京都大学の永井和教授です。

 永井教授は、明治〜昭和初期の高級官僚である倉富勇三郎の日記翻刻プロジェクトにSMART-GSを採用しました。倉富日記は「日記魔」とも呼ばれた倉富勇三郎により、9年間にわたって304冊の日記帳に綴られた世界的にも類を見ないほど長大な日記です。個人の作業容量を遥かに超える倉富の日記集に対して、永井教授は全体の作業を分割し11人のメンバーの協働で翻刻にあたる体制で挑みました。実際の翻刻にあたっては、次のような作業フローがとられました。まず、翻刻担当のメンバーが、倉富日記のスキャン画像をSMART-GSにインポートし、SMART-GS上で翻刻文の作成を行います。その際、SMART-GSのプロジェクトファイルをWebDAVサーバー上に格納することで、メンバー間で翻刻データを共有します。また、翻刻担当メンバーとは別に配置されている校閲担当メンバーが、翻刻担当メンバーが作成した翻刻文をチェック・訂正して、翻刻文を確定させます。さらに出来上がった完成翻刻文に対して注釈を施し、最終的な出版用稿本を作成します[6]

 倉富日記翻刻プロジェクトにおけるSMART-GSの利用方法は、個人用ツールとして開発されたSMART-GSの設計意図とはまったく異なるものでしたが、複数人で史料画像データを共有し、翻刻や解釈の妥当性をチームで検証する体制が、歴史史料の研究に非常に有効であることを示唆してくれました。倉富日記の翻刻プロジェクト以降、SMART-GSを利用した歴史研究プロジェクトの多くはこの方法を踏襲しています。

 例えば、京大文学部で行われている田邊元研究会では、昭和9年に田邊元が行った講義の準備原稿の翻刻にSMART-GSを使用しています。具体的な方式としては、まず持ち回りの担当者がベースとなる翻刻文を使って作成した上で、図5のように研究会の席上にてSMART-GS上の翻刻文と史料画像をスクリーンに投影します。このようにして史料画像と翻刻文を参加者間で共有し、翻刻文のチェック・訂正や、史料内容についての議論を行います。田邊の手稿はドイツ語、ギリシャ語、ラテン語が入り交じる難易度の高い文章で、加えて極めつけの悪筆で書かれているため、個人の手で完璧な翻刻文が完成することはほとんどありません。しかしながら、異なるバックグラウンドを有する複数の参加者が、お互いに知恵を出しあい、史料解釈を共有することで、多くの場合は問題無く翻刻文を完成させることができます。田邊の手稿のように判読困難な史料の場合、ひとりの専門家の力よりも、複数の人間のコミュニケーションを通じて得られる集合知の方が強力であるということが、研究会を通して経験的に確かめられつつあります。

 同じように、近畿大学の近藤教授が主導する「内海忠司日記研究会」においても、SMART-GSを使用したチームによる翻刻内容の共有とチェックが行われています(図6)[7]


図 5:田邊元研究会にてSMART-GSを使用する模様


図 6:内海忠司日記研究会にてSMART-GSを使用する模様

SMART-GSのこれから

  SMART-GSは現在も進行中のプロジェクトであり、私も含めた数名の開発者が新規機能の導入にあたっています。現在開発チームが取り組んでいる主要な課題は、TEI(Text Encoding Initiative)への対応と、ネットワークベースのプロジェクト支援機能強化の2点です。

 先述した通りSMART-GSはJava製のHTMLエディターを内蔵しており、翻刻文をHTMLでマークアップすることができるのですが、HTMLでは翻刻テキストの構造的・意味論的な表現能力に限界があります。たとえばHTMLでは「人物」や「地名」といった情報を明示的にマークアップすることはできません。そこで、現在は人文学テキストのマークアップ方式の世界標準であるTEIに対応したエディターを開発中です。SMART-GSのTEI対応が完了すれば、史料の翻刻テキストを標準化されたフォーマットで、精密に構造化して記述することが可能になります。

 また、 倉富日記翻刻プロジェクトのようなチームベースの史料研究に使用されることを念頭に置いて、SMART-GSで作成されたプロジェクトの共有と履歴管理を行うための機能の開発も進められています。この機能はソースコードのバージョン管理システムであるSubversionを手本に設計されたものです。簡単なグループウェアとしての機能もサポートしており、遠隔地にいる複数のメンバーがひとつのプロジェクトに参加することを意図して設計がなされています。この機能が完成すれば、Skypeのようなビデオチャットツールやデスクトップ共有ツールと組み合わせて、対面式の研究会や読書会と同じように、参加者間で同期的にコミュニケーションを取りながら史料読解を進めることも可能になるはずです。

おわりに

 最後に、私自身が開発している、もうひとつのソフトウェアについて少しだけ紹介させてください。国立国会図書館によって運営されている「近代デジタルライブラリー」(近デジ)[8] については、多くの方々がご存知のことだと思います。近デジのウェブサイトでは、国会図書館の蔵書のうち、著作権処理の終了した35万件以上の書籍の画像データが提供されています。近現代史研究者にとっては宝の山のような存在ですが、一方で、近デジのユーザーインターフェイスはPC上での閲覧を想定して設計されており、電子書籍のように持ち運び可能な媒体で歴史史料を読むことはできません。そこで、今年2月にスマートフォンやタブレット上で近デジ資料を閲覧するためのiOSアプリケーションを開発し、『近デジブラウザ』という名前で公開しました[9]

  『近デジブラウザ』は試験的に3日間でコードを書き上げた至極単純なアプリなのですが、公開後にTwitter上で宣伝したところ予想以上に大きな反響がありました。 近デジがいかに多くの人々に愛用されているか、身をもって知ったように思います。

 これに味をしめた訳ではありませんが、現在はこの『近デジブラウザ』を拡張し、近デジ資料に対してユーザーがコメントやアノテーションを追加することを可能にするアプリケーションを開発しています。動画サイトの「ニコニコ動画」の歴史史料版と考えて頂ければ、イメージしやすいかもしれません(ただしコメントは流れませんが)。

 近年の電子書籍の普及とともに、インターネットを介して読書体験を読者間で共有する、いわゆる「ソーシャルリーディング」と呼ばれる仕組みが注目を集めています。例えば、書籍のレビューやリスト、お気に入りの引用文といったコンテンツをユーザー間で共有するGoodreads [10]というソーシャルサービスは、2013年7月の時点で2000万人のユーザーを獲得したと発表しました。また、読書史・出版史の観点からソーシャルリーディングの興隆を分析したメディア論研究も最近出版されています[11]。私が現在開発しているアプリは、こうしたソーシャルリーディングの仕組みを近デジ上の公開資料に適用しようとするものです。

 ただし、ユーザーがどのようにシステムを利用することになるのか、開発者の私自身にも予測がつきません。アプリを公開しても、ほとんど誰もコメントを書き込まないのでは、という不安もありますし、ひょっとしたら史学研究者間の交流を促進し、共同研究の成立に一役買うことになるかも知れない、という期待も一方であります。

 私個人の試みがどういう結果を生むかはさておき、ブログやWikiといった新しいメディアやKindleに代表される電子書籍リーダー、またソーシャルリーディングなどの新しい読書スタイルの普及によって、「書物を読む」行為の意味は着実に拡張されつつあります。 これまで研究者の個人的営為として把握されることの多かった「歴史史料の読解」も、 古代に実践されていた読書方式のように、一種のコミュニケーションとして捉え直される日が来るかもしれません。本稿で紹介したSMART-GSのようなツールは、このような史料読解の社会化に少なからず貢献するはずだと私は考えています。

  1. ^アルベルト・マングェル『読書の歴史—あるいは読者の歴史』(原田範行訳、柏書房、1999年)
  2. ^アウグスティヌス『告白 上』 (服部英次郎訳、岩波文庫、1976年)、168頁
  3. ^永嶺重敏『〈読書国民〉の誕生:明治30年代の活字メディアと読書文化』(日本エディタースクール出版部、2004年)
  4. ^http://sourceforge.jp/projects/smart-gs/
  5. ^寺沢憲吾、長崎健、川嶋稔夫、 "固有空間法とDTWによる古文書ワードスポッティング"、 電子情報通信学会論文誌、vol.J89-D, no.8, pp.1829-1839 (Aug. 2006)
  6. ^永井教授らによる倉富日記の翻刻文は、現在第二巻までが国書刊行会から出版されています。『倉富勇三郎日記』(倉富勇三郎日記研究会編、国書刊行会、2010-2012年)
  7. ^内海日記は、植民地時代の台湾で台北州警務部長などを務めた地方官僚である内海忠司による日記です。現在約10年分の日記が近藤教授らによって出版されています。『内海忠司日記1928-1939』(近藤正己・北村嘉恵・駒込武編、京都大学学術出版会、2012年)
  8. ^http://kindai.ndl.go.jp/
  9. ^https://itunes.apple.com/app/id799259241
  10. ^https://www.goodreads.com/
  11. ^Cordón-García, José-Antonio, et al. Social Reading: Platforms, applications, clouds and tags. Elsevier, 2013.

======================
プロフィール ^
1984年生まれ。京都大学大学院文学研究科博士後期課程。京都大学文学研究科博士前期課程修了後、株式会社内田洋行にてWebエンジニア職を経て現課程に編入。専門は近代西洋科学史および歴史情報学。iOSアプリ『ドイツ語基礎単語800』、『近デジブラウザ』を公開中。

※『人文情報学月報』No. 37 所収

Tweet: