ISSN 2189-1621

 

現在地

Perseus Digital Libraryのご紹介

◇《特集》「デジタル学術資料の現況から」第1回
 ペルセウス・デジタル・ライブラリーのご紹介(1)
(吉川斉:東京大学大学院人文社会系研究科 西洋古典学研究室)

Perseus Digital Library ペルセウス・デジタル・ライブラリー
http://www.perseus.tufts.edu/hopper/

 Perseus Digital Libraryは、米タフツ大学を拠点として運営・公開されている非
営利の電子図書館です。現在は、古代ギリシア・ローマのギリシア語・ラテン語文
献や図像資料、それらに関連する参考文献や辞書をはじめ、アラビア語文献、ルネッ
サンス期の文献など、多種多様な資料が電子化され、ウェブベースで公開されてい
ます。

 本欄は、Perseus Digital Libraryについて、徒然とご紹介していきます。回数未
定ですが、初回は簡単な歴史から。略歴[*1]や更新履歴[*2]がウェブサイト上
に掲載されていますので、それに多少肉付けする形でご紹介します。

 現在のウェブサイトではPerseus Digital Libraryと銘打たれていますが、それを
運営公開しているプロジェクトは、Perseusプロジェクトです。もともとPerseusプ
ロジェクトは、古代ギリシア(主にアルカイック期から古典期)の文献および図像
資料のデータベースを構築する計画として1985年秋から構想され、1987年に始動し
ました。当初、プロジェクトの拠点はハーバード大学でしたが、1993年の秋からタ
フツ大学へと移動し、種々の支援に支えられて現在に至ります。

 プロジェクトの主幹は、構想当時からプロジェクトに関わるGregory Crane博士で
す(86~88年はCo-Director、88年~Editor in Chief)。プロジェクトの常勤スタッ
フは博士を含めて8名[*3]。なお、博士の経歴によると、1985年から1993年までは
ハーバード大学(助教85~89年、准教授89~93年)、1992年からはタフツ大学に所
属(現在は教授)となっていますので、プロジェクト拠点の移動もそれに関わるも
のと思われます。

 現在のPerseusはウェブベースとなっていますが、当初のプロジェクトの成果は、
Perseus 1.0(1992年)およびPerseus 2.0(1996年)として、CD-ROM媒体の
Macintosh用ソフトウェアによって発表されています(イェール大学出版刊行)。
Perseus 2.0を確認したところ、副題には“Interactive Sources and Studies on
Ancient Greece”と付けられ、多くの図像資料や地図、参考資料とともに、28名の
古代ギリシア作家の作品が英訳付で収録されており、また、Intermediate版の
Liddell & Scott, Greek-English Lexicon(LSJ)が電子化されて収録されました。
電子化の利点を活かし、語彙の形態分析や用例検索、辞書検索、資料の検索や相互
参照なども容易にできる点が特徴です。あるいは、むしろ、電子化資料の活用法の
一例をPerseusプロジェクトが提示した、ともいえます(実行環境が手元にないため
実際の動作確認まではできていませんが、当時としては少々贅沢な環境が求められ
るソフトウェアです。)

 Perseusの沿革を見ると、ウェブでの公開は、1995年に開始したようです。1995年
といえば、Windows 95の登場とも相まって、インターネットが一般に普及し始めた
頃です。まだ利用者の少ない世界でしたが、Perseusプロジェクトは時代を先取りし
てウェブ公開を始めたともいえます。CD-ROM版Perseus 2.0の完成までは、ウェブサ
イトがPerseus 1.0以後のプロジェクトの公開の場となり、その後も、Windowsユー
ザーにとっては、Perseusの利用手段は基本的にはウェブサイトでした(後述すると
おり、Windowsでも利用可能となる、クロスプラットフォームなCD-ROM版Perseus
2.0は2000年3月にイェール大学出版から発売されます。)

 公開開始時のPerseusのウェブサイトは残念ながら未見なのですが、1997年以降の
様子は部分的にInternet Archiveで確認することができます[*4](冒頭で述べた
通り、更新履歴は現在のPerseusのウェブサイトに残っています)。1997年1月の様
子を確認してみると、当時多数あったウェブ評価サイトから各種の賞をもらってお
り(受賞報告ページも有り)、既に評判のサイトであったことを窺えます。1997年
頃には、たとえばProject Gutenberg[*5](発祥は1971年、ウェブ公開開始は1994
年ですので、Perseusよりも古いものです)や日本の青空文庫[*6]といった、現在
も続く電子図書館プロジェクトが既にインターネット上でウェブサイトを運営し始
めていましたが、Perseusの特異性は、ただ文献を電子化して公開するだけにとどま
らず、語彙データベースの構築や用例、辞書検索を含め、情報技術を用いた電子化
データの活用法を自ら模索して、利用者に提示している点に見出せます。

 ところで、この時期のウェブサイトの表題はPerseus Project Home Pageであり、
ページ下部にAn Evolving Digital Library on Ancient Greece and Romeとありま
す。ページによってはウェブサイトをWeb Perseusと説明し、まだCD-ROM版
Perseus 2.0と二本立ての状態でした。1997年1月時点では、CD-ROM版の方がウェブ
サイトの二倍近い図像資料を収録している一方、ウェブサイトでは1996年以降のプ
ロジェクトの進展が反映されています。ギリシア語辞書ではFull版のLSJが利用可能
になり、ギリシア語文献も複数追加された他、パピルス文献なども追加されました
(なお、パピルス文献は、現在はPerseusのコレクションから外れ、外部サイトに掲
載されています[*7])。

 1997年前後の特筆すべき点としては、ギリシア語文献だけでなく、ラテン語文献
やルネッサンス期の文献についても電子化する計画が進んだことでしょう。プロジェ
クトの射程が、古代ギリシアから古代ローマ世界、さらに先へと広がっていきます。
そして、1997年10月以降、電子化されたラテン語文献がウェブ上で公開され始めま
した。また、ウェブサイトのトップページが更新され、The Perseus Projectの副題
としてAn Evolving Digital Libraryが強調されるようになります。なお、1999年頃
になると、ページ内部にPerseus Digital Libraryの表記も見られるようになってい
ます。2000年頃には、幾つかミラーサーバが立てられており、ウェブサイト利用者
増大への対策が図られています。

 また、同じ時期に、Perseus 2.0のクロスプラットフォームなソフトウェアの開発
版が、ウェブサイト上で公開されている点も興味を惹きます。開発版の仕様では、
ソフトウェア開発にTcl/Tkを使用し(そのため開発版はPerseus Tkと呼ばれていま
す)、各種文献データや図像データ、検索結果などをインターネット上のPerseusサ
ーバから取得する方式になっています。つまり、サーバのデータ利用のためのフロ
ントエンドとして機能し、各OS向けに共通のインターフェースを提供するソフトウェ
アを目指していたようです。この方式の場合、サーバのデータが充実したときに、
CD-ROM版は過去のものとなります。1998年9月にベータ版のテストに入っていますが、
その時点で既にCD-ROM版を超えるデータがサーバ上にあり、インターネット接続さ
えできれば、それらを利用可能な状態になっていました。2000年3月にイェール大学
出版からクロスプラットフォームなCD-ROM版Perseus 2.0が発売された頃には(収録
データには1996年以降の更新も反映されます)、ネット環境の充実とともに、オフ
ラインで利用可能という点を除いて、CD-ROM版の意義は相対的に低くなりました。
さらにいえば、ソフトウェアで扱うデータはギリシア語関連文献のみであり、既に
ラテン語文献を公開し始めていたウェブサイトとの差も大きくなっていました。

 2000年11月、Perseusプロジェクトはウェブサイトの大規模更新を実施し、幾つか
のコレクションを追加して、Perseus 3.0へとバージョンアップしました。幅広い原
典資料を可能な限り広範な人々に参照可能な状態にすること(accessibilityの向上
など)を目標に掲げ、情報技術を用いて人文学研究の新しい地平を開くことを目指
す試行の場となります。サイトのタイトルはPerseus Digital Libraryへと変更され、
専用のソフトウェアを必要としない、完全にウェブベースなオンラインデジタル図
書館へと姿を変えました。Perseus 3.0の頃から、各種原典資料だけでなく、注釈書
や参考文献、文法書なども次々と追加されていきます。(一方、当時は、サーバの
性能や回線速度の問題か、データ表示に時間がかかることが多々あり、あるいはサ
ーバメンテナンスのためにPerseusがしばしば使用不能になっていた記憶もあります。
これはオンラインの弱点ともいえそうです。)

 2005年5月末、現行のバージョンである、Perseus 4.0(通称“Perseus Hopper”
)が公開されました。バックエンドにJavaを採用(それまでは主にPerlを用いてい
ました)、また、W3C勧告のウェブ標準仕様に準拠したウェブサイトへと更新されま
す。バックエンド変更による処理速度およびシステムの汎用性の向上が要点ですが、
当時広まりつつあったウェブ標準仕様に準拠して、OSやブラウザを選ばないウェブ
サイト構築を意識した点も注目すべき点といえます。また、各文献データについて、
TEIに準拠したXML化も進行し、データの可搬性や利便性向上が図られています。以
降も、サーバプログラムの更新や改良、各種文献の追加や整理、データのXML化が随
時進められていきますが、目新しいものとしては、2008年3月にPerseus 4.0に対応
したルネッサンス期文献コレクションが、2008年9月にはアラビア語文献コレクショ
ンが公開されています。

 一方、2006年5月に、それまで作成されたXMLデータがCreative Commons
Attribution-NonCommercial-ShareAlike(著作権者表示、非営利、ライセンス継承)
の下でダウンロード可能になります。さらに、翌年2007年11月には、Hopperプログ
ラム本体のソースコードが同ライセンスの下に公開され、ウェブサイトからダウン
ロード可能になります。これによって、Peuseusの利用者は、自身の環境にPerseus
4.0を構築できるようになり、状況に応じて利用者自身の手でプログラムを改良する
こともできるようになりました。なお、2008年5月にプログラムのソースコードは
Sourceforge上に移されています[*8]。また、2012年12月には、XMLデータのライ
センスがCreative Commons Attribution-ShareAlike(著作権者表示、ライセンス継
承)に変更され、適切な扱いの下での商用利用も可能となっています。

 近年のPerseusの展開について、私は「オープン(Open)」が一つのキーワードで
あると考えていますが、それはさておき、とくにここ数年のPerseusは、ギリシア・
ローマの古典作品の枠にとどまらず、それまで培った経験をもとに、より積極的に
情報技術と人文学の連携の在り方を探求しているように見えます。タフツ大学のウェ
ブサイトに先日掲載された大学紹介の記事にCrane教授が登場し、情報技術と人文学
の連携の先にあるものについて、それは“the digital humanities”ではなく“the
humanities in a digital age”であると述べていますが[*9]、これは現在の
Perseus Digital Libraryが展望する世界を示すものと言ってもよいかもしれません。

 さて、今回はPerseus Digital Libraryの機能や使い方などを具体的には扱いませ
んでしたので、次回は、「所蔵」されている何かしらの古典作品を参照しつつ、現
在のPerseus Digital Libraryの実際についてご紹介する予定です。

[*1] http://www.perseus.tufts.edu/hopper/help/versions.jsp
[*2] http://www.perseus.tufts.edu/hopper/help/oldannounce.jsp
[*3] http://www.perseus.tufts.edu/hopper/about/who
[*4] https://archive.org/web/
[*5] http://www.gutenberg.org/
[*6] http://www.aozora.gr.jp/
[*7] http://papyri.info/
[*8] http://sourceforge.net/projects/perseus-hopper
[*9] http://as.tufts.edu/news/2014digitalHumanities.htm

第二回へ | 第三回へ

Copyright(C)YOSHIKAWA, Hitoshi 2014- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

=======================
『人文情報学月報』No. 32より

Tweet: