ISSN 2189-1621

 

現在地

DHM 034 【前編】

2011-08-27創刊

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2014-05-28発行 No.034 第34号【前編】 476部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【前編】
◇《巻頭言》「デジタル技術になぜ人文学は必要なのか」
 (大谷卓史:吉備国際大学アニメーション文化学部)

◇《連載》「Digital Humanities/Digital Historyの動向
      ~2014年4月中旬から5月中旬まで~」
 (菊池信彦:国立国会図書館関西館)

◇《特集》「デジタル学術資料の現況から」第3回
 ペルセウス・デジタル・ライブラリーのご紹介(3)
 (吉川斉:東京大学大学院人文社会系研究科 西洋古典学研究室)

【後編】
◇人文情報学イベントカレンダー

◇イベントレポート(1)
北米日本研究司書の協力のあり方、これまでとこれから
-デジタル人文学の登場をきっかけに(CEAL、NCC、AAS年次会議参加レポート)
 (田中あずさ:ワシントン大学)

◇イベントレポート(2)
CAA2014
 (堀内史朗:山形大学)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《巻頭言》「デジタル技術になぜ人文学は必要なのか」
 (大谷卓史:吉備国際大学アニメーション文化学部)

 私の関心領域は、情報技術の社会史・科学技術史、デジタルメディア研究、情報
倫理学--などである。これらの分野は、デジタル社会の過去・現在・未来に対応
する学問をカバーするように思われる。

 情報技術の社会史・科学技術史は、デジタル社会の来歴を研究するものである。
情報技術の研究開発史にとどまらず、社会への情報技術の普及と影響、社会からの
情報技術のあり方への制約などを歴史的に研究していくことになる。

 次に、デジタルメディア研究は、ジャーナリスティックにもなるが、歴史的知見
や後述する情報倫理学の視点も取り入れて、現在のデジタルメディアと人間・社会
とのかかわりを観察し、分析するものだ。主にエッセイという形式で、近頃起きた
デジタルメディアにかかわる事件やデジタルメディアと人びととのかかわりを記述
・分析する活動がこれにあたる。

 情報倫理学は、デジタル社会の過去・現在にもかかわるが、デジタル社会の倫理
や規範を探究・探求するという立場から、主に未来にかかわる学問だと思われる。
現在・過去の規範やルールとそれにかかわるデジタル社会の論点を記述し、批判的
に分析するとともに、デジタル社会のあるべき規範やルールを探るという活動は、
デジタル社会の未来を(思考実験的に、また現実のルールの構築によって)創造す
る試みでもある。

 これらの活動は、歴史・哲学・倫理学などの人文学を背景とする学問的・知的営
為と考えられるが、人文学の視点からデジタル技術を考察することはなぜ必要なの
だろうか。デジタル技術もデジタル技術の研究開発もそれ自体で自足しており、人
文学の視点による研究などは必要がないという見方ももちろん可能だろうから。

 ところで、先日「マンガ・出版の著作権」という授業で、放送大学オープンコー
スウェア「日本漫画と文化多様性~世界に拡散する絵物語コミュニケーション」[1]
を上映し、学生とディスカッションした。同コースウェアは、出口弘東京工業大学
教授の放送大学特別講義をそのまま収録したものである。この講義は、放送当時
Twitter周辺が大いにざわついた放送大学神回として知られている。[2]

 この講義を見せて学生とディスカッションしたところ、「先生があまりにも熱す
ぎて引く」と言われ、衝撃を受けた。ここで先生が私か出口教授であるか謎である
が、いずれにせよ彼らにとっては自明であるマンガのおもしろさについて語ろうと
する大人がたぶん暑苦しかったのだろう。また、「おもしろいものはおもしろいで
よいのではないか」という感想を書いた学生もいた。もちろんそのとおりで、マン
ガは娯楽であるし、おもしろければそれでよいのであって、それについて語ろうと
することは余計なことなのかもしれない。

 しかし、人間の営みである限りは、その営みが私たち人間にとってどのような意
味を有しており、人類文化の伝統・歴史の中でどのように位置づけられるのか、私
たちのそれぞれの人生にとってどのような意味があるのかやはり考えようとするべ
きではないだろうか。

 デジタル技術は技術そのもので自足しているわけではなく、私たちの社会の中で
の営みであり、企業活動や政府・大学の研究開発という文脈の中で社会から資金や
人材などの提供を受けて展開・成長する一方、その成果が私たちの社会や人生に大
きな影響を与える。そして、デジタル技術の研究開発や製造という現場そのものが、
人間同士が交流し、交渉して利害調整を行い、さまざまな駆け引きや競争、協力な
どが行われる、人間くさい場所である。人間がかかわるところには、何らかの価値
判断が入り込み、技術の開発や利用においてもいかなる価値を優先すべきか、とい
う考慮が存在せざるをえない。

 私たち人類にとって、そして私たち個人にとって、デジタル技術とは何であるか
ということを私たちは知らなければ、デジタル技術によって形成されつつあるこの
デジタル社会を生きていくことも、そしてよりよいデジタル社会のあり方を探るこ
ともできないだろう。人類の文化の集積を保存し、教育や保存・展示などの活動を
通じて次代に引き継いでいくとともに、人類と世界とのかかわりについて価値を含
む総合的な観点から考察する人文学の伝統は、デジタル社会においてもますます重
要性を増大させるとしても、弱まってよいという判断は成り立ちえないはずだ。

 デジタル社会における人文学的視点からの哲学・倫理学、歴史学などの考察や、
デジタル技術やデジタル社会を対象とするそれらの学問からの接近は、デジタル社
会における私たちとは何かを知るために必要なのだと思われる--という言説は、
たぶん件の学生が言うように暑苦しいようにも思えるのだが、やはり記しておきた
い。

 これらの学問や関心領域は相互に影響し、相互に浸透し合うものだから、トータ
ルに研究することが望ましい。

 ところが、現代の専門分化した科学のあり方からすると、きっちりと学問・関心
領域を区画し、境界づけることが求められることになるだろう。もちろん方法論抜
きでかつ思い付きだけでいい加減に学問を進めることは戒められるべきである。し
かしながら、歴史も現代社会の分析も、倫理学も、その対象とする現象や規範、概
念の文脈や背景をも含みこんだ形で研究をしようとするならば、幅広い分野の知識
や知見を総合し、現在・過去・未来を往還しながら対象を考察する必要が出てくる
だろう。少なくとも興味関心を広く取ることが求められる。

 また、デジタル社会をよりよいものにしていくためにも、総合的な知識や知見が
必要とされる。複雑な現代社会の問題を解決するため、多数の学問分野の協働や「
学際的」といわれるような学問分野の構築が求められるが、これらの協働や学際的
分野の創出のためには、個別科学の知識だけでなく、これら個別科学の知識を人類
文化の伝統に接続するための人文学的が必要に思われる。

[1] http://ocw.ouj.ac.jp/tv/70111021/
[2]Togetter「放送大学特別講義『日本漫画と文化多様性~世界に拡散する絵物語
 コミュニケーション~』に驚いた人々」 http://togetter.com/li/156910

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
大谷卓史(おおたに・たくし) 情報倫理学(主にプライバシーと知的財産権の哲学
・倫理学)、科学技術史(情報技術の社会史)専攻。主要著訳書:土屋俊監修、大
谷卓史編著『情報倫理入門』(アイ・ケイコーポレーション、2012年)、ダニエル
・J.ソローヴ著『プライバシーの新理論:概念と法の再考』(みすず書房、2013年
)、『アウト・オブ・コントロール ネットにおける情報共有・セキュリティ・匿
名性』(岩波書店、2008年)。月刊『みすず』(みすず書房)で「メディアの現在
史」、『情報管理』(科学技術振興機構)で「過去からのメディア論」など連載中。

Copyright(C)OOTANI, Takushi 2014- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
《連載》「Digital Humanities/Digital Historyの動向
      ~2014年4月中旬から5月中旬まで~」

 (菊池信彦:国立国会図書館関西館)

 前号に引き続き、2014年4月中旬から5月中旬までのDigital Humanities/Digital
Historyに関する動向をまとめた。

○新聞・ブログ記事
 4月17日、ドイツのDH学会ブログDHdBlogに“Explore, play, analyse your
corpus with TXM”という記事が掲載されている。これは、今年2月にヴュルツブル
ク大学で開催された“Introduction to the TXM Content Analysis Platform”とい
うワークショップの記録で、TXMというテキスト分析ソフトのチュートリアルとして
まとめられたもの。
http://dhd-blog.org/?p=3384
http://www.germanistik.uni-wuerzburg.de/lehrstuehle/computerphilologie/a...
http://wiki.tei-c.org/index.php/TXM

 4月22日、米国議会図書館の電子情報保存に関するブログに““Distant Reading”
and Web Archiving”という記事が掲載された。同館のデジタルアーカイブチームの
インターンAndrea Foxによるもの。記事は、Foxが今年3月にまとめた“Bit by Bit:
Tagging into Big Data”というレポートを下敷きにしたもので、デジタル化された
テキストがどのようにアクセスできるようになっているのか、研究者がいかに機械
的にそのデータから答えを見つけ出しているのかを、Google N-gramビューワーを使
い調査した結果がまとめられている。
http://blogs.loc.gov/digitalpreservation/2014/04/distant-reading-and-web...
http://digitalpreservation.gov/documents/big-data-report-andrea-fox0414....

 4月22日、h-europeのウェブサイトに、“What online sources can we use for
a WW1 project on Twitter?”という記事が掲載されている。記事は、h-europeが行
っている“World War One goes Twitter”という、第一次世界大戦に関する情報を
ツイートするプロジェクトで参考にしているウェブリソースをリストとしてまとめ
たもの。なお、h-europeはルクセンブルク大学の現代史専攻の院生が運営している
プロジェクトサイトである。
http://h-europe.uni.lu/?p=2074
http://h-europe.uni.lu/?page_id=621

 5月2日、New Republicに“Technology Is Taking Over English Departments”と
いう記事が掲載された。同紙の編集者Adam Kirschが、DHの定義を巡る諸問題をはじ
め、DHの重要図書やプロジェクトに言及しつつ、オーソドックスな人文学にとって
DHの限界を指摘する内容となっている。これに対して、Kirschの記事でも言及され
ていたMITpressから刊行されている“Digital_Humanities”の著者Jeffrey Schnapp
らが、これを批判する記事を5月12日に同紙に寄せている。また、Inside Higher
Educationの5月8日の記事には“Digital Humanities Bubble”という記事が掲載さ
れており、DHが人文学の“救世主”とはなっていない現状を指摘する議論がなされ
ている。
http://www.newrepublic.com/article/117428/limits-digital-humanities-adam...
http://www.newrepublic.com/article/117711/digital-humanities-have-immens...
http://www.insidehighered.com/news/2014/05/08/digital-humanities-wont-sa...

 5月6日、Open Cultureのサイトで、ニューメディアスタディーズやDHをテーマと
した15の研究書(いずれも無料のもの)が紹介されている。DHとしては、Kevin Kee
の“Pastplay: Teaching and Learning History with Technology”など4編が取り
上げられている。
http://www.openculture.com/2014/05/read-15-free-ebooks-on-new-media-stud...

 5月2日から15日にかけて、Digital Humanities Now等のプロジェクトを運営する
プロジェクトPressForwardが、ウェブ上にある灰色文献の学術情報のキュレーショ
ンをテーマにした計4回のシリーズ記事を同サイトに掲載している。そこでは、
PressForwardの3年間の経験から学術情報の収集と発信のノウハウが示されている。
http://pressforward.org/category/research-reports/guides/curating-schola...

○イベント・出来事
 このほど、スペインの放送大学Universidad Nacional de Educacio'n a
Distancia(UNED)に、DHイノベーションラボ(Laboratorio de Innovacio'n en
Humanidades Digitales)が開設された。これを記念して、4月30日にDHアンカンフ
ァレンスイベントTHATCamp LINHD-UNED 2014が開催されている。
http://linhd.uned.es/en/home/
http://linhduned.thatcamp.org/
またUNEDの研究グループは、中世を中心に8世紀から18世紀までのスペイン法をマッ
ピングしたウェブサイトを公開している。
http://www.agenciasinc.es/Noticias/La-UNED-disena-el-primer-mapa-dinamic...

 4月30日、Association for Computers and the Humanities(ACH)をはじめとす
る、DH学協会が連名で、ネットワーク中立性をめぐる公開質問状を米国連邦通信委
員会(FCC)に対して提出した。ACHのウェブサイトに公開された質問状は、「イン
ターネットのオープンかつ非差別的、クリエイティブでありまた競争的であるとい
う本質的な特徴」を守るよう求める内容となっている。また、5月13日には、
MLA(Modern Language Association)も同様の公開質問状を提出している。
http://ach.org/2014/04/30/net-neutrality/
http://www.mla.org/ec_net_neutrality

 人文学研究や教育においてオープンデータやオープンコンテンツ、オープンソー
スを活用するプロジェクトを支援する助成プログラムOpen Humanities Awardsが、
4月30日から5月30日まで公募されている。同プログラムは今回で2回目となる。
http://openhumanitiesawards.org/

 5月7日、DHツールやソフトウェアのディレクトリサイトBamboo DiRTが、編集委員
を募集している。新旧のDHツール等の評価やレビューを行うのが任務とされている。
http://dirt.projectbamboo.org/news/dirt-seeks-editorial-board

 5月12日、米国議会図書館のワーキンググループNational Digital Stewardship
Alliance Innovation Working Groupが、2014年のNDSA Innovation Awardsの結果を
発表した。これは電子情報保存に関して、イノベーティブかつ大きな貢献を果たし
たプロジェクトや機関・個人に対して贈られるもの。
http://blogs.loc.gov/digitalpreservation/2014/05/software-digital-art-da...
ちなみに、電子情報保存に関する動きとして、Internet ArchiveのWayback Machine
の収録ページ数が4000億に達したとのこと。
http://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000/

 5月13日、環太平洋戦略的経済連携協定(TPP)交渉の首席交渉官会合において、
難航している知的財産分野については著作権保護期間を「70年」とする方向で調整
が進んでいるとする報道が新聞各社からなされている。
http://www.yomiuri.co.jp/economy/20140512-OYT1T50171.html
http://www.sankeibiz.jp/macro/news/140514/mca1405140500002-n1.htm
http://news.braina.com/2014/0514/rule_20140514_001____.html
http://www3.nhk.or.jp/news/html/20140513/k10014410721000.html
(NHKニュースへのリンクは2014年5月26日現在でアクセス不能)

 5月13日、欧州連合司法裁判所は、Googleに対して自分の情報へのリンクを検索結
果から削除するよう求めたスペイン人男性の請求--いわゆる「忘れられる権利」
--に関し、これを認める判決を言い渡した。
http://japan.cnet.com/news/business/35047992/
http://current.ndl.go.jp/node/26137

○プロジェクト・ツール・リソース
 4月15日、総務省が、スマートフォン上で、身近な政府統計データを提供するアプ
リ「アプリDe統計」の試行版の提供を開始した。
http://www.soumu.go.jp/menu_news/s-news/01toukei01_02000031.html

 4月17日、ミシガン州立大学のKaty Myersが、“ieldran, the Early Anglo-Saxon
Cemetery Mapping Project”の公開を発表した。これは、同大学の人類学部とDHセ
ンターであるMatrixとの共同プロジェクトCultural Heritage Informatics
Initiativeの一環として行われたもので、5世紀半ばから7世紀初頭までのイングラ
ンドにおける墓地情報をマッピングしたもの。Cultural Heritage Informatics
Initiativeではここ最近DHプロジェクトサイトの開設が相次いでいる。
http://chi.anthropology.msu.edu/2014/04/the-dead-have-come-alive/
http://acrl.ala.org/dh/2014/04/21/project-ieldran-early-anglo-saxon-ceme...
http://chi.anthropology.msu.edu/blog/

 写真や画像上の文字列を選択してコピー&ペースト可能にするGoogle拡張機能
“Project Naptha”がリリースされた。
http://projectnaptha.com/
http://gigazine.net/news/20140423-project-naptha/
http://chronicle.com/blogs/profhacker/grabbing-text-from-images-with-pro...

 4月29日、バージニア大のScholars’ LabがWordpressのテーマである“Ivanhoe
Game”をリリースした。
http://ivanhoe.scholarslab.org/
http://www.scholarslab.org/announcements/connect-create-inspire-the-ivan...

 昨年12月に英国図書館がFlickr Commonsで公開したパブリックドメインの画像コ
レクションに対し、メタデータを付与するゲーム“Ships Tag”が公開された。ユー
ザーは船の画像に対してタグ付けを行うことで、それら画像のアクセシビリティの
向上と研究利用に貢献できるとされている。
http://www.tiltfactor.org/metadata-games-tag-event-may-day-may-day/
http://current.ndl.go.jp/node/26091
https://play.metadatagames.org/shipstag

 5月1日、古代ギリシア語が記されたスキャニング画像からテキストを読み取るこ
とのできる“Ancient Greek OCR”のver.2.0がリリースされた。
http://ancientgreekocr.org/
http://ancientworldonline.blogspot.jp/2014/05/ancient-greek-ocr.html

 2014年5月から、CrossRefが、新しいテキスト・データ・マイニングサービスの提
供を予定していると発表している。
http://www.infodocket.com/2014/05/01/crossref-plans-to-launch-their-text...
http://www.crossref.org/10quarterly/quarterly_apr14.html
http://current.ndl.go.jp/node/26063

 図書館が所蔵する19世紀から20世紀初めに出版された図書にある、元の持ち主に
よる書き込み等の情報を集めるクラウドソーシングプロジェクト“Book Traces”
が開始されている。
http://current.ndl.go.jp/node/26065
http://www.booktraces.org/

 5月2日、三重県が「三重の歴史・文化デジタルアーカイブ」の運用を開始した。
県では、これまで文化施設等の所蔵品や図書、行政資料等の歴史・文化・自然等に
関する様々なデータベースを施設単位で提供してきたが、この「三重の歴史・文化
デジタルアーカイブ」ではそれらを横断的に検索できるとのこと。
http://www.bunka.pref.mie.lg.jp/app/details/index.asp?cd=2014040411

 5月12日、イギリスの帝国戦争博物館(Imperial War Museums)が“Lives of
the First World War”を公開した。これは、第一次世界大戦に関わった英連邦の
800万人以上のそれぞれの個人史について、クラウドソーシングで情報を収集し、記
憶化するためのプラットフォームである。注目すべきは、単にユーザーが知ってい
ることを書き加えるだけではなく、公式記録の検索を行ったり手持ちの史料等をア
ップロードしたりすることで、史料に基づいた情報収集となるよう配慮している点
であろう。
https://livesofthefirstworldwar.org/
【PDF】 http://www.iwm.org.uk/sites/default/files/press-release/Lives_of_the_Fir...

 5月12日、“DH Box”がリリースされた。クラウド環境にあるLinuxコンピュータ
に、DHで利用するソフトウェア(Omeka、NLTK、Ipython、R Studio、Mallet)があ
らかじめインストールされているというもの。授業や研究で容易にDH環境を構築で
きるとされている。
http://dhbox.org/
http://dhbox.commons.gc.cuny.edu/blog/2014/dh-box-takes-off

 5月15日、明日の京都 文化遺産プラットフォーム、大日本印刷株式会社、株式会
社毎日放送が共同で「京都・文化遺産アーカイブプロジェクト」を発足した。プロ
ジェクトの中心は、登録20周年を迎えた京都の世界遺産「古都京都の文化財」を構
成する17社寺・城の高精細映像によるアーカイブ事業とのこと。
http://prtimes.jp/main/html/rd/p/000000003.000008685.html

○論文・学術雑誌・研究書
 このほど刊行されたDifferences: A Journal of Feminist Cultural Studiesの
25巻1号で、“In the Shadows of the Digital Humanities”と題した特集が組まれ
ている。
http://differences.dukejournals.org/content/current

 Journal of Digital Humanitiesの3巻1号(2014年春期)が刊行された。
http://journalofdigitalhumanities.org/

 DHjpの第3号が刊行された。特集テーマは「デジタルデータと著作権」で、緊急シ
ンポジウム「近デジ大蔵経公開停止・再開問題を通じて人文系学術研究における情
報共有の将来を考える」が取り上げられている。
http://bensei.jp/index.php?main_page=product_book_info&products_id=100328

○レポート・報告書等
 4月17日にBritish Academyは、人文学および社会科学分野のジャーナル出版にオ
ープンアクセス方針が与える影響について、初のエビデンスベースの分析を行った
レポート“Open access journals in humanities and social science”を公開した。
http://www.theguardian.com/higher-education-network/blog/2014/apr/17/uk-...
【PDF】 http://www.britac.ac.uk/templates/asset-relay.cfm?frmAssetFileID=13584
http://current.ndl.go.jp/node/25956

 4月30日、ITHAKA S+Rは、デジタル時代において美術史研究者の活動がいかなる変
化を遂げつつあるのかを調査したレポート“Supporting the Changing Research
Practices of Art Historians”を公開した。
http://www.sr.ithaka.org/research-publications/supporting-changing-resea...
http://www.infodocket.com/2014/04/30/new-report-from-ithaka-sr-supportin...

特殊文字については次のとおり表記しました。
アセント:o'

Copyright(C)KIKUCHI, Nobuhiko 2013- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《特集》「デジタル学術資料の現況から」第3回
ペルセウス・デジタル・ライブラリーのご紹介(3)
 (吉川斉:東京大学大学院人文社会系研究科 西洋古典学研究室)

 前回は、Perseusでの作品の読み方を、ホメロス『イリアス』を題材にご紹介しま
した。作品を読む場合、ウェブブラウザに「表示されたもの」を読むことになりま
すが、Perseusでは、はじめから表示通りのページが用意されているわけではありま
せん。注釈や翻訳など複数の文献が同一ページに読み込まれることからも分かる通
り、各文献のデータファイルは個別に作成されており、リクエストに従ってそれら
が組み合わされ、ページが動的に構成されています。今回は、そうしたPerseusのデ
ータに注目しつつ、いわば表示とその裏側をめぐる話題を中心に、簡単にご紹介し
ます。

なお、筆者の環境ですが、Firefoxのバージョンがあがり、Firefox 30.0(beta版)
となっています。表示上の相違はとくにありません。

 ペルセウス紹介記事の初回で、Perseusが各種文献の電子化データ(XMLデータ)
をCreative Commons Attribution-ShareAlikeの下で公開していることを記しました。
これは、見方を変えると、Perseusが基本的に「公開可能」な文献を電子化している
ということを意味しています。そのような公開可能な文献というと、一般的には、
著作権の切れた文献か、著作権者に承諾を得た文献に大別されると考えられますが、
Perseusも例にもれず、両者を含んでいます。

 Perseusがプロジェクトの当初に電子化を進めた文献は、現在ハーバード大学出版
局から刊行されているLoeb Classical Library(LCL)に含まれる作品を中心として
いました。LCLは1911年に創始された古代ギリシア・ローマの古典作品の古典語-英
語対訳本シリーズです。当初のPerseusはその中から利用可能な古代ギリシア語作品
を選んで、原典テキストおよび翻訳を電子化したわけです(なお、はじめはデータ
の記述にSGMLを用いていたようです)。CD-ROM版Perseusに含まれる作品データはそ
うして準備されたものが利用され、Perseusがウェブベースになったあとも、データ
は引き継がれています。

 前回、原典テキストの右カラムに英文訳や注釈等も表示されることを紹介しまし
たが、そこで挙げられているものは19世紀末から20世紀初頭のものです。また、現
行のPerseusのホメロス『イリアス』をみてみると、ギリシア語原典テキストには定
評のあるOCT版(Oxford Classical Text)が利用されており、翻訳にはLCL版や他の
ものが付されています(OCT版は1920年刊行のものと記されています。同じホメロス
の『オデュッセイア』については、ギリシア語原典テキストもLCL版です)。最近の
Perseusでは、LCL以外の校訂本を元に電子化された作品も増えていますが、LCL版を
利用した場合と異なり、原典テキストのみで英訳等が存在しないこともあります。

 ざっと見渡してみると、Perseusでは、古典語の文法書や辞書など、原典テキスト
や翻訳以外にも種々の文献が電子化されて公開されていますが、その多くは著作権
の切れた文献です。したがって、校訂テキストを含め、注釈書などにしても、最新
の研究を参照できるわけでない点には注意が必要です。そうした文献の良し悪しは
一概にはいえませんが、この点はPerseus(や同種のサイト)のひとつの制約とみる
こともできます(なお、Perseusの著作権関連ページ[1]を確認すると、一部のテ
キストは出版社や著者の承諾を得て使用しているようです。完全には確認できてい
ませんが、そうした作品のXMLデータはダウンロード可能になっていない場合もある
ようです)。

 既にご紹介したとおり、Perseusプロジェクトは1980年代後半に始まり、1990年代
半ばにはウェブサイトでの公開を始めています。古代ギリシアの作品を電子化する
にあたって、ひとつの問題は、気息記号やアクセント付のギリシア文字(polytonic
Greek)の扱いです。今でこそUnicodeの恩恵で文字の扱いが簡単になり、記号付き
文字を直接入力することも可能になっていますが、プロジェクト開始当初はまだそ
うした仕組みは整っていませんでした。

 古代ギリシアの作品を電子化する試みはPerseus以前から既に行われており、1970
年代前半には、ギリシア語文献の電子化を進めるTLG(Thesaurus Linguae Graecae
)プロジェクト[2]が開始されました。その中で、TLGの表示、検索システムの開
発を率いていたDavid Woodley Packardによって、Beta Codeと呼ばれる、ASCII文字
のみでアクセントや気息記号まで表記するための入力規則が開発され、1981年にTLG
のギリシア語入力法として採用されました。そして、Perseusプロジェクトも、ギリ
シア語文献の電子化にあたって、このBeta Codeを採用します(ただし、基本的には、
TLGでは全て大文字、Perseusは小文字での入力です。原則として各文字はギリシア
語小文字として扱われ、ギリシア語大文字を表記する際はその文字の前に*をつけま
す)。

http://www.dhii.jp/DHM/imgs/pers3/figure01.png
(図1:Perseusにおけるギリシア語入力法)

 Beta Codeで入力されたデータは、ウェブブラウザ等で表示される際に、Beta Code
から利用者のシステムに適合する形に変換されて表示されます。

 現在はUnicode(UTF-8等)が利用可能となり、ほぼ環境を選ばない状況が出来て
いますが、それ以前は、記号付きギリシア文字を表示するためには、特定のフォン
トを指定するなど特殊な手順が必要となっていたうえ、手法毎に入力規則が異なっ
ており、ある環境で作成したデータは、それと同種の環境でしか表示できない(あ
るいは表示するためには手間がかかる)という問題がありました。それに対して、
ASCII文字のみで規格化されたBeta Codeによって内部の文献データを記述すること
で、データの入力と出力が切り分けられます。一定の規則に基づいて記述されるの
であれば、内部のデータと画面表示が一致している必要はなく、利用者の画面での
記号付きギリシア文字の表示は「見せ方」(出力)の処理の問題となります。

http://www.dhii.jp/DHM/imgs/pers3/figure02.png
(図2:Perseusのギリシア文字表示設定)

 現在のPerseusでは、ギリシア文字の表示方法について、各ページ右カラムに表示
される設定欄(Display Preferences)から、環境にあわせて利用者自身が設定でき
ます。今日の一般的なPC環境であれば、「Unicode(precombined)」で問題ありま
せん。図2のリストのSPIonicなどは、Unicode以前の表示法の名残ともいえるもので
す。

 Unicodeを用いれば、記号付きギリシア文字を直接指定して入力することが可能で
す。つまり、入力と出力を共通化する形で内部のデータを蓄積し処理することがで
きます。しかも、ギリシア語に限らず、多言語を共存させることも可能になります。
しかしながら、PerseusのウェブサイトはUnicodeに対応済みとなってはいるものの、
Perseusのシステム内部では、ギリシア語を処理する際はBeta Codeを用いているよ
うです。

 Perseusのギリシア語原文において、それぞれの語彙から語彙分析ツールへのリン
クが張られていることは前回ご紹介した通りですが、たとえば『イリアス』冒頭の
「μ~ηνιν」を例にとると、そのリンクのURIは図3のようになっています。

http://www.dhii.jp/DHM/imgs/pers3/figure03.png
(図3:「μ~ηνιν」から語彙分析ツールへのリンク[3])

 「μ~ηνιν」を分析プログラムに引き渡す際に「mh=nin」と記述しており、
Beta Codeが利用されています。また、語彙の分析結果ページでは、図4のように右
カラム上部に検索ボックスが表示されますが、ここでも表記はBeta Codeです。

http://www.dhii.jp/DHM/imgs/pers3/figure04.png
(図4:「μ~ηνιν」分析結果ページの右カラム検索ボックス)

 ちなみに、検索欄にUnicodeで「μ~ηνιν」と入力しても検索可能ですが、結
果表示後の検索欄は図4と同じになります。つまり、内部でUnicodeからBeta Codeへ
の変換が行われているわけです(このあたりの処理については、公開されているプ
ログラムのソースコードをきちんと読めば明確になりますが、筆者はそこまで確認
できておりませんので、ここでの話は実際の動作からの推測です)。

 Unicodeは利便性の高いコード体系ではありますが、各種プログラムやシステムの
対応状況はまちまちです。Unicode対応が完全ではない場合、Unicodeで記述された
データの取り扱いに困難をきたします。それに対して、ASCII文字のみで記述される
Beta Codeの場合、基本的にどのようなプログラムやシステムでも処理できます。こ
のような、環境に依存しない汎用性は、Beta Codeの大きな特徴ですし、現在なお利
用されるひとつの要因であろうと考えられます。なお、今後Unicodeがさらに一般化
し、各種データのUnicode化が進む場合も、基本的には現在のBeta Codeから変換す
るだけで済むため、大きなコストはかからないものと思われます。

 さて、現在のPerseusは各文献データをTEI/XML(以下XMLとのみ表記します)を用
いて構造化しています。本稿で全体を扱うことは難しいため、ホメロス『イリアス
』冒頭の本文部分を中心に、データと画面表示について簡単に触れておきたいと思
います(文字のエンコードに対して、文献のエンコードともいえるかもしれませ
ん)。

 各文献について、そのページで表示されている部分のXMLデータは、各ページの本
文下部にあるXMLリンク(【XML】)から確認できます。ホメロス『イリアス』冒頭
について、XMLデータを確認すると、図5のように表示されます(データの階層的表
示はブラウザによって整形されたものです)。

http://www.dhii.jp/DHM/imgs/pers3/figure05.png
(図5:ホメロス『イリアス』冒頭・本文XMLデータ)

 ここではUnicodeのギリシア文字が表示されていますが、これは表示設定を
Unicode(precombined)としてページを表示した上でXMLデータを表示しているため
です。後で確認しますが、元のXMLデータファイルではBeta Codeが用いられていま
す。

 このXMLデータが整形されて、通常表示される画面となります(図6)。

http://www.dhii.jp/DHM/imgs/pers3/figure06.png
(図6:ホメロス『イリアス』冒頭・本文表示)

 XMLデータにおいては、詩行が1行ずつタグで囲まれ、5行ごとに
などとして行番号が付されます。そうした情報を元に、実際の本文表示では、行番
号が右側に表示されます。「book」や「card」の情報なども、XMLデータの中に埋め
込まれています。一方、XMLデータでは記述されませんが、本文表示の際には、ギリ
シア語の各語彙に対してPerseusのシステムによって自動的に語彙分析ツールへのリ
ンクが生成されます。

 あわせて、右カラムの注釈部分もXMLデータを確認しておきます。注釈は英語とギ
リシア語などが混在した文献ですので、ギリシア語原典とは性質が異なるものとい
えます。ここでは、1891年版の注釈について見てみます。

http://www.dhii.jp/DHM/imgs/pers3/figure07.png
(図7:ホメロス『イリアス』冒頭・右カラム注釈)

 右カラムでは図7のように表示されますが、この部分のXMLデータは図8の通りです
(ここでもUnicode表示の関係でギリシア語部分がBeta Codeではなくなっています)。

http://www.dhii.jp/DHM/imgs/pers3/figure08.png
(図8:ホメロス『イリアス』冒頭・注釈部分XMLデータ)

 細かいタグの説明は省きますが、注釈のXMLデータでは、『イリアス』本文の場合
と異なり、lang属性による言語指定が行われています。このデータでは、
と記述して基本言語に英語を指定しつつ、該当部分では
lang="greek"やlang="la"の属性をつけて、その部分がギリシア語やラテン語である
ことを指定しています。ブラウザで表示される際には、そうした指定に基づき、ギ
リシア語やラテン語部分の語彙に、Perseusのシステムによって語彙分析ツールへの
リンクが自動的に生成されます。また、文献情報もタグで埋め込まれていま
すが(ここではウェルギリウス『アエネイス』への言及)、この部分についても、
ブラウザでの表示の際には、Perseusのシステムによって自動的に該当箇所へのリン
クが生成されます。

 再び『イリアス』本文に戻りますが、『イリアス』本文下部で先程みたXMLリンク
の下に、作品の電子データに関するライセンス表示があります(図9)。

http://www.dhii.jp/DHM/imgs/pers3/figure09.png
(図9:『イリアス』本文下部・CCライセンスに関する表示)

 このライセンス表示の文章中の「XML version」の部分をクリックすると、(本稿
の例では)『イリアス』本文全体のXMLデータファイルを確認することができます。
筆者の環境の場合、Firefoxではリンクをそのまま読みこめなかったため、以下の画
像はInternet Explorer 11上での表示です。

http://www.dhii.jp/DHM/imgs/pers3/figure10.png
(図10:ホメロス『イリアス』ギリシア語XMLデータ・ヘッダー部分)

 ここまで確認したXMLデータは抜粋表示であり、ヘッダー情報が含まれていません
でしたが、元のデータファイルでは、図10のとおりに種々の情報がヘッダーに記載
されています。図10では情報を折りたたんだ状態で表示していますが、すべて展開
した状態にすると、の間に、各種のタグを含めて80行程度
あります。また、ヘッダーの情報の一部は、ページ表示の際に利用されています(
本文下部に表示される出典情報など)。

http://www.dhii.jp/DHM/imgs/pers3/figure11.png
(図11:ホメロス『イリアス』ギリシア語XMLデータ・本文冒頭)

 ギリシア語本文の部分も見ておきますと、先に述べた通り、ギリシア語が
Beta Codeで記述されていることを確認することができます。繰り返しになりますが、
このように記述されたデータが機械的に処理されて、図6の本文表示となっているわ
けです。そのようなデータの加工処理は、データを扱うシステムに依拠します。
PerseusはPerseusなり、他のシステムは他のシステムなりの方針に従って処理を行
うことになります。

 純粋にデータ構造を記述するのであれば、端末の画面表示(あるいは人間へのデ
ータの見え方)に関わる要素は不要です。図10の中で記される「Iliad (Greek).
Machine readable text」というタイトルが、電子化データに関するPerseusの考え
方を端的に表現しているようにも思われます。

 ここまで述べてきたように、Perseusでは、そうした「機械に読ませる」データを
記述するにあたって、独自規格ではなく、Beta Codeや(古くは)SGML、(現在は)
TEI/XMLといった標準規格を用いています(Beta Codeを「標準」というのは難があ
るかもしれませんが)。そのため、Perseusの作成するデータは、汎用性・可搬性が
非常に高いものとなっています。また、作成されたデータは機械的処理の対象とな
りますが、そのデータを記述していく作業は、人間の領域です。文献を規格に沿っ
て電子化するにあたっては、たとえば図10や図11のようにタグ付けを行い、文書構
造や付随情報を明記する必要があります。この作業自体、文献を意識的に意味づけ
していくことに繋がりますので、多大な労力を要する高度な作業ともいえます。場
合によっては、そうした意味づけの過程で、それまで意識されていなかった問題が
顕在化し、新たな知見が得られることもありえます。Perseusはそうして作成された
データまで、可能な限り、惜し気もなく公開しているわけです。

 デジタル化する人文学の世界の中にあって、Perseusプロジェクトがひとつの先進
的なモデルケースであることは、広く認められることと思われます。筆者はやはり
キーワードとして「オープン(Open)」を思い浮かべますが、ここまで紹介してき
たPerseusの持つ標準化技術への意識の高さ、データを公開する姿勢、それらを実践
していく在り方、情報技術との連携などは、まさにPerseusの先進性を支えてきた柱
であると同時に、これまでの、そして、これからの人文学の世界に対する大きな挑
戦である、ともいえるかもしれません。今後のPerseusの動向にも要注意です。

[1] http://www.perseus.tufts.edu/hopper/help/copyright
[2] http://www.tlg.uci.edu/
[3] http://www.perseus.tufts.edu/hopper/morph?l=mh=nin&la=greek&can=mh=nin0

[編集室注]
メールマガジンではアクセントつきギリシア文字が文字化けする恐れがありました
ので、変換しています。実際の古典ギリシア文字は、本文中に掲載したURLから図を
ご覧いただくか、人文情報学月報の公式サイトにてご覧ください。
公式サイトURL: http://www.dhii.jp/DHM/An_Introduction_to_Perseus_Lib_3

Copyright(C)YOSHIKAWA, Hitoshi 2014- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 続きは【後編】をご覧ください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM034]【前編】 2014年05月28日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: