ISSN 2189-1621

 

現在地

DHM 017

【差替版】[DHM017]人文情報学月報

*12月27日に配信した第17号 イベントレポート(2)において冒頭の一文が抜けて
しまっていました。
*訂正版を送信させていただき、ここにお詫び申し上げます。

2011-08-27創刊

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

                 2012-12-27発行 No.017 第17号 326部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

◇「日本史研究推進における情報技術・デジタル技術の役割」
 (山田太造:人間文化研究機構本部)

◇人文情報学イベントカレンダー

◇イベントレポート(1)
日本オリエント学会第54回大会 企画セッション2「文献資料のデジタル化とその活
用-オリエント研究におけるデジタル・ヒューマニティーズの可能性」
(永井正勝:筑波大学人文社会科学研究科準研究員)

◇イベントレポート(2)
「第四回デジタル・アーカイブとデジタル・ヒューマニティーズ国際研究会」
(永崎研宣:人文情報学研究所)

◇イベントレポート(3)
「アジア歴史地理情報学会第1回国際会議」
 (近藤康久:東京工業大学大学院情報理工学研究科)

◇イベントレポート(4)
京都大学白眉センター&応用哲学・倫理学教育研究センター(CAPE)共催セミナー
「デジタル・ヒューマニティーズの現在」
(川名雄一郎:京都大学白眉センター)

◇イベントレポート(5)
「The International Conference for the Korean Association for Corpus
Linguistics 2012」
 (小林雄一郎:日本学術振興会/立命館大学)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇「日本史研究推進における情報技術・デジタル技術の役割」
 (山田太造:人間文化研究機構本部)

 日本史研究に限らないであろうが、歴史学研究において研究対象となる史料を調
査することからすべてが始まる。例えば、対象となる史料の所在がどこであるか、
どの函のどの巻・冊に収載されているか、タイトルが何であるか、いつ書かれたも
のであるか、誰が書いたものであるか、という目録情報を蓄積し、他の史料との関
係や、史料そのものの位置づけを明確にしていく。さらに史料の記述内容を把握す
る。そして、関連するさまざまな史料を読み解き、歴史的事実がどうであったかと
いうことを明らかにしていく。

 対象史料が常に手元にある状態は、以前であればありえないことであった。しか
しながらデジタル技術により、情報デバイスを介して、史料を検索し、画像として
閲覧できる状態になった。さらには翻刻を公開していればそのものも容易に取得で
きる。これが、いつでも、どこでも、できる。

 画像の撮影は目的によって変わることがある。書いてある文字が確認できる程度
でよい場合もあれば、図録で扱えるくらいの高精細画像を必要とする場合や、紙質
が確認できるような特別な撮影を求める場合などもあり、さまざまである。これら
の画像に対してメタデータを付与することで、目的に応じた画像を取得することが
可能なシステムも存在する。

 実は、多くの日本史研究者がデジタル技術に求めていることは“ここまで”では
ないかと思うことがある。ここより先に待つと考えている、もしくは実現している
各種情報技術・デジタル技術を、日本史研究者は自身の研究を進める上では利用し
ないのでないかと。ただし、自分の研究成果を表現し公開する場合においては利用
できると考えている研究者が存在するのは否定しない。成果公開でデジタル技術を
利用することにより、例えばマップシステムやタイムライン上に各種コンテンツを
配置する可視化手法のように、研究者だけでなくそれ以外のユーザにも把握しやす
い形式で表示することができるようになった。

 蒐集した史料の目録・画像等の研究素材やそれらの研究素材をもとにした研究成
果の公開においてはデジタル技術を利用することがあるが、しかしながら、残念な
ことに、研究過程における分析においては利用することが非常に少ない。ここでの
分析に対するデジタル技術応用はCH(Computing and Humanities)やDH(Digital
Humanities)における大きな課題であろう。そのためにこの分野が存在していると
言っても過言ではない。特に日本史の分野において、デジタル技術利用による分析
はほとんど行われていない。

 なぜ、デジタル技術を用いて分析を進めるような方法がほとんどないのか。1つは
日本史学研究者と情報学研究者の間での意思疎通がうまくいっていないためであろ
う。日本史学研究者が求めているシステムと情報学研究者が構築したいシステム、
ここに隔たりがある。例えば次のとおりだ:情報学研究者にとっては、面白いシス
テムを用意したのになぜか日本史学研究者が利用しない、利用しないのがおかしい、
と考えており、反対に、情報学研究者はまたもやわけのわからないシステムを持っ
てきた、これを使ってなんの研究ができるのか、と日本史学研究者は考えている。
大げさな表現であろうが、これが現状であろう。つまり、日本史学研究に対するデ
ジタル技術利用の方法論を確立するためには、デジタル技術だけを追跡するだけで
はなく、日本史研究における分析自体の“デジタル化”が重要だ。情報学の各分野
でのトレンドとも言うべき技術をそのまま持ってきても解決しないであろうし、テ
キスト分析のような日本史研究推進へ寄与できそうなデジタル技術を無視しても解
決しない。

 上記について、多々の異論反論はあるであろうが、私は常日頃から痛感しており、
この場を借りて言及させていただいた次第である。私が2007年に東京大学史料編纂
所に赴任した際に感じたことであり、非常に重要なことであると今でも考えている。
情報学研究者と日本史学研究の歩み寄りができるかどうか、共通した概念を共有で
きるかどうか、ともにそれを具現化できるかどうか……これが日本史学CH・DHの将
来を左右するだろう。

 最後に私自身の取り組みを紹介したい。寺社、民家、博物館、美術館、図書館等
へ参り、史料の目録作成や撮影を行うなどの史料調査の段階から日本史研究者とと
もに行動し、史料目録の表現、撮影、撮影した画像の管理等の手法について、日本
史研究者の理想像を聞き出す。それを実現する上ための最善のデジタル化手法を、
自分自身が知りうるすべてを費やして導き出す。さらに、どのように利用して研究
を進めているか-調査した史料をどのように使って、なにが生成され、どのような
結果を出そうとしているのか-を聞き出す。そこでシステム的に不足しているとこ
ろ、それこそが重要であり、取り組むところだと考えている。日本史研究者と私の
思惑が一致したとき、さらにそれに向けて実行するとき、さらには、ともに良いと
思える結果が出たとき、ここに何事にも代えがたい面白さがある。

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
山田 太造(やまだ・たいぞう) 人間文化研究機構本部特任助教。博士(情報学)。
情報処理学会、日本データベース学会、日本デジタル・ヒューマニティーズ学会各
会員。情報処理学会人文科学とコンピュータ研究会幹事。専門はデータ工学。最近
は日本史史料における検索問題、デジタルアーカイブ、テキストマイニング、人文
科学研究資源の共有などに取り組んでいる。

Copyright(C)YAMADA, Taizo 2012- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◇人文情報学イベントカレンダー(■:新規イベント)

【2013年1月】
□2012-01-25(Fri):
第97回 人文科学とコンピュータ研究会発表会
(於・東京都/東京大学 史料編纂所)
http://jinmoncom.jp/

【2013年2月】
■2012-02-11(Mon)~2012-02-16(Sat):
Documentary Linguistic Workshop focusing on working with native speaker
linguists and resource development.
(於・東京都/東京外国語大学 アジア・アフリカ言語文化研究所)
http://lingdy.aacore.jp/jp/activity/docling/2013.html

【2013年3月】
■2013-03-15(Fri):
東洋学へのコンピュータ利用 第24回 研究セミナー
(於・京都府/京都大学人文科学研究所本館 新館)
http://www.kanji.zinbun.kyoto-u.ac.jp/seminars/oricom/

■2013-03-29(Fri)~2013-03-30(Sat):
日本地理学会 2013年度春季学術大会
(於・埼玉県/立正大学熊谷キャンパス)
http://www.ajg.or.jp/meetiing/2013spring.html

Digital Humanities Events カレンダー共同編集人
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
小林雄一郎(大阪大学大学院言語文化研究科/日本学術振興会特別研究員)
瀬戸寿一(立命館大学衣笠総合研究機構PD)
佐藤 翔(筑波大学図書館情報メディア研究科)
永崎研宣(一般財団法人人文情報学研究所)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(1)
日本オリエント学会第54回大会 企画セッション2「文献資料のデジタル化とその活
用-オリエント研究におけるデジタル・ヒューマニティーズの可能性」
http://www.hum.u-tokai.ac.jp/~orient54/
(永井正勝:筑波大学人文社会科学研究科準研究員)

1.はじめに
 日本オリエント学会は三笠宮崇仁殿下の提唱によって1954年に設立された学術団
体であり、会員にはオリエント(中東)地域を対象とした歴史学、考古学、宗教学、
言語学、建築学などの専門家が名を連ねている。年に1度開催される学術大会では毎
年多様な分野の研究発表が行われており、2012年11月24日から25日に開催された第
54回大会では、5部会で合計47件の口頭発表と、11件のポスター発表とがあった。

 さらに第54回大会からは、会員有志による企画セッションが公募制となり、2件の
企画セッションが第6部会として開催された。筆者は「文献資料のデジタル化とその
活用――オリエント研究におけるデジタル・ヒューマニティーズの可能性」というタ
イトルで企画セッションに応募し、研究発表を行うことができた。以下、企画セッ
ションの代表者として、セッションの内容について報告したい[*1]。

2.セッションのプログラム
 最初にセッションのプログラムを紹介する。

テーマ:「文献資料のデジタル化とその活用――オリエント研究におけるデジタル・
ヒューマニティーズの可能性」

■発表1(13:20-13:45)
永井正勝(筑波大学)「文書の持つ情報の何をどのようにデジタル化するのか?
-古代エジプト語神官文字の字形研究を例として」

■発表2(13:50-14:15)
安形麻理(慶應義塾大学)「ヨーロッパ初期印刷本研究とデジタル化の技法
-グーテンベルク聖書の画像を用いた校合とXMLによるコーディング」

■発表3(14:20-14:45)
唐橋文(中央大学)「タグ付きコーパスの作成事例
-ペン・中央大学シュメール語コーパス」

■発表4(15:05-15:30)
中道静香(国立民族学博物館)「『アラビアンナイト・カルカッタ第2版』全文デー
タベースの活用-典拠特定の手がかりとして」

■コメント・討論(15:35-16:00)

 このように本セッションは4件の発表と「コメント・討論」から構成される。

3.セッション設立の目的と意図
 Digital Humanities(DH)に対する日本語の用語の1つとして「人文情報学」があ
る。これは言うまでもなく「人文学」と「情報学」を統合させた用語である。情報
学が最後に置かれているので日本語の感覚としては情報学の方に重きが置かれてい
るように感じられるかもしれないが、「人文学」と「情報学」が対等な立場で向き
合うものが人文情報学(DH)だと言えるであろう。本セッションの基点も「人文学」
と「情報学」の対等な関係を基盤としている。

 ここで、「人文学」と「情報学」の対等な関係について触れたのは、「自分はDH
に関心を持ってはいるものの、情報学に疎いため、DHに関わることができない」と
考えている人文系学者が少なからず存在しているからである。そこで本セッション
では、そのような方々の参加を促すためにも、そして日本オリエント学会の性格も
考慮し、人文系学者からみた文献資料のデジタル化について論じることを主眼とし
た。

 以上のような問題意識のもと、対象言語と学問手法を異にする4名の研究者でセッ
ションを構成させ、各自が関わっているデータベース/デジタル資料を題材に、デ
ジタル化の「目的と対象」(永井:古代エジプト語)、「技法」(安形:中世ラテ
ン語)、「作成」(唐橋:シュメール語)、「利用」(中道:アラビア語)につい
て、人文学の立場から論じて頂くことにした。

4.個別の内容
 次に、それぞれの発表内容を紹介する。

発表1:「文書の持つ情報の何をどのようにデジタル化するのか?-古代エジプト語
神官文字の字形研究を例として」(永井正勝)

 本発表では、古代エジプト語の文書を資料として「文献資料は入力できるのか」
という問いから、デジタル化の諸問題について論じた。

 第一に扱った課題は「対象」を巡る検討であり、ここでは、
 1.バージョン(写本/版)の違い
 2.「ドキュメント・ベース」か「テキスト・ベース」か
 3.言語単位の設定の難しさ
を論じた。

 第二に、「テキスト」と「言語」を巡る問題を検討した。ここで扱ったことは、
文字として書かれたものがそのままの形で言語になるわけではないということであ
る。たとえば、エジプト語において、「ピラミッド」という単語(男性単数名詞)
の読みはmrと転写され、その複数形はmr-wと転写される。このように複数形の形成
法は単数形に接尾辞-wを付加すればよいのだが、これは言語(音転写)のレヴェル
で把握できるものであり、文字表記では、単数形がmr、複数形がmr-mr-mrとなる。
このような場合、文字入力をしたとしても、言語そのもの(つまりmr-wという読み)
が視覚的に見えない。それゆえ、文字入力に加えて言語を示すための音転写の入力
も必要となる。

 第三に、デジタル化の基本的な「技法」を巡る問題が検討された。つまり、「プ
レーン・テキスト」を採用するのか「タグ付きテキスト」を採用するのか、あるい
は「XML」を採用するのか「RDB」を採用するのか、などの問いである。

 最後に、筑波大学のHieratic DB Projectチーム(永井正勝、和氣愛仁、高橋洋成)
が作成している古代エジプト語の神官文字資料のデータベースについて紹介した
[*3]。

発表2:「ヨーロッパ初期印刷本研究とデジタル化の技法-グーテンベルク聖書の画
像を用いた校合とXMLによるコーディング」(安形麻理)

 本発表はヨーロッパの18世紀までの手引き印刷本、特に初期印刷本の校合手法に
ついて、慶應義塾大学が所有するグーテンベルク聖書[*3]を中心に論じたもので
ある。手引き印刷本は、印刷の途中で修正作業が行われたため、同じ刷でも本文に
違いがあるのが普通であった。こうした現存諸本間の違い(stop-press variant)
は、その本の印刷工程を解明する重要な手がかりとなりうるが、綴りの修正などだ
けではなく、同じ文字の異形活字への差し替えや字間の調整といった通常のテキス
トデータでは明らかにできない種類の違いが含まれるため、厳密な校合が必要とな
る分野である。ところが、従来は校合手法が限られていたために、初期刊本の校合
は進んでいなかった。このような問題意識のもと、本発表では画像による校合の結
果が紹介された。その後、国際的な枠組みであるTEI(Text Encoding Initiative)
によるガイドラインに基づき、中世ラテン語に特徴的な異形活字や短縮語、合字の
区別、字間の調整、印刷上または文法的な誤りや諸本間に見られる印刷中の修正に
よる違いなどの手がかりを、マークアップ言語であるXMLを用いて効果的に記述する
ための方法についても論じられた。

 グーテンベルグ聖書はラテン語(ラテン文字)で書かれているため、素人目には
文字入力が容易な資料に思われがちだが、実際には異形活字や縮約語が数多く存在
しており、テキスト化のルールが整備されていない状況にある。本発表はそのよう
な制約をむしろ逆手にとって、画像を使ったデジタル校合を遂行し、異形活字の分
析を定量的に示した点で大きな意義を持つ。

発表3:「タグ付きコーパスの作成事例-ペン・中央大学シュメール語コーパス」(
唐橋文)

 シュメール語とは古代メソポタミアで使用された言語であり、楔形文字で表記さ
れていた。ペン・中央大学シュメール語コーパス[*4]は楔形文字そのものの入力
ではなく、音転写されたテキストを利用し、そこに品詞などのタグを付したもので
ある。

 本コーパスは2003年にペンシルヴァニア大学のシュメール語辞書編纂事業と関連
する学際的な研究プロジェクトとして唐橋を中心に中近東言語文化学部のSteve
Tinneyおよび同大学言語学部のBeatrice SantoriniとAnthony Krockの協力を得て始
まったもので、現在では担当者の唐橋が中央大学に移ったため、ペンシルヴァニア
大学と中央大学の両方の名前を冠してペン・中央大学シュメール語コーパスと呼ば
れている。

 ペンシルヴァニア大学言語学部とコピューター・情報科学学部はコンピューター
言語学(computational linguistics)の分野において早くから中心的役割を担って
おり、コーパス言語学のリサーチを補助するプログラムCorpusSearchを作成・提供
している。シュメール語のコーパス作りは、その専門知識と技術・経験に全面的に
依存したものである。現在のテスト・コーパスは各単語が品詞でタグ付け(part-
of-speech tags)され、さらに節・句が構文上でタグ付け(syntactic tags)され
たグデア王碑文1~100を含み、CorpusSearchでサーチが可能な状態にある。

 本コーパスの作成では、人文学に軸足を置く唐橋氏がコーパスの注釈マニュアル
を作成するとともに、情報学に精通したTinney氏がシュメール語テキストと
CorpusSearchとの互換性を保つ作業を担当した。

 品詞のタグ付けというと簡単なことのように思われるかもしれないが、シュメー
ル語の文法は未だ完全に解明されていない状況にある。そのようななか、シュメー
ル学の専門家によって作成された本コーパスは、他の研究者にとっても有益なデー
タ&解釈となるはずである。

発表4:「『アラビアンナイト・カルカッタ第2版』全文データベースの活用-典拠
特定の手がかりとして」(中道静香)

 本発表で紹介されたデータベースは、国立民族学博物館・西尾哲夫教授による一
連のアラビアンナイト研究プロジェクトにおいて作成されているものである。本プ
ロジェクトのデータベースシステム構築については人文情報学研究所の永崎研宣氏
が、アラビア語テキストのデータ整理および分析には中道静香が携わった。

 対象とした版は『アラビアンナイト・カルカッタ第2版』(1839-1942、全4巻)で
ある。このカルカッタ第2版は、バートン訳をはじめ多くの翻訳の底本ともなった『
アラビアンナイト』主要刊本の1つであるが、その典拠については諸説あり、不明な
点が多い。

 本データベースの最大の特徴は、不備や誤植も含めて刊本テキストをできる限り
忠実にデジタル化したことにある。データベース作りでは、原文に見られる書き誤
りを訂正することがしばしば行われるが、本データベースではそれを行わず、あり
のままに入力することが方針とされていた。しかも、データ自体は最も古典的なプ
レーン・テキストとして入力されている。このようなデータベースを作成したこと
により、刊本内部における正書法と言語変種の違いがかえって浮き彫りとなり、そ
の結果として典拠の解明に至ることができたという。データベースの学術利用の好
事例だと言える。

5.全体討論について
 全体討論ではいくつかの質問が出たが、そのうち深刻に受け止めるべき課題は、
「人文系の学問にとって、デジタル化の作業は果たして学問と言えるのかどうか。
また、これらが学問であるとすれば、どのような点でそうなのか」というものであっ
た。この問いは、DH自体が学問領域なのか研究手法なのかという問いでもあるが、
本セッションの聴衆を含めた意見としては、
 1.資料の共有化
 2.暗黙知の可視化
 3.定量的な分析が可能
という点から人文系の学問として意義を持つということが指摘された。
 
6.おわりに
 すでに述べたように、日本オリエント学会は歴史学、考古学、宗教学、言語学、
建築学などの専門家が会員となっており、間口の広い学会となっている。しかしな
がら、年次大会では間口の広さを利点とした研究発表の場が少なく、エジプト考古
学やイスラーム宗教史など、個別の専門領域ごとに閉ざされた場で議論が行われが
ちであった。それはそれで専門領域の深化に繋がる重要な学会活動であるわけだが、
その一方で、学問領域の垣根を越えて研究者が集う機会があってもよいのではない
かと筆者は長らく考えていた。本セッションの企画は、そのような磁場の1つとなる
ことを願ってのことでもあったし、実際、4名の発表者は本セッションの企画によっ
て初めて一堂に会すことができた。また、後日、セッションの聴衆者からメールで
意見を頂くこともできた。このように、DHに関わるセッションを立ち上げたことに
より、横の繋がりができたことは、大きな収穫であった。

 最後に、拙い企画者を支えて下さった他の発表者の方々、ならびに長時間に及ぶ
セッションに参加して下さった聴衆の方々に対し、記して感謝を申し上げたい。

[*1]本稿をまとめるにあたり、セッションの発表者の安形、唐橋、中道からご協
力を頂いた。

[*2]本データベースの詳細は「じんもんこん2012」で発表した。
http://id.nii.ac.jp/1001/00087025/

[*3]慶應本グーテンベルク聖書-慶應義塾大学HUMIプロジェクト
http://www.humi.keio.ac.jp/treasures/incunabula/B42-web/b42/html/index_j...

[*4]現在、改訂版を準備中であるが、旧版のガイドは以下で紹介されている。
The Penn Parsed Corpus of Sumerian
http://psd.museum.upenn.edu/ppcs/

Copyright(C)NAGAI, Masakatsu 2012- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(2)
「第四回デジタル・アーカイブとデジタル・ヒューマニティーズ国際研究会」
http://www.dadh.digital.ntu.edu.tw/
(永崎研宣:人文情報学研究所)

 2012年11月29から30日、国立台湾大学Center for Digital Humanitiesの主催に
より、台湾大学にて、第四回デジタル・アーカイブとデジタル・ヒューマニティー
ズ国際研究会が開催された。

 台湾では中央研究院を中心としてデジタル・アーカイブに国会事業として取り組
んできており、すでに様々な大規模デジタル・アーカイブが構築されている[*1]。
デジタル・アーカイブのガイドブックも刊行されており、東アジア圏では先進的な
取り組みと言えるだろう。そして、台湾大学では、Jieh Hsiang教授を中心として、
このデジタル・アーカイブをデジタル・ヒューマニティーズに応用するための試み
にこの数年取り組んできており、また、デジタル・ヒューマニティーズのCenterNet
に参加するなど国際的な枠組みにも積極的に参加してきており、今回の国際研究集
会は、そういった流れの一環としてとらえることができるだろう。

 今回は、昨年の第三回と同様、2日間、1トラックで、500人規模の会場で開催され
た。口頭発表19件、ポスター・デモ発表が十数件となっており、これに加えて基調
講演や海外からの招待講演が行われた。参加者はほとんどが台湾の方々であったよ
うに見受けられたが、100人近く集まっていたようであり、同時通訳が用意されてい
たためディスカッションも中英取り混ぜて活発に行われた。招待講演ではADHOの前
ChairであるRay Siemens氏による、新しい知識環境としてのデジタルメディアにお
ける人文学の可能性についてのビデオ講演やオーストラリア国立大学のPaul Arthur
氏、大阪大学の田畑智司氏によるそれぞれの地域でのデジタル・ヒューマニティー
ズへの取り組みについての発表が行われた。

 一般発表では、シャークスピア・データベースなど、海外の資料に関するデジタ
ル化の発表もあったが、やはり、台湾で構築された様々なデジタル・アーカイブを
用いて分析を行った発表には特に目を引かれるものがあった。日本からも、立命館
大学の滑田明暢氏による東日本大震災のデジタルアーカイブのヴィジュアライゼー
ションに関する発表があり、活発な議論が行われた。

 個人的に興味深かったのは、北京師範大学の胡佳佳氏による、説文解字を用いた
漢字のネットワーク構築に関する発表と、国立政治大学・香港中文大学の研究者グ
ループによって行われた、近代中国思想と文学史のデジタル・アーカイブを用いて
行われた近代中国における「平等」概念の変遷に関する発表であった。前者は日本
でも類似の研究が行われているところだが、日本での研究についての参照がなかっ
たため、今後、相互に交流するなかでの研究の発展が期待されるところであった。
また、後者については、一億二千万字にのぼるデジタル・アーカイブから共起情報
を取り出しての分析であり、平等概念の発展過程を、比較的明確に時系列で示すこ
とができていた。

 全体として、すでに構築されたデジタル・アーカイブをいかにして活用するかと
いう応用事例としての発表が興味深く、また、人文学研究というよりはむしろ情報
工学における応用研究という印象が強かった。その意味では、日本で言うなら情報
処理学会の「人文科学とコンピュータ研究会」や「文化とコンピューティング国際
会議」の方向性に近いような印象であったが、徐々に人文学研究色も強まってきて
おり、将来的にはさらなる発展の余地があるように思われた。また、同じ漢字文化
圏ということもあり、ここから日本が学ぶべきことや貢献できることは多々あるよ
うに感じられ、日本からの発表者がもう少し増えて様々な次元で相互に連携してい
くことができれば東アジアの人文学研究全体がより豊かなものになるのではないか
と大いに期待されるところであった。

 なお、当日の発表スライドとアブストラクトは上記大会Webサイトから閲覧できる
ようになっている。どちらかというと中国語で書かれた資料が多いが、ご興味のあ
る方はぜひご覧いただきたい。

[*1]台湾でのデジタル・アーカイブへの取り組みについては次の論文にその初期
段階が報告されている。
http://ci.nii.ac.jp/naid/110006854676

Copyright(C)NAGASAKI, Kiyonori 2012- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(3)
「アジア歴史地理情報学会第1回国際会議」
http://www.l.u-tokyo.ac.jp/~angisj/
 (近藤康久:東京工業大学大学院情報理工学研究科)

 12月1・2日に東京大学本郷キャンパスにおいて、アジア歴史地理情報学会(Asian
Network of GIS-based Historical Studies;略称ANGIS)の第1回国際会議が催さ
れた。

 日本の研究者によるアジアの歴史学研究においては近年GISの利活用が進み、その
成果は『歴史GISの新地平:景観・環境・地域構造の復原に向けて』(HGIS研究協議
会編、勉誠出版、2012年)にまとめられた。この執筆陣が母体となって、本年6月に
ANGISの設立を呼びかけ、国際会議開催の運びとなった。

 国際会議には、日本をはじめ、台湾・フィリピン・タイ・インドネシア・インド
から研究者約50名が参加した。講演はすべて英語で行われた。初日には柴山守氏(
京都大学)による開会の辞と水島司氏(東京大学)による基調講演で、ANGISの設立
趣旨とGISを用いた歴史学研究の現状が説明された後、日本から5名、台湾・フィリ
ピン・タイ・インドネシアから各1名の研究者が自国におけるGISの現状について報
告した。その後の総会で会則が承認され、学会が正式に発足した。学会は、ANGIS
Asiaの傘下に国別ユニット(日本はANGIS Japan)が属する体制をとる。会議に提出
されたペーパーをもとに電子媒体の英文査読誌を定期刊行することが固まった。

 2日目には、計16本の研究報告が行われた。「ANGISのための情報基盤」セッショ
ンでは、京都大学地域研究情報統合センター(CIAS)における情報資源共有システ
ムと、時空間情報ツールHuMap/HuTimeの開発・運用に関する取り組みが報告された。

 「東南アジア東西回廊」セッションでは、東南アジア大陸部(ヴェトナム・カン
ボジア・タイ・ミャンマー)を東西にむすぶ古道の復元について、研究史の整理と
リモートセンシングおよび現地踏査・史料調査を組み合わせた研究の現状と展望が
提示された。これらの研究成果がGISを用いて統合され、デジタル地図に表現される
ようになったことが、歴史地理学の大きな進歩であることを実感した。

 このほか、事例研究として、日本、中国、トルキスタン、フィリピン、インドネ
シア、インド、エジプトなどを対象地域とする研究が報告された。対象とする時代
は統計資料や行政・経済文書が比較的多く入手できる近現代が中心であったが、研
究アプローチは経済史・人口動態・都市史・農村史・建築史・災害史・考古など、
実に多様であった。しかしその中にも、資料の公開・共有にかかわる権利あるいは
研究慣行の問題や、GISが地図表現の上で不得手とする時間概念の取り扱いなど、歴
史学に共通する論点が提示され、バックグラウンドの異なる参加者の間で問題意識
を共有できたように思う。先述の「情報基盤」セッションで提示されたような情報
ツールが、これらを解決する手段を提供することとなろう。

 GISによる空間解析の手法としては、多くの研究で基礎的な点分布パターン分析が
用いられていた。カーネル密度分析やゾーン集計、空間的自己相関分析など、もう
一手間かければ、より科学的客観性の高い形で時空間パターンを理解できるものと
期待される。この点、近接分野でありかつGISの応用で先行する人文地理学の研究手
法を積極的に参照し、取り入れていくことが望まれる。

 昨今、地理情報システム学会の「歴史・考古」セッションや、情報処理学会人文
科学とコンピュータシンポジウム(じんもんこん)においては、GIS関係の報告者の
顔ぶれが固定されているように感じられる。ANGISはアジア歴史学におけるGISの「
ユーザー会」として、研究者の新しい結集軸ないし交流軸になりうる可能性を秘め
ており、これからGISを利用しようと考えている大学院生や研究者の新規参入を積極
的にうながすことによって、今後の発展が期待される。

 なお総会時のアナウンスによれば、次回の国際会議は時期詳細は未定であるが、
2013年に京都で、それ以降の開催地はアジア各国の持ち回りとなる見込みである。

Copyright(C)KONDO, Yasuhisa 2012- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(4)
「デジタル・ヒューマニティーズの現在」
http://www.bun.kyoto-u.ac.jp/cape/cape-cape_and_hakubi_seminar_digital_h...
(川名雄一郎:京都大学白眉センター)

 2012年12月10日(月)に京都大学白眉センター&応用哲学・倫理学教育研究セン
ター(CAPE)共催セミナー「デジタル・ヒューマニティーズの現在」を開催した。
白眉センターは、京都大学が2009年からはじめた次世代研究者育成支援事業「白眉
プロジェクト」によって採用された、さまざまな分野の若手研究者が所属している
センターである。また、CAPEは2012年4月に京都大学文学研究科内に設立された、現
代社会におけるさまざまな問題について理論的・実践的に研究しているセンターで
ある。両センターの関係者の間で近年のデジタル・ヒューマニティーズ(以下、DH)
の動向について情報交換を進めるなかで、DHに関心をもつさまざまな分野の研究者
が集まれるような機会を持ちたいという機運が高まってきていた。それが実現した
のが今回の共催セミナーである。ここでは開催責任者の一人として、セミナーの内
容について簡単に紹介したいと思う。

 セミナーでは最初に、永崎研宣氏(人文情報学研究所)から「人文学はデジタル
技術に何を期待し得るか~デジタル・ヒューマニティーズの動向を通じて」と題し
た報告があった。日本におけるデジタル技術を用いた人文学の研究活動の嚆矢とし
ての計量国語学会の設立(1957年)以来の国内外におけるDHの歴史を振り返りつつ、
DHの現状と今後の展望について話された。‘Methodological Commons’という考え
方――個々の学問成果ではなく方法論を共有するという考え方――をDHを規定する
特徴として指摘した上で、人文学的文脈を離れたビッグデータの解析をどのように
してそれぞれに長い歴史をもっている個々の人文学の専門研究に結びつけていくか
という問題が論じられた。そして、この点に関連して、大規模/大容量資料群への
効率的アプローチを通じての「『気づき』の獲得」の重要性が強調された。

 続く志田泰盛氏(京都大学)の報告のタイトルは「インド古典哲学文献の系統分
析の可能性」で、インド古典文献の批判校訂テキストを確立する上での課題と、そ
れらに取り組む際にコンピューター技術を利用することの必要性や可能性について
論じられた。インド古典文献は長い年月の間に写本が繰り返し作成されてきたため
に、その過程で誤字・脱字や混交、さらには史料の損傷などによって写本の系統関
係が複雑になり、信頼できるテキストを特定することがきわめて困難となっている。
したがって、インド古典研究においてはテキストの確立という作業がきわめて重要
な意味をもつことになる。この問題については、インド古典学はその長い歴史のな
かで、いわゆる主観的分析によって大きな成果を上げてきているが、近年では、進
化生物学などで用いられているPAUPやSplits Treeといった解析ソフトを用いて写本
同士の親近性や系統関係を推定する試みも進展しつつある。報告は、このようなソ
フトウェアツールによる研究の事例を紹介しつつ、このような分析を主観的分析と
どのように組み合わせることで系統関係推定の精度を高めることができるかを検討
するものであった。

 最後は、久木田水生氏(京都大学)による「SMART-GS――歴史的文献研究のため
のソフトウェアツール」と題する報告であった。SMART-GS[1]は林晋・京都大学教
授が久木田氏や大浦真氏(京都大学)とともに開発を進めている人文学テキスト研
究用のオープンソース・ソフトウェアで、手書きのものも含めたあらゆるテキスト
の画像イメージを検索、マークアップ、リンクすることを可能にするソフトである
(林教授本人の談によると、GSはドイツ語のGeschichte Studie(歴史研究)だけで
なく、尊敬する杉田玄白も意味しているらしい)。SMART-GSは開発者による田辺元
研究やドイツ数学史研究の他、近代日本史の重要史料とされる倉富勇三郎日記や内
海忠司日記の研究においても用いられるなど、近現代史の手稿研究における利用が
広がり始めている。このソフトの大きな特徴は、人文学者自らが自らの研究に資す
るために開発しているソフトであるという点にあり、人文学者にとってきわめて実
用的なツールとなっている(アップデート作業も、実際に使用している人文学者か
らの要望を反映する形ですすめているということであった)。

 セミナーには30名強の参加者があり、京都大学内のさまざまな部局からだけでな
く、他大学、さらには国会図書館に籍をおく研究者にも参加していただいた。質疑
の時間も、それぞれの専門分野での知見に基づいた活発な議論が交わされ、非常に
啓発的であった。また、セミナー後の懇親会にも多くの方に参加していただき、専
門分野や所属組織が違うために普段はなかなか出会う機会のない研究者の間で、DH
という話題をきっかけとして貴重な交流の時間をもつことができたのも嬉しいこと
であった。

 現在の学術活動はどのようなものであっても、程度の差はあるにしてもデジタル
技術抜きには考えられない。その意味で、ほとんどすべての人文学者がDHに何らか
の形で関わっていると言えるだろう。もちろん、人文学者がみなDHという潮流に主
体的にコミットメントする必要はないが、個々の分野において新奇なデジタル技術
を用いることによって生み出される新しい研究成果に「気づかない」でいる理由も
ないだろう。この点に関連して、参加者の一人が「自分のやっていることがデジタ
ル・ヒューマニティーズと呼ばれるものであることを初めて知った」と冗談半分に
言っていたことが印象的であった。

 報告いただいた三人および参加いただいた方々へ感謝するとともに、専門分野に
関係なくDHに関心をもつ研究者が集い、DHとそれぞれの専門研究の双方の進展にとっ
て有意義な機会を今後も企画していきたいと思う。

[1]SMART-GSは以下のサイトで公開されている。
http://sourceforge.jp/projects/smart-gs

Copyright(C)KAWANA, Yuichiro 2012- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(5)
「The International Conference for the Korean Association for Corpus
Linguistics 2012」
http://kacl.pusan.ac.kr/
 (小林雄一郎:日本学術振興会/立命館大学)

 2012年12月10から11日、韓国の釜山大学でThe International Conference for
the Korean Association for Corpus Linguistics(KACL)の第1回大会が開催された。
この学会は、言語学とコンピュータ科学の学際的研究を標榜し、コーパス言語学と言
語教育という2つの領域を主な対象とするものである。

 今大会では、『コーパスを活用した認知言語学』[1]の著者Alice Deignan氏によ
る“Searching for metaphorical patterns in corpora: Implications for
English language teaching”、フリーのコーパス分析ツールAntConc[2]の開発者
Laurence Anthony氏による“The past, present, and future of software tools
in corpus linguistics”、Jae-Woong Choe氏による“Argument structure and
language resources in Korean”という3件の招待講演があった。

 その他、31件の研究発表があり、英語、韓国語、中国語、マオリ語などが分析対象
とされていた。そして、分析テーマとしては、学術語彙表の作成、談話表現の分析、
語法研究、多言語コーパスの分析に関する発表が多い印象を受けた。その中で日本人
による発表は、早稲田大学の原田康成氏らによる“Data collection and
annotation of spontaneous utterances by Japanese learners of English”と、
筆者による“A multivariate approach to metadiscourse markers in native and
non-native English”の2件であった。全体的に参加者が非常に積極的で、どの発表
に対しても多くの質問やコメントが寄せられ、活発な議論が行われていた。

 コーパス言語学の分野における国際会議としては、ヨーロッパのICAME[3]や
Corpus Linguistics[4]、アメリカのAmerican Association for Corpus
Linguistics[5]などが有名である。また、アジア太平洋地域の会議としては、最
近Asia Pacific Corpus Linguistics Conference[6]が設立された。コーパス言語
学は、主に英語圏で発達してきた学問分野ないしは方法論であるが、アジアの言語
はいくつかの点で英語と大きく異なっている。その意味において、今後アジアにお
けるコーパス言語学の発展が望まれている。

[1] http://plaza.taishukan.co.jp/shop/Product/Detail/21114
[2] http://www.antlab.sci.waseda.ac.jp/software.html
[3] http://www.usc.es/en/congresos/icame34/index.html
[4] http://ucrel.lancs.ac.uk/cl2013/call.php
[5] http://aacl.sdsu.edu/
[6] http://www.corpling.com/conf/

Copyright(C)KOBAYASHI, Yuichiro 2012- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆編集後記(編集室:ふじたまさえ)
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 2012年最後の人文情報学月報、いかがでしたか?巻頭言を始め、イベントレポー
トでも、人文情報学についてさまざまな議論が進められている様子が伝わってきま
す。ご寄稿いただきました皆さま、ありがとうございました。

 人文情報学月報では今後も、さまざまな立場からのご寄稿を掲載していきたいと
思います。

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM017] 2012年12月27日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: