ISSN 2189-1621

 

現在地

DHM 020 【後編】

[DHM020]人文情報学月報【後編】

2011-08-27創刊

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2013-03-31発行 No.020 第20号【後編】 335部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【前編】
◇《巻頭言》「バレエ古典作品のデジタルアーカイブ化」
 (曽我麻佐子:龍谷大学理工学部)

◇《連載》「Digital Humanities/Digital Historyの動向
      ~2013年2月中旬から3月中旬まで~」
 (菊池信彦:国立国会図書館関西館)

【後編】
◇人文情報学イベントカレンダー

◇イベントレポート(1)
「シンポジウム:すべてをコンピュータの中に(繋がってしまったデータとその未
来)」
 (山崎直樹:関西大学)

◇イベントレポート(2)
「第3回コーパス日本語学ワークショップ」
 (小木曽智信:国立国語研究所 言語資源研究系)

◇イベントレポート(3)
「『東洋学へのコンピュータ利用』第24回研究セミナー」
 (安岡孝一:京都大学人文科学研究所附属東アジア人文情報学研究センター)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◇人文情報学イベントカレンダー(■:新規イベント)

【2013年5月】
■2013-05-11(Sat):
情報処理学会 第98回 人文科学とコンピュータ研究会発表会
(於・京都府/大谷大学)
http://jinmoncom.jp/

□2013-05-22(Wed)~2013-05-24(Fri):
The Music Encoding Conference 2013
(於・ドイツ/Mainz Academy for Literature and Sciences)
http://music-encoding.org/conference

□2013-05-24(Fri)~2013-05-26(Sun):
International Conference on Japan Game Studies 2013
(於・京都府/立命館大学衣笠キャンパス)
http://www.ptjc.ualberta.ca/en/Conferences/Japan%20Game%20Studies.aspx

■2013-05-25(Sat):
日本図書館情報学会 2013年 春季研究集会
(於・茨城県/筑波大学 筑波キャンパス 春日エリア)
http://www.jslis.jp/conference/2013Spring.html

□2013-05-25(Sat)~2013-05-26(Sun):
情報知識学会 第21回 2013年度 年次大会
(於・東京都/お茶の水女子大学)
http://www.jsik.jp/?2013cfp

【2013年6月】
□2013-06-03(Mon)~2013-06-05(Wed):
2013 Annual Meeting of the Canadian Society For Digital Humanities
(於・カナダ/University of Victoria)
http://csdh-schn.org/2012/11/16/cfp2013/

□2013-06-04(Tue)~2013-06-07(Fri):
5th International Conference on Qualitative and Quantitative Methods in
Libraries
(於・イタリア/"La Sapienza" University)
http://www.isast.org/qqml2013.html

□2013-06-06(Thu)~2013-06-10(Mon):
Digital Humanities Summer Institute 2013
(於・カナダ/University of Victoria)
http://dhsi.org/

□2013-06-13(Thu)~2013-06-14(Fri):
17th International Conference on Electronic Publishing
(於・スウェーデン/Blekinge Institute of Technology)
http://www.bth.se/elpub2013

□2013-06-26(Wed)~2013-06-29(Sat):
Digital Humanities Summer School Switzerland 2013
(於・スイス/University of Bern)
http://www.dhsummerschool.ch/

【2013年7月】
□2013-07-08(Mon)~2013-07-12(Fri):
Digital.Humanities@Oxford Summer School
(於・英国/Oxford University)
http://digital.humanities.ox.ac.uk/dhoxss/

□2013-07-10(Mon)~2013-07-12(Fri):
The 5th International Conference on Asia-Pacific Library and Information
Education and Practice
(於・タイ/Khon Kaen University)
http://www.aliep2013.com/

□2013-07-16(Tue)~2013-07-19(Fri):
Digital Humanities 2013
(於・米国/University of Nebraska)
http://dh2013.unl.edu/

【2013年8月】
■2013-08-04(Sun)~2013-08-09(Fri):
IGU 2013 Kyoto Regional Conference
(於・京都府/国立京都国際開館)
http://oguchaylab.csis.u-tokyo.ac.jp/IGU2013/jp/

■2013-08-06(Tue)~2013-08-09(Fri):
Balisage: The Markup Conference 2013
(於・カナダ/Montre'al)
http://www.balisage.net/

■2013-08-15(Thu):
IFLA 2013 Satellite Meeting "Workshop on Global Collaboration of Information
Schools"
(於・シンガポール/Nanyang Technological University)
http://conference.ifla.org/ifla79/satellite-meetings

Digital Humanities Events カレンダー共同編集人
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
小林雄一郎(大阪大学大学院言語文化研究科/日本学術振興会特別研究員)
瀬戸寿一(立命館大学衣笠総合研究機構PD)
佐藤 翔(筑波大学図書館情報メディア研究科)
永崎研宣(一般財団法人人文情報学研究所)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(1)
「シンポジウム:すべてをコンピュータの中に(繋がってしまったデータとその未
来)」
http://kanji.zinbun.kyoto-u.ac.jp/~ymzknk/kanzi/2013-02-16.html
 (山崎直樹:関西大学)

1.はじめに

 2013年2月16日、京都大学人文科学研究所で「すべてをコンピュータの中に(繋が
ってしまったデータとその未来)」と題するシンポジウムが開催された。これは、
筆者も参加している同研究所の共同研究プロジェクト「情報処理技術は漢字文献か
らどのような情報を抽出できるか: 人文情報学の基礎を築く」(2010から2012年度
)の活動の一環として行われたものである。以下にその報告をする。

2.問題の所在

 このプロジェクトを始めるにあたり、研究の基盤となるべき現状の認識に関して、
議論を行い、次の問題点を確認した。

A)漢字文献の資料は文字テキストとして整備されたものばかりではなく、画像デー
タとして蓄積されたものも多い(例:拓本、写本、変体仮名の資料……など)。人
文情報学の発展のためには、それらのデータにも機械可読な形でのメタデータを付
与することにより、活用を図らねばならない。

B)文字に関するアーカイブズは着々と整備が進められているが、非文字に関する資
料はそうではない。

C)文字テキストにメタデータを付与するためのマークアップ技術は発展したが、非
文字データにメタデータを付与する方法は発展途上にある。非文字データへのメタ
データ付与技術が未整備なので、当然、それらに対する検索技術も未整備である。

D)文字/非文字の大量のデータを蓄積し、それにメタデータを付与することに成功
したにせよ、そのデータ相互の関連付けが有効に行われなかった場合、そのデータ
は活用されにくい。

E)我々が、あるデータの集積物から、情報処理技術を用いて、何か意味のあるデー
タを抽出しようとする場合、そのデータの集積物がどのような構造をもっていると
見なすか(=その構造をモデル化すること)に関して、明確な見解が必要である。

 これらの現状認識を踏まえ、次の3つの検討すべき課題を導きだした。

課題(甲):非文字データのように、これまでメタデータを付与することが困難な
だと考えられてきたデータへのメタデータ付与にはどのような問題点があり、どの
ような可能性があるか。

課題(乙):文字データにせよ、非文字データにせよ、メタデータを付与すること
により、単なる機械可読ではなく、機械が意味を読み取ることが可能となったデー
タは、そのデータ相互をどのように関連づけたらよいのか。「セマンティックウェ
ブ」という枠組みで示された方向でよいのか。

課題(丙):我々が分析の対象とする文字データの集まり=テキストは、どのよう
な構造をもっているものとしてモデル化できるか、また、非文字データの集積体の
基本的なデータフォーマットは、画像や動画であると考えられるが、それらの集積
体(例:記録映画など)はどのような構造をもっているものとしてモデル化できる
か。

3.今回のシンポジウムについて

 2010から2012年度にわたり、当プロジェクトは上記の課題を検討すべく、シンポ
ジウムやセミナーを開催してきた。最終年度にあたる2012年度に開催したのが、標
題のシンポジウムである。このシンポジウムでは、次の3件の報告が行われた。

(1)漢字構造情報のRDF化の試み/守岡知彦(京都大学)
(2)国立国会図書館のメタデータ標準-データを繋げるメタデータ:DC-NDL/柴田
洋子(国立国会図書館)
(3)PageRankと学術論文の評価:ノーベル賞の窓を探そう/藤田裕二((株)ター
ンストーンリサーチ、日本大学)

 (1)は、漢字構造情報を機械可読にする表現の代表的な形式であるIdeographic
Description Sequence(IDS)を、セマンティックウェブを支える基幹技術として、
メタデータやオントロジーを表現するに開発されたRDFで表現した場合、どのような
結果を招くのか、その可能性と問題点を論じた。

 (2)は、書誌情報のメタデータ形式として標準化されているDublin Coreから出
発したものの「もはや、Dublin Coreではない」と評される、国立国会図書館による
メタデータ形式DC-NDLについて、その変遷や、概念モデル、データフォーマットに
ついて解説がなされた。

 (3)は、代表的な検索エンジンであるGoogle Searchの基盤技術であるPageRank
と、その人文科学の他分野への応用について論じた。PageRankは、データとデータ
のリンクから再帰的にデータの重要度を決定するというアイデアを基にしているが、
このアイデアを現実に存在する文書間のネットワークの解析に応用するためにはい
くつか実装上の問題点がある。これらの問題がどのように解決されたか、そしてそ
れを、「学術論文間の引用ネットワーク」というデータ構造の解析に応用するには
何が必要かが報告された。

 その後、永崎研宣氏(人文情報学研究所)をコメンテーター及び司会に迎え、パ
ネル討論を行った。これらの模様は、下記の[1]でその記録を見ることができる。
また、予稿などは[2]で入手できる。

[1]人文:USTREAM http://ustream.tv/channel/zinbun/
[2] http://kanji.zinbun.kyoto-u.ac.jp/~ymzknk/kanzi/

4.3年間を振り返って

 当研究プロジェクトの催し物は、次の点にこだわり、繰り返しテーマとして取り
上げてきた。

イ)我々の研究対象(文献、画像、文字……)はどのような構造をもつものとして
モデル化できるのか、それに対してメタデータを付与するにはどうしたらよいのか、
そのメタデータにはどのような構造をもたせるべきか。

ロ)データとデータをつなげるだけでよいのか、どのようなメタデータを付与し、
どのようにリンクさせるべきか。

 これらに対し、明確な解答を出すことは難しいが、その解決の糸口程度は示せた
のではないかと考えている。

Copyright(C)YAMAZAKI, Naoki 2013- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(2)
「第3回コーパス日本語学ワークショップ」
http://www.ilcc.com/corpus/
 (小木曽智信:国立国語研究所 言語資源研究系)

 2013年2月28日と3月1日、国立国語研究所で「第3回 コーパス日本語学ワークショ
ップ」が開催された。両日ともに約170人、のべ約340人の参加者があり盛況であっ
た。

 コーパス日本語学ワークショップの前身は「現代日本語書き言葉均衡コーパス(
BCCWJ)」の構築を行った科研費特定領域研究「日本語コーパス」(2006年から2012
年まで)の全体会議・公開ワークショップである。2012年から現在の形で年2回開催
され、現在では「現代日本語書き言葉」という限定を離れ、話し言葉や対話、歴史
コーパスなどまで分野が拡大している。そして、日本語学・日本語教育をはじめと
する文系の研究者と、自然言語処理の研究者をはじめとする理系の研究者とが、共
通の研究基盤であるコーパスを介してつながり、意見を交わせる貴重な機会となっ
ている。

 今年は、口頭発表12件、ポスター発表42件の総計54件の発表があった。分野別に
見ると、自然言語処理と教育への応用に関するものが10件、音声や対話コーパスに
関するものが9件、コーパスの設計・構築に関わるものが12件、コーパスにもとづく
文法や語彙研究が16件、日本語の歴史コーパスに関するものが7件であった(ここで
は重複させていないが実際には多分野にまたがるものが少なくない)。前川喜久雄
・国語研言語資源研究系長の総評でも触れられていたが、当ワークショップは回を
追うごとに内容面でも充実してきていることが感じられる。研究発表の予稿集は全
文がPDFファイルで公開される予定である(現在準備中)。

http://www.ninjal.ac.jp/event/specialists/project-meeting/

 コーパスの利用は、自然言語処理においても日本語学においても当たり前のこと
になりつつあるが、両者の交流は必ずしも盛んでない。しかし、自然言語処理の手
助けを必要とする文系研究者は多く、また日本語学・日本語教育からのフィードバ
ックを期待する理系研究者も少なくないはずである。当ワークショップを起点に、
今後更に両者の交流が進み、そのコラボレーションの下で新しい研究が進められる
ことに期待したい。

Copyright(C)OGISO, Toshinobu 2013- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(3)
「『東洋学へのコンピュータ利用』第24回研究セミナー」
http://www.kanji.zinbun.kyoto-u.ac.jp/seminars/oricom/2013.html
 (安岡孝一:京都大学人文科学研究所附属東アジア人文情報学研究センター)

 2013年3月15日(金)京都大学人文科学研究所本館において、『東洋学へのコンピ
ュータ利用』第24回研究セミナーが開催された。

 この研究セミナーは、1990年以来、年1回の頻度で開催されており、最初の13回は
京都大学大型計算機センターの主催だった。当初、『東洋学へのコンピュータ利用
』は、京都大学大型計算機センターの研究セミナーの1つとして開催されていて、そ
の後、2003年より京都大学人文科学研究所附属漢字情報研究センターの主催となり、
さらに2010年からは、京都大学人文科学研究所附属東アジア人文情報学研究センタ
ーが主催するに至っている。

 『東洋学へのコンピュータ利用』第24回研究セミナーでは、午前中に2件、午後
に4件、合計6件の発表があった。

(1)平仮名字体通時データベースのために
   岡田一祐(北海道大学)
(2)甲骨文データベースのデジタル化諸要件と作業プロセスの検討
   鈴木敦(茨城大学)・鈴木俊哉(広島大学)
(3)IVS vs UCS
   安岡孝一(京都大学)
(4)多粒度漢字構造情報のための包摂規準機械可読化の試み
   守岡知彦(京都大学)
(5)『白氏文集』本文データと検索についての課題
   當山日出夫(立命館大学)
(6)東洋学デジタル化における技術の選択
   永崎研宣(人文情報学研究所)

 (1)は、平仮名の「通時コーパス」を作成しようとする試みであり、いわゆる変
体仮名に真正面から取り組む発表だった。(2)は、甲骨文の各「文字」に文字コー
ドを振ろうという大胆な試みに際し、どのような視点と意識と準備が必要なのかを、
ISOにおける失敗から学ぶという発表だった。(3)と(4)は、文字コードにおける
漢字の包摂粒度が小さくなっていく際に現れる問題に対し、(3)はその問題提起を
行い、(4)はその解決を試みた。一方、(5)と(6)は、東洋学における「デジタ
ル化」が直面する問題を、(5)では『白氏文集』を一例として、(6)ではマクロ
な視点から、議論したものだった。

 なお、当日の発表は全てUSTREAM録画されており、
(1)、(2)は http://www.ustream.tv/recorded/29980917 で、
(3)、(4)は http://www.ustream.tv/recorded/29983992 で、
(5)、(6)は http://www.ustream.tv/recorded/29985463 で、見ることができる。
興味のある向きは、ぜひ視聴してみてほしい。

Copyright(C)YASUOKA, Koichi 2013- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆編集後記(編集室:ふじたまさえ)
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

 人文情報学月報もあっという間に第20号を配信することができました。今号も、
たくさんの皆さまにご寄稿いただき、ありがとうございました。

 今号の見どころは、前編の巻頭言で示されたデジタルアーカイブのデータ作成と
その維持についての考察に対して、後編のイベントレポートの1本目が、ちょうどそ
の答えのヒントになるような内容になっていることです。編集室では、イベントレ
ポートは基本的に開催日順に掲載しており、特に内容によって並び替えをしたわけ
ではありません。しかし、この二つの記事を続けて読んでみると、対象とする内容
や分野は違えど、課題となっている根幹が共通していることがうかがえます。

 後編のイベントレポート(3)では、「コーパス」を共通項に自然言語処理と日本
語学という異分野が交流していくことができるのではないか、というメッセージで
した。イベントレポート(4)に関して、このメールマガジンの読者には当然の知識
かもしれませんが、特にふじたが気になった「包摂」(*1)と「粒度」(*2)とい
う概念について、わかりやすく掲載している記事を参考までに共有して、編集後記
を終わりにします。

(*1)http://www.cinra.net/column/morisawa/morisawa09-2.php
(*2)http://blog.livedoor.jp/nrudt/archives/51364666.html

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM020]【後編】 2013年03月31日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: