ISSN 2189-1621

 

現在地

DHM 056 【後編】

2011-08-27創刊                       ISSN 2189-1621

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2016-03-29発行 No.056 第56号【後編】 624部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

【前編】
◇《巻頭言》「言語データから見えてくることばの機微」
 (内田 諭:九州大学大学院言語文化研究院)

◇《連載》「Digital Japanese Studies寸見」第12回「住所不定と参照性」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

【後編】
◇人文情報学イベントカレンダー

◇イベントレポート(1)
国際シンポジウム「HathiTrustとデジタルアーカイブの未来」<後編>
 (永崎研宣:人文情報学研究所)

◇イベントレポート(2)
「第109回人文科学とコンピュータ研究会発表会」参加報告
 (北崎勇帆:東京大学大学院人文社会系研究科日本文化研究専攻 修士課程二年)

◇イベントレポート(3)
シンポジウム「テキストマイニングとデジタル・ヒューマニティーズ」(九州大学)
 (大賀 哲:九州大学)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◇人文情報学イベントカレンダー(□:新規掲載イベント)

【2016年4月】

□2016-04-06(Wed)~2016-04-08(Fri):
Second MEDEA Workshop
(於・米国/Wheaton College in Norton)
http://medea.hypotheses.org/wheatonmassachusetts-april-6-8-2016

□2016-04-08(Fri):
Day of DH 2016
(於・virtual/Worldwide)
http://dayofdh2016.linhd.es

□2016-04-20(Wed)~2016-04-22(Fri):
Workshop on Big Data and Digital Humanities@taipei
(於・台湾/台北)
https://sites.google.com/site/bddh2016/

【2016年5月】

□2016-05-14(Sat):
情報処理学会 人文科学とコンピュータ研究会 第110回研究発表会
(於・茨城県/筑波大学 筑波キャンパス 春日エリア)
http://www.jinmoncom.jp/

□2016-05-14(Sat)~2016-05-15(Sun):
日本語学会2016年度春季大会
(於・東京都/学習院大学 目白キャンパス)
http://www.jpling.gr.jp/taikai/2016a/

□2016-05-30(Mon)~2016-06-01(Wed):
CSDH/SCHN conference
(於・カナダ/University of Calgary)
http://csdh-schn.org/category/activites/conference/

【2016年6月】

□2016-06-20(Mon)~2016-06-23(Thu):
aaDH Australasian Assoc of Digital Humanities Conf
(於・豪州/University of Tasmania)
http://www.uqhistory.net/web/dha2016

□2016-06-24(Fri)~2016-06-27(Mon):
AAS-in-ASIA conference@京都
(於・京都府/同志社大学)
http://aas-in-asia-doshisha.com/

Digital Humanities Events カレンダー共同編集人
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
小林雄一郎(東洋大学社会学部)
瀬戸寿一(東京大学空間情報科学研究センター)
佐藤 翔(同志社大学教育文化学科 助教)
永崎研宣(一般財団法人人文情報学研究所)

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(1)
国際シンポジウム「HathiTrustとデジタルアーカイブの未来」<後編>
http://21dzk.l.u-tokyo.ac.jp/DHI/index.php?sympo2015_1
 (永崎研宣:人文情報学研究所)

 第54号所収の前編に引き続き、表題のシンポジウムを報告したい。J. Stephen
Downie氏による基調講演「HathiTrust Research Center: Latest Development and
New Opportunities」の後、小休止をはさんで、国立国会図書館電子情報部電子情報
企画課長の大場利康氏、国文学研究資料館古典籍共同研究事業センター副センター
長山本和明氏の講演が行われた。

 大場氏は国立国会図書館(以下、NDL)におけるデジタル化事業の歴史的経緯と現
状について紹介を行った。「国立国会図書館の資料デジタル化に係る基本方針」に
触れつつ、10年間で14億円というペースで行われていた資料のデジタル化が、2009
年に突如として127億円もの費用がつくとともに、前後して2度の著作権法改正が行
われ、大規模な資料デジタル化が行われたことが紹介され、現状では約248.5万点の
デジタル化資料のうち、約49万点がインターネット公開されていること、絶版等で
市場に流通していない資料が閉じたネットワークによる送信を通じて国内各地の図
書館等で閲覧できること等が報告された。そして、研究利用の促進に関わる取組み
として、科学技術振興機構(JST)、物質・材料研究機構(NIMS)、国立情報学研究
所(NII)、国立国会図書館が共同で運営するジャパンリンクセンター(JaLC)を通
じて、デジタル化資料にDOI(Document Object Identifier)が付与されていること
が挙げられた。DOIは、インターネット上の資料に永久に与えられる識別子であり、
資料のサーバ等が移動したとしても同じ識別子でアクセスできることを前提とした
ものである。そこで、デジタル化資料を学術論文等で参照する際にこのDOIを用いる
ことで、論文の根拠を永続的に検証可能なものとし、それを通じてデジタル化資料
への注目度も高めていき、さらに、そうしたデータを蓄積していくことで資料の評
価や分析にもつなげていくという青写真が描かれた。特に古典籍資料に関しては、
所蔵約28万点中、7万点程度がインターネット公開されており、それらにもDOIが付
与されている。さらに、デジタル画像の利用手続きの簡素化、オープンデータセッ
トの公開、NDLラボを通じた図書館資料活用のための研究者への実験場の提供、とい
ったことが紹介された。

 山本氏は、「古典籍研究ネットワークの目指す未来」と題する講演を行い、すで
に本メールマガジンでも様々な形で言及されてきている「日本語の歴史的典籍の国
際共同研究ネットワーク構築計画( https://www.nijl.ac.jp/pages/cijproject/
)」の現状と将来像について報告した。文部科学省による大規模学術フロンティア
促進事業の一つとして2014年度に開始された10ヶ年計画のこのプロジェクトは、30
万点の日本語古典籍画像とその書誌情報の撮影・公開を目指しつつ2年が経過したと
ころであり、すでに2015年11月には、撮影済みの350点を書誌情報やタグ・解題・一
部の本文等とともに国立情報学研究所の情報学研究データリポジトリからオープン
データ(CC BY-SA)として公開している。ここでも、DOIの付与が課題として挙げら
れ、「検証可能な人文学の構築」という表現で識別子の永続性によってもたらされ
る意義が説明された。技術的な取組みとして、くずし字のOCRの実験やワードスポッ
ティング技術による文字画像検索、ソーシャルタギング、検索の多言語対応、日本
古典籍総合目録データベースを活かした典拠コントロールに基づく利便性の高い検
索システムの提供、といったことが紹介された。このプロジェクトでは、さらに、
こういった基盤を活用した学際的な国際共同研究を推進しつつネットワークを構築
していくことも課題としているとのことであった。

 この後、小休止を挟んで、東京大学大学院人文社会系研究科世代人文学開発セン
ター人文情報学拠点長下田正弘氏、東京大学附属図書館副館長堀浩一氏による講演
が行われた。下田氏は、自らの科研費基盤研究(S)プロジェクトである「仏教学
新知識基盤の構築―次世代人文学の先進的モデルの提示」を例として、次世代人文
学のモデルを提示した。内容を簡潔にまとめると下記のようになる。仏教学は前5世
紀頃から現代に至る2000年以上の期間を人間の言語活動を対象としつつ、言語も地
域も極めて多様であり、さらに大蔵経という形で伝統的に知識をコーパス化してき
ている。これをデジタル媒体の時代に適切に展開し直すための基盤を形成するのが
このプロジェクトの課題である。すでに1994年から継続的に構築運営されてきたデ
ータベース群とネットワークがあり、その一方で、その果実を人文学全体にも反映
すべく、方法論の共有地としての国際的なデジタル・ヒューマニティーズにも積極
的に関わり、日本でこの領域の学会活動を支援することも一つ野課題としている。
また、オープンデータにも取り組んでおり、東大総合図書館所蔵の万暦版大蔵経を
CC BYで公開するなどしている。その一方で、優良な商用コンテンツとの連携も視野
に入れ、現在はSAT大蔵経データベースとJapan Knowledgeとの有機的なリンク機能
を提供している。最終的には、単なるコンテンツの構築提供だけでなく、学術的な
信頼性を伴った動的学術プラットフォームの構築を通じて、知の共有化・公共化の
促進を目指すということが明らかにされた。そして、これを実現するための基盤と
して、Unicodeに文字を登録するための取組みや、国際的に広がる研究ネットワーク
等が紹介された。

 堀氏の講演は、これまでとは少し視点が異なり、むしろ、デジタルアーカイブの
構築とはどのようにあるべきか、という議論が中心となっていたように見受けられ
た。東京大学でのデジタルアーカイブ構築という課題の下、どのような人がどのよ
うなものを作るべきか、そのためには誰が何をすべきか。研究者はこれを他人事と
せずに主体的に取り組む必要があるのではないか。そのような問題提起から、知識
は動的な側面を持っており、すべての学問分野が同様に、この動的側面をデータベ
ースに反映する必要があり、そのためには研究者がこれに主体的に取り組まなけれ
ばならない、ということが示された。堀氏のプレゼンは、独自のソフトウェアを用
いて思考経路を動的に形成しながら進められていくもので、それ自体も大変興味深
いものであったことも付記しておきたい。

 最後には、全体討論が行われ、筆者の司会により、質問用紙形式での質疑応答と
議論が行われた。個別の技術からデジタル化の全体像の話まで、様々な質問が投げ
かけられたが、なかでも印象に残ったのは、すでに前編に述べたように、人文学が
Digital Humanitiesという形でHathiTrust研究センターと深く関わっている理由に
ついての質問に対するDownie氏の回答であった。図書館情報学が自らの戦略として、
研究者、なかでも特に人文学と長い間連携を続けてきていて、それがHTRCにも反映
されたのだ、という説明は、我々にとっての今後の方向性を示すものでもあったの
ではないかという印象を持った。

 このシンポジウムを振り返ってみると、日本を代表する大型デジタルアーカイブ
の研究活用の取組みと米国の最先端の取組みとの邂逅という、今後の様々な展開に
もつながり得るまたとない機会であり、さらに、全体を通じ、デジタルアーカイブ
の研究活用を考える上での大小様々なヒントがちりばめられていた。日本のデジタ
ルアーカイブに関わる方々が未来に向けた何かをそれぞれにくみ取ってくださる場
になったであろうことを願いつつ、この報告を終えたい。

Copyright(C)NAGASAKI, Kiyonori 2016- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(2)
「第109回人文科学とコンピュータ研究会発表会」参加報告
http://www.jinmoncom.jp/
 (北崎勇帆:東京大学大学院人文社会系研究科日本文化研究専攻 修士課程二年)

 2016年1月30日(土)、国立情報学研究所に於いて、第109回人文科学とコンピュ
ータ研究会発表会が開催された。筆者は本研究会への参加が今回で2度目であり、果
たしてレポートを書くのに適任なのだろうかという戸惑いがある。今回は午後始ま
りで口頭発表が3件+企画セッションという控えめな構成であり、そのため紙幅を十
分に取ることができるため、以下、プログラムに沿って見ていくこととする。

 一件目、高田智和氏(国立国語研究所)による「ISO/IEC 10646への変体仮名収録
提案-レパートリと符号化アーキテクチャ-」は、2015年10月に行われた、変体仮名
の国際文字コード規格への登録提案に関する報告であった。変体仮名のISO/IEC
10646登録については月報52号の岡田一祐氏による記事で取り扱われたため、経緯に
ついては当該記事を参照頂きたい( http://www.dhii.jp/DHM/dhm52-2 )。変体仮
名の登録提案は無事受理され、現在は符号化へのプロセス上にあるということで、
今後の報告が益々楽しみである。

 二件目、山田太造氏(東京大学史料編纂所)による「前近代日本史史料に関わる
人名情報の収集・蓄積に関する考察」は、東京大学史料編纂所によって構築中の
「人名リポジトリ」に関する発表である。曰く、東大史料編纂所による30にも及ぶ
データベースはその全てが人物・人名に関わるデータを有しているが、一人の人物
が複数の名を持つこと、同一名の人物が複数人いること、データベースによって人
名の表記法が異なることなどにより、人物をキーとする場合、単純検索では十分な
検索結果が得られない。そうした問題から、各データベースに散在するデータを一
元的に扱うリポジトリの構築を目指したという旨の報告であった。各データベース
の人名に関する部分を統合的に扱うために、結果的にざっくりとして柔軟な、ある
意味「なんでもアリ」なリポジトリが構築されていることが興味深かった。また、
同一人物の同定については、吉賀氏の発表とも関連するところがあった。

 三件目、吉賀夏子氏(佐賀大学大学院)による「古典籍書誌注記文からの作品構
造および関連人物のつながりを明らかにする周辺情報抽出」では、古典籍の書誌学
的研究に欠かせない注記情報を抽出する手法が紹介された。書誌データとして個別
のタグ付けがされていない注記内の、序者・書肆等の固有表現を自動的に取得する
ことを目指すという。事例として佐賀大学所蔵の市場直次郎コレクションを対象と
しており、市場コレクションにおける記述を前提としていることから、他のデータ
ベースに応用が効くのか、そのためにはどのような機械学習が有効なのか、という
声が聴衆より寄せられていた。また、質疑では触れられなかったが、各所蔵機関の
書誌調査の段階で情報の取捨選択と整理が行われ、記述の段階で情報がある程度正
規化されている(例えば、早稲田大学古典籍総合データベースでは [序者名]序
(序年) と統一されているように)ため、各データベースから得られる書誌情報は
一次ソースではない。そうした情報を人文系の研究者が(特に書誌学的な文脈で)
利用するだろうか、という点が個人的には気がかりであった。本発表の目的と直接
関係するところではないが、データベースから抽出された書誌データがそのまま人
文系寄りの研究に寄与するというよりはむしろ、大量に集まった書誌データを情報
学的な文脈から処理することによって、何か新しく見えてくるものがあるのではな
かろうか。

 企画セッション「研究者の一日をみてみよう」ではセッションタイトルの通り、
CHに関連するポストに就く11名の先生方の、一日のタイムスケジュールの紹介が行
われた。当たり前のことながら、職務は人それぞれ、学生の有無といったレベルか
ら、相手とする学生の規模も人それぞれ、時間の使い方も人それぞれ、である。
「会議が多いな」とか「全然寝てないな」とか「働くって大変だな」とかいった小
学生のような感想も抱きつつ、「研究以外の雑務に追われていると自分が何者であ
るかを見失いがち(なので、見失わないためにどうにかしないといけない)」とい
う話を心に留めておかねばならないと感じた次第である。

 セッションは予定時間を超過するほどに盛り上がり、セッション後には先日のじ
んもんこん2015における最優秀論文賞の発表と、学生奨励賞の表彰が少々の急ぎ足
で行われた。最優秀論文賞が与えられたのは北本朝展氏・西村陽子氏による
「Digital Criticism Platform: エビデンスベースの解釈を支援するデジタル史料
批判プラットフォーム」であり、まさに「納得の受賞」といったところであったよ
うに思う(私事で恐縮だが、筆者も学生奨励賞を頂くことができた。身に余る光栄
である)。

 北本氏の研究等に鑑みるに、人文情報学という一学問分野が、「DとHの融合によ
って何ができるか」を模索する段階から、「DとHの融合で○○ができる」「△△が
できる」ということを前提とし、そうした事例の統合によって研究の枠組みのレベ
ルを(再)構築していく段階へと移行しているのだろうか。だとすれば、このタイ
ミングで、この分野に関わることができたことを大変嬉しく思う。

 次回の第110回研究会は5月14日(土)に筑波大学で開催される。学生ポスターセ
ッションには奨励賞が授与されるため、そちらにも期待しつつ、奮ってご参加頂き
たい。

Copyright(C)KITAZAKI, Yuho 2016- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇イベントレポート(3)
シンポジウム「テキストマイニングとデジタル・ヒューマニティーズ」(九州大学)
http://mtc.kyushu-u.ac.jp/index.php?cmd=s&k=719143ef05
 (大賀 哲:九州大学)

 2016年1月30日(土)に九州大学箱崎キャンパスでシンポジウム「テキストマイニ
ングとデジタル・ヒューマニティーズ」が開催された。このシンポジウムは九州大
学異分野融合テキストマイニング研究会(後述)の第4回研究会として開催されたも
のである。周知のようにテキストマイニング(Text mining 以下、TM)とは文字列
を対象としたデータマイニング(Data mining)で、統計学などのデータ解析の技法
を用いて大量のデータから「隠れた」特徴や傾向を見つけ出す技術である。TMによ
って、大量のテキストデータから重要語やキーワードを抽出し文書の傾向や重要事
項を抽出する、大量のテキストデータを分類しその要点や特徴を見出す、テキスト
中に隠れている問題点や新しい視点などを発見する、といったことが可能になる。
このシンポジウムでは、TMの先行事例、活用事例を検証し、その上でデジタル・ヒ
ューマニティーズ(以下、DH)におけるTMの意義や課題を主たるテーマとしていた。
つまり、TMによってどのように研究の領野が拡がるのかを検討し、さらにDHにおい
てTMの手法や技法を活かす余地があるのか、あるとすればそこにはどのような可能
性と課題があるのか、ということを考えるのがこのシンポジウムの趣旨であった。

 シンポジウムは3部構成で、第I部はTMのフリーソフト(KH Coder)を開発した立
命館大学准教授・樋口耕一氏による入門講座、第II部は同じく立命館大学文学部教
授・田中省作氏によるTMの事例研究、第III部は人文情報学研究所主席研究員・永崎
研宣氏によるDHにおけるTMの活用とその課題についての講演であった。

 第I部の樋口講演では、前半で内容分析や計量テキスト分析についての概要説明、
後半で実際にKH Coderを操作しての入門講座が行われた。樋口講演は、なぜ計量テ
キスト分析を行うのか?そこにはどのようなメリットがあるのか?といった初歩的
な問いから出発し、内容分析の研究史や先行研究の事例を簡単に振り返りながら、
具体的な調査事例から計量テキスト分析が全体としてデータの特徴を捉え、データ
をよりよく理解すると同時に分析の信頼性を高める方法であることを示していた。
具体的には高校生を対象にした東日本大震災についてのアンケート調査を例に、性
別・賛否・クラス・リスク言及の有無などとの対応分析を行いながら、計量テキス
ト分析の方法とその意義を説明していた。この中でとくに、量的方法と質的方法の
循環的な関係が示唆されていた。つまり、量的な分析を自動処理で行う多変量解析
のプロセスと、その結果を参照しつつ分析者自身が注目したいコンセプトについて
質的な分析を行うコーディングのプロセスを分けて考え(かつ後者においては、コ
ーディングルールは分析者が考えるが、コーディング自体はコンピュータが行う)、
両者を循環的に捉えて分析を深化させていくことが提起されていた。このように計
量テキスト分析についての理論的背景や意義を説き、後半では実際にKH Coderを用
いながら、具体的事例を参考に共起関係の探索、対応分析、コーディング作業等の
方法を示していた。

 第II部の田中講演は、学術情報や機関リポジトリを活かしたTMの事例を紹介しな
がら、TMの意義と課題について考察した。講演の前半では「機関リポジトリ」を用
いた学術情報マイニング、とくに学術英語に着眼し、機関リポジトリに登録されて
いる論文をマイニングして、学部(部局)別に重要語彙のリストを作るという研究
事例が紹介された。これは部局ごとに語彙分布を抽出し、例文を提示するという方
法である。後半は機関リポジトリと学術支援についての研究が紹介された。具体的
には研究者データベースを用いてその研究者の「トピック」を同定し、その上でそ
れを研究者マッチングとして活用するという方法である。ここでは論文からトピッ
クを抽出し(語の確立分布から生成)、トピックの近い研究者どうしを結びつける
という手法がとられ、連携可能性等の情報を付与したり、競争的資金獲得戦略に活
かすということが想定されていた。また、大学間の機関リポジトリを併合して大学
間研究者マッチングを分析するという将来構想も紹介されていた。田中氏によれば、
情報登録と利活用の好循環の構成―つまり個々の研究者が学術情報を自発的に蓄積
(登録)していくことと、その結果として(たとえば研究マッチングなど)個々の
研究者に資する情報の提供、両者の間の循環をいかに図っていくのか―が今後の重
要な課題になるという。

 第III部の永崎講演はDHにおけるTMの活用を課題とし、TMとDHの関係について示唆
的な分析を多く含んでいた。まずはDHの研究史から学会設立や国際的な組織展開を
俯瞰し、さらに日本での大規模プロジェクト、教育カリキュラムの事例が紹介され
た。永崎氏によれば、実際のDHの研究には蓄積・公開・活用という要素があるが、
このうち活用という位相で解析ツールを用いたTMが活かされることとなる。つまり、
資料をデータ化し、公開した上で、分析するためのツールとしてTMが注目される。
またテキストデータだけでなく、メタデータの分析、画像・音声・映像・動作の解
析や感性情報の分析なども必要であることから、DHの研究事例として考えた場合に
TMの活用範囲は広い。クラウド・ソーシングなどを通じた、画像からテキストデー
タを作る手法についても注目が集まっている。DHにおいては方法論の研究、ソフト
開発、研究実践が循環的に進行していくので、これらのプロセスにおいてTMが活か
される余地は多い。他方、課題としては著作権の問題、(テキストの)読み取りの
難しさ、フォーマットの共通化などの問題がある。講演の中では米国のHathiTrust
の先行例が示され、日本での可能性も示唆された。さらに、研究成果について言え
ば、TMの結果にどのような意味を見出すか、既存の人文学的研究成果との関係・整
合が必要となる。講演の中では大正新修大蔵経の研究事例が挙げられ、DHの研究成
果と既存の研究成果とを整合させていくことの意義が語られ、人文学者の細やかな
知見の集積とテキストマイニング研究者の分析手法の連携の可能性が示唆された。

 以上のように、このシンポジウムでは前半の講演でTMの入門講座と事例研究がな
されTM技術を実際の研究にどのように活かすのかということが検討された。その上
で、後半の講演ではDHに対象を絞り、DHの中でのTMの活用とその課題が論じられた。
シンポジウムには100人以上が参加し、質疑応答も活発であった。

 最後にこのシンポジウムの主催団体である九州大学異分野融合テキストマイニン
グ研究会について簡単に紹介しておきたい。この研究会は、九州大学の学術研究・
産学官連携本部の協力の下、2015年7月に組織された。分析することで有意義な情報
が得られる可能性の高いデータ(文書群)を持つ研究者と分析技術は持つものの分
野限定のデータの解読技術を持たない研究者を結びつけることが目的で、部局・専
門の枠を超えて研究の知見やノウハウを共有するための活動をしている。これまで
学内で3回の研究会を行い、第4回研究会として外部にも参加をオープンにして開催
したのが今回のシンポジウムである。当日の講演資料はこの研究会のウェブサイト
http://mtc.kyushu-u.ac.jp/index.php?cmd=s&k=e56c0bad4e )で閲覧すること
ができる。

Copyright(C)OGA, Toru 2016- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆編集後記(編集室:ふじたまさえ)
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
第56号も充実の内容となりました。いかがでしたか?
ご寄稿いただいた皆さま、本当にありがとうございました!

今回注目したのは、巻頭言で内田さんが述べていた「共起語」という言葉のです。
不勉強でお恥ずかしいのですが、実はこの言葉を初めて知りました。Googleで検索
してみると、始まりはGoogle社の鈴木さんが“動詞の「co-occur」と名詞の
「co-occurrence」を堅めの日本語に訳した”[1]言葉とのこと。もともとはウェ
ブサイトのSEO効果を向上させるために考えられた用語のようですが、巻頭言では、
言葉の細かい意味をよく考えるために使える概念として紹介されているように読み
取りました。

直接的に表現されていない文脈や行間を読み取る力も、こういった言語データを使
いこなすことによって今後は気軽に養えるようになるのかもしれませんね。

次号もお楽しみに。

[1] https://www.suzukikenichi.com/blog/debanking-seo-using-co-occuring-phrases/

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM056]【後編】 2016年03月29日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【 ISSN 】2189-1621
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: