2011-08-27創刊 ISSN 2189-1621
人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly
2018-03-31発行 No.080 第80号【前編】 728部発行
_____________________________________
◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【前編】
◇《巻頭言》「知識ベースの学術情報フローへ向けたIIIFへの期待」
(西岡千文:京都大学附属図書館研究開発室)
◇《連載》「Digital Japanese Studies寸見」第35回「デジタル空間と公器としてのアーカイブ」
(岡田一祐:国文学研究資料館古典籍共同研究事業センター)
【後編】
◇人文情報学イベントカレンダー
◇イベントレポート 関西大学アジア・オープンリサーチ・センター(KU-ORCAS)キックオフ・シンポジウム「デジタルアーカイブが開く東アジア文化研究の新しい地平」
(菊池信彦:京都府立京都学・歴彩館)
◇編集後記
◇奥付
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《巻頭言》「知識ベースの学術情報フローへ向けたIIIFへの期待」
(西岡千文:京都大学附属図書館研究開発室)
2018年3月12日、World Wide Web(以下、ウェブ)は29歳の誕生日を迎えた[1]。ウェブならびにデジタル技術の進展が社会へ与えた影響の大きさについては述べるまでもないが、学術コミュニケーションへも多大な影響を与えた。電子ジャーナルの普及により、検索・査読・出版といったプロセスが容易となり効率的になった。また、新しい学術情報の流通チャネルであるarXivといったプレプリントサーバが誕生し、研究成果の迅速な共有が可能となった。
一方、現在までにウェブが学術コミュニケーションへ与えた変化は、出版物が単にその電子的複製であるPDFに置換されただけで限定的であると捉えられ、ウェブやデジタル技術がもつ可能性を最大限に活用しきれていないと指摘されている[2][3]。
現在までにウェブやデジタル技術の進展が学術コミュニケーションに与えた変化は、ヘンリー・フォードの「もし顧客に、彼らの望むものを聞いていたら、彼らは『もっと速い馬が欲しい』と答えていただろう。」という言葉を引用してしばしば例えられている[3][4]。
ウェブやデジタル技術を活用した学術コミュニケーションに関する取り組みとして、オックスフォード大学のDavid Shotton氏はSemantic Publishingを「出版された論文のコンテンツに意味付け(機械可読な情報の埋め込み等)がなされ、自動的な知識発見を容易にし、論文内のデータへのアクセスを可能にし、論文間のデータの統合を容易にするもの」と定義している[2]。
Semantic Publishingの実例として、テキストへのセマンティック・マークアップ、インタラクティブな図表の公開、CiTO[5]を利用した引用への意味付け(背景、比較手法、データの使用等の引用理由を機械可読な形式で表現)等がなされた論文を公開している( http://dx.doi.org/10.1371/journal.pntd.0000228.x001 )。
英国高等教育財政審議会(HEFCE)のSteven A. Hill氏は、注釈の共有について言及している[3]。多くの研究者は研究プロセスで様々な形式の注釈を生み出すが現状では共有されていない。ウェブやデジタル技術を活用して研究者は注釈を研究成果として共有することができる。注釈を学術コミュニケーションの単位とする動きについては、過去の本メールマガジンの巻頭言において国立国会図書館の奥田倫子氏より指摘されている[6]。
2018年1月、German National Library of Science and Technology(TIB)館長のSo:ren Auer氏より、「Towards an Open Research Knowledge Graph」と題したポジションペーパーが発表された[7][8]。ポジションペーパーでは、学術コミュニケーションにおいて、論文ベース(document-centric)の情報フローから知識ベース(knowledge-centric)の情報フローへの転換を目指して、Open Research Knowledge Graph (ORKG)というナレッジグラフが提案されている。
ORKGは、論文等に表現されている研究結果の明示的な意味表現を提供し、多様な情報源とのリンクを提供する(ORKGの全体像が文献[7]の図1にあり、図3・5にナレッジグラフによる研究成果の明示的な意味表現が例示されている)。前述の注釈の共有も、知識ベースの情報フローの構成要素であると考えられる。
知識ベースの情報フローを確立するためには、情報モデル、オントロジー、ナレッジグラフの分散・協調的な構築についての研究開発と多種多様なステークホルダー間のデータや情報の共通理解を進めることが不可欠である。その上で、開発された技術を、研究図書館における検索と知識交換の基盤に統合することが必要であると述べられている[7]。 ORKGが論文の内容を機械可読な構造的な形式で提供し、人間と機械が協調することで、複雑な情報ニーズに適切に対応できる。
その結果、研究に関するあらゆる情報の発見・再利用が容易になるため、研究が効率的になることが期待される。
ウェブ・デジタル技術を活用した学術情報の利用例として、Semantometrics[9]が挙げられる。Semantometricsは被引用数やAltmetricsといった文献評価指標の代替となるものである。Semantometricsは、ある文献の評価を、その文献が引用した文献群とその文献を引用している文献群の本文の意味的距離を指標として用いることを提案している。意味適距離が大きいほどその文献が与えたインパクトは高いと解釈される。
この意味適距離の測定において、現在はオープンアクセスの論文から抽出されたテキストを使用しているが、機械可読な情報が埋め込まれた論文を使用することで、より正確に意味適距離を計算できるようになるだろう。
また、前述のORKGが発展することで、ナレッジグラフのグラフ構造(ノードの度数等)を解析することで、論文単位ではなく論文の構成要素(データ、注釈等)といったより細かい単位での研究成果の評価といったことが可能になることが予想される[7]。
現在、貴重資料等の画像データの公開において、IIIF(International Image Interoperability Framework)に取り組む図書館が増えている。筆者が所属する京都大学でも、京都大学オープンアクセス推進事業において、2017年12月1日にIIIFに対応した京都大学貴重資料デジタルアーカイブ( https://rmda.kulib.kyoto-u.ac.jp/ )が正式公開された。IIIFにおけるデータの表現モデルは、W3C勧告であるWeb Annotation[10]に基づいている。
Web Annotationは、異なるソフトウェアプラットフォーム間でのアノテーションの共有・再利用を容易にすることを目的として標準化された。IIIFのコミュニティでは、翻刻・翻訳・タグなどの注釈の生成・共有・検索を支援する取り組みが積極的に行われている。資料に対する研究過程で誕生した注釈が、研究途中もしくは研究終了後に、オープンに公開されることで、先述した知識ベースの情報フローが創出されることが期待される。このような背景から、筆者はIIIFに関心を持っている。
注釈の生成・共有・検索を支援する取り組みに携わるとともに、注釈によって創出される知識ベースの情報フローを活用する可能性についても模索していきたい。
(本稿の意見に係る箇所については筆者個人の見解であり、筆者の所属機関を代表するものではない。)
[1]Web Foundation, “The web is under threat. Join us and fight for it.” 2018. https://webfoundation.org/2018/03/web-birthday-29/
[2]D. Shotton, “Semantic publishing: the coming revolution in scientific journal publishing” Learned Publishing, Vol. 22, pp. 85-94, 2009. https://doi.org/10.1087/2009202
[3]S. A. Hill, “Making the future of scholarly communications” Learned Publishing, Vol. 29, pp. 366-370, 2016. https://doi.org/10.1002/leap.1052
[4] https://lists.w3.org/Archives/Public/semantic-web/2018Feb/thread.html のNewsletter & Call for Papers WebSci'18というタイトルのスレッドに相当
[5]S. Peroni and D. Shotton, “FaBiO and CiTO: ontologies for describing bibliographic resources and citations” Journal of Web Semantics, Vol. 17, pp. 33-43, 2012. https://doi.org/10.1016/j.websem.2012.08.001
[6]人文情報学月報編集室, “人文情報学月報[DHM074]【前編】” 2017. https://www.dhii.jp/DHM/dhm74-1
[7]S. Auer, “Towards an Open Research Knowledge Graph” TIB Position Paper, 2018. https://doi.org/10.5281/zenodo.1157184
[8]German National Library of Science and Technology, “TIB publishes position paper on Open Research Knowledge Graph” 2018. https://www.tib.eu/en/service/news/details/tib-publishes-position-paper-...
[9]D. Herrmannova and P. Knoth, “Semantometrics: Towards fulltext-based research evaluation” 2016 ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL), pp. 235-236, ACM, 2016. https://doi.org/10.1145/2910896.2925448
[10]W3C Recommendation, “Web Annotation Data Model,”2017. https://www.w3.org/TR/annotation-model/
執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
西岡千文(にしおか・ちふみ)京都大学附属図書館研究開発室助教。慶應義塾大学理工学部卒業、慶應義塾大学大学院理工学研究科博士前期課程修了、キール大学大学院工学研究科博士後期課程修了を経て現職(博士後期課程時の研究拠点は、ドイツ国立経済学図書館)。博士(工学)。専門は情報工学。学術情報のマイニング、セマンティックウェブに関する研究に携わる。
Copyright(C) NISHIOKA, Chifumi 2018- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《連載》「Digital Japanese Studies寸見」第35回「デジタル空間と公器としてのアーカイブ」
(岡田一祐:国文学研究資料館古典籍共同研究事業センター)
先日、とある研究者との会話のなかで、前近代日本研究におけるデジタルアーカイブを取り巻く状況として、社会的地位の弱いひとびとの存在が見えなくなりがちであることに及んだ。利用者として要望を出せるかという話になり、クレーマーと思われたいわけでもないからというところで、その話題は終った。
このような情報の偏在という問題については、以前、第5回で触れた[1]、English Resource Guide for Japanese Studies and Humanities in Japanにおいて学術情報を集めたときも感ぜられたところであった(それは多分に英語で得られる情報というのに絞ったというためでもあろうが)。以下、まとまりや深みがあるわけではないが、最近すこし話題になったことでもあるので、いささか説き及んでみたい。
このような情報の偏在は、けして、デジタルにはじまったことではないし、もし社会的地位の弱さというものがあるのだとしたら、それは、適切に記録が残らないことも含まれていようから、ただちにそれぞれのデジタルアーカイブが「わるい」のだとは言えない。しかしながら、機械学習についてさいきんあらためて注意されているように[2]、デジタル空間が社会的地位を増幅させることがあるのだとすれば、それは、たんに現実の投影にすぎないと居直ることは許されないようにも思える。
たとえば、歴史研究に疎いのでこまかなことは知らないが、出自による差別を助長するような史料をデジタルアーカイブで無思慮に公開するようなことがあれば、史料を書いたのが自分だからということでは済まないものがあるだろう[3][4]。
とはいえ、大半の歴史的資料を取り扱うデジタルアーカイブにとっては、差別にあたる表現を取るものを示すことによって差別の主体となるわけではないのもまたあきらかである。それは、「史料を書いたのがデジタルアーカイブの提供者ではないから」というところに戻ってくる。たとえば、女人成仏を否定した数百年前の資料を掲載したら、その考えにデジタルアーカイブの提供者が和したのだとはならないようにである。
むしろ、それらを保存して、資料としてそのようなものが現に存在し、伝来してきたということを社会のひとりひとりが見つめるための資料を提示する場というものを担わなければならない、とさえ言えるのではなかろうか。
しかしながら、あるものについてはともかく、欠落についてはどう考えればよいのだろうか?ないものはないというのはかんたんで、じっさい、そうであるならばそれ以上どうしようもないのだが、おもしろいものがないからといって出さないのだとすれば、それは、いまある差別の投影であって、過去の差別の現実の正確な描写としてのアーカイブではない。
アーカイブが差別的な表現をそのままにしておけるのは、社会のありのままを示す公器としての役割を認められてのことである。それが、デジタル空間における差別の増幅を助長するのだとすれば、「ありのまま」を示しておくことが難しくなってゆくのかもしれない。
やはり、そうなるまえに人文学があるべきで、資料を読み解き、人間の知のなかに可変性を持たせて位置づける-複数の読みの可能性を限界まで広げていきながら-ことで、差別の支えとさせないようにする務めがあるのではなかろうか(げんに、デジタル人文学には、デジタル空間の批判的役割が期待されているという議論もある[5][6]。セールストークと言われたらそれまでかもしれないが)。
このようなデジタルアーカイブ(ライブラリ)の偏りの問題というのは、アーカイブ構築のなかでできることもそう多くなく、専門機関ではなく取り組んでいるところもあまり見受けられないようである。
けっきょくは、アーカイブには見せたくなるようなもの以外にもあり、それらもまた(直接にだれかの権利を侵害しないかぎりにおいて)見られるようになっていなければならないのだという単純な事実をわたしたちが受け止められるかという一点にかかってくるために、なにか動きとして現れにくいのかもしれないが、繊細なことがらを含むゆえに、経験を共有し、教えを請いたいところでもあろう。AIの問題を機に、議論が深まるとよいのではないかと考える。
[1]拙稿「「Digital Japanese Studies寸見」第5回: 英語による学術情報発信:人間文化研究機構のEnglish Resource Guide for Japanese Studies and Humanities in Japanをもとに」『人文情報学月報』49号、2015年8月
[2]たとえば、エイプリル・グレーザー「AIが性差別・人種差別をするのはなぜか?どう防ぐか?」『ニューズウィーク日本版』2018年2月15日 https://www.newsweekjapan.jp/stories/technology/2018/02/ai-32.php
[3]Google Earthの古地図と部落差別問題、本家/.で話題に | スラド IT https://it.srad.jp/story/09/05/27/0854223/
[4]ネットの部落差別「いたちごっこ」監視続ける自治体:朝日新聞デジタル https://www.asahi.com/articles/ASL3G53SRL3GPLXB009.html
[5]How the Humanities Compute in the Classroom - The Chronicle of Higher Education https://www.chronicle.com/article/How-the-Humanities-Compute-in/143809
[6]‘Digital’ Is Not the Opposite of ‘Humanities’ - The Chronicle of Higher Education https://www.chronicle.com/article/Digital-Is-Not-the/241634
Copyright(C)OKADA, Kazuhiro 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
続きは【後編】をご覧ください。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
配信の解除・送信先の変更は、
http://www.mag2.com/m/0001316391.html
からどうぞ。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちしています。
情報提供は人文情報学編集グループまで...
DigitalHumanitiesMonthly[&]googlegroups.com
[&]を@に置き換えてください。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM080]【前編】 2018年03月31日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【 ISSN 】2189-1621
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
[&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/
Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄