ISSN 2189-1621

 

現在地

DHM 048 【前編】

2011-08-27創刊                       ISSN 2189-1621

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2015-07-29発行 No.048 第48号【前編】 578部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

【前編】
◇《巻頭言》「デジタルアーカイブの利活用に向けて:有機的な相互連携の可能性」
 (永崎研宣:人文情報学研究所)

◇《連載》「西洋史DHの動向とレビュー
  -DHにおけるClose ReadingとDistant Reading研究のビジュアル化手法の現状
                               (論文紹介)」
 (菊池信彦:国立国会図書館関西館)

◇《連載》「Digital Japanese Studies寸見」第4回
 「研究におけるクラウドソーシング:
           Rice and population in Asia: Japan's rice 1883-1954」
 (岡田一祐:北海道大学大学院文学研究科専門研究員)

【後編】
◇人文情報学イベントカレンダー

◇イベントレポート(1)
「アクセスの再定義:日本におけるアクセス、アーカイブ、著作権をめぐる諸問題」
 (江上敏哲:国際日本文化研究センター)

◇イベントレポート(2)
「東京文化資源会議」第一回総会
 (鈴木親彦:東京大学大学院人文社会系研究科 博士課程(文化資源学))

◇イベントレポート(3)
「国立情報学研究所(NII)学術情報基盤オープンフォーラム2015」参加報告
 (天野絵里子:京都大学学術研究支援室)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《巻頭言》「デジタルアーカイブの利活用に向けて:有機的な相互連携の可能性」
 (永崎研宣:人文情報学研究所)

 先日、国立西洋美術館にて開催されたアート・ドキュメンテーション学会に参加
し、独立行政法人国立美術館理事長・国立西洋美術館長の馬渕明子氏による「国立
美術館の野望」というご講演を拝聴した。「野望」として提示されたのは、国立美
術館が主導して、高い精度で構築した美術情報を効果的・効率的に、国内外へと広
く継続的に提供していくための、人材育成や予算措置までも含めた包括的な将来設
計であり、そこではデジタルアーカイブがキーワードとなっていた。たとえば「ア
ーカイブ立国宣言」が実質的にはデジタルアーカイブを基礎に据えた文化資源の活
用を目指しているように、近年、改めて、デジタルアーカイブがクローズアップさ
れるようになってきている。これまでもデジタルアーカイブが注目されてきたこと
はあったが、利活用が課題として前面に出てくるようになっているのが近年の傾向
と言えるだろう。

 活用が注目される理由はよくわかる。投入した公金によって適切に成果が生み出
されたかどうかを問われる傾向が年々強くなってきている昨今、何らかの形で公金
が投入されることが多いデジタルアーカイブが、何にどう役立ったかと問われる事
態を避けるのはちょっと難しいだろう。もちろん、そうした背景事情に関わらず、
苦心して作成したものが活用され、意義を見出してもらえること、それがデジタル
アーカイブ作成者にとって喜びであることに異論を挟む人はほとんどいないだろう。

 しかし、見方を変えるなら、「まだ十分に活用されていない」というデジタルア
ーカイブ作成者側やそこに予算をつける側の思いが、利活用への注目という事態を
生んでいることも確かだろう。では、利活用状況を改善していくためには、現状で
はどういったことが欠けていて、何が必要とされているのか。ここでは、この20年
程色々な形でそこに関わってきている筆者の経験を下敷きにしつつ、少し考えてみ
たい。

 筆者は、いわゆるデジタルアーカイブに様々な形で関わってきている。一例を挙
げるなら、筆者が技術面を担当している(実際にプログラミングやシステム構築を
している)SAT大蔵経テキストデータベース( http://21dzk.l.u-tokyo.ac.jp/SAT/
は、主に漢文と日本語からなる約1億字のテキストデータと画像データベースを含む、
いわゆる広義のデジタルアーカイブにあたるものであり、同時に、国内外の様々な
デジタルアーカイブと色々な形で連携することによって、いわば、仏教典籍のポー
タルとして関連デジタルアーカイブのハブ機能を果たし、利用者の便を図るだけで
なく、各デジタルアーカイブの利活用性を高めている。月間アクセス数は延べ30万
~50万件となっており、仏教学以外でも、歴史学や文学をはじめ様々な分野の研究
者によって広く利用されているものである。ここでの文脈に沿って言い換えれば、
様々なデジタルアーカイブを利活用することによって自らの利活用性を高めるとい
うサイクルを実現しているデジタルアーカイブであると言ってもいいだろう。さら
に、昨年から本年にかけて、コロンビア大学で公開されているチベット大蔵経の統
合的デジタルアーカイブBCRDと相互連携したことで、その輪は一気に広がった。元
々、このSAT大蔵経DBでは、漢文の本文をドラッグすると電子仏教辞典を検索して英
語での意味を表示したり、関連分野の研究論文データベースINBUDSを検索したり、
さらにCiNii等に本文PDFがあればそこへのリンクも表示されるようになっていたが、
近年のリンクや連携により、たとえば漢文の『妙法蓮華経』を読みながら、東京大
学図書館所蔵の16~17世紀に刷られた木版大蔵経の画像や、8世紀頃の京都国立博物
館所蔵の写本をe国宝の画像で確認したり、大英図書館所蔵の8世紀頃の敦煌写本の
画像を確認したりしてテキスト変容の状況について確認する一方で、チベット語訳
され数百年前に刷られた木版チベット大蔵経も画像で確認しつつチベット語での検
索も行う、といったことが可能になっている。さらに、SAT大蔵経DBとBCRDはそれぞ
れ独自に拡張を継続しており、それによって双方の利活用性がさらに高まっていく
という状況になっている。このようにして、用途や内容、想定利用者等、様々な違
いのあるデジタルアーカイブが、相互に有機的に連携することによって重層的なも
のとなり、そしてそのようにしてあちこちにできた連携の輪が相互に重なり合って
いくことでさらに価値を高めていくことは、デジタルアーカイブが本来もたらしえ
る大きなポテンシャルの一つであり、デジタルアーカイブの利活用を進めていく上
で重要な要素と言えるだろう。

 デジタルアーカイブの利活用の仕方はこういったものに限らず他にも様々な可能
性があり、とりわけ、作られ続けながら同時に使われ続ける動的なデジタルアーカ
イブやクラウドソーシングの導入などが近年注目を集めているところだが、ここで
はとりあえず、上記のようなものについて考えてみよう。有機的なデジタルアーカ
イブの相互連携を実現するためには、デジタルアーカイブを構築運営する側だけで
なく、それを利用する側にも、取り組むことで事態改善につながる課題があると思
われる。

 まず、構築運営する側としては、多くの論者がすでに指摘してきたことだが、ラ
イセンスの明示とパーマリンクの提示がきわめて重要である。デジタルアーカイブ
同士を連携させようと考えた場合、他のデジタルアーカイブのデータをどのように
して利用可能であるか、ということと、そのデータが永続的に(あるいは少なくと
も一定の長期間)同じURLでアクセスできるのかどうか、ということが明らかでない
と、連携するための仕組みやデータを作るための投資に踏み切ることは困難である。
理想的にはオープンデータだが、そうでないとしても、たとえば、非商用利用なら
再配布可、等のライセンスが明示されていれば、連携先のデータが自分のサイトで
もどこまで利用できるのか、どこからできないのか、ということが明らかになるた
め、その点についての計画をきちんと立てながら考えられるようになる。そして、
デジタルアーカイブの連携においては、最終的には相手の個々のデータにリンクを
張ることが必要になるのであり、そのためには、各データのURLか、あるいは相手方
のデータ検索のためのURLを中心に手元のリンクデータを構築していくことになる。
ここで、リンク先のURLがいつ変更されるかわからない、という状況だったとしたら、
やはり、連携のためのデータ作成に時間をかけたり費用をかけたりすることはなか
なか難しくなってしまうのであり、その点において、URLの固定化はきわめて重要な
のである。

 さて、次に、活用する側について考えてみよう。これはデジタルアーカイブ連携
だけでなく、単にデジタルアーカイブ利用においても同様なことなのだが、活用す
る側が活用したことをきちんと明示すること、それから、活用する側が構築する側
に、自分たちにとって必要な要件を適切に伝達すること、が今後一層重要となって
いくだろう。

 まず、近年特に増えてきており、国文学研究資料館によって進められている「日
本語の歴史的典籍の国際共同研究ネットワーク構築計画」によってさらに大幅な増
加が期待される古典籍等の一次資料のデジタルアーカイブでは、一般の人々が直接
活用するだけでなく、研究者がそれを活用して、研究論文や一般向けのコンテンツ
を公表するということが大いに期待される。この場合、研究者には元々、引用・参
照を明記するという作法が定着しており、その作法にデジタルアーカイブが乗るよ
うになれば、活用されていることが認知されるようになるだろう(ただし、辞典等
のいわゆる工具書類の利用はこれまで明記する習慣のない分野も多く、デジタルア
ーカイブの場合にはそうしたものでもある程度記載すべしというコンセンサスを形
成していく必要があるだろう)。さらに、近年広まりつつあるJ-STAGE等の電子ジャ
ーナル媒体等において電子的な引用索引に掲載されるようになれば、半ば自動的に
具体的な活用状況を確認できるようになる。さらに、研究論文に付与するパーマリ
ンクとしてすでに広まっているDOIを研究データ等に付与するという議論が広まって
きているが、これもそのことを後押しすることになるだろう。さらに言えば、一度
どこかでこうした作法が確立されれば、研究者に限らず、誰もがその作法を採り入
れやすくなるだろう。このようにしてデジタルアーカイブの引用が一般化したなら、
パーマリンク提示の必要性への認識が高まり、結果として、デジタルアーカイブ連
携のための基盤形成にもプラスに作用することだろう。

 また、研究者による活用という観点では、研究者のニーズへの対応をより強く意
識したデジタルアーカイブの構築も視野に入ってくるだろう。すでに欧米ではTEIガ
イドライン( http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ )を通じ
て文献学・言語学をはじめとする人文学全般におけるデジタルアーカイブ的なもの
についての様々な要求を共通のフォーマットに反映し、デジタルアーカイブ構築に
有効活用できるところまできており、これを対象としたツールも徐々に大がかりな
ものが登場してきている。アジアの文献に適用しようとした場合はまだ色々な課題
が残っているものの、こういった角度から研究者がもう一歩踏み出すことで、研究
者にとってより使いやすいものが作られれば、引用もしやすくなり、活用状況がよ
り把握しやすく、かつ明らかになり、それによってデジタルアーカイブが豊かなも
のになっていくことだろう。これにあたっては、構築運営する側が活用する側との
コミュニケーションをうまく確立していくことも必要になるだろう。そして、そう
した細やかな要求が適切に反映されたデジタルアーカイブ同士であれば、より深く
有機的な連携を比較的容易に実現でき、さらに利活用性を高めていくことができる
だろう。そして、これもまた、研究者に限らず、広く展開し得る話である。

 ということで、ここまでの述べてきたことを改めてまとめると、デジタルアーカ
イブの利活用を推進していくにあたっては、デジタルアーカイブ間の有機的な相互
連携が一つの可能性として有効であり、それを志向するには、構築運営する側にも
活用する側にも取り組むべき課題があり、特に活用する側では研究者が取り組む余
地が大きい。「アーカイブ立国宣言」でも、こういった側面への配慮をさらに深め
ていただくことで、その価値を一層高めていっていただけるのではないか、そして、
馬渕氏の「野望」も、より有効なものとなるのではないか、などと、外野席からで
恐縮だが、期待する次第である。

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
永崎研宣(ながさき・きよのり)筑波大学大学院哲学・思想研究科単位取得退学。
博士(文化交渉学・関西大学)。東京外国語大学アジア・アフリカ言語文化研究所、
山口県立大学准教授を経て、現在、一般財団法人人文情報学研究所主席研究員、東
京大学大学院情報学環特任准教授。1995年頃より、人文学におけるデジタル化につ
いて様々な角度から研究と実践を続けてきている。

Copyright (C) NAGASAKI, Kiyonori 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《連載》「西洋史DHの動向とレビュー
  -DHにおけるClose ReadingとDistant Reading研究のビジュアル化手法の現状
                               (論文紹介)」
 (菊池信彦:国立国会図書館関西館)

 2015年5月25日から29日にかけて、イタリアのサルデーニャ島南部のカリャリにお
いて、EuroVis2015が開催された。EuroVisとは、Eurographics(European
Asscociaion for Computer Graphics)のデータビジュアライゼーションワーキング
グループと、IEEEのビジュアライゼーション及びグラフィクステクニカル委員会が
主催する年次カンファレンスのことで、今年で17回目を数える[1]。この中で報告
された一論文を、今号では紹介したい。

 取り上げる論文は、“On Close and Distant Reading in Digital Humanities:
A Survey and Future Challenges”で、ドイツのライプツィヒ大学のStefan
Ja:nicke、Muhammad Faisal Cheema、Gerik Scheuermannと、同じくドイツにあるゲ
ッティンゲン大学のGreta Franziniら4名の共著によるものである[2]。EuroVisで
は、通常の研究報告とは別に、State-of-the-Art Reports(STARs)と呼ばれる、ビ
ジュアライゼーションの研究動向の発表枠があり、同論文もこれにあたる。同論文
は、タイトルにある“Close Reading”と“Distant Reading”のビジュアル化手法
をテーマとしたものであり、DH研究の主要なトピックの一つであるそれらの動向を
知るのに有益なものである。以下、論文の構成に沿って、その内容を簡単に紹介し
ていきたい。

 第1章 Introductionでは、人文学資料のデジタル化とそのデータへのビジュアル
化技術の活用の流れが、2005年にスタンフォード大の文学史研究者Franco Moretti
が発表した“Graphs, Maps, Trees”[3]におけるDistant Readingの提唱によって
大きな飛躍を遂げたと指摘して、同論文の背景が語られている。そして、Distant
ReadingとClose Readingのビジュアル化技術の動向をテーマとすることなどの問題
設定が提示されている。

 第2章 A Definition of Close and Distant Readingでは、Close Readingと
Distant Readingの定義がまとめられている。Close Readingは人文学研究者が慣れ
親しんできた伝統的な読みの技法であり、対してDistant Readingについては、
Morettiの定義を引用しつつ、一つないしは複数のテキストやコーパスを、人の眼で
はなくコンピュータに解析させビジュアル化することで、総体としてそれを把握す
るものとされている。

 第3章 Scope & Considered Research Papersでは、同論文が調査対象とした2005
年以降のビジュアライゼーション研究の雑誌5誌(論文数25本)と、DHの雑誌3誌
(論文数67本)について紹介があり、次いで第4章 Taxonomyで、それらのClose
ReadingとDistant Readingの論文で使われているビジュアル化技術を分類し、各分
類の中で該当する論文を取り上げて論じている。この第4章が同論文の中心なので、
次の段落で少し詳しく紹介したい。

 第4章でまとめられているビジュアル化技術は、Close ReadingとDistant Reading、
そしてその両者という3つに分けられている。Close Readingのビジュアル化技術で
は、テキストの「色」や「フォントサイズ」、図案で示す「グリフ」(Glyphs)、
そのほかに例えば版の違いで同一のテキストの間の異同を示す「コネクション」
(Connections)が項目として挙げられている。Distant Readingでは、個々のテキ
ストあるいはコーパス全体のヒエラルキーを示す「構造化」や、コーパス内のテキ
スト間の関係を示すのに使われたりする「ヒートマップ」、語の登場数を示す「タ
グクラウド」、「マップ」や「タイムライン」のほか、テキストの関係をネットワ
ークで示す「グラフ」等がある。この第4章の最後では、分析するテキストが単一か
複数か、あるいはコーパス分析かという3つの観点で大きく分けて、そこで使用され
るビジュアル化の様式ごとに、調査を行った論文が表の形で示されている。

 さて、第5章 Collaboration Experiencesでは、調査対象の論文で言及されていた、
人文学研究者とビジュアライゼーションの専門家との共同研究から得られた教訓が
取り上げられている。第6章 Visualization Solutions Used in the Digital
Humanitiesでは、第4章で紹介したビジュアル化技術について、その様式ではなく使
われているツール、そして今後役立つであろうビジュアル化の技術が紹介されてい
る。そして第7章 Future Challengesでは、ビジュアル化の専門家らが今後貢献しう
るDHの課題として、Close Reading向けの新技術の開発や、テキストに表れる地理空
間情報や時間情報の不確かさの克服、ユーザビリティ研究の必要性が挙げられてい
る。

 同論文は、最近10年間に発表されたDistant ReadingとClose Readingに関わる相
当数の論文に言及しており、これらの分野の先行研究の把握と整理に役立つもので
あると言えるだろう。欲を言えば、技術面だけでなく論文のテーマという観点から
の分類もあってほしいものだが、それは求めすぎというべきかもしれない。とはい
え、充実した内容であることは間違いないので、ぜひ一読をお勧めしたい。

[1]EuroVis2015. http://www.eurovis2015.it/, (accessed 2015-07-16).
[2]Ja:nicke, Stefan; Franzini, Greta; Cheema, Muhammad Faisal;
 Scheuermann, Gerik. On Close and Distant Reading in Digital Humanities:
 A Survey and Future Challenges. http://www.informatik.uni-leipzig.de/~stjaenicke/Survey.pdf
 ,(accessed 2015-07-16).
[3]Franco Moretti. Graphs, Maps, Trees: Abstract Models for Literary
 History. New York. 2005.

特殊文字については次のとおり表記しました。
ウムラウト:a:

Copyright(C)KIKUCHI, Nobuhiko 2013- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《連載》「Digital Japanese Studies寸見」第4回
 「研究におけるクラウドソーシング:
           Rice and population in Asia: Japan's rice 1883-1954」
 (岡田一祐:北海道大学大学院文学研究科専門研究員)

 2015年7月4日より、University College of London(UCL)のThe impact of
evolving of rice systems from China to Southeast Asiaプロジェクト[1](以
下UCLプロジェクト)では、奈良大学の協力のもと、MicroPastsのクラウドソーシン
グプラットフォームを利用して、日本の農林省(現農林水産省)の作成した稲作に
関する全国統計資料の電子化プロジェクト「Rice and Population in Asia:
Japan's rice〈アジアにおける稲作と人口:日本の稲作(1883-1954)〉」を開始し
た[2]。

 この電子化プロジェクトは、近代化以前の稲作のアジア一帯におけるひろまりを
分析することを目的としたものという。UCLプロジェクトは、植物考古学の専門家で
あるD. Fuller氏の指揮するもので、稲作の起源を探った前プロジェクト[3]に引
き続き、考古学的調査および近代的な統計資料の活用により、稲作、ひいては文明
の拡大を探るものであるようだ。それゆえ、日本文化の解明を直接目指したもので
はないが、稲作は日本文化を形作る重要な要素ともいわれるもので、その基本的な
データが整備されることじたい、日本文化と無関係なものではないだろう。この資
料の電子化にあたるまえは、東南アジアにおける稲作の統計資料の電子化にあたっ
ていて、本電子化プロジェクトはそれに続くものである[4][5][6]。なお、研
究の動機は[1]に語られているが、なぜ[1]に述べられない日本に関する資料が
取り上げられるのかは、[2]からはよく分らなかった。研究成果が公にされるとき
を待てということなのであろう。

 この資料は、農林省農林経済局統計調査部編『農林省累年統計表』の稲の部、お
よび同編『水陸稲収穫量累年統計表』に拠るようだ(くわしくは調べきれなかった)
。資料名は書いてはあるが、詳細は作業者には関係ないとのことで、詳細を省いた
ものであろうか。じっさい、入力の際も原資料にはあっただろう凡例さえ提供され
ていない。作業者には数字の転記以上の期待はしていないのが明確で、この電子化
プロジェクトの動機が明らかでないのと同様、ずいぶんと割り切ったものだと思っ
た。

 入力画面そして作業はいたってシンプルである。ひとりあたりにおよそ144の画像
が割り当てられるようだ。画面では統計表をスキャンして、拡大縮小ができるよう
になった画像が上部にあり、下部にそれを表に入力できるようになっている。表は
入力してゆくとどんどんとおおきくなっていき、大きさに関して心配する必要はな
い。ひとつの画像を入力しおえると、つぎの画像の入力に移るようになっていて、
順にこなしていくようになっている。稿者の見るかぎり、作業の一時保存や、過去
の作業の修正といったことには対応していないようである。作業はエクセル等手元
の表計算アプリケーションで行ってもよいが、そのときは貢献の名義が他者に移る
可能性があるというあおり文句があった。とはいえ、表はちいさいものではないの
で、一時保存ができないとなると、手元で入力したほうが安全ということになるの
ではないだろうか。

 このように作業に徹することを求められてはいるが、じっさいにタスクをひとつ
入力してみると、いくつかの問題を感じた。入力画面があまり親切なものではない
ということ、また、作業者に対する期待はそう割り切れたものでもないということ
が挙げられる。ひとつめに関しては、複数の集計方法の一致しない表を扱っている
ためではあろうが、入力画面には見出し行もなければ区切り線もなにもないので、
どこになにを入れればよいのかそこまで分明ではない。稿者の入れたものでは各項
目の単位が数値の区域に割り込んでいたが、それをそのまま入力したほうがいいの
か、しないほうがいいのか分らなかった。また、単純に行や列を見失って誤転記が
怖いということもいえる。またこれは単なるバグあるいは環境上の問題なのだろう
が、入力していくと、まだ下の行があるのにもかかわらず、入力画面の行を増やす
ことができなくなってしまった。このようなデータを送ってよいのかどうか分らな
いが、中断ができないのでそのまま送ってしまった。

 ふたつめに関して、日本人の作業者に対しては、表の見出しの入力や英訳につい
ても期待されているが、これは資料がどういうものか知らせない姿勢と相反するよ
うに思える。凡例を見ずに翻訳できる見出しなどそうそうないだろう。チュートリ
アルで例示はされるが直訳ではなく、そこまで責任は負いきれないと思ったし、そ
れをセルにどう入れてほしいかにまでは言及がなく、扱いに困ってしまった。また、
全体的に日本語の説明は訳が練られていないようだし、誤訳も散見し、あまり親切
ともいえない。

 その他、ログインをせずに作業をすると、貢献が記録されないむね警告があるが、
これは作業をこなせばいいことがあるということだろうか。以前のプロジェクトを
見ると、説明ページに貢献者の氏名があるが、これが作業者のことだとすると、そ
れくらい明記してくれともよいのにと思う。

 クラウドソーシングを利用したデータ整備というものは、今後とも増えてゆくも
のと思われる。日本語でも説明のある本電子化プロジェクトはそれがどのようなも
のであるのか、垣間見させてくれるものではないだろうか。あれこれと苦言はした
が、稿者のした苦言は些細なことがらに属する。むしろ、下請けにまわすとはこれ
くらい割り切るべきなのだということがありありと感じられ、そこからどう研究に
使えるデータを作っていくかに研究者のデジタル能力が問われるのであろう(研究
推進者本人が処理能力を持っている必要はないにせよ)。

 本電子化プロジェクトを擁するMicroPastsでは、UCLプロジェクト以外のクラウド
ソーシングプロジェクトも行われており[7]、そのなかには考古学遺物画像の切り
抜きなど、作業者に高い言語能力を求めないものも存する。本電子化プロジェクト
は、はからずも言語の壁を示すものではあったが、画像の簡単な特徴抽出や、統計
資料の電子化などはもっと積極的にひとびとの手を頼ってよいのかもしれない。ま
た、専門能力が求められる作業(たとえばよく言われるものとして古写本・古文書
の電子化など)についても、割り切ってさえしまえば、案外インターネット・コミ
ュニティの力を信じてよいのかもしれないと感じた。

 そのためには、作業するデータと貢献に対する発注者からの肯定的な反応が必要
であろうが。

[1] http://www.ucl.ac.uk/archaeology/research/directory/evolution-rice-fuller
[2] http://crowdsourced.micropasts.org/project/japanrice/
[3] http://dx.doi.org/10.5334/ai.1314
[4] http://crowdsourced.micropasts.org/project/ricepops1/
[5] http://crowdsourced.micropasts.org/project/ricepops2/
[6] http://crowdsourced.micropasts.org/project/ricepops3/
[7] http://crowdsourced.micropasts.org/

Copyright(C)OKADA, Kazuhiro 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 続きは【後編】をご覧ください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM048]【前編】 2015年07月29日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【 ISSN 】2189-1621
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: