ISSN 2189-1621

 

現在地

DHM 069 【前編】

2011-08-27創刊                       ISSN 2189-1621

人文情報学月報
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄Digital Humanities Monthly

             2017-04-30発行 No.069 第69号【前編】 661部発行

_____________________________________
 ◇ 目次 ◇
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

【前編】

◇《巻頭言》「人文学における市民参加と人文情報学」
 (橋本雄太:国立歴史民俗博物館)

◇《連載》「Digital Japanese Studies寸見」第25回
「Adobe・Google、中日韓対応の明朝体フォントを公開」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

【後編】

◇人文情報学イベントカレンダー

◇イベントレポート
「デジタルアーカイブ学会設立総会に参加して気がついたこと・期待すること」
 (永崎研宣:人文情報学研究所)

◇編集後記

◇奥付

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
【人文情報学/Digital Humanitiesに関する様々な話題をお届けします。】
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《巻頭言》「人文学における市民参加と人文情報学」
 (橋本雄太:国立歴史民俗博物館)

 学術研究の手法として、「クラウドソーシング」や「オープンサイエンス」など、
集合知や市民参加の仕組みを活用したアプローチについて耳にする機会が多くなっ
た。ポータルサイトのZooniverse[1]では、銀河の形状を分類するGalaxy Zoo[2]
をはじめとして、数十の市民参加型プロジェクトがホスティングされており、これ
までに100本以上の論文の発表に繋がっているという。筆者の近辺では、京都大学に
所属する理学系研究者が中心となって「オープンサイエンスミートアップ」[3]と
いうグループを運営しており、先日会合にお邪魔する機会があった。この会合では、
移入種のナメクジの生息域を調査する「ナメクジ捜査網」プロジェクト[4]や、雷
雲から放出されるガンマ線を検出するThundercloud Project[5]などをご紹介頂き、
人文学出身の筆者にとっても大変興味深かった。

 人文情報学分野でも、市民参加の手法はさかんに活用されており、こちらは「ク
ラウドソーシング」と呼ばれることが多い。University College Londonが運営する
Transcribe Bentham[6]は、哲学者J. ベンサムの6万枚に及ぶ手稿を、オンライン
で参加するボランティアの手により全文翻刻することを目的としたプロジェクトで
ある。上述のZooniverse上でも、シェイクスピアとの同時代人の人々の手稿を翻刻
するShakespeare's World[7]や、第一次世界大戦の兵士の従軍日記を分類・タグ
付けするOperation War Diary[8]といったプロジェクトが運営されている。

 「クラウドソーシング」という用語は、雑誌『WIRED』の編集者Jeff Howeの造語
であるが、もともとは企業のアウトソーシングの一形態を指すために使われた用語
である。学術研究における市民参加型プロジェクトを「クラウドソーシング」とし
てひとまとめに扱うことには、筆者はやや抵抗がある。天体観測や動植物の生態調
査など、インターネット出現以前から市民との協働を進めてきた自然科学分野には、
「市民科学」(citizen science)という言葉がある。人文情報学分野でも、これに
倣って、citizen humanitiesという呼称を使用してはどうだろうか。市民概念は古
代ギリシャ以来の人文学における重要テーマでもあり、この呼称の方が、伝統的人
文学との関わりを議論する上でも相応しいように思われる。

 手前味噌で恐縮なのだが、筆者自身の取り組みについても少しだけ紹介させて頂
きたい。今年(2017年)1月に、災害史料の市民参加型翻刻プロジェクトである「み
んなで翻刻」[9]を公開した。本メルマガにおいても岡田一祐氏の連載上ですでに
ご紹介頂いているが、これは、江戸時代以前の地震をはじめとする災害記録を、市
民の手で翻刻することを目的としたWebベースのプロジェクトである。先述したよう
に、欧米では歴史資料を対象にした市民参加型プロジェクトがすでに多数実施され
ている。しかし日本の場合、明治期におこなわれた書記体系の変革のために、江戸
時代以前の文字が一般人にはほとんど読めなくなっているという困った事情がある。
そこで「みんなで翻刻」では、参加者の「学習」を前面に押し出すことで、参加者
の増加と翻刻文の精度向上をはかった。具体的には、くずし字解読の学習支援アプ
リ「KuLA」[10]を内部に組み込むとともに、参加者間で相互に翻刻文を添削する
協調的学習の仕組みを取り入れた。

 幸いなことに、これまでプロジェクトは順調に進捗しており、公開から105日目が
経過した現時点で、3193枚ある史料画像の89%の翻刻が完了している。参加者により
入力された文字の合計は180万字に達した。筆者が所属する京都大学古地震研究会は、
2011年から歴史地震史料を解読する活動を続けているが、現在までに翻刻できたテ
キストは15万字程度である。その約12倍の量のテキストが、4ヶ月に満たない期間で
入力されたことは、筆者を含む研究会メンバーにとって大きな驚きであった。もっ
とも、専門研究者が複数で検討した翻刻文と比較すれば、正確性の面では問題が多
い。今後は、専門家の介在のもと、「みんなで翻刻」上で入力されたデータを校訂
し、研究資料として活用に繋げる仕組みを構築することが課題である。

 参加者を対象に実施したアンケートの結果によると、翻刻作業の中核を担ったの
は、学生時代に日本史や日本文学を専攻していたOBや、カルチャーセンターや市民
サークルで古文書解読を学習している非研究者の方々であった。「みんなで翻刻」
を運営していて強く実感したことは、このような在野の人々の能力の高さと、史料
解読に向ける情熱の強さである。参加者の中には、公開から3ヶ月の間に、21万字
(!)を翻刻した人もいる。こうした人々の存在は、なかなかアカデミア内部から
は見えにくい。しかし人文情報学は、ネットワーク技術を駆使して、地域や所属に
関わらず人々を結びつけることができるという強みを有している。市民の人文学研
究への参加を実現する上で、人文情報学は今後も主導的な役割を果たすことになる
だろう。

 この4月から、筆者は国立歴史民族博物館で勤務しているが、博物館は市民と直接
交流する機会の多いpublic-facingな機関である。欧米の市民参加型プロジェクトも、
博物館や図書館、美術館などpublic-facingな機関が主催したものが多い。今後は、
Webだけで完結するのではなく、物理的装置としての博物館も巻き込みつつ、市民と
歴史研究者の協働を可能にする仕組みのあり方を探っていきたい。

[1]Zooniverse https://www.zooniverse.org/
[2]Galaxy Zoo https://www.galaxyzoo.org/
[3]オープンサイエンスミートアップ http://kyoto-open.science/
[4]ナメクジ捜査網 https://sites.google.com/site/udakawebsite/madarakouranamekuji-limax-max...
[5]Thundercloud Project https://thdr.info/
[6]Transcribe Bentham http://blogs.ucl.ac.uk/transcribe-bentham/
[7]Shakespeare's World https://www.shakespearesworld.org/
[8]Operation War Diary https://www.operationwardiary.org/
[9]みんなで翻刻 https://honkoku.org
[10]くずし字学習支援アプリKuLA
https://play.google.com/store/apps/details?id=yuta.hashimoto.kula (Android)、
https://itunes.apple.com/jp/app/id1076911000 (iOS)

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
橋本雄太(はしもと・ゆうた)専門は歴史情報学、近代西洋科学史。京都大学大学
院文学研究科博士後期課程中退。2017年4月より国立歴史民俗博物館助教。「歴史史
料研究における市民参加と学習」をテーマに「くずし字学習支援アプリKuLA」、
「みんなで翻刻」などのソフトウェアやWebサービスを開発・公開している。

Copyright(C) HASHIMOTO, Yuta 2017 All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇《連載》「Digital Japanese Studies寸見」第25回
「Adobe・Google、中日韓対応の明朝体フォントを公開」
 (岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)

 2017年4月3日、GoogleとAdobeは、中日韓対応の明朝体フォントを公開した[1]
[2]。これは、Google・Adobeが2014年にリリースしたゴシック体フォントに続く
もので[3]、Googleの取り組む「フォントの不足で表示できない文字をなくそう」
というGoogle Noto Fontsというオープンソースフォント開発プロジェクトの一環で
開発されたものである[4]。Google、Adobeの両者からべつべつに公開されており、
GoogleからはNoto Serif CJK、AdobeからはSource Han Serif(日本語名:源ノ明朝、
中国語名:思源宋體、朝鮮語(文化観光部2000年式)名:Bon myeongjo)という名
称である。以下、便宜上Noto Serif CJKで統一する。

 どうしてもあたらしい「無料」の日本語フォントという目線で見がちであるが、
このリリースじたいはそれより広い意味合いを持つ。Google Notoの“Noto”とは、
NO more TOfu、すなわちテキストを表示した際、適切な文字を持つフォントがない
場合に出てくるトウフマーク(□)をなくすことを意味する[5]。Googleの開発す
るAndroidやChrome OS等で使用しているDroidフォントの拡張という実際的な意味も
あるようである[4]。Googleでは、そのために各地のフォント制作会社や文字の専
門家と連携して、一貫したスタイルでフォントを展開しており、1980年代になって
作られたアフリカのアドラム文字(フラ文字)については、製作者と連携してフォ
ントがデザインされたという[6]。CJK版もその一部として開発されたものである。
Google Notoは2016年10月の時点で、800の言語に対応し、11万もの文字を有する一
大フォントとなっている[4][7]。

 Noto Serif CJKは、Noto Sans CJKと同様、GoogleとAdobeの主導のもと、中国の
常州華文・日本のイワタ・韓国のSandollが協力して開発された。[2]の映像で、
Adobe Japanのチーフ・タイプデザイナーの西塚氏が語るように、このフォントは、
液晶画面等で鮮明に文章を表示することを予定しつつ、印刷物などにも用いられる
ような高品位のデザインを目指したものであるという。数万もの文字に対応するた
めに、漢字のデザインには,Adobeの小塚明朝のストロークシステムを活用したとの
ことである。個人的な印象を語れば、写研の本蘭明朝や大日本スクリーン製造のヒ
ラギノ明朝体W2を思い出させるモダンですっきりとした、しかし、フォントワーク
スの筑紫明朝のごとき筆画の動きへのこだわりも見せる書体に仕上がっている[8]。

 Noto Sans CJKとおなじく、このフォントで注目すべきは、中国語の繁体字・簡体
字、日本語の漢字、朝鮮語の漢字という、ひとことで「同文」といっても細部にお
いて異なりを持つ四つの変種に対して、デザイン的な一貫性を保ちながら、その異
なりを極力保存したことにある。これがローマン・アルファベットであれば、ロマ
ンス語圏向けの文字、ゲルマン語圏向けの文字に分かれるようなもので、そのよう
な事態はあまり考えにくいが、いわゆる漢字文化圏を覆おうとするとなると、その
ようなことが問題になる([2]では、その四種類がすべて異なる「曜」の例が挙げ
られている)。このような事態を解決したものは、そうそうあるものではない。台
湾のフォントメーカーであるダイナフォントや、大日本スクリーン製造のヒラギノ
角ゴシックが中日でデザインを一貫させたものを出しているが、もちろん有償であ
るほか、フォントの種類や用途が限られているうえ、そこまで大々的に展開されて
いるわけでもない。Microsoft Windowsにせよ、Mac OS Xにせよ、一貫してデザイン
された標準フォントというものは存在しないことを思えば、Google Noto Fontsの壮
大さは明らかである。

 それに対して、本フォントはたんに無償であるだけではなく、オープンソースラ
イセンスで公開されているので、必要に応じて改変することもできる。本フォント
で採用されているのは、オープンソースフォント向けのSIL Open Font License 1.1
であり、フォントの名称を変え、ほかの配布物の一部とすればどんな再利用もでき
るというものである。また、フォントが自由に使えるということにより、これらの
地域に向けたサービスを展開していくうえで、大きな味方となるだろう。近時はウ
ェブフォントとして、インストールせずにインターネットを通じてその都度フォン
トを供給することが一般化しつつあり、Google Noto Fontsでもそれが配慮されてい
る。日本研究は、もとより日本だけに留まるものではなく、多言語展開は欠かすべ
からざるものである。これまでは、フォントの準備がかならずしも容易ではなかっ
たが、Noto Serif CJKの登場により、それがさらに容易になったものと思われる。

 現状のNoto Sans / Serif CJKは、古典籍の表現に必要な文字をかならずしも有
するわけではなく(収録文字数は[9]に詳しい)、その点でまだまだ不足はあるか
もしれないが、オープンソースの利点を活かして、必要な文字のみを自家製するこ
ともできよう。さらなる展開が期待される。

[1] https://github.com/googlei18n/noto-cjk/blob/master/NEWS
[2]源ノ明朝 https://source.typekit.com/source-han-serif/jp/
[3]Google Developers Blog: Noto: A CJK Font That is Complete, Beautiful
 and Right for Your Language and Region
https://developers.googleblog.com/2014/07/noto-cjk-font-that-is-complete...
 Adobe版はSource Han Sans(源ノ角ゴシック)として出ている。この名前は、
 Noto Sans CJKがGoogleとMonotypeの協同によるNoto Sansではなく、Adobeの
 Source Sansから来ていることに由来する。ちなみに、源とはSourceの訳であって、
 ゲンと読むとのことである。Noto Serif CJKについても、同様に、Noto Serifで
 はなく、このためにあらたに開発されたSource Serifが用いられている。
[4]Google Developers Blog: An open source font system for everyone
https://developers.googleblog.com/2016/10/an-open-source-font-system-for...
[5]このトウフマークとは、技術的には、フォントの.notdefグリフの標準的なデ
 ザインのことである: cf. https://www.microsoft.com/typography/OTSPEC/recom.htm
 .notdefグリフは、当該フォントに登録されていない文字を表示させようとしたと
 きに代わりに出力されるグリフである。
[6]More than 800 languages in a single typeface: creating Noto for
 Google | Monotype http://www.monotype.com/resources/case-studies/more-than-800-languages-i...
[7]くわしいリストは管見に入らなかったが、有志がまとめたものがウィキペディ
 ア英語版に掲載されている。Noto fonts - Wikipedia https://en.wikipedia.org/wiki/Noto_fonts
[8]デザインや開発過程については、Noto Sans CJKに関するものも参考になるだ
 ろう。たとえば、
 第3回タイプデザインコンペティション特別セミナー&表彰式レポート: タイプデ
 ザイナーの視点(前半)「Pan CJKフォントの誕生」 ● type.center http://type.center/articles/2465
 ASCII.jp:「源ノ角ゴシック」を実現させたアドビ西塚氏の勘と感覚 (1/5)
http://ascii.jp/elem/000/000/917/917366/
[9]Source Han Serif / Noto Serif CJK History & Development
https://blogs.adobe.com/CCJKType/2017/04/source-han-serif-history-develo...

Copyright(C)OKADA, Kazuhiro 2015- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 続きは【後編】をご覧ください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 配信の解除・送信先の変更は、
    http://www.mag2.com/m/0001316391.html
                        からどうぞ。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◆人文情報学月報編集室では、国内外を問わず各分野からの情報提供をお待ちして
います。
情報提供は人文情報学編集グループまで...
       DigitalHumanitiesMonthly[&]googlegroups.com
                  [&]を@に置き換えてください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
人文情報学月報 [DHM069]【前編】 2017年04月30日(月刊)
【発行者】"人文情報学月報"編集室
【編集者】人文情報学研究所&ACADEMIC RESOURCE GUIDE(ARG)
【 ISSN 】2189-1621
【E-mail】DigitalHumanitiesMonthly[&]googlegroups.com
                 [&]を@に置き換えてください。
【サイト】 http://www.dhii.jp/

Copyright (C) "人文情報学月報" 編集室 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

Tweet: