ISSN 2189-1621

 

現在地

DHM 149 【前編】

人文情報学月報/Digital Humanities Monthly


人文情報学月報第149号【前編】

Digital Humanities Monthly No. 149-1

ISSN 2189-1621 / 2011年08月27日創刊

2023年12月31日発行 発行数1105部

目次

【前編】

  • 《巻頭言》「情報でいただく
    片倉峻平東北大学史料館
  • 《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第66回
    生成 AI サービスの新展開:動画・スライド/ホームページ・歌曲の自動生成
    宮川創人間文化研究機構国立国語研究所研究系
  • 《連載》「仏教学のためのデジタルツール」第14回
    浄土宗発行の『浄土宗全書テキストデータベース』
    渡邉眞儀東京大学大学院人文社会系研究科博士課程単位取得退学

【後編】

  • 《特別寄稿》「CIDOC CRM を拡張したテクスト情報表現の試み:CRMtex
    小川潤ROIS-DS 人文学オープンデータ共同利用センター
  • 《特別寄稿》「Matthew James Driscoll と Elena Pierazzo による「1. Introduction: Old Wine in New Bottles?」(『Digital Scholarly Editing-Theories and Practices』所収)の要約と紹介
    塩井祥子早稲田大学大学院文学研究科
  • 人文情報学イベント関連カレンダー
  • イベントレポート「国際シンポジウム「デジタル・ヒューマニティーズと研究基盤」参加報告
    中川奈津子国立国語研究所
  • 編集後記

《巻頭言》「情報でいただく

片倉峻平東北大学史料館特任講師

この冬、生を受けてから30年以上お世話になった東京から、300km以上離れた宮城県に転居した。転居先で過ごす第一日目は、搬入直後でまだ充分に冷えていない冷蔵庫に食材があるわけでもなく、最寄りのめぼしい飲食店を探すことに苦心した。

いきなり話は大きく変わるが、私が研究課題に関する先行研究を探す際には、まずは論文を検索できるウェブサイトでキーワードの検索を行う。想定されるキーワードを様々に変えて試行錯誤して何とか情報を探し出そうと奮起する。検索結果にオープンアクセスの論文があれば、労することなく目を通すことができるため好都合だ。勿論ウェブサイトから辿れる情報だけで先行研究の探索が終わったなどと自負してはならず、関連する可能性のある書籍や論文誌を網羅的に紐解いてみるという作業も残っている。これは学部生の時に先生方から、「ゆめゆめ怠ることなかれ」と繰り返し忠告を頂いた課題である。場合によっては図書館の本棚をブラウジングしてみると、想定していなかった書籍や論文誌から重要な情報を手に入れられることもあるはずだ。

読者の皆様が先行研究を探す際にどのような探索方法をどのような手順で取るかは未知であるが、私は上述したような工程で進めることが多い。そして少なくとも私の接して来た同輩たちの中にもまずはウェブで情報を仕入れようとしていた人たちは散見される。この姿勢が褒められたものかどうかはさておき、現実的な話をしてしまうと、ウェブでの情報の検索というものはとても便利である。ウェブ上で情報が確認できる論文というのは雑誌上にのみ情報が存在する論文よりもアクセシビリティが高いため読まれやすいであろうという見解は、安易には否定できない。論文がオープンアクセスだからといって雑誌掲載論文と比較した際の引用数には大きな影響はないという研究結果もあるが[1]、目を通してもらえる可能性というのはやはり高いのではないだろうか。

話は戻って転居初日、荷解きに一息ついた瞬間に空腹であることに気付いた。もう14時である。さて何を食べよう、そこそこ寒いから湯気の立つ蕎麦で温まろうか、引っ越し作業でエネルギーが不足しているであろうから脂質豊富でカロリーの高い町中華にしようか、それとも思い出作りの贅沢ということで寒冷期でふっかふかのうなぎを楽しもうか。とにかく全くの新天地であるため、最寄りにどのような店があるかを調べることにした。まず頼りにしたのは Google Maps である。自宅近辺を表示させて「レストラン」と打ち込めば近隣の飲食店を地図上に表示してくれる。飲食店をタップするとユーザレビュー(クチコミ)を読むこともできる[2]。これで辺りにどのような店があるのかを雑駁に知ることができた。そしてそれぞれの店の大体の評価も。レビューで星がそこそこ付いていた店をいくつか候補にしたところで、今度はそれぞれの店の「食べログ」[3]情報を確認した。言わずと知れたレストラン検索サイトである。ここでもまたユーザによるレビューが、そしてメニューや料理の写真が多く確認できる。先に限定した店の中から、今度はこちらのレビューサイトでも一定の評価を得ている店を絞り込んだ。どちらの情報でも低くはない評価なのだからきっと美味しいのだろうと期待を膨らませる。そうしてあるラーメン屋を第一希望として選出し、その店の SNS を最後に調べてみる。店側が自信を持って提供する料理の写真、レビューサイトには載っていなかった季節限定メニュー、そして本日が定休日ではないことも全て確認できた。上々の首尾である。ここまで合理的な店の決め方が他にあるだろうか。肩肘張って家を出た。初めて歩く道すがら、東京よりも多少ひんやりする風を顔に受けながらも、これから充分に食欲を満たせるという期待からか、それとも最適な店を導けた自身の天晴れな手際の良さに酔いを覚えているからか、頬には体温を感じていた。

ふと香ばしい匂いがすることに気付いた。辺りを見てみると小さな大衆食堂があった。こんなところに大衆食堂があるなんて、Google Maps には載っていなかったはずだ。窓から軽く覗いてみると結構お客も入っている。そこそこ大きな焼き魚の定食を食べているが、あれはニシンだろうか。定番の味噌汁に漬物、煮物の入った小鉢…。何より、食べている当人がとても満足そうである。生唾を飲み込みながらもその場を去った。だってこの店はレビューサイトで確認していなかったのだから。暫く歩くと今度はイタリアンレストランを見つけた。確かここのパスタはそこまで高い評価を得ていなかったはずである。店頭に置かれているメニューをめくって見ると、なんと中々に魅力的なラインナップの数々である。それに値段も手頃。しまった、レビューサイトでの評価が芳しくなかったから詳しく調べていなかった。後ろ髪を引かれながらも目的のラーメン屋へ急いだ。ようやく到着したラーメン屋は、15時に差し掛かっていたせいか客がまばらでとても広く感じた。味噌ラーメンを頼んで早速スープをすすってみると、なるほど確かにとても美味しい。高評価なのも頷ける。美味に加えて空腹が追い風となっていたせいかあっという間に食べきってしまった。良かった、店選びは失敗しなかった。

慣れない帰り道で先程のイタリアンを横目にし、また暫くして大衆食堂を過ぎたところで少し考えてしまった。これらの店に入っていたらどんな体験が出来たのだろうか。思い返してみると、最初に店を探した際にはイタリアンは相対的なレビュー評価により選択肢から除外され、大衆食堂に至ってはそもそも存在の情報すら出てこなかった。しかし足を使ってみると店頭からの魅力的な情報を獲得することが出来たわけである。もし食事をしてみたら、結局はラーメン屋のほうが高い満足度であったという評価を私もするかもしれない。しかしともすると全く逆の評価になる可能性だってある。それは実際に体験してみないと分からないのである。レビューサイトの情報のお陰で美味しいラーメン屋を知ることができたのは事実であるが、一方でその情報のせいで足切りを食らってしまった店、いや私が勝手に撥ね退けてしまった店もあることに気付き、誰に対してというわけでもなく今度は無性に腹が立った。腹を鳴らした後に腹を立ててしまったのであるから、この日は腹に多くのご迷惑をお掛けしてしまっている。

レストランのレビューサイトが登場してから処々しばしば語られるテーマをこの場でも披露してしまい大変恐縮である。ただし、新天地でそれを実体験として確認することができ、また「自身の足よりも、手に取りやすい情報を優先して何かを選択する」というこの構図はもはや自身の日常に当たり前のように入り込んでしまっていると改めて実感して、思いのままにタイピングしてしまった。せっかくなのでもう一つ類似したお話を。これは最近婚活に勤しんでいる友人から居酒屋で聞いた話であるのだが、彼が登録している結婚相談所では理想のパートナーの条件を伝えると、年齢・年収・学歴・家族構成など様々な条件から絞り込みを行い候補となる人物を予め選んでくれるそうである。相手にも自身の情報を伝えて納得を得られると、そこで初めて双方対面することになるとのこと。互いに情報を確認して共に了承したということは、情報の上ではとても合理的な選択が出来たということである。さて実際にこの合理的に選択した相手と対面して話をしてみると…。

[1] Isabel Basson & Jaco P. Blanckenberg & Heidi Prozesky.(2021). Do open access journal articles experience a citation advantage? Results and methodological reflections of an application of multiple measures to an analysis by WoS subject areas. Scientometrics, 126: 459–484. https://doi.org/10.1007/s11192-020-03734-9.

執筆者プロフィール

片倉峻平(かたくら・しゅんぺい)。東京大学大学院在学中に DH に触れ、東京国立博物館、東京文化財研究所を経て、2023年12月より現職。専門は上古中国語。古漢字のテキストデータ化、古漢字資料のデジタルアーカイブ化に関心を持つ。
Copyright(C) KATAKURA, Shumpei 2023– All Rights Reserved.

《連載》「欧州・中東デジタル・ヒューマニティーズ動向」第66回

生成 AI サービスの新展開:動画・スライド/ホームページ・歌曲の自動生成

宮川創人間文化研究機構国立国語研究所研究系

近年、人工知能(AI)の進化は目覚ましく、特にコンテンツ生成の分野では画期的な技術が次々と登場している。この記事では、動画、音楽、スライド、ホームページ生成に関する最新の AI 技術ツールのうち、筆者が使用している3つのツールを紹介する。もちろん、使用条件の遵守、著作権・知的財産権の尊重、そして、訓練データと類似していないかなどのチェックなど、その使用には本稿の最後に述べるように細心の注意を要する。しかしながら、これらを正しく活用すれば、博物館や美術館などの展示品の解説動画やプロモーション動画、様々な教育動画などのコンテンツを迅速かつ効果的に作れるように思われる。

動画生成:HeyGen

動画生成の AI 技術は、リアルタイムの映像合成からアニメーション作成まで多岐にわたる。こうした技術は、手間と時間を大幅に削減しつつ、手軽にビジュアルコンテンツを生み出すことが可能になっている。動画生成AIに関しては、プロンプトから映画のような動画を作成できる Runway の Gen-2[1]など様々なものがすでに利用可能である。それに対して、読み上げる文章の方はユーザが用意しなければならないが、読み上げ音声を生成し、動画に映る紹介者のリップシンキングや手振りを自動生成する、紹介動画・教育動画専門の生成 AI が存在する。主なものは HeyGen[2]や Synthesia[3]などがあるが、本稿では、HeyGen を紹介する。

HeyGen は、AI を活用して簡単に高品質な動画を作成できるウェブベースのプラットフォームである。まず、HeyGen は40種類以上の言語で動画作成が可能である。さらに、年齢、声色を調整できるフィルターがあり、動画のコンセプトに合わせた音声を選択できる。もちろん英語が最も声の選択肢が多いものの、日本語も4種類ほど選択肢がある。また、話すスピードや、声のピッチの高さも変えることができる。実際のモデルを用いた多数あるアバターから1つを選択し、そのアバターに読ませる文を入力し、背景や文字などを加えていけば、あたかも、そのアバターがセリフを実際に読み上げているかのようなリアルな解説・紹介動画を作ることができる。さらに、 自分の声を録音し、音声クローンを作成することや、自身の顔写真を使ったアバターの作成など、様々なカスタマイズが可能である。図1は、筆者が HeyGen を用いて作成した動画の一部である。

図1:筆者が、神戸学院大学グローバル・コミュニケーション学部 学術シンポジウム「デジタルトランスフォーメーション(DX)と言語教育の行方」[4]で例示した筆者の発表のまとめ動画(視聴リンク:https://www.youtube.com/watch?v=MGY3FdoA9Ec

スライド/ホームページ生成: Gamma

Gamma[5]はプレゼンテーションスライドを自動生成する AI である。ユーザが入力した内容に基づいて、効果的なレイアウトやデザインを提案し、プロフェッショナルなプレゼンテーション資料を短時間で作成することが可能である。まず、タイトルをインプットし、そこから AI がプレゼンの内容をリスト形式で提示する。ここで、プレゼンの概要を修正したり、さらに細かく指定することも可能である。その後、デザインを、いくつかの既存のものから選ぶ。その後、スライドが生成される。スライドは、挿絵やグラフなど画像や、ダイアグラムつきで非常に見やすいものが作成される。生成されたものは、もちろん修正可能であり、ここで事実関係や、生成 AI 特有のハルシネーション(誤った情報をあたかも真実であるように提示すること)を修正することができる。図2は、編集画面の一例であり、非常に直感的に編集することが可能である。スライド自体はウェブページとなっており、簡単にオンラインで公開することができる。また、スライドだけでなく、商品など何かを説明・紹介するようなスライド型のホームページを作ることもできる。こちらはスライドとも多少類似しているものの、よりホームページ的なレイアウトになっている。以下は、『人文情報学月報』の「欧州・中東デジタル・ヒューマニティーズ動向」のスライドを自動生成したものである。本アプリの性能を見るため、あえてハルシネーションなどの修正は行っていない。また、共同でスライドやホームページを作成し、コメントなどを付与する機能もついている。

図2:Gamma で自動生成したスライドの編集画面(閲覧リンク:https://gamma.app/docs/-rbxnb47pll2moea

歌曲生成:Suno AI

今月から、X(旧 Twitter)で[6]話題となっている生成 AI の一つに Suno AI[7]がある。これは音楽生成の AI の一種であり、ユーザが入力したテキストから音楽を生成する。Mubert[8]など、音楽を生成する AI は複数存在しているが、この Suno AI は、人間の歌を含む、比較的クオリティの高い歌曲を作成することが可能である。ユーザは、曲の歌詞を入力し、それを歌わせることができる。さらに、曲のジャンルも指定することができ、筆者は、フォークメタル、トランス、ヘヴィーメタルなどである程度の品質の曲を生成することに成功している。歌詞の内容は、ありきたりなものではなく、エジプト神話に関するものや言語学の専門用語に関するものなど、通常は歌曲にならないような歌詞を入れて筆者は音楽を生成しているが、それでも、良い結果が得られている。生成される曲の曲調は、どうも歌詞の内容にある程度影響されるようである。通常一回の生成では1分程度の曲が作成されるが、そこから追加生成して、複数の歌曲の断片を繋げ、1つの曲に統合させる操作もアプリ上で可能である。日本語やドイツ語など、英語以外の歌詞も可能である。日本語の場合、漢字の発音が誤っている場合が多いため、ひらがなで歌詞を書いた方が確実である。筆者は、『人文情報学月報』「欧州・中東デジタル・ヒューマニティーズ動向」の歌を、ChatGPT による作詞、Suno AI による作曲で作成した。こちらのアドレス(https://app.suno.ai/song/62efbd97-4131-4634-929b-c01d3d125a8b)からその自動生成された曲「デジタルの風に乗せて」を聴くことができる。

生成 AI 使用の際の注意点

今回、紹介した音楽・動画・スライド作成生成 AI 以外にも、様々な AI が登場している。例えば、画像生成 AI は様々な優れたサービスが複数提供されてきている。ChatGPT にも組み込まれた OpenAI の DALL-E 3[9]、幻想的な絵やアニメ風の絵など特定のタッチでの生成が得意で、GUI とプロンプトで生成画像の部分的な修正も可能な Midjourney[10]、Adobe がもつサンプル画像で訓練され、Adobe Photoshop や Illustrator などの Adobe ソフトウェアと連携し様々な活用ができる Adobe Firefly[11]、ブラウザである Microsoft Edge のサイドバーから簡単に画像を作れる Microsoft Designer の Image Creator[12]、高品質な画像生成 AI として2022年前半に話題となった Stable Diffusion[13]など様々ある。

ChatGPT や画像生成 AI でよく話題となっているように、今回紹介したような他の AI でも生成 AI を使用する際は、著作権と知的財産権の尊重が必要である。もちろん、AI による生成物が他者の作品に基づいている場合には、適切な許可やライセンスの取得が求められる。しかし、ユーザが気づかない範囲でそのような生成 AI による模倣は起こりうる。また、AI 生成コンテンツは現実と見分けがつかないほどリアルなことが多い。その出所を明確にし、誤解を招くような使用を避ける必要がある。さらに、画像や動画生成などでは、個人情報とプライバシーの保護も重要であり、個人の特徴を無断で使用しないよう注意が必要である。これらの理由で、生成 AI を使用した場合は、その使用を明確に表示する必要がある。同時に、特にスライドなどテキストを含む AI の場合は、ハルシネーションに注意が必要である。他にも、意図せず、公序良俗に反する内容になっていないかなど、倫理的なチェックも必要である。このように、生成 AI を実際に使用する際は、様々な問題や注意点があり、それぞれの分野での遵守すべきガイドラインの作成が急務である。

[1] “Gen-2 by Runway,” Runway, accessed December 19, 2023, https://research.runwayml.com/gen2.
[2] “HeyGen - AI Spokesperson Video Creator,” HeyGen, accessed December 19, 2023, https://app.heygen.com/home.
[3] “Synthesia - #1 AI Video Generator,” Synthesia, accessed December 19, 2023, https://www.synthesia.io/.
[4] 「グローバル・コミュニケーション学部 学術シンポジウム「デジタルトランスフォーメーション(DX)と言語教育の行方」」神戸学院大学、2023年12月19日閲覧、https://www.kobegakuin.ac.jp/events/afee35ba75bb507774e0.html
[5] Gamma App: Generate AI Presentations, Webpages & Docs, Gamma, accessed December 19, 2023, https://gamma.app/.
[6] “Home,” X, accessed December 19, 2023, https://twitter.com/.
[7] “Suno AI,” Suno AI, accessed December 19, 2023, https://www.suno.ai/.
[8] “Mubert - Thousands of Staff-Picked Royalty-Free Music Tracks for Streaming, Videos, Podcasts, Commercial Use and Online Content,” accessed December 19, 2023, https://mubert.com/.
[9] “DALL·E 3,” Open AI, accessed December 19, 2023, https://openai.com/dall-e-3.
[10] “Midjourney,” Midjourney, accessed December 19, 2023, https://www.midjourney.com/explore.
[11] “Adobe Firefly,” Adobe, accessed December 19, 2023, https://www.adobe.com/jp/products/firefly.html.
[12] “Image Creator from Microsoft Designer,” Bing, accessed December 19, 2023, https://www.bing.com/images/create.
[13] “Stable Diffusion,” Stability AI Japan, accessed December 19, 2023, https://ja.stability.ai/stable-diffusion.
Copyright(C) MIYAGAWA, So 2023– All Rights Reserved.

《連載》「仏教学のためのデジタルツール」第14回

仏教学は世界的に広く研究されており各地に研究拠点がありそれぞれに様々なデジタル研究プロジェクトを展開しています。本連載では、そのようななかでも、実際に研究や教育に役立てられるツールに焦点をあて、それをどのように役立てているか、若手を含む様々な立場の研究者に現場から報告していただきます。仏教学には縁が薄い読者の皆様におかれましても、デジタルツールの多様性やその有用性の在り方といった観点からご高覧いただけますと幸いです。

浄土宗発行の『浄土宗全書テキストデータベース』

渡邉眞儀東京大学大学院人文社会系研究科博士課程単位取得退学

今回紹介する「浄土宗全書テキストデータベース(浄全データベース)」(http://jodoshuzensho.jp/jozensearch_post/)は、浄土宗総合研究所が開発し、浄土宗がインターネット上で公開しているデータベースである。これは浄土宗の基本典籍を網羅した『浄土宗全書』20巻までと『続浄土宗全書』の全19巻を収録し、テキスト検索機能と画像閲覧機能を備えている。

データベースの詳細について説明する前に、『浄土宗全書』および『続浄土宗全書』の基本的な情報についてお伝えしたい。まず『浄土宗全書』(正篇)は法然700年遠忌記念事業として1906年に刊行計画が発表されたものである[1]。明治から大正にかけて刊行された初版、昭和前期に刊行された再版、戦後に山喜房佛書林より刊行された第3版(山喜房版)の3つの版がある。初版は全20巻で、1907年から1914年にかけて出版された。その付録小冊子である「附言」には底本の種類と所蔵者、凡例や編集後記などが掲載されている。再版では初版の全20巻に加えて第21巻として解題、第22巻として索引、別巻として梵蔵和英合璧浄土三部経が追加され、1928年から1936年にかけて大東出版社より出版された。第3版は浄土宗開宗800年記念として再版の全23巻を復刻したもので、巻末に解題と浄全月報が付され1970年から1972年にかけて山喜房から出版されている。浄全データベースの正篇についてはこのうちの山喜房版を底本としているが、収録されているのは第20巻までであり巻末の解題および浄全月報も含まれていない。

『続浄土宗全書』(続篇)は正篇の初版刊行後の1915年から1928年にかけて、正篇に収録されなかった浄土宗典籍を採録し、それを補完する目的で刊行された[2]。続篇の編集ならびに刊行作業は『大日本仏教全書』と平行して行われており、後者の編纂過程で新たに発見された未刊行の浄土教典籍が多く収録された。また初版付録の「宗書保存会会報」には収録された典籍の解題が収録されている。その後、続篇も正篇と同様に、1940年から1942年にかけて再版の出版が企画されたが、戦況の悪化に伴いこの企画は途中で休止してしまった。その後1972年から1974年にかけて、山喜房から改めて復刻版(山喜房版)が刊行された。続篇の山喜房版も正篇と同じように、巻末に解題と浄全月報が付されている。また続篇の山喜房版は初版の写真複製であるので各巻のテキスト内容は同一であるが、巻の配列のみ入れ替え整理が行われている。浄全データベースは続篇についても山喜房版を底本としているが、やはり巻末の解題および浄全月報は含まれていない。

浄全テキストデータベースに先駆けて開発されたデータベースとして、浄土宗教学院による浄土宗全書検索システム(現、浄土宗全書・法然上人伝全集検索システム)がある。これは『浄土宗全書』の正篇第20巻までを収録したものである。浄全データベースに収録されているデータのうちで、正篇の電子テキストデータと各ページ画像については、浄土宗全書検索システムから提供されたものである。したがって浄全データベースは、内容的には浄土宗全書検索システムの収録分に正篇の第21巻から第23巻と続篇を付け加えて拡充したものと言える。

次に浄全データベースの機能について解説する。その核となるのはやはり検索機能である。検索に際しては SAT などと同様に、文献を指定せずデータベース内すべてのテキストから検索する方法と、特定の文献内のみを検索する方法の2種類がある。検索結果には巻と頁段行、版面の画像データへのリンク、書名、著者名、本文の検索箇所が表示される。また巻と頁段行には、本文の検索箇所が含まれる頁へのリンクがある。特に SAT と異なり著者名が表示される点は、検索結果からさらに必要なものをピックアップしようとする時には便利である。版面画像には検索画面のほかに、本文の各頁からも飛ぶことができる。さらに浄全データベースならではの機能として、『新纂浄土宗大辞典』との連携検索機能がある。これは浄全データベース内で範囲選択した語句を、別途公開されているWeb版『新纂浄土宗大辞典』(http://jodoshuzensho.jp/daijiten/index.php/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%9A%E3%83%BC%E3%82%B8)で検索することができるという機能である。これによって浄土教文献独特の難解な語彙についても、手軽にその意味を知ることができる。

以上のように、浄全データベースは SAT などと同じ感覚で利用しやすいインターフェースを備えつつ、40巻近くに及ぶ浄土宗関連の膨大なテキストを網羅しており、浄土宗についての研究者はもちろんのこと、広く浄土教に関心のあるすべての方にとって極めて有益なものであると言える。

Copyright(C) WATANABE, Masayoshi 2023– All Rights Reserved.


Tweet: