ISSN 2189-1621

 

現在地

《巻頭言》「デジタルが変えるテクストと「読み」」

◇「デジタルが変えるテクストと「読み」」
 (田畑智司:大阪大学大学院)
 
1.Digital humanities
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
東京大学,大阪大学において2009年,2010年に行われた Digital Humanities
Workshop,そして去る 9月に開催された Osaka Symposium on Digital Humanities
2011,さらには立命館大学の GCOE「日本文化デジタルヒューマニティーズ拠点」
などの企画・プログラムを通して,少しずつではありますが,日本でも“digital
humanities”という用語が学界に浸透しつつあるようです。

Wikipediaには digital humanitiesについて次のような記述がなされています。

The digital humanities, also known as humanities computing, is a ?eld of
study, research, teaching, and invention concerned with the intersection
of computing and the disciplines of the humanities. It is methodological
by nature and interdisciplinary in scope.(Digital humanities,別名人文学
コンピューティング,とはコンピューティングと人文学諸領域との交錯に関する研
究,調査,教育,開発を行う学術分野である。それは本質的に方法論的であり,学
際的な領域である。和訳:筆者)

Digital humanitiesは広範な学術領域をカバーしているのに加え,各領域には異な
る学問の文化や伝統があるため,統一的な定義を与えるのは容易ではありません。
とはいえ,たいへん大雑把な定義をするならば,「コンピュータを有機的に組み合
わせたデジタル時代の人文学」だと言えるのではないでしょうか。Wikipediaの記
述にも見られるように,従来,この分野は humanities computingと称されていま
した。2000年代に入り,米国・カナダ・欧州に本拠を置くコンピュータを活用した
人文科学研究・教育の普及・推進に取り組む 3つの学協会が,ADHO(Alliance of
Digital Humanities Organizations)という傘組織を形成するのに歩調を合わせて,
当該学術コミュニティでは戦略的に‘digital humanities’という用語が使用され
るようになりました。

Humanities computingから digital humanitiesへの呼称の転換,文法的な言い方
をすれば‘head’(主要部)がcomputingからhumanitiesへ移ることで,「人文学」
にあらためてフォーカスが置かれたと言えます。これによって,デジタル時代の人
文学という認識が新たにされたのだとと筆者は解釈しています。

2.デジタルが変えるテクストと「読み」
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
では「デジタル」によって何が変わるのでしょうか。あるいは何が変わったので
しょうか?ここでは私が取り組んでいるテクスト分析の観点からその変化について
述べます。

先ず第一に挙げられることは,デジタル技術がもたらす「テクスト」と「読み」の
変革とでもいうべきものです。人文学と「テクスト」の「読み」とは不可分の関係
にあると言ってよいでしょう。デジタル時代以前のテクストの読みは,一般的には,
テクストの構成順序に沿って,テクストの起点から終点へ向けて順を追って進んで
いくものでした。典型的な例は小説など物語の読解です。たとえば,未読の小説を
読む際,読者は物語というテクストの冒頭から読み始めて,岩清水が渓谷を下り,
平野部を流れる河川となって海へ注ぐように,結末へ向かって読み進める。つまり,
テクストの進行に沿って読者の視線は語から語へ,句から句へ,ある文から次の文
へと移っていくリニア(linear)な読みを行います。

既読の小説をパラパラと断片的に再読する場合や,辞書を引く行為,研究論文や研
究書などの情報散文を読む場合などは,一見リニアな読みの例に当てはまらないよ
うに思えるかもしれません。確かに,情報散文の読者は,見出しや巻末のインデッ
クス,索引を頼りに,必要とする情報が含まれる特定の箇所のみを読み,他の箇所
には一瞥もしないことも少なくありません。しかし,局所的な読みを行う場合であっ
ても,読み手は,章,節,条,項,段落,文,節など規模は異なれど,一単位(ひ
とまとまり)のテクストの起点から終点へ向けて読み進みます。読みの単位はサイ
ズに関係なくテクストを構成する語・句・文のシークエンスであり,その読みは
「リニアな読み」なのです。

これに対し,デジタルテクノロジーは全く異質な読みをもたらしました。「ノンリ
ニア(non-linear)な読み」です。典型的な例はKWIC(KeyWord In Context)コン
コーダンスです。KWICコンコーダンスとは,検索対象の語(句)を行の中心に,数
十文字程度の前後の文脈を対象語の左右に配置して,検索対象の文書における対象
語の全用例を一覧表示するプログラムによる出力のことです。KWICコンコーダンサー
には,Mac OS X用のCasualConc,Windows用のAntConC,WordSmith Toolsなど特定の
OSプラットフォームでのみ動作するものから,ウェブブラウザ上で実行するウェブ
アプリケーションとして利用できるものまで様々なものがあります。

例えば,19世紀英国の文豪 Charles Dickensの作品全部を KWICコンコーダンサーに
読み込み,gentlemanという語を検索したとします。ほんの数秒で,4千数百行にの
ぼる用例が,出現する作品名と共に一挙に表示されます。さらに,多くのコンコー
ダンサーでは検索対象語に先行する語や後続の語を基準にソートすることが可能で
あり,これにより,例えば,Dickensが描くgentleman像がどのようなものであるか,
そしてgentlemanの語法・文体上の特徴的パターンなどを把握することが容易になり
ます。大規模なテクストデータから特定の条件に合致する箇所のみを抽出し,一覧
表示することで,テクストはコンコーダンス行に還元されます。分析者は行を横断
的に視線を走査させ,パターンを視覚的に捉えることができます。文字や語,句,
関連概念などをキーに(往々にして複数の)テクストを縦横無尽に移動する読みが
可能になります。分析者はテクストを (従来の意味での)テクストとして読むのでは
なく,テクストを文字・音節・語句などの形態素や,意味素,時には数字に還元し
てノンリニアに「読む」ことが可能になったのです。

3.デジタル時代のテクスト分析へ
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
このように,デジタル化されたテクストと印刷媒体のテクストの最大の違いは,
‘transformability’(形態可変性)に見い出せます。デジタルツールによってテ
クストの形態は自由自在に変更され,ノンリニアな読みを可能にします。それはま
た,極めて多数の項目を同時に処理すること(multivariate processing)にも繋が
ります。元の文字列が時には数値行列に還元され,統計学的視覚化技術を援用する
ことで,ページの上の文字列からだけでは到底読み取れない情報が姿を表すことも
あるのです。デジタル化されたテクストのもう一つの利点は,分析者の思惑に関係
なく現実を写し出す点でしょう。人間の目は往々にして,思い込みや偏見によって,
事実の一面しかとらえていません。都合の悪いデータというのは,(場合によって
は無意識のうちに見過ごされ)自分の目に入らないこともあるかもしれません。し
かし,デジタルテクスト(の解析結果)は,都合の悪い現実をも否応なく提示しま
す。時には自分の唱える仮説や理論の反例が容赦なく提示されるかもしれません。
結果として,ユーザーは仮説や理論の修正や棄却を余儀なくされれこともあるだろ
うと思います。

もっとも,デジタルツールは万能の道具ではありません。また,決して人間の分析
にとって代わるものでもありません。デジタルツールは,結局のところ,分析者の
コマンド(命令)通りの仕事しかしないわけです。換言すれば,分析の視点や手順
が誤っていれば,誤った結果しかもたらさないものです。ユーザーのコマンドに対
しては,非常に忠実ですが,不適切な分析命令に対しても,そのまま不適切な出力
を忠実に返します。デジタルツールを活用するしないにかかわらず,正しい分析を
行うには,基本的に対象とするテクストに対する十分な知識とsensitiveな読みに裏
打ちされた理解が不可欠です。さらに言えば,データ分析結果の解釈は常に分析者
の洞察力に依拠します。解析結果を適切に解釈するには,言語的知識はもちろん,
より広い社会文化的知識,そしてテクストの読みの経験を有機的に組み合わせるこ
と,いわば人文知の連係プレーが不可欠であることを繰り返し強調しておかねばな
りません。デジタル技術がどれほど進もうとも,分析者の洞察を伴わなければ,解
析結果から得られるものは何もないわけですから。

こうした点をふまえた上で,デジタルであることの長所,つまり新次元の「読み」
を最大に生かせるかどうかが,デジタル時代のテクスト分析研究の成否の分岐点に
なるのではないでしょうか。

執筆者プロフィール
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
田畑智司(たばた・ともじ)大阪大学大学院言語文化研究科准教授。IAUPE
(International Associtation of University Professors of English)、PALA
(Poetics and Linguistics Association、国際文体論学会)、英語コーパス学会、
近代英語協会、情報処理学会(人文科学とコンピュータ研究運営委員会)所属。
近代英語散文の文体研究を始め、Dickensの言語の文体統計論的研究等、デジタル
ヒューマニティーズに関する研究を進めている。

Copyright (C) TABATA, Tomoji 2011- All Rights Reserved.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

DHM 003

Tweet: