- コメントを投稿するにはログインしてください
以下、とりあえずとってきて色々いじることができそうで、人文学研究に役立ちそうなデータをリストします。(by 永崎研宣)
日本編
近代語のコーパス(国立国語研究所)
http://www.ninjal.ac.jp/corpus_center/cmj/
コーパス開発センター(国立国語研究所)-近代文語Unidic、中古Unidic等もあり
http://www.ninjal.ac.jp/corpus_center/
参考: オープンソースの日本語形態素解析エンジンMecab https://code.google.com/p/mecab/
オックスフォード上代日本語コーパス
http://vsarpj.orinst.ox.ac.uk/corpus/
日本語テキストイニシアチブ
http://jti.lib.virginia.edu/japanese/index.euc.html
近代デジタルライブラリー/ 国立国会図書館デジタルコレクション
http://kindai.ndl.go.jp/
http://dl.ndl.go.jp/
翻デジ http://lab.kn.ndl.go.jp/dhii/omk2/
日本語Wordnet
http://nlpwww.nict.go.jp/wn-ja/
East Asian Readings Indexes
http://www.buddhism-dict.net/ddb/indexes/ea-read-chooser.html
頁の一番下に、少し古いが、電子仏教辞典の見出し語・英訳・ピンイン表記などのリスト(allindex.zip)へのリンクあり
http://buddhism-dict.net/ddb/allindex-intro.html
CHISE (CHaracter Information Service Environment) - ソース中にS式による(主に漢字の)膨大な文字オントロジー情報を含んでいる
http://chise.zinbun.kyoto-u.ac.jp/
http://git.chise.org/gitweb/
漢字データベースプロジェクト
http://kanji-database.sourceforge.net/
東寺百合文書Web - CC BYで画像・メタデータが公開されている。
http://hyakugo.kyoto.jp/
e国宝(画像等の再配布はできないのでご注意を)
http://www.emuseum.jp/help/ja
○Web API関連:
国立国会図書館サーチ・外部提供インタフェース(API)
http://iss.ndl.go.jp/information/api/
CiNii メタデータ・API
http://support.nii.ac.jp/ja/cinii/api/api_outline
J-STAGE Web API
https://www.jstage.jst.go.jp/pub/html/APIinfo_forJ3/info_server_api/ter…
言語グリッド - 翻訳サービスAPIとして利用可能
http://langrid.org/jp/
DBpedia Japanese
http://ja.dbpedia.org/
ヨコハマ・アート・LOD プロジェクト
http://fp.yafjp.org/yokohama_art_lod
海外編
シェイクスピア ボドリアン・ファーストフォリオ(信頼性が高いとされるシェイクスピア戯曲のTEI/XMLテキストと画像)
http://firstfolio.bodleian.ox.ac.uk/
シェイクスピア 四つ折り本アーカイブ(各地の図書館に所蔵されるシェイクスピア戯曲の画像とTEI/XMLテキスト)
http://www.quartos.org/
MONKプロジェクトのダウンロードサイト。シェイクスピアの単語レベルでのタグ付きコーパスあり
http://quest.library.illinois.edu/monk/project/downloads/
The University of Oxford Text Archive 色々な電子テクスト。TEI/XML等で構造化されたもの多数
http://ota.ahds.ac.uk/
ルネッサンス期からの様々なオンラインテクスト
http://www.english.upenn.edu/~traister/texts.html
世界の国・地域
https://geonlp.ex.nii.ac.jp/dictionary/geonlp/world_country
Europeana APIs
http://www.europeana.eu/portal/api-introduction.html
DPLA 米国デジタル公共図書館 API とサンプルコード等
http://dp.la/info/developers/codex/