じんもんそんで使えそうなデータやAPI等のリスト

以下、とりあえずとってきて色々いじることができそうで、人文学研究に役立ちそうなデータをリストします。(by 永崎研宣)

日本編

近代語のコーパス(国立国語研究所)
http://www.ninjal.ac.jp/corpus_center/cmj/
コーパス開発センター(国立国語研究所)-近代文語Unidic、中古Unidic等もあり
http://www.ninjal.ac.jp/corpus_center/
 参考: オープンソースの日本語形態素解析エンジンMecab https://code.google.com/p/mecab/

オックスフォード上代日本語コーパス
http://vsarpj.orinst.ox.ac.uk/corpus/

日本語テキストイニシアチブ
http://jti.lib.virginia.edu/japanese/index.euc.html

青空文庫
http://www.aozora.gr.jp/

近代デジタルライブラリー/ 国立国会図書館デジタルコレクション
http://kindai.ndl.go.jp/ 
http://dl.ndl.go.jp/
翻デジ http://lab.kn.ndl.go.jp/dhii/omk2/

日本語Wordnet
http://nlpwww.nict.go.jp/wn-ja/

East Asian Readings Indexes
http://www.buddhism-dict.net/ddb/indexes/ea-read-chooser.html

頁の一番下に、少し古いが、電子仏教辞典の見出し語・英訳・ピンイン表記などのリスト(allindex.zip)へのリンクあり
http://buddhism-dict.net/ddb/allindex-intro.html

CHISE (CHaracter Information Service Environment) - ソース中にS式による(主に漢字の)膨大な文字オントロジー情報を含んでいる
http://chise.zinbun.kyoto-u.ac.jp/
http://git.chise.org/gitweb/

漢字データベースプロジェクト
http://kanji-database.sourceforge.net/

東寺百合文書Web - CC BYで画像・メタデータが公開されている。
http://hyakugo.kyoto.jp/

e国宝(画像等の再配布はできないのでご注意を)
http://www.emuseum.jp/help/ja

○Web API関連:

国立国会図書館サーチ・外部提供インタフェース(API)
http://iss.ndl.go.jp/information/api/

CiNii メタデータ・API
http://support.nii.ac.jp/ja/cinii/api/api_outline

J-STAGE Web API
https://www.jstage.jst.go.jp/pub/html/APIinfo_forJ3/info_server_api/ter…

言語グリッド - 翻訳サービスAPIとして利用可能
http://langrid.org/jp/

DBpedia Japanese
http://ja.dbpedia.org/

ヨコハマ・アート・LOD プロジェクト
http://fp.yafjp.org/yokohama_art_lod

海外編

シェイクスピア ボドリアン・ファーストフォリオ(信頼性が高いとされるシェイクスピア戯曲のTEI/XMLテキストと画像)
http://firstfolio.bodleian.ox.ac.uk/

シェイクスピア 四つ折り本アーカイブ(各地の図書館に所蔵されるシェイクスピア戯曲の画像とTEI/XMLテキスト)
http://www.quartos.org/

MONKプロジェクトのダウンロードサイト。シェイクスピアの単語レベルでのタグ付きコーパスあり
http://quest.library.illinois.edu/monk/project/downloads/

The University of Oxford Text Archive 色々な電子テクスト。TEI/XML等で構造化されたもの多数
http://ota.ahds.ac.uk/

ルネッサンス期からの様々なオンラインテクスト
http://www.english.upenn.edu/~traister/texts.html

世界の国・地域
https://geonlp.ex.nii.ac.jp/dictionary/geonlp/world_country

Europeana APIs
http://www.europeana.eu/portal/api-introduction.html

DPLA 米国デジタル公共図書館 API とサンプルコード等
http://dp.la/info/developers/codex/