言語データの収集とコーパスの構築

赤瀬川史朗, 中尾浩 著

コーパス言語学において最も苦労するのは、データの構築である。コーパス言語学は具体的な学問である。何らかのデータに基づいて分析することから始めなければならないので、データがなければ始まらない。では、そのデータはどこにあるのか。本書では筆者たちが実践しているデータ構築法を中心に、可能な限りさまざまなデータの収集法とその加工法について紹介している。

「BOOKデータベース」より

[目次]

  • 第1章 キーボードからの直接入力
  • 第2章 OCRによる入力
  • 第3章 インターネットの活用
  • 第4章 Perlによるテキスト処理の基本
  • 第5章 Perlによるテキスト処理の実際
  • 第6章 GUIソフトによるファイル操作の実際
  • 第7章 GUIソフトによるテキスト変換の実際

「BOOKデータベース」より

この本の情報

書名 言語データの収集とコーパスの構築
著作者等 中尾 浩
赤瀬川 史朗
書名ヨミ ゲンゴ データ ノ シュウシュウ ト コーパス ノ コウチク
シリーズ名 コーパス言語学の技法 2
出版元 夏目書房
刊行年月 2004.11
ページ数 402p
大きさ 21cm
ISBN 4931391710
NCID BA69775421
※クリックでCiNii Booksを表示
全国書誌番号
20791022
※クリックで国立国会図書館サーチを表示
言語 日本語
出版国 日本
この本を: 
このエントリーをはてなブックマークに追加

このページを印刷

外部サイトで検索

この本と繋がる本を検索

ウィキペディアから連想