Tomas Mikolovらによって提案されたニューラルネットワーク(CBOW, Skip-gram)のオープンソース実装word2vecについて、基本的な使い方を体験し、さらにその仕組みを学ぶ書籍です。
基本的な使い方から、自分の好きなコーパスの作り方、登場の背景、仕組み、さらには応用例や弱点についてもコンパクトなボリュームで概観できます。付録にはword2vecの出力結果を主成分分析を使って可視化する方法について解説しています。
著者の西尾さんによる本書の解題[リンク]
word2vecによる自然言語処理
西尾泰和 著
- TOPICS
- 発行年月日
- 2014年05月
- PRINT LENGTH
- 86
- ISBN
- 978-4-87311-683-9
- FORMAT
- PDF EPUB
目次
はじめに 1章 word2vecを使ってみる 書き換えてみよう 2章 コーパスを変えてみる text8 単語に分割する(MeCab) CSVからのコーパス作成 Facebook EPWING Wikipedia PDFからの抜き出し まとめ 3章 word2vecの生まれた理由 文章の表現 4章 word2vecの仕組み ニューラルネットワークの構造 学習の方法 まとめ 5章 word2vecでできること・苦手なこと word2vecの弱点 付録A word2vecの結果を可視化 インストール 主成分分析のメリット・デメリット