Tomas Mikolovらによって提案されたニューラルネットワーク(CBOW, Skip-gram)のオープンソース実装word2vecについて、基本的な使い方を体験し、さらにその仕組みを学ぶ書籍です。
基本的な使い方から、自分の好きなコーパスの作り方、登場の背景、仕組み、さらには応用例や弱点についてもコンパクトなボリュームで概観できます。付録にはword2vecの出力結果を主成分分析を使って可視化する方法について解説しています。
著者の西尾さんによる本書の解題[リンク]
word2vecによる自然言語処理
西尾泰和 著
- TOPICS
- AI/LLM
- 発行年月日
- 2014年05月
- PRINT LENGTH
- 86
- ISBN
- 978-4-87311-683-9
- FORMAT
- PDF EPUB
目次
はじめに
1章 word2vecを使ってみる
書き換えてみよう
2章 コーパスを変えてみる
text8
単語に分割する(MeCab)
CSVからのコーパス作成
Facebook
EPWING
Wikipedia
PDFからの抜き出し
まとめ
3章 word2vecの生まれた理由
文章の表現
4章 word2vecの仕組み
ニューラルネットワークの構造
学習の方法
まとめ
5章 word2vecでできること・苦手なこと
word2vecの弱点
付録A word2vecの結果を可視化
インストール
主成分分析のメリット・デメリット