word2vecによる自然言語処理

[cover photo]
TOPICS
発行年月日
PRINT LENGTH
86
ISBN
978-4-87311-683-9
FORMAT
PDF EPUB
Ebook
1,540円
Ebookを購入する

Tomas Mikolovらによって提案されたニューラルネットワーク(CBOW, Skip-gram)のオープンソース実装word2vecについて、基本的な使い方を体験し、さらにその仕組みを学ぶ書籍です。
基本的な使い方から、自分の好きなコーパスの作り方、登場の背景、仕組み、さらには応用例や弱点についてもコンパクトなボリュームで概観できます。付録にはword2vecの出力結果を主成分分析を使って可視化する方法について解説しています。

著者の西尾さんによる本書の解題[リンク]

目次

はじめに

1章 word2vecを使ってみる
    書き換えてみよう

2章 コーパスを変えてみる
    text8
    単語に分割する(MeCab)
    CSVからのコーパス作成
    Facebook
    EPWING
    Wikipedia
    PDFからの抜き出し
    まとめ

3章 word2vecの生まれた理由
    文章の表現

4章 word2vecの仕組み
    ニューラルネットワークの構造
    学習の方法
    まとめ

5章 word2vecでできること・苦手なこと
    word2vecの弱点

付録A word2vecの結果を可視化
    インストール
    主成分分析のメリット・デメリット