word2vecによる自然言語処理

[cover photo]
  • 2014年05月 発行
  • 86ページ
  • ISBN978-4-87311-683-9
  • フォーマット Print PDF ePub mobi

オライリー・ジャパンで書籍を購入:
定価1,512円

Ebook Storeで電子版を購入:
価格1,512円

Tomas Mikolovらによって提案されたニューラルネットワーク(CBOW, Skip-gram)のオープンソース実装word2vecについて、基本的な使い方を体験し、さらにその仕組みを学ぶ書籍です。
基本的な使い方から、自分の好きなコーパスの作り方、登場の背景、仕組み、さらには応用例や弱点についてもコンパクトなボリュームで概観できます。付録にはword2vecの出力結果を主成分分析を使って可視化する方法について解説しています。
なお本書はEbook版およびWeb直販のみ販売となります。

著者の西尾さんによる本書の解題[リンク]

関連書籍

Caffeをはじめよう
入門 機械学習
入門 自然言語処理
入門 データ構造とアルゴリズム
バンディットアルゴリズムによる最適化手法

はじめに

1章 word2vecを使ってみる
    書き換えてみよう

2章 コーパスを変えてみる
    text8
    単語に分割する(MeCab)
    CSVからのコーパス作成
    Facebook
    EPWING
    Wikipedia
    PDFからの抜き出し
    まとめ

3章 word2vecの生まれた理由
    文章の表現

4章 word2vecの仕組み
    ニューラルネットワークの構造
    学習の方法
    まとめ

5章 word2vecでできること・苦手なこと
    word2vecの弱点

付録A word2vecの結果を可視化
    インストール
    主成分分析のメリット・デメリット

Feedback

皆さんのご意見をお聞かせください。ご購入いただいた書籍やオライリー・ジャパンへのご感想やご意見、ご提案などをお聞かせください。より良い書籍づくりやサービス改良のための参考にさせていただきます。
[feedbackページへ]