Caffeは深層学習(Deep Learning)のオープンソースフレームワークで、主に画像処理分野において利用されています。本書はCaffeを使って画像処理をしてみたいという初心者を対象に、Caffeの使い方、Caffeを使う上で最低限必要な知識について解説する書籍です。
まずビルド方法や利用するためのインターフェースの解説から、実際に画像認識を行う一連の流れを説明します。続いてCaffeで利用している畳み込みニューラルネットワーク(CNN)とその構成要素、さらにAlexNetやGoogLeNetといった代表的なCNNのアーキテクチャについても解説します。
さらにblobやlayerといったCaffe独自のクラス、また設定できるパラメータについて解説し、検出のような実際のタスクやモデルを学習する上で用いられている技術についても説明しています。
これまでCaffeを使ったことのない読者が、実際に画像処理をしてみるよい手引きとなるでしょう。
なお本書はEbook版およびWeb直販でのみ販売しており、一般の書店では購入できません。
Caffeをはじめよう
―深層学習による画像解析の実践
石橋 崇司 著
- TOPICS
- 発行年月日
- 2015年08月
- PRINT LENGTH
- 144
- ISBN
- 978-4-87311-745-4
- FORMAT
- PDF EPUB
関連ファイル
目次
まえがき 第1章 深層学習 1.1 深層学習とは 1.2 画像処理分野における深層学習 Park or Bird DeepFace DeepPose 第2章 Caffeの紹介 2.1 ソースコード構成 2.2 依存ライブラリ CUDA BLAS OpenCV (> version 2.4) Boost glog gflags protobuf LevelDB snappy LMDB HDF5 2.3 Caffeのビルド GPU対応準備 必須準備 2.4 インターフェース コマンドライン Python 2.5 Caffeが扱う主なファイル ネットワーク定義ファイル solver定義ファイル caffemodel 第3章 Caffeを使ってみよう 3.1 データ取得 3.2 データベース作成 3.3 モデル学習 ネットワーク定義ファイル(prototxt)の用意 solverの用意 モデルの学習 学習率を小さくする 3.4 画像分類 第4章 畳み込みニューラルネットワーク(Convolutional Neural Network、CNN) 4.1 畳み込み層 4.2 プーリング層 4.3 全結合層 4.4 活性化関数 シグモイド関数 ReLU ソフトマックス関数 4.5 重みの学習 最急降下法 誤差逆伝播法 4.6 代表的なネットワークアーキテクチャ LeNet-5 AlexNet GoogLeNet 第5章 Caffeの独自要素 5.1 Blob データ構造 CPUとGPU間のデータ転送 5.2 Layer データ層 畳み込み層 プーリング層 全結合層 損失 正規化 活性化 実装 5.3 Net 第6章 もっとCaffeを使ってみよう 6.1 Fine-tuning Caffe Model Zoo 6.2 学習済みモデルにおける隠れ層の重みを可視化 6.3 Feature extraction 6.4 R-CNN 6.5 モデルパラメータの編集 6.6 Fully Convolutional Network 第7章 モデルの学習における技術 7.1 ミニバッチ学習 7.2 Data Augmentation 7.3 Dropout Dropout Layer 付録A Caffeの開発に貢献する A.1 Issue A.2 Pull request 付録B Datasets B.1 MNIST B.2 The Street View House Numbers (SVHN) Dataset B.3 The CIFAR-10/100 dataset B.4 Caltech101/256 B.5 ImageNet B.6 MIRFLICKR 参考文献 著者紹介 奥付