統計分析の標準ツールとして不動の人気を誇るオープンソースソフトウェアRについてのリファレンス。Rの基本操作から、パッケージの詳細、コマンドや関数の一覧、さらには可視化、最適化、並列化など、Rをさらにパワーアップさせるテクニックまで、幅広いトピックを取り上げます。Rの持つ機能を詳しく解説しつつ、Rの可能性を追求する一冊です。圧倒的な情報量を誇り、初心者にも上級者にも有用な情報が満載です。Rユーザにとっては常に手元に置いておきたい一冊です。
Rクイックリファレンス 第2版
Joseph Adler 著、大橋 真也、木下 哲也 訳
- TOPICS
- クイックリファレンス , Data Science , Database , R
- 発行年月日
- 2014年01月
- PRINT LENGTH
- 860
- ISBN
- 978-4-87311-651-8
- 原書
- R in a Nutshell, 2nd Edition
- FORMAT
- Print PDF
目次
はじめに 第I部 Rの基本 1章 Rの入手とインストール 1.1 Rのバージョン 1.2 Rのバイナリの入手とインストール 2章 Rのユーザインタフェース 2.1 RのGUI 2.2 Rコンソール 2.3 バッチモード 2.4 Microsoft ExcelでRを使う 2.5 RStudio 2.6 Rを走らせる他の方法 3章 R超入門 3.1 Rの基本操作 3.2 関数 3.3 変数 3.4 データ構造入門 3.5 オブジェクトとクラス 3.6 モデルとフォーミュラ 3.7 グラフとグラフィックス 3.8 ヘルプの利用 4章 Rのパッケージ 4.1 パッケージの概要 4.2 ローカルライブラリのパッケージ一覧 4.3 パッケージの読み込み(ロード) 4.4 パッケージリポジトリを探索する 4.5 他のリポジトリからのパッケージのインストール 4.6 カスタムパッケージ 第II部 R言語 5章 R言語の概要 5.1 表現式 5.2 オブジェクト 5.3 シンボル 5.4 関数 5.5 オブジェクトは代入文でコピーされる 5.6 Rのすべてはオブジェクトである 5.7 特殊な値 5.8 型強制 5.9 Rインタプリタ 5.10 Rの挙動を見る 6章 R文法 6.1 定数 6.2 演算子 6.3 式 6.4 制御構造 6.5 データ構造にアクセスする 6.6 Rコードスタイルの基準 7章 Rオブジェクト 7.1 プリミティブオブジェクト型 7.2 ベクトル 7.3 リスト 7.4 その他のオブジェクト 7.5 属性 8章 シンボルと環境 8.1 シンボル 8.2 環境での作業 8.3 グローバル環境 8.4 環境と関数 8.5 例外 9章 関数 9.1 関数キーワード 9.2 引数 9.3 返り値 9.4 引数としての関数 9.5 引数の順序と名前つき引数 9.6 サイドエフェクト 10章 オブジェクト指向プログラミング 10.1 Rにおけるオブジェクト指向プログラミングの概要 10.2 Rにおけるオブジェクト指向プログラミング:S4クラス 10.3 RのOOP古い流儀:S3 第III部 データの操作 11章 データの保存、読み込み、編集 11.1 Rにデータを入力する 11.2 Rオブジェクトの保存と読み込み 11.3 外部ファイルからデータをインポートする 11.4 データのエクスポート 11.5 データベースからデータをインポートする 11.6 Hadoopからデータを取得する 12章 データの準備 12.1 データセットを結合する 12.2 変換 12.3 データのビニング 12.4 部分集合 12.5 要約関数 12.6 データクリーニング 12.7 重複を見つけ、除去する 12.8 ソート 第IV部 データの可視化 13章 グラフィックス 13.1 Rグラフィックスの概要 13.2 グラフィックスデバイス 13.3 グラフのカスタマイズ 14章 latticeグラフィックス 14.1 歴史 14.2 latticeパッケージの概要 14.3 高水準latticeプロット関数 14.4 latticeグラフィックスのカスタマイズ 14.5 低水準関数 15章 ggplot2 15.1 簡単な紹介 15.2 グラフィックスの文法 15.3 さらに複雑な例:医療保険データ 15.4 クイックプロット 15.5 ggplot2でのグラフィックスの作成 15.6 参考資料 第V部 Rでの統計 16章 データ分析 16.1 要約統計量 16.2 相関と共分散 16.3 主成分分析 16.4 因子分析 16.5 ブートストラップリサンプリング 17章 確率分布 17.1 正規分布 17.2 共通の分布型引数 17.3 分布関数ファミリー 18章 統計的検定 18.1 連続データ 18.2 離散データ 19章 検出力検定 19.1 実験計画の例 19.2 t検定のデザイン 19.3 比率検定のデザイン 19.4 分散分析検定のデザイン 20章 回帰モデル 20.1 例:単純線形モデル 20.2 lm関数の詳細 20.3 部分集合選択と収縮法 20.4 非線形モデル 20.5 生存モデル 20.6 平滑化 20.7 回帰のための機械学習アルゴリズム 21章 分類モデル 21.1 線形分類モデル 21.2 分類のための機械学習アルゴリズム 22章 機械学習 22.1 マーケットバスケット分析 22.2 クラスタリング 23章 時系列分析 23.1 自己相関関数 23.2 時系列モデル 第VI部 その他のトピック 24章 Rプログラムの最適化 24.1 Rプログラムの性能測定 24.2 Rコードの最適化 24.3 その他のR高速化方法 25章 Bioconductor 25.1 例 25.2 主なBioconductorパッケージ 25.3 データ構造 25.4 参考資料 26章 RとHadoop 26.1 RとHadoop 26.2 並列計算のためのその他のパッケージ 26.3 参考資料 付録1 Rリファレンス base boot cluster class codetools foreign grDevices graphics grid KernSmooth lattice MASS methods mgcv nlme nnet rpart spatial splines stats stats4 survival tcltk tools utils 参考文献 索引