Think Stats 第2版

―プログラマのための統計入門

[cover photo]
TOPICS
Data Science , Database , Python
発行年月日
PRINT LENGTH
272
ISBN
978-4-87311-735-5
原書
Think Stats, 2nd Edition
FORMAT
Print PDF
Ebook
2,640円
Ebookを購入する
Print
2,640円

「プログラミングのスキルを統計の理解に役立てよう」というコンセプトで人気を博した第1版に大幅な加筆を行い、全面的に書き換えた改訂版です。数学的な観点から語られることが多い統計について、計算処理の観点から説明。実際にPythonのコードを示し、実データを分析しながら統計の基礎を解説しています。実際に手を動かしながら統計が学べる、という第1版の長所はそのままに、Anaconda、pandas、IPython Notebookといったツールやライブラリを使った統計手法を示すほか、仮説検定、回帰、時系列分析、生存分析などについて新たな章を追加し内容を充実させました。例題、演習問題をGitHubに掲載。プログラマのための統計入門の決定版です。

正誤表

ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷版、刷り年月日をご確認の上、ご利用ください。

1刷正誤表


※2018年6月更新。2刷で修正済みです。

■P.107 脚注
【誤】scatter.py
【正】estimation.py

■P.119 脚注
【誤】scatter.py
【正】hypothesis.py

■P.137 脚注
【誤】scatter.py
【正】linear.py

■P.151 脚注
【誤】scatter.py
【正】regression.py

目次

はじめに

1章 探索的データ解析
    1.1 統計的なアプローチ
    1.2 全米世帯動向調査
    1.3 データのインポート
    1.4 DataFrame
    1.5 変数
    1.6 変換
    1.7 検証
    1.8 解釈
    1.9 演習問題
    1.10 用語集

2章 分布
    2.1 ヒストグラム
    2.2 ヒストグラムを表現する
    2.3 ヒストグラムをプロットする
    2.4 NSFG変数
    2.5 外れ値
    2.6 第一子
    2.7 分布を要約する
    2.8 分散
    2.9 効果量
    2.10 結果のレポート
    2.11 演習問題
    2.12 用語集

3章 確率質量関数
    3.1 Pmf
    3.2 PMFをプロットする
    3.3 その他の可視化
    3.4 クラスサイズのパラドックス
    3.5 DataFrameのインデックス処理
    3.6 演習問題
    3.7 用語集

4章 累積分布関数
    4.1 PMFの限界
    4.2 パーセンタイル
    4.3 累積分布関数(CDF)
    4.4 CDFの表現
    4.5 CDFを比較する
    4.6 パーセンタイル派生統計量
    4.7 乱数
    4.8 パーセンタイル順位を比較する
    4.9 演習問題
    4.10 用語集

5章 分布をモデル化する
    5.1 指数分布
    5.2 正規分布
    5.3 正規確率プロット
    5.4 対数正規分布
    5.5 パレート分布
    5.6 乱数の生成
    5.7 モデルが何の役に立つの?
    5.8 演習問題
    5.9 用語集

6章 確率密度関数
    6.1 PDF
    6.2 カーネル密度推定
    6.3 分布のフレームワーク
    6.4 Hist実装
    6.5 Pmf実装
    6.6 Cdf実装
    6.7 モーメント
    6.8 歪度
    6.9 演習問題
    6.10 用語集

7章 変数間の関係
    7.1 散布図
    7.2 関係を特徴付ける
    7.3 相関
    7.4 共分散
    7.5 ピアソンの相関
    7.6 非線形関係
    7.7 スピアマンの順位相関
    7.8 相関と因果
    7.9 演習問題
    7.10 用語集

8章 推定
    8.1 推定ゲーム
    8.2 分散を予測する
    8.3 標本分布
    8.4 標本バイアス
    8.5 指数分布
    8.6 演習問題
    8.7 用語集

9章 仮説検定
    9.1 古典的仮説検定
    9.2 HypothesisTest
    9.3 平均の差を検定する
    9.4 他の検定統計量
    9.5 相関を検定する
    9.6 割合を検定する
    9.7 カイ二乗検定
    9.8 第一子についてもう一度
    9.9 誤り
    9.10 検出力
    9.11 再現
    9.12 演習問題
    9.13 用語集

10章 線形最小二乗法
    10.1 最小二乗適合
    10.2 実装
    10.3 残差
    10.4 推定
    10.5 適合度
    10.6 線形モデルの検定
    10.7 重み付けリサンプリング
    10.8 演習問題
    10.9 用語集

11章 回帰
    11.1 StatsModels
    11.2 重回帰
    11.3 非線形関係
    11.4 データマイニング
    11.5 予測
    11.6 ロジスティック回帰
    11.7 パラメータを推定する
    11.8 実装
    11.9 正確度
    11.10 演習問題
    11.11 用語集

12章 時系列分析
    12.1 インポートとクリーニング
    12.2 プロット
    12.3 線形回帰
    12.4 移動平均
    12.5 欠損値
    12.6 系列相関
    12.7 自己相関
    12.8 予測
    12.9 自習用参考文献
    12.10 演習問題
    12.11 用語集

13章 生存分析
    13.1 生存曲線
    13.2 ハザード関数
    13.3 生存曲線を推論する
    13.4 カプラン・マイヤー推定
    13.5 結婚曲線
    13.6 生存曲線を推定する
    13.7 信頼区間
    13.8 コホート効果
    13.9 外挿
    13.10 期待残存生存期間
    13.11 演習問題
    13.12 用語集

14章 統計解析手法
    14.1 正規分布
    14.2 標本分布
    14.3 正規分布を表現する
    14.4 中心極限定理
    14.5 CLTを試す
    14.6 CLTを適用する
    14.7 相関検定
    14.8 カイ二乗検定
    14.9 議論
    14.10 演習問題

索引
訳者あとがき