Think Stats 第3版

―Pythonで学ぶ統計学入門

[cover photo]
TOPICS
Data Science , Python
発行年月日
PRINT LENGTH
328
ISBN
978-4-8144-0137-6
原書
Think Stats, 3rd Edition
FORMAT
Print
Print
3,740円

本書は「プログラミングのスキルを統計学の理解に役立てよう」というコンセプトのもとで、多くの学生の支持を得ているPythonで統計学を学ぶ教科書です。統計学を学ぶ際に必要となる数学分野の知識をPythonのコードで示していくことによって、実データを分析しながらわかりやすく解説しています。プログラムはGoogle Colab上で動作できるように設計されているので、ライブラリのインストールや環境設定に悩まされることなく、すぐにプログラムを試すことができます。データのインポートとクリーニングといった前処理から仮説検定、回帰分析、時系列分析、生存時間解析といった高度な分析手法まで、一通りの統計学の分析を学ぶことができます。

目次

はじめに

1章 探索的データ分析
    1.1 証拠
    1.2 家族の成長に関する全国調査
    1.3 データの読み込み
    1.4 検証
    1.5 変換
    1.6 要約統計量
    1.7 データの解釈
    1.8 用語集
    1.9 練習問題

2章 分布
    2.1 度数分布表
    2.2 NSFGの分布
    2.3 外れ値
    2.4 第一子
    2.5 効果量
    2.6 結果の報告
    2.7 用語集
    2.8 練習問題

3章 確率質量関数
    3.1 確率質量関数
    3.2 PMFを要約する
    3.3 クラス規模のパラドックス
    3.4 NSFGデータ
    3.5 その他の可視化
    3.6 用語集
    3.7 練習問題

4章 累積分布関数
    4.1 パーセンタイルとパーセンタイル順位
    4.2 累積分布関数
    4.3 CDFを比較する
    4.4 パーセンタイルに基づく統計量
    4.5 乱数
    4.6 用語集
    4.7 練習問題

5章 分布をモデル化する
    5.1 二項分布
    5.2 ポアソン分布
    5.3 指数分布
    5.4 正規分布
    5.5 対数正規分布
    5.6 なぜモデルなのか
    5.7 用語集
    5.8 練習問題

6章 確率密度関数
    6.1 分布の比較
    6.2 確率密度
    6.3 指数分布のPDF
    6.4 PMFとPDFの比較
    6.5 カーネル密度推定
    6.6 分布のフレームワーク
    6.7 用語集
    6.8 練習問題

7章 変数間の関係
    7.1 散布図
    7.2 デシルプロット
    7.3 相関
    7.4 相関の強さ
    7.5 順位相関
    7.6 相関と因果
    7.7 用語集
    7.8 練習問題

8章 推定
    8.1 ペンギンの体重測定
    8.2 頑健性
    8.3 分散の推定
    8.4 標本分布
    8.5 標準誤差
    8.6 信頼区間
    8.7 誤差の原因
    8.8 用語集
    8.9 練習問題

9章 仮説検定
    9.1 コイン投げ
    9.2 平均の差の検定
    9.3 その他の検定統計量
    9.4 相関の検定
    9.5 比率の検定
    9.6 用語集
    9.7 練習問題

10章 最小二乗法
    10.1 最小二乗法
    10.2 決定係数
    10.3 MSEの最小化
    10.4 推定
    10.5 不確実性の可視化
    10.6 変換
    10.7 用語集
    10.8 練習問題

11章 重回帰分析
    11.1 統計モデル
    11.2 重回帰
    11.3 コントロール変数
    11.4 非線形関係
    11.5 ロジスティック回帰
    11.6 用語集
    11.7 練習問題

12章 時系列分析
    12.1 電力
    12.2 時系列成分の分解
    12.3 予測
    12.4 乗法モデル
    12.5 自己回帰
    12.6 移動平均
    12.7 自己回帰による遡及予測
    12.8 ARIMA
    12.9 ARIMAによる予測
    12.10 用語集
    12.11 練習問題

13章 生存時間解析
    13.1 生存関数
    13.2 ハザード関数
    13.3 結婚データ
    13.4 重み付きブートストラップ
    13.5 ハザード関数の推定
    13.6 生存関数の推定
    13.7 lifelinesパッケージ
    13.8 信頼区間
    13.9 期待残存期間
    13.10 用語集
    13.11 練習問題

14章 分析手法
    14.1 正規確率プロット
    14.2 正規分布
    14.3 標本平均の分布
    14.4 差の分布
    14.5 中心極限定理
    14.6 中心極限定理の限界
    14.7 中心極限定理の適用
    14.8 相関検定
    14.9 カイ二乗検定
    14.10 計算と分析
    14.11 用語集
    14.12 練習問題

索引