Rではじめるデータサイエンス

Hadley Wickham、Garrett Grolemund　著、黒川利明　訳、大橋真也　技術監修

TOPICS: Data Science , Database , R
発行年月日: 2017年10月25日
PRINT LENGTH: 480
ISBN: 978-4-87311-814-7
原書: R for Data Science
FORMAT: オンライン学習プラットフォーム

購読可
いますぐ読む

ggplot2、dplyrといったRを代表するパッケージやRStudioの開発で知られる「Rの神様」ハドリー・ウィッカムと、『RStudioではじめるRプログラミング入門』の著者ギャレット・グロールマンドによる、Rプログラミングを通してデータサイエンスの理解と知識を深めるための一冊。Rの機能と威力を知り尽くし、また、統計とデータサイエンス教育のプロフェッショナルでもある著者たちによるわかりやすくクリアな説明は、既存のデータサイエンス入門書とは一線を画します。データサイエンスに必要な要素とプロセス（インポート、整理、変換、可視化、モデル、コミュニケーション、プログラミング）を明確に定義し、それぞれ順を追い、各節の最後には練習問題を掲載して、ていねいに説明します。データサイエンティストを目指すなら必読の一冊です。

正誤表

書籍発行後に気づいた誤植や更新された情報を掲載しています。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷数をご確認の上、ご利用ください。

1刷正誤表

※2018年6月更新。2刷で修正済みです。

■P.vii　3-4行目
【誤】広範囲のデータサイエンスの
【正】データサイエンスの広範囲な

■P.vii　下から2-3行目
【誤】データセットが格納されたセマンティクスと合致した
【正】データセットが格納されている意味と一致するように

■P.viii　2行目
【誤】集中できるので重要です。
【正】集中できるのです。

■P.viii　12行目
【誤】質問が間違っていることを示したり、
【正】質問が誤っていることを示したり、

■P.viii　16行目
【誤】モデルは基本的に数学的、コンピュータ向きのツールなので、
【正】モデルは基本的に数学的またはコンピュータ向きのツールなので、

■P.viii　下から5行目
【誤】ここに挙げたツールを使うでしょうが、
【正】ここに挙げたツールを使いますが、

■P.ix　7行目
【誤】既にインポートされて整理されたデータの可視化と
【正】既にインポートされ整理されたデータの可視化と

■P.ix　14行目
【誤】プログラミングツールの選択を許して、
【正】プログラミングツールの選択をして、

■P.ix　下から1行目
【誤】学習には努力が必要ですが、性能上の効果があるので学ぶ価値があります。
【正】性能上の効果があるので学ぶのに努力する十分な価値があります。

■P.xi　13行目
【誤】戦略について少し述べる。
【正】戦略について少し説明する。

■P.xiii　訳注
【誤】「きちんとした詩」
【正】「整理された世界」

■P.xiii　訳注
【誤】（雑然とした詩）
【正】（雑然とした世界）

■P.xiv　17行目
【誤】正しいRでの書き方。
【正】正しいRでの書き方である。

■P.xiv　19-20行目
【誤】Rを習得するのに1つだけ学んで済むことなどありえません。
【正】1冊の本や資料を読むだけで、Rを習熟できることなどありえません。

■P.xiv　23行目
【誤】R用の結果がそもそもない
【正】Rに関する結果がそもそもない

■P.xiv　下から6行目
【誤】ヘルプがあるでしょう
【正】ヘルプが見つかるでしょう

■P.xvi　1行目
【誤】もたらしてくれたからです。
【正】与えてくれたからです。

■P.xxiv　19行目
【誤】9.4　分割と接合
【正】9.4　分割と結合

■P.xxv　下から9行目
【誤】11.4.4　置換マッチ
【正】11.4.4　マッチの置換

■P.xxviii　7行目
【誤】16.7　強化ベクトル
【正】16.7　拡張ベクトル

■P.1　1行目
【誤】データ探索では、データを調べて、
【正】データ探索は、データを調べて、

■P.1　下から3行目
【誤】質問を投げかけては答えていく。
【正】質問を投げかけ答える。

■P.1　下から1行目
【誤】まだ十分ではないでしょうから、
【正】まだ十分ではないと考えられることから、

■P.3　4行目
【誤】Rにはグラフを描く手段が
【正】Rにはグラフを描く方法が

■P.3　5行目
【誤】多くの機能を持ちます。
【正】多くの機能を持っています。

■P.4　14-15行目
【誤】関数ggplot()を使っていることを明示します
【正】ggplot()関数を使っていることを明示します

■P.5　下から4行目
【誤】面白みがないので
【正】面白味がないので

■P.7　7行目
【誤】オブジェクトの視覚特性です。
【正】オブジェクトの可視化特性です。

■P.9　6行目
【誤】一度に6つの形しか
【正】一度に6つの形（shape）しか

■P.9　下から8行目
【誤】変数に対応付ける視覚特性
【正】変数に対応付ける可視化特性

■P.11　下から6行目
【誤】往々にしてうまくいかないことがあります。
【正】往々にしてうまくいかないことがありますが、

■P.12　10行目
【誤】関数名を選んで
【正】関数名を選択して

■P.14　練習問題5
【誤】nrowは何をするだろうか。ncolは何をするだろうか。他のオプションは個別パネルの配置にどう影響するのか。
【正】nrowは何を表しているか。ncolは何を表しているか。他のオプションは個々のパネルの配置にどう影響するのか。

■P.14　練習問題6
【誤】行の変数として使うのが普通です。
【正】行の変数として使うのが普通である。

■P.15　下から2行目
【誤】これではよくないと感じるなら、
【正】これではしっくりこないと感じるなら、

■P.15　下から2-1行目
【誤】色をつけても構いません。
【正】色をつけるとより明確にすることができます。

■P.20　2行目
【誤】わかりにくいことが
【正】わかりにくかったことが

■P.33　3行目
【誤】杓子定規で
【正】プログラミングは杓子定規で､

■P.33　7行目
【誤】Rコード実行の
【正】Rコードの実行についての

■P.34　訳注2を削除
【誤】＊2 訳注：RStudioのセッションが新規だと、thiと入力した時点で補完される。
【正】（削除）

■P.45　練習問題1
【誤】欠損値を頭から整列させる
【正】欠損値を頭に整列させる

■P.47　5行目
【誤】配列変更には
【正】結合には

■P.53　下から1行目
【誤】「そして」です。
【正】「そして（then）」です。

■P.58　下から2行目
【誤】平均、個数、和を
【正】平均（mean）、個数（count）、和（sum）を

■P.60　3-4行目
【誤】xの値は上位25%下位75%に
【正】xの値はx以下の値が25％、x以上の値が75%に

■P.69　1行目
【誤】プログラミングに取り掛かる
【正】プログラミングを始める際

■P.73　2行目
【誤】これは統計家が
【正】これは統計学者が

■P.78　下から3行目
【誤】（4－5分の）長いもので、
【正】（4～5分の）長いもので、

■P.79　7行目
【誤】y軸が
【正】yの軸が

■P.79　下から4行目
【誤】y軸の
【正】yの軸の

■P.84　下から8行目
【誤】さまざまなことがこのグラフにある
【正】さまざまな問題がこのグラフにある

■P.84　6行目
【誤】統計家が
【正】統計学者が

■P.93　11行目
【誤】オールドフェイスフル間欠泉の
【正】オールド・フェイスフル・ガイザーの

■P.96　3-4行目
【誤】可視化のすべての側面を述べています。
【正】可視化のすべての面について説明しています。

■P.99　1行目
【誤】実行するとRコードで印刷できます。
【正】実行すると作業ディレクトリの位置が表示されます。

■P.99　下から1行目
【誤】使われる。
【正】指定される。

■P.105　3行目
【誤】古めかしい振る舞いを変更して
【正】古めかしい振る舞いを修正して

■P.105　11行目
【誤】さまざまに使います
【正】さまざまな用途で使います

■P.114　3行目
【誤】readr関数を
【正】readrの関数を

■P.116　15行目
【誤】数のパース
【正】数値のパース

■P.117　24行目
【誤】#> [1] ] 1.23e+08
【正】#> [1] 1.23e+08

■P.120　4行目
【誤】オプションの:と秒、
【正】オプションの「:と秒」、

■P.122　下から3行目
【誤】最初の1000行では
【正】最初の1,000行では

■P.122　下から2行目
【誤】最初の1000行には
【正】最初の1,000行には

■P.132　5行目
【誤】# 人口10,000当たりの率を計算
【正】# 人口10,000当たりの比率を計算

■P.133　下から13行目
【誤】入力がやさしい
【正】入力が易しい

■P.134　9行目
【誤】列を集めて
【正】列を集めて（gather）

■P.134　下から12行目
【誤】非構文的名前なので、
【正】非構文的な名前なので、

■P.137　下から3行目
【誤】9.4　分割と接合
【正】9.4　分割と結合

■P.152　1行目
【誤】表の間の関係の連鎖を
【正】表の間の関係の繋がりを

■P.154　下から9行目
【誤】最初のツールが更新ジョインです。
【正】最初のツールが更新ジョイン（mutating join）です。

■P.157　5行目
【誤】内部ジョインです。
【正】内部ジョイン（inner join）です。

■P.158　1行目
【誤】左ジョインは、
【正】左ジョイン（left join）は、

■P.158　2行目
【誤】右ジョインは、
【正】右ジョイン（right join）は、

■P.158　3行目
【誤】完全ジョインは、
【正】完全ジョイン（full join）は、

■P.160　下から4行目
【誤】自然ジョインと呼ばれる。
【正】自然ジョイン（natural join）と呼ばれる。

■P.162　下から1行目
【誤】どんな天候状況だと
【正】どんな天候だと

■P.163　下から6行目
【誤】フィルタジョインは、
【正】フィルタジョイン（filtering join）は、

■P.167　下から11行目
【誤】xとyの両方にある観測だけを返す。
【正】xとyに共通な観測だけを返す。

■P.167　下から9行目
【誤】xとyの観測を一意にして返す。
【正】xとyにある観測を一意にして返す。

■P.169　5行目
【誤】わけのわからないものに
【正】わけのわからない文字列に

■P.187　13行目
【誤】11.4.4　置換マッチ
【正】11.4.4　マッチの置換

■P.193　下から10行目
【誤】全Rマークダウンファイル
【正】すべてのRマークダウンファイル

■P.195　下から6行目
【誤】tidyverseの中核ではないので、
【正】tidyverseに含まれていないので、

■P.203　下から2行目
【誤】任意か定まっているか調べなさい。
【正】任意か定まっているかを調べなさい。

■P.213　9行目
【誤】日付の個別部分は、
【正】日付の個々の部分は、

■P.215　4行目
【誤】「好適な」出発時刻への
【正】「丁度良い」出発時刻への

■P.223　下から13行目
【誤】タイムゾーンは日付時刻の1属性で表示のみを制御します。
【正】タイムゾーンは日付時刻の表示をコントロールする唯一の属性です。

■P.230　訳注1
【誤】このコードをそのまま実行するとError: could not find function "little_bunny"になる。
【正】このコードをそのまま実行すると「little_bunny() でエラー: 関数 "little_bunny" を見つけることができませんでした」になる。

■P.231　2行目
【誤】
pryr::object_size(diamonds)
#> 3.46 MB
pryr::object_size(diamonds2)
#> 3.89 MB
pryr::object_size(diamonds, diamonds2)

【正】（1行追加）
pryr::object_size(diamonds)
#> 3.46 MB
pryr::object_size(diamonds2)
#> 3.89 MB
pryr::object_size(diamonds, diamonds2)
#> 3.89 MB

■P.233　18行目
【誤】この評価振る舞いに
【正】この評価の振る舞いに

■P.234　14行目
【誤】右側ではなく左側を
【正】右辺の代わりに左辺を

■P.237　2行目
【誤】最良の方法が関数を書くことです。
【正】最良の方法は関数を書くことです。

■P.238　23行目
【誤】このコードでは単一数値ベクトルが
【正】このコードでは1つの数値ベクトルが

■P.247　下から6行目
【誤】テストの詳細が
【正】検定の詳細が

■P.252　12行目
【誤】● パイプで関数を使えるか。
【正】● パイプを使って関数が書けるか。

■P.258　8行目
【誤】アトミックベクトルが均質なのに、
【正】アトミックベクトルが等質なのに、

■P.259　4行目（2か所）
【誤】強化ベクトル
【正】拡張ベクトル

■P.259　9行目
【誤】強化ベクトルで終わります。
【正】拡張ベクトルで終わります。

■P.266　下から7行目
【誤】最終列以外
【正】1列目以外

■P.274　1行目、3行目、4行目、5行目（4か所）
【誤】強化ベクトル
【正】拡張ベクトル

■P.275　柱
【誤】強化ベクトル
【正】拡張ベクトル

■P.276　2行目、下から4行目（2か所）
【誤】強化ベクトル
【正】拡張ベクトル

■P.280　9行目
【誤】c. 「99 Bottles of Beer on the Wall」を
【正】c. 歌「99 Bottles of Beer on the Wall」を

■P.286　下から11行目
【誤】これらの関数は相違点（mean(), median(), sd()）が
【正】これらの関数（mean(), median(), sd()）は違いが

■P.294　1行目
【誤】
mu %>%
map(rnorm, n = 5) %>%
str()
#> List of 3
#> $ : num [1:5] 5.45 5.5 5.78 6.51 3.18
#> $ : num [1:5] 10.79 9.03 10.89 10.76 10.65
#> $ : num [1:5] -3.54 -3.08 -5.01 -3.51 -2.9

【正】（1行追加）
mu <- list(5, 10, -3)
mu %>%
map(rnorm, n = 5) %>%
str()
#> List of 3
#> $ : num [1:5] 5.45 5.5 5.78 6.51 3.18
#> $ : num [1:5] 10.79 9.03 10.89 10.76 10.65
#> $ : num [1:5] -3.54 -3.08 -5.01 -3.51 -2.9

■P.303　下から5行目
【誤】「教師付き」や「教師なし」と
【正】「教師あり」や「教師なし」と

■P.304　12行目
【誤】今のところは、定量アセスメントと
【正】今のところは、定性評価と

■P.307　10行目
【誤】これは捕捉したい
【正】これは捉えたい

■P.307　13行目
【誤】異なるパターンを捕捉するパラメータだ。
【正】異なるパターンを捉えるパラメータである。

■P.307　15行目
【誤】特定化する。
【正】特定する。

■P.310　下から8行目
【誤】30の距離が
【正】30個の距離が

■P.312　2行目
【誤】最良10モデル
【正】最良の10モデル

■P.313　下から9行目
【誤】最良モデルを煮詰めることが
【正】最良モデルに絞り込むことが

■P.313　下から6行目
【誤】これ以上低くならないところに到達するまで曲線を徐々に下がっていきます。
【正】これ以上下がれないところに到達するまで曲線上を徐々に滑り降りていきます。

■P.314　下から7行目
【誤】関連を使い
【正】関係を使い

■P.317　5行目
【誤】実際のy値が要るからです。
【正】実際のy値が必要だからです。

■P.318　1行目
【誤】モデルの質の校正に役立ちます。
【正】モデルの質の軟正に役立ちます。

■P.322　3行目
【誤】
tibble(x = "e") %>%
add_predictions(mod2)
#> Error in model.frame.default(Terms, newdata, na.action =
#> na.action, xlev = object$xlevels): factor x has new level e

【正】（1行追加）
tibble(x = "e") %>%
add_predictions(mod2)
#> model.frame.default(Terms, newdata, na.action = na.action,
#> xlev = object$xlevels) でエラー :
#> factor x has new level e

■P.324　下から2行目
【誤】捕捉したかどうかの質的アセスメント
【正】捕捉したかどうかの定性評価

■P.334　1行目
【誤】投げ捨てるのを恐れず、やり直した
【正】投げ捨てやり直すことを恐れなかった。

■P.338　2行目
【誤】尺度はどうかを
【正】スケールはどうかを

■P.340　下から6行目
【誤】間違って低い価格が
【正】誤って低い価格が

■P.354　12行目
【誤】医師であり統計家の
【正】医師であり統計学者の

■P.396　下から2行目
【誤】個別の観測や一群の観測にラベルを
【正】個々の観測や一連の観測にラベルを

■P.417　4行目
【誤】比率関係については、
【正】適正な比率については、

■P.432　下から1行目
【誤】
Peter Bruce & Andrew Bruce『Practical Statistics for Data Scientists: 50 Essential Concepts』、O’Reilly Media、2017（邦訳近刊）
【正】
Peter Bruce & Andrew Bruce（黒川訳、大橋技術監修）『データサイエンスのための統計学入門―予測、分類、統計モデリング、統計的機械学習とRプログラミング』、オライリー・ジャパン、2018

日本の読者のみなさんへ
まえがき

第Ⅰ部　探索

1章　ggplot2によるデータ可視化
    1.1　はじめに
        1.1.1　準備するもの
    1.2　第1ステップ
        1.2.1　mpgデータフレーム
        1.2.2　ggplotを作る
        1.2.3　グラフ作成テンプレート
    1.3　エステティックマッピング
    1.4　よくある不具合
    1.5　ファセット
    1.6　幾何オブジェクト
    1.7　統計変換
    1.8　位置調整
    1.9　座標系
    1.10　階層グラフィックス文法

2章　ワークフロー：基本
    2.1　コーディングの基本
    2.2　名前の中には何がある?
    2.3　関数呼び出し

3章　dplyrによるデータ変換
    3.1　はじめに
        3.1.1　準備するもの
        3.1.2　nycflights13
        3.1.3　dplyrの基本
    3.2　filter()で行にフィルタにかける
        3.2.1　比較
        3.2.2　論理演算子
        3.2.3　欠損値
    3.3　arrange()で行を配置する
    3.4　select()で列を選ぶ
    3.5　mutate()で新しい変数を追加する
        3.5.1　有用な作成関数
    3.6　summarize()によるグループごとの要約
        3.6.1　パイプで複数演算を結合する
        3.6.2　欠損値
        3.6.3　カウント
        3.6.4　便利な要約関数
        3.6.5　複数の変数によるグループ化
        3.6.6　グループ解除
    3.7　グループごとの変更（とフィルタ）

4章　ワークフロー：スクリプト
    4.1　コードを実行する
    4.2　RStudioの診断

5章　探索的データ分析
    5.1　はじめに
        5.1.1　準備するもの
    5.2　質問
    5.3　変動
        5.3.1　分布の可視化
        5.3.2　典型値
        5.3.3　異常値
    5.4　欠損値
    5.5　共変動
        5.5.1　カテゴリ変数と連続変数
        5.5.2　2つのカテゴリ変数
        5.5.3　2つの連続変数
    5.6　パターンとモデル
    5.7　ggplot2呼び出し
    5.8　さらに学ぶために

6章　ワークフロー：プロジェクト
    6.1　リアルとは
    6.2　どこで分析するか
    6.3　パスとディレクトリ
    6.4　RStudioプロジェクト
    6.5　まとめ

第Ⅱ部　データラングリング

7章　tibbleのtibble
    7.1　はじめに
        7.1.1　準備するもの
    7.2　tibbleを作る
    7.3　tibbleとdata.frame
        7.3.1　画面表示
        7.3.2　要素抽出
    7.4　古いコードとの関わり

8章　readrによるデータインポート
    8.1　はじめに
        8.1.1　準備するもの
    8.2　作業を始めるにあたって
        8.2.1　基本 Rとの比較
    8.3　ベクトルをパースする
        8.3.1　数値
        8.3.2　文字列
        8.3.3　ファクタ
        8.3.4　日付、日付時刻、時刻
    8.4　ファイルをパースする
        8.4.1　戦略
        8.4.2　問題点
        8.4.3　他の戦略
    8.5　ファイルへの書き出し
    8.6　他の種類のデータ

9章　tidyrによるデータ整理
    9.1　はじめに
        9.1.1　準備するもの
    9.2　整理データ
    9.3　広げたり集めたり
        9.3.1　集める
        9.3.2　広げる
    9.4　分割と接合
        9.4.1　分割
        9.4.2　結合
    9.5　欠損値
    9.6　ケーススタディ
    9.7　非整理データ

10章　dplyrによる関係データ
    10.1　はじめに
        10.1.1　準備するもの
    10.2　nycflights13
    10.3　キー
    10.4　更新ジョイン
        10.4.1　ジョインを理解する
        10.4.2　内部ジョイン
        10.4.3　外部ジョイン
        10.4.4　重複キー
        10.4.5　キーの列を定義する
        10.4.6　他の実装
    10.5　フィルタジョイン
    10.6　ジョインの問題
    10.7　集合演算

11章　stringrによる文字列
    11.1　はじめに
        11.1.1　準備するもの
    11.2　文字列の基本
        11.2.1　文字列の長さ
        11.2.2　文字列の連結
        11.2.3　文字列の一部抽出
        11.2.4　ロケール
    11.3　正規表現でパターンマッチ
        11.3.1　基本マッチ
        11.3.2　アンカー
        11.3.3　文字のクラスと候補
        11.3.4　繰り返し
        11.3.5　グループ化と後方参照
    11.4　ツール
        11.4.1　マッチの可否
        11.4.2　マッチの抽出
        11.4.3　グループのマッチ
        11.4.4　置換マッチ
        11.4.5　分割
        11.4.6　マッチを探し出す
    11.5　他の種類のパターン
    11.6　正規表現の別の用途
    11.7　stringi

12章　forcatsでファクタ
    12.1　はじめに
        12.1.1　用意するもの
    12.2　ファクタを作る
    12.3　総合的社会調査
    12.4　ファクタ順序の変更
    12.5　ファクタ水準の変更

13章　lubridateによる日付と時刻
    13.1　はじめに
        13.1.1　用意するもの
    13.2　日付 /時刻の作成
        13.2.1　文字列から作成
        13.2.2　個別要素から作成
        13.2.3　他の型から作成
    13.3　日付時刻の要素
        13.3.1　要素を取得する
        13.3.2　丸める
        13.3.3　要素を設定する
    13.4　タイムスパン
        13.4.1　duration（期間）
        13.4.2　period（時期）
        13.4.3　interval（間隔）
        13.4.4　まとめ
    13.5　タイムゾーン

第Ⅲ部　プログラム

14章　magrittrでパイプ
    14.1　はじめに
        14.1.1　用意するもの
    14.2　パイプの代用
        14.2.1　中間ステップ
        14.2.2　元のオブジェクトを書き換える
        14.2.3　関数作成
        14.2.4　パイプを使う
    14.3　パイプを使ってはいけないとき
    14.4　magrittrの他のツール

15章　関数
    15.1　はじめに
        15.1.1　用意するもの
    15.2　関数を書くべきとき
    15.3　関数は人間とコンピュータのためのもの
    15.4　条件実行
        15.4.1　条件
        15.4.2　複合条件
        15.4.3　コードのスタイル
    15.5　関数の引数
        15.5.1　名前の選択
        15.5.2　値をチェックする
        15.5.3　3ドット（ ...）
        15.5.4　遅延評価
    15.6　戻り値
        15.6.1　明示的リターン文
        15.6.2　パイプにできる関数を書く
    15.7　環境

16章　ベクトル
    16.1　はじめに
        16.1.1　用意するもの
    16.2　ベクトルの基本
    16.3　アトミックベクトルで重要な型
        16.3.1　論理ベクトル
        16.3.2　数値ベクトル
        16.3.3　文字ベクトル
        16.3.4　欠損値
    16.4　アトミックベクトルを使う
        16.4.1　型強制
        16.4.2　テスト関数
        16.4.3　スカラーとリサイクル規則
        16.4.4　ベクトルの名前付け
        16.4.5　要素抽出
    16.5　再帰ベクトル（リスト）
        16.5.1　リストの可視化
        16.5.2　要素抽出
        16.5.3　調味料のリスト
    16.6　属性
    16.7　強化ベクトル
        16.7.1　ファクタ
        16.7.2　日付と日付時刻
        16.7.3　tibble

17章　purrrでイテレーション
    17.1　はじめに
        17.1.1　用意するもの
    17.2　forループ
    17.3　forループのバリエーション
        17.3.1　既存オブジェクトの変更
        17.3.2　ループパターン
        17.3.3　出力長不明
        17.3.4　シーケンス長不明
    17.4　forループと関数型
    17.5　マップ関数
        17.5.1　ショートカット
        17.5.2　基本 R
    17.6　失敗の処理
    17.7　複数引数へのマップ
        17.7.1　さまざまな関数を呼び出す
    17.8　ウォーク
    17.9　forループの他のパターン
        17.9.1　述語関数
        17.9.2　reduceとaccumulate

第Ⅳ部　モデル

18章　modelrを使ったモデルの基本
    18.1　はじめに
        18.1.1　用意するもの
    18.2　単純なモデル
    18.3　モデルの可視化
        18.3.1　予測
        18.3.2　残差
    18.4　フォーミュラとモデルファミリー
        18.4.1　カテゴリ変数
        18.4.2　交互作用（連続とカテゴリ）
        18.4.3　交互作用（ 2連続変数）
        18.4.4　変換
    18.5　欠損値
    18.6　他のモデルファミリー

19章　モデル構築
    19.1　はじめに
        19.1.1　用意するもの
    19.2　なぜ低品質ダイヤモンドの方が高価なのか
        19.2.1　価格とカラット
        19.2.2　さらに複雑なモデル
    19.3　何が 1日の便数に影響するか
        19.3.1　曜日
        19.3.2　シーズンの土曜日効果
        19.3.3　計算した変数
        19.3.4　年間の日：別のアプローチ
    19.4　モデルについてさらに学ぶには

20章　purrrとbroomによる多数のモデル
    20.1　はじめに
        20.1.1　用意するもの
    20.2　gapminder
        20.2.1　入れ子データ
        20.2.2　リスト列
        20.2.3　入れ子解消
        20.2.4　モデル品質
    20.3　リスト列
    20.4　リスト列を作る
        20.4.1　入れ子を使ってリスト列を作る
        20.4.2　ベクトル化関数からリスト列を作る
        20.4.3　多値要約からリスト列を作る
        20.4.4　名前付きリストからリスト列を作る
    20.5　リスト列を単純化
        20.5.1　リストをベクトルに変換
        20.5.2　入れ子解消
    20.6　broomで整理データを作る

第Ⅴ部　コミュニケーション

21章　Rマークダウン
    21.1　はじめに
        21.1.1　用意するもの
    21.2　Rマークダウン
    21.3　マークダウンによるテキストフォーマット
    21.4　コードチャンク
        21.4.1　チャンク名
        21.4.2　チャンクオプション
        21.4.3　表
        21.4.4　キャッシュ
        21.4.5　グローバルオプション
        21.4.6　インラインコード
    21.5　トラブルシューティング
    21.6　YAMLヘッダ
        21.6.1　パラメータ
        21.6.2　参考文献と引用
    21.7　さらに学ぶために

22章　ggplot2でコミュニケーションのためのグラフ作成
    22.1　はじめに
        22.1.1　用意するもの
    22.2　ラベル
    22.3　アノテーション
    22.4　スケール
        22.4.1　座標軸目盛と凡例のキー
        22.4.2　凡例の配置
        22.4.3　スケールの入れ替え
    22.5　ズーミング
    22.6　テーマ
    22.7　プロットを保存する
        22.7.1　図のサイズ
        22.7.2　他の重要なオプション
    22.8　さらに学ぶために

23章　Rマークダウンフォーマット
    23.1　はじめに
    23.2　出力オプション
    23.3　文書
    23.4　ノートブック
    23.5　プレゼンテーション
    23.6　ダッシュボード
    23.7　インタラクティブな要素
        23.7.1　htmlwidgets
        23.7.2　Shiny
    23.8　ウェブサイト
    23.9　他のフォーマット
    23.10　さらに学ぶために

24章　Rマークダウンワークフロー

訳者あとがき
索引

Rではじめるデータサイエンス

正誤表

1刷正誤表

目次

関連書籍