ビューティフルデータ

[cover photo]
  • 2011年02月 発行
  • 400ページ
  • ISBN978-4-87311-489-7
  • フォーマット Print PDF
  • 原書: Beautiful Data

オライリー・ジャパンで書籍を購入:
定価3,672円

Ebook Storeで電子版を購入:
価格2,938円

現在、多くの企業、公的機関、研究者が業務を通じて入手した大量のデータをオンラインに公開しています。またユーザ自身も日々膨大なコンテンツを生み出しています。それらのデータは、創造的な方法で、収集、処理、分析、可視化することにより、それ以前とはまったく異なる価値を持ちはじめます。本書『ビューティフルデータ』は、20本のエッセイを通して、大規模データの利用に関する現状と今後の可能性を伝える書籍です。Yahoo!、Facebook、Googleに在籍するエンジニアが執筆した基盤技術の開発ストーリーから、火星探査機の画像処理プログラム、レーザースキャナーによって撮影されたミュージックビデオ、国勢調査、犯罪レポート、投票行動などの可視化を通じた分析まで、幅広い分野にわたる先進的な事例を紹介し、データのなかに新しい意味を見出すための考え方を提供します。

関連書籍

ビジュアライジング・データ
ビューティフルアーキテクチャ
ビューティフルコード
ビューティフルセキュリティ
ビューティフルテスティング

はじめに

1章 データの中に生活を見る(Nathan You)
 PEIR(Personal Environmental Impact Report)
 YFD(your.flowingdata)
 パーソナルデータの収集
 データの蓄積
 データ処理
 データの可視化
 まとめ
 参加するには

2章 ビューティフル・ピープル
─ ユーザの存在を忘れることなくデータ収集の手段をデザインする
   (Jonathan Follett、Matthew Holm)
 はじめに:ユーザへの共感がこれからのデザインの基本原則
 プロジェクト:あるラグジュアリー新製品のための顧客調査
 データ収集に伴う特有の課題
 我々のデザインについて
 結果と考察

3章 火星上での組み込み画像処理(J. M. Hughes)
 概要 
 はじめに
 背景知識
 詰めるか、詰めまいか
 3つのタスク
 スロットへの画像格納
 画像の受け渡し:3つのタスク間でのやりとり
 写真を取得する:画像のダウンロードと処理
 画像圧縮
 ダウンリンク、あとは地球へまっしぐら
 おわりに

4章 PNUTShellにおけるクラウドストレージの設計
(Brian F. Cooper、Raghu Ramakrishnan、Utkarsh Srivastava)
 はじめに
 データの更新
 複雑なクエリ
 他のシステムとの比較
 まとめ

5章 情報プラットフォームと データサイエンティストの登場
    (Jeff Hammerbacher)
 図書館と脳
 自己認識能力を持つようになったFacebook
 ビジネスインテリジェンスシステム
 データウェアハウスの停止と復活
 データウェアハウスを超えて
 チーターとゾウ
 データの不合理な有効性
 新しいツールと応用研究
 MADスキルとCosmos
 データスペースとしての情報プラットフォーム
 データサイエンティスト
 まとめ

6章 写真アーカイブの地理学的な美(Jason Dykes、Jo Wood)
 地理データの中の美:Geograph
 視覚化と美、そしてツリーマップ
 Geographの単語頻度における地理学的観点
 発見の中の美
 考察とまとめ

7章 データの自己発見(Jeff Jonas、Lisa Sokol)
 はじめに
 ジャスト・イン・タイム発見の利点
 ルーレットでイカサマをする
 企業内発見能力
 横串検索ですべては解決しない
 ディレクトリ:プライスレス
 関連性:問題は何か? それは誰にとって問題なのか?
 構成要素と注意点
 プライバシーについての考察
 まとめ

8章 リアルタイムのポータブルデータ(Jud Valeski)
 はじめに
 最新技術
 ソーシャルデータの標準化
 まとめ:Gnip経由での仲介

9章 ディープウェブを活用する(Alon Halevy、Jayant Madhaven)
 ディープウェブとは
 ディープウェブへのアクセスを提供するための2つの手法
 まとめと今後について

10章 Radiohead「House of Cards」の プロモーションビデオができるまで
(Aaron Koblin、Valdean Klump)
 ビデオ作成のきっかけ
 データキャプチャ機器
 2つのデータキャプチャシステムを使う利点
 データのキャプチャ「撮影」
 データ処理
 データの後処理
 ビデオの公開
 まとめ

11章 都市データの視覚化(Michal Migurski)
 はじめに
 背景 
 難問の解決
 データサービスの公開
 再検討
 まとめ

12章 sense.usの設計(Jeffrey Heer)
 データの視覚化と社会調査のためのデータ分析
 データ
 データの視覚化
 コラボレーション機能
 探索者と観察者
 まとめ

カラー図版

13章 データでできないこと(Coco Krumme)
 データの導きが得られないとき
 まとめ

14章 自然言語のコーパスデータ(Peter Norvig)
 ワードセグメンテーション
 暗号 
 スペル訂正
 他の適用分野
 議論とまとめ

15章 データの中の生命:DNA物語(Matt Wood、Ben Blackburne)
 データ格納庫としてのDNA
 デジタルストレージとしてのDNA
 データソースとしてのDNA
 DNAの未来

16章 実世界のデータをビューティフルにする
(Jean-Claude Bradley、Rajarshi Guha、Andrew Lang、
  Pierre Lindenbaum Cameron Neylon、Antony Williams、
  Egon Willighagen)
 現実のデータが持つ問題
 実験ノートの生データを公開する
 クラウドソースされたデータを検証する
 ネット上でのデータの表現
 改善サイクルを回す:可視化して新しい実験を見つける
 オープンデータとフリーサービスでデータウェブを構築する

17章 外見のデータ解析:数百万人の社会的ステロタイプ調査
(Brendan O'Connor、Lukas Biewald)
 はじめに
 データの前処理
 データの調査
 年齢、魅力、性別
 タグを見る
 性差のある語はどれ?
 クラスタリンク
 まとめ

18章 ベイエリア・ブルース:住宅市場崩壊の影響
(Hadley Wickham、Deborah F. Swayne、David Poole)
 はじめに
 データをどのように得たのか
 ジオコーディング(Geocoding)
 データのチェック
 分析 
 インフレの影響
 金持ちはより金持ちに、貧乏人はますます貧乏に
 地理的差異
 国勢調査の情報
 サンフランシスコの調査
 まとめ

19章 政治に関するビューティフルデータ
(Andrew Gelman、Jonathan P. Kastellec、Yair Ghitza)
 事例1:選挙区画の再編成と政党の偏り
 事例2:推定値の時系列
 事例3:年齢と票
 事例4:最高裁判事指名に関する世論と上院での投票
 事例5:ペンシルバニア州における党派の局所的な偏り
 まとめ

20章 データをつなぐ(Toby Segaran)
 パブリックなデータには、実際どんなものがあるか
 データの結合が可能にすること
 企業の中で
 データ結合の障害
 解決策
 まとめ

訳者あとがき
索引



Feedback

皆さんのご意見をお聞かせください。ご購入いただいた書籍やオライリー・ジャパンへのご感想やご意見、ご提案などをお聞かせください。より良い書籍づくりやサービス改良のための参考にさせていただきます。
[feedbackページへ]