大規模並列処理(MPP)エンジンであり、Hadoopのデータに対してSQLを用いてクエリを実行できるソフトウェアImpalaについて紹介する書籍です。ビッグデータのワークフロー全体から、またRDBMS、OS、そしてHadoopといった読者の背景知識を元にして、Impalaが実現する機能や役割を紹介します。なお本書はEbook版のみのリリースとなります。
Cloudera Impala
John Russell 著、Cloudera株式会社 監修、玉川竜司 訳
- TOPICS
- Database
- 発行年月日
- 2014年03月
- ISBN
- 978-4-87311-672-3
- 原書
- Cloudera Impala
- FORMAT
- EPUB
目次
イントロダクション
1章 ビッグデータのエコシステムにおけるImpalaの立ち位置
2章 ビッグデータのワークフローにおけるImpalaの場所
柔軟性
パフォーマンス
3章 RDBMSの背景知識から見たImpala
標準的なSQL
ストレージ、ストレージ、ストレージ
数十億行に及ぶデータ
Impalaとデータウェアハウスの相似点
Impalaでの初めてのクエリ
Impalaのテーブルへのデータの取り込み
4章 UnixあるいはLinuxの背景知識から見るImpala
管理
ファイルとディレクトリ
SQL文とUnixコマンドの比較
簡単なUnixコマンドの例
5章 Apache Hadoopの背景知識から見るImpala
Apache Hive
Apache HBase
MapReduceとApache Pig
スキーマオンリード
6章 Impalaを使いはじめましょう
この先の参考資料及びダウンロードリンク
7章 まとめ
この先の参考資料及びダウンロードリンク