大規模並列処理(MPP)エンジンであり、Hadoopのデータに対してSQLを用いてクエリを実行できるソフトウェアImpalaについて紹介する書籍です。ビッグデータのワークフロー全体から、またRDBMS、OS、そしてHadoopといった読者の背景知識を元にして、Impalaが実現する機能や役割を紹介します。なお本書はEbook版のみのリリースとなります。
Cloudera Impala
John Russell 著、Cloudera株式会社 監修、玉川竜司 訳
- TOPICS
- Database
- 発行年月日
- 2014年03月
- ISBN
- 978-4-87311-672-3
- 原書
- Cloudera Impala
- FORMAT
- EPUB
目次
イントロダクション 1章 ビッグデータのエコシステムにおけるImpalaの立ち位置 2章 ビッグデータのワークフローにおけるImpalaの場所 柔軟性 パフォーマンス 3章 RDBMSの背景知識から見たImpala 標準的なSQL ストレージ、ストレージ、ストレージ 数十億行に及ぶデータ Impalaとデータウェアハウスの相似点 Impalaでの初めてのクエリ Impalaのテーブルへのデータの取り込み 4章 UnixあるいはLinuxの背景知識から見るImpala 管理 ファイルとディレクトリ SQL文とUnixコマンドの比較 簡単なUnixコマンドの例 5章 Apache Hadoopの背景知識から見るImpala Apache Hive Apache HBase MapReduceとApache Pig スキーマオンリード 6章 Impalaを使いはじめましょう この先の参考資料及びダウンロードリンク 7章 まとめ この先の参考資料及びダウンロードリンク