Cloudera Impala

[cover photo]
TOPICS
Database
発行年月日
ISBN
978-4-87311-672-3
原書
Cloudera Impala
FORMAT
EPUB

大規模並列処理(MPP)エンジンであり、Hadoopのデータに対してSQLを用いてクエリを実行できるソフトウェアImpalaについて紹介する書籍です。ビッグデータのワークフロー全体から、またRDBMS、OS、そしてHadoopといった読者の背景知識を元にして、Impalaが実現する機能や役割を紹介します。なお本書はEbook版のみのリリースとなります。

目次

イントロダクション

1章 ビッグデータのエコシステムにおけるImpalaの立ち位置

2章 ビッグデータのワークフローにおけるImpalaの場所
    柔軟性
    パフォーマンス

3章 RDBMSの背景知識から見たImpala
    標準的なSQL
    ストレージ、ストレージ、ストレージ
    数十億行に及ぶデータ
    Impalaとデータウェアハウスの相似点
    Impalaでの初めてのクエリ
    Impalaのテーブルへのデータの取り込み

4章 UnixあるいはLinuxの背景知識から見るImpala
    管理
    ファイルとディレクトリ
    SQL文とUnixコマンドの比較
    簡単なUnixコマンドの例

5章 Apache Hadoopの背景知識から見るImpala
    Apache Hive
    Apache HBase
    MapReduceとApache Pig
    スキーマオンリード

6章 Impalaを使いはじめましょう
    この先の参考資料及びダウンロードリンク

7章 まとめ
    この先の参考資料及びダウンロードリンク