Cloudera Impala

Ebook Storeで電子版を購入:
価格0円
カートに入れる

内容

大規模並列処理(MPP)エンジンであり、Hadoopのデータに対してSQLを用いてクエリを実行できるソフトウェアImpalaについて紹介する書籍です。ビッグデータのワークフロー全体から、またRDBMS、OS、そしてHadoopといった読者の背景知識を元にして、Impalaが実現する機能や役割を紹介します。なお本書はEbook版のみのリリースとなります。

関連書籍

目次

イントロダクション

1章 ビッグデータのエコシステムにおけるImpalaの立ち位置

2章 ビッグデータのワークフローにおけるImpalaの場所
    柔軟性
    パフォーマンス

3章 RDBMSの背景知識から見たImpala
    標準的なSQL
    ストレージ、ストレージ、ストレージ
    数十億行に及ぶデータ
    Impalaとデータウェアハウスの相似点
    Impalaでの初めてのクエリ
    Impalaのテーブルへのデータの取り込み

4章 UnixあるいはLinuxの背景知識から見るImpala
    管理
    ファイルとディレクトリ
    SQL文とUnixコマンドの比較
    簡単なUnixコマンドの例

5章 Apache Hadoopの背景知識から見るImpala
    Apache Hive
    Apache HBase
    MapReduceとApache Pig
    スキーマオンリード

6章 Impalaを使いはじめましょう
    この先の参考資料及びダウンロードリンク

7章 まとめ
    この先の参考資料及びダウンロードリンク