2. はじめに — 「impalaがHadoop MapReduceのHiveより1桁速い」(※)と聞 いて、普段業務にて使用しているHiveより本当に速いのかを検 証した — 普段の業務では… — CDH3でHadoopクラスタを構築 — WebのアクセスログをSnappyで圧縮してRCFileでHDFSに保存 — Map処理出力とReduce処理出力も共にSnappyで圧縮 — Thriftサービス経由でPHPからHiveでクエリを実行 ※出典 Cloudera Impala:Apache Hadoopで実現する、リアルのためのリア ルタイムクエリ