第1部 Hadoopの基礎(Hadoopの基礎知識
MapReduceアプリケーションの活用例 ほか)
第2部 MapReduceアプリケーション開発(MapReduceプログラミングの基礎-Javaによる開発(1)
MapReduceプログラミングの応用-Javaによる開発(2) ほか)
第3部 Hadoopクラスタの構築と運用(環境構築の効率化
可用性の向上 ほか)
第4部 Hadoopを活用するための技術(Hadoopチューニング
分散型データベースHBase ほか)
Hadoopは、多数のコンピュータを束ねて極めて大きな処理ができるオープンソースソフトウェアです。MapReduceというJavaフレームワークでプログラミングできるほか、標準入出力が使えるHadoopStreaming、フロー記述環境Pig、SQL風インターフェイスであるHiveなど多彩な環境を備えています。また、行指向DBのHBaseやログコレクタのFluentdの基盤としても利用できるなど、Hadoopには高い汎用性があります。第2版である本書では、実システムで多く利用されているCloudera社のCDH4ディストリビューションを軸に、システムの拡張や監視、メンテナンス方法など、より現場での利用を意識した最新のノウハウをまとめました。Hadoopを導入してその効果を得るためのいろいろな情報をまとめた一冊です。
・ログ分析基盤のアーキテクチャを振り返る [2019-04-17に投稿]