【レビュー】詳解Apache Spark


【PR】この記事には広告を含む場合があります
  • 出版情報
  • ・著者:下田倫大/著 今井雄太/著 師岡一成/著 加嵜長門/著 小宮篤史/著 田中裕一/著 ほか
  • ・出版日:2016-06
  • ・ページ数:337P
  • レビュー数
  • ・週間:0記事
  • ・月間:0記事
  • ・年間:0記事
  • ・全期間:3記事

ジャンルTop10選

目次

第1章 Sparkの基礎
第2章 Sparkの導入
第3章 RDD
第4章 クラスタ構築と運用
第5章 DataFrameとSpark SQL
第6章 Spark Streaming
第7章 MLlib
第8章 GraphX
Appendix YARN

概要

Apach Sparkはより高速にビッグデータを処理するための分散処理フレームワークです。SQLインターフェースや機械学習などの機能が標準で組み込まれ、バッチ処理だけでなくストリーミング処理や対話的な処理にも対応できるため、さまざまなシーンのデータ分析を強力にサポートします。本書では、Sparkの基礎であるRDDのしくみ、Sparkを構成する各コンポーネントの機能を理解するところからはじめます。さらにSparkクラスタの構築と運用、構造化データを処理するためのDataFrame APIとSpark SQL、ストリーミング処理のためのSpark Streaming、機械学習ライブラリMLlib、グラフ処理のためのGraphXの各コンポーネントの実践的な利用方法を基礎から徹底的に解説します。

レビューの一覧

 ・Sparkのアーキテクチャと処理の流れ[2021-08-16に投稿]

 ・Apache Spark Streamingをローカルでサクっと動かす[2020-06-21に投稿]

 ・Apache Sparkの概要[2020-01-16に投稿]


amazonで確認