パターンでわかるHadoop MapReduce

三木大知 著

分散クラスタシステムHadoopは、MapReduceという枠組みを利用して処理を行う。MapReduceはさまざまな分散処理を単純な処理の組み合わせで解決できるHadoopの特徴のひとつである。本書ではHadoopでできるデータ処理をシンプルに解説。「理解しにくい」といわれるMapReduce処理を13の単純なパターンで紹介し、それらを使って「株価分析」「ログ解析」「ワードカウント」から簡単な「クラスタ分析」までを試す。ロジックはJavaに基づく簡易コードを使うほか、手続き型処理系「Pig」を使って説明。自分がHadoopに処理させたいことを実現するための考え方を紹介する。

「BOOKデータベース」より

[目次]

  • ビッグデータとデータの活用
  • Hadoopのエコシステム-Hadoopとオープンソースプロダクト
  • データを分散するって、どういうこと?-分散ファイルシステム
  • ばらばらか、まとめるか、それが問題だ-MapReduceの基本概念
  • 並列処理はパターンで覚えよう-基本的な13の処理パターン
  • とにかく動かしてみよう!-株価チャートの処理
  • 単語を数えるだけでも見えてくる?-テキストの解析
  • 構造がないなら意味を与えればいいじゃない?-アクセスログの分析
  • データとデータをくっつける!-鉄道情報の分析
  • 簡単な分析をしてみよう-クラスタ分析
  • Hadoopべからず集
  • 付録 簡易環境の構築/リファレンス

「BOOKデータベース」より

この本の情報

書名 パターンでわかるHadoop MapReduce
著作者等 三木 大知
書名ヨミ パターン デ ワカル ハドゥープ マップ リデュース : ビッグ データ ノ データ ショリ ニュウモン
書名別名 ビッグデータのデータ処理入門
シリーズ名 NEXT-ONE
出版元 翔泳社
刊行年月 2012.8
ページ数 351p
大きさ 23cm
ISBN 978-4-7981-2806-1
NCID BB10208053
※クリックでCiNii Booksを表示
全国書誌番号
22142570
※クリックで国立国会図書館サーチを表示
言語 日本語
出版国 日本
この本を: 
このエントリーをはてなブックマークに追加

Yahoo!ブックマークに登録
この記事をクリップ!
Clip to Evernote
このページを印刷

外部サイトで検索

この本と繋がる本を検索

ウィキペディアから連想