Sparkによる実践データ解析

Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills 著 ; 石川有 監訳 ; 玉川竜司 訳

本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。

「BOOKデータベース」より

[目次]

  • ビッグデータの分析
  • ScalaとSparkによるデータ分析の紹介
  • 音楽のレコメンドとAudioscrobblerデータセット
  • 決定木を使った森林被覆の予測
  • K平均クラスタリングを使ったネットワークトラフィックにおける異常の検出
  • 潜在意味解析を使ったWikipediaの理解
  • GraphXを使った共起ネットワークの分析
  • ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析
  • モンテカルロシミュレーションによる金融リスクの推定
  • ゲノムデータの分析とBDGプロジェクト
  • PySparkとThunderを使った神経画像データの分析
  • Sparkの詳細
  • MLlib Pipelines API
  • SparkRについて
  • SparkのJVM、OSレベルのチューニングによる高速化

「BOOKデータベース」より

この本の情報

書名 Sparkによる実践データ解析
著作者等 Laserson, Uri
Owen, Sean
Ryza, Sandy
玉川 竜司
石川 有
Wills Josh
ウィルス ジョシュ
オーエン ショーン
ラサーソン ユーリ
ライザ サンディ
書名ヨミ スパーク ニ ヨル ジッセン データ カイセキ : ダイキボ データ ノ タメ ノ キカイ ガクシュウ ジレイシュウ
書名別名 Advanced Analytics with Spark

大規模データのための機械学習事例集
出版元 オライリー・ジャパン : オーム社
刊行年月 2016.1
ページ数 309p
大きさ 24cm
ISBN 978-4-87311-750-8
NCID BB20471645
※クリックでCiNii Booksを表示
全国書誌番号
22698808
※クリックで国立国会図書館サーチを表示
言語 日本語
原文言語 英語
出版国 日本
この本を: 
このエントリーをはてなブックマークに追加

このページを印刷

外部サイトで検索

この本と繋がる本を検索

ウィキペディアから連想