![]() ![]() |
大數(shù)據(jù)技術入門——Hadoop+Spark
本書基礎理論、應用開發(fā)以及實際案例相結合,圍繞Hadoop、Spark生態(tài)圈循序漸進地介紹關于大數(shù)據(jù)技術領域中的基礎知識、應用開發(fā)技術和基于Spark的常見機器學習算法,最后以兩個實戰(zhàn)案例全面、系統(tǒng)地應用了本書介紹的基礎知識和應用開發(fā)方法。全書共14章,分別為大數(shù)據(jù)概述、Hadoop簡介及安裝部署、HDFS、MapReduce計算框架、Hive數(shù)據(jù)倉庫、HBase分布式數(shù)據(jù)庫、Spark基礎、Spark RDD彈性分布式數(shù)據(jù)集、Spark SQL、Spark Streaming實時計算框架、Spark Streaming與Flume、Kafka的整合、Spark MLlib 機器學習、實戰(zhàn)案例——分布式優(yōu)惠券后臺應用系統(tǒng)和實戰(zhàn)案例——新聞話題實時統(tǒng)計分析系統(tǒng),書中的每個知識點都有相應的實現(xiàn)代碼和實例。
本書主要面向廣大從事大數(shù)據(jù)分析、應用開發(fā)、機器學習、數(shù)據(jù)挖掘的專業(yè)人員以及從事高校信息技術專業(yè)的教師和高等院校的在讀學生及相關領域的廣大科研人員。
你還可能感興趣
我要評論
|