本書以任務驅動為主線,圍繞企業(yè)級應用進行項目任務設計,介紹了平臺的本地模式安裝、偽分布式模式安裝及完全分布式模式安裝,并基于Hadoop 2.X生態(tài)系統(tǒng),全面講解了Hive環(huán)境搭建與基本操作、ZooKeeper環(huán)境搭建與基本操作、HBase環(huán)境搭建與基本操作、Hadoop常用工具組件的安裝與應用、集群搭建與管理,以及Hadoop平臺應用綜合案例等相關知識及操作技能。
本書具有實用性和可操作性強、語言精練、通俗易懂等特點,可作為高等院校大數(shù)據(jù)應用專業(yè)、軟件技術專業(yè)、云計算技術與應用專業(yè)的教材,也可作為從事大數(shù)據(jù)分析、云計算應用等工作的技術人員的參考用書。
1.基于企業(yè)級項目,以任務驅動為主線,便于教師教學,學生理解。
2.配套資源齊全,配有PPT課件等多種教學資源。
3.企業(yè)配套資源,院校完善體系結構。
米洪,主持省級項目3項;發(fā)表北大核心論文5篇;學院交通物聯(lián)網(wǎng)技術科技創(chuàng)新團隊骨干成員;江蘇省高等職業(yè)院校教師專業(yè)帶頭人訪問學者(東南大學);江蘇省高!扒嗨{工程”優(yōu)秀中青年骨干教師。
項目1 認識大數(shù)據(jù) 1
學習目標 1
項目描述 1
任務1.1 認知大數(shù)據(jù),完成系統(tǒng)環(huán)境搭建 2
任務描述 2
任務目標 2
知識準備 2
任務實施 17
任務1.2 Hadoop環(huán)境搭建 23
任務描述 23
任務目標 23
知識準備 23
任務實施 24
項目2 Hive環(huán)境搭建與基本操作 40
學習目標 40
項目描述 40
任務2.1 Hive的安裝與配置 40
任務描述 40
任務目標 41
知識準備 41
任務實施 45
任務2.2 Hive操作 52
任務描述 52
任務目標 52
知識準備 52
任務實施 63
項目3 ZooKeeper環(huán)境搭建與基本操作 70
學習目標 70
項目描述 70
任務3.1 ZooKeeper的安裝與配置 70
任務描述 70
任務目標 71
知識準備 71
任務實施 79
任務3.2 ZooKeeper CLI操作 87
任務描述 87
任務目標 88
知識準備 88
任務實施 90
項目4 HBase環(huán)境搭建與基本操作 96
學習目標 96
項目描述 96
任務4.1 HBase的安裝與配置 96
任務描述 96
任務目標 96
知識準備 97
任務實施 104
任務4.2 HBase Shell操作 113
任務描述 113
任務目標 114
知識準備 114
任務實施 115
項目5 Hadoop常用工具組件的安裝與應用 122
學習目標 122
項目描述 122
任務5.1 Sqoop的安裝與應用 122
任務描述 122
任務目標 123
知識準備 123
任務實施 127
任務5.2 Pig的安裝與應用 132
任務描述 132
任務目標 132
知識準備 132
任務實施 139
任務5.3 Flume的安裝與應用 149
任務描述 149
任務目標 149
知識準備 149
任務實施 150
項目6 集群搭建與管理 155
學習目標 155
項目描述 155
任務6.1 搭建Ambari Hadoop系統(tǒng) 155
任務描述 155
任務目標 155
知識準備 156
任務實施 160
任務6.2 使用Ambari管理Hadoop集群 169
任務描述 169
任務目標 169
知識準備 169
任務實施 169
項目7 Hadoop平臺應用綜合案例 176
學習目標 176
項目描述 176
任務7.1 本地數(shù)據(jù)集上傳到數(shù)據(jù)倉庫Hive 176
任務描述 176
任務目標 176
任務實施 177
任務7.2 使用Hive進行簡單的數(shù)據(jù)分析 180
任務描述 180
任務目標 180
任務實施 180
任務7.3 Hive、MySQL、HBase數(shù)據(jù)的互導 181
任務描述 181
任務目標 182
任務實施 182