本書主要講解Hadoop的分布式文件系統(tǒng)、MapReduce編程模型和Spark大數據處理技術。全書共12章,具體包括大數據概述、Hadoop大數據處理架構、HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架、HBase分布式數據庫、Spark概述、基于Scala的Spark編程、Windows環(huán)境下Spark綜合編程、Spark SQL結構化數據處理、Spark Streaming流計算、Spark GraphX圖計算、項目實訓:《平凡的世界》孫家人物關系圖分析。 本書可作為高等院校計算機、信息管理、軟件工程、大數據、人工智能等相關專業(yè)的大數據課程教材,也可供企業(yè)中從事大數據開發(fā)的工程師和科技工作者參考。
1.融入應用場景,理論講解與動手實踐相結合。
2.適配大數據處理主流技術,提供大量實踐案例。
3.基礎知識 案例指導 綜合應用。
本書結合編者多年的程序設計、系統(tǒng)開發(fā)與課程講授的經驗,由淺入深、循序漸進地展開,使讀者能夠系統(tǒng)、全面地掌握程序設計的理論與應用。
同濟大學計算機軟件與理論專業(yè)博士,鄭州輕工業(yè)大學軟件學院教師。研究方向:數據分析、機器學習、并行分布式處理等。近年在軟件學報、電子學報、計算機研究與發(fā)展、通信學報等核心刊物上發(fā)表學術論文10余篇,2019年7月在清華大學出版社以第一作者身份出版高等院校信息技術規(guī)劃教材《Python語言程序設計(微課版)》
第 1章 Python語言概述 1
1.1 Python語言特點 2
1.2 Python應用領域 3
1.3 下載和安裝Python軟件 3
1.4 編寫和執(zhí)行Python代碼的方式 6
1.4.1 用命令行格式的Python Shell編寫和執(zhí)行代碼 6
1.4.2 用帶圖形界面格式的Python Shell編寫和執(zhí)行交互式代碼 7
1.4.3 用帶圖形界面格式的Python Shell編寫和執(zhí)行程序代碼 8
1.5 Python注釋 9
1.5.1 單行注釋 9
1.5.2 多行注釋 9
1.6 在線幫助 9