本書基于Python 3.10版本,使用Jupyter Notebook進行編程;以項目任務(wù)驅(qū)動模式,系統(tǒng)地闡述了Python數(shù)據(jù)分析的相關(guān)知識,內(nèi)容包括Python數(shù)據(jù)分析概述、NumPy數(shù)值計算實戰(zhàn)、pandas統(tǒng)計分析實戰(zhàn)、Matplotlib數(shù)據(jù)可視化實戰(zhàn)、Python數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、基于sklearn的數(shù)據(jù)分析實戰(zhàn)、電商產(chǎn)品評論數(shù)據(jù)情感分析實戰(zhàn);通過多個實戰(zhàn)任務(wù)的學(xué)習(xí)與練習(xí),讓讀者在短時間內(nèi)掌握Python數(shù)據(jù)分析的技術(shù)和方法。為了方便讀者學(xué)習(xí),本書附有配套源代碼、教學(xué)PPT、題庫、教學(xué)視頻、教學(xué)設(shè)計等資源。本書可作為高職院校人工智能、大數(shù)據(jù)相關(guān)專業(yè)數(shù)據(jù)分析課程的教材,也可作為從事數(shù)據(jù)分析工作的相關(guān)人員的參考用書。
蘆婭云,女,中共黨員,碩士,講師,工程師,“雙師”型教師, 曾獲高教創(chuàng)新教學(xué)論文一等獎,湖北省信息化教學(xué)設(shè)計大賽二等獎,全國微課大賽三等獎,廣東職協(xié)論文二等獎。參與省級科研成果獎項2項、獲個人軟著專利5項、公開發(fā)表省級國家級期刊論文10余篇、作為主要編著人參與編寫教材4本,其中,與騰訊公司合作主編教材《微信小程序開發(fā)》被評為廣東省省級精品課程。
項目1 Python數(shù)據(jù)分析概述 1
任務(wù)1.1 認識數(shù)據(jù)分析 2
任務(wù)1.2 搭建Anaconda環(huán)境 6
任務(wù)1.3 基于Jupyter Notebook創(chuàng)建餐飲訂單數(shù)據(jù)分析項目 12
項目2 NumPy數(shù)值計算實戰(zhàn) 15
任務(wù)2.1 數(shù)據(jù)的讀取與顯示 16
任務(wù)2.2 利用NumPy進行統(tǒng)計分析 18
項目3 pandas統(tǒng)計分析實戰(zhàn) 23
任務(wù)3.1 從CSV文件中讀取餐飲訂單數(shù)據(jù) 24
任務(wù)3.2 創(chuàng)建餐飲訂單數(shù)據(jù)的DataFrame 30
任務(wù)3.3 利用行列索引查看餐飲訂單數(shù)據(jù)的子集 34
任務(wù)3.4 生成餐飲訂單數(shù)據(jù)的銷售額 36
任務(wù)3.5 按給定的時間周期統(tǒng)計菜品或餐飲店的銷售額 38
任務(wù)3.6 按菜品拆分銷售額數(shù)據(jù) 43
項目4 Matplotlib數(shù)據(jù)可視化實戰(zhàn) 50
任務(wù)4.1 基于pyplot()函數(shù)繪制圖表和圖像 51
任務(wù)4.2 繪制餐飲訂單數(shù)據(jù)中日銷售額的散點圖 52
任務(wù)4.3 繪制餐飲訂單數(shù)據(jù)中某家餐飲店月銷售額的折線圖 54
任務(wù)4.4 繪制餐飲訂單數(shù)據(jù)中各家餐飲店月銷售額的直方圖 57
任務(wù)4.5 繪制餐飲訂單數(shù)據(jù)中各家餐飲店月銷售額的餅圖 59
任務(wù)4.6 繪制餐飲訂單數(shù)據(jù)中月銷售數(shù)量前五的銷售額的箱形圖 61
項目5 Python數(shù)據(jù)探索 64
任務(wù)5.1 餐飲訂單數(shù)據(jù)的缺失值分析 65
任務(wù)5.2 餐飲訂單數(shù)據(jù)的異常值分析 68
任務(wù)5.3 餐飲訂單數(shù)據(jù)的分布分析 69
任務(wù)5.4 餐飲訂單數(shù)據(jù)的周期性分析 72
任務(wù)5.5 餐飲訂單數(shù)據(jù)的相關(guān)性分析 74
任務(wù)5.6 餐飲訂單數(shù)據(jù)的貢獻度分析 75
任務(wù)5.7 餐飲訂單數(shù)據(jù)的統(tǒng)計量分析 77
項目6 數(shù)據(jù)預(yù)處理 79
任務(wù)6.1 清洗餐飲訂單數(shù)據(jù) 80
任務(wù)6.2 集成餐飲訂單數(shù)據(jù) 84
任務(wù)6.3 規(guī)約餐飲訂單數(shù)據(jù) 85
任務(wù)6.4 轉(zhuǎn)換餐飲訂單數(shù)據(jù) 87
任務(wù)6.5 分組與聚合餐飲訂單數(shù)據(jù) 89
項目7 基于sklearn的數(shù)據(jù)分析實戰(zhàn) 93
任務(wù)7.1 預(yù)處理廣州珠江水道水質(zhì)化驗數(shù)據(jù) 94
任務(wù)7.2 劃分廣州珠江水道水質(zhì)化驗數(shù)據(jù)的訓(xùn)練集與測試集 99
任務(wù)7.3 構(gòu)建與評價廣州珠江水道總氮濃度的回歸模型 101
任務(wù)7.4 構(gòu)建廣州珠江水道水質(zhì)類別的決策樹模型 103
任務(wù)7.5 基于餐飲訂單數(shù)據(jù)的銷售額預(yù)測分析 105
任務(wù)7.6 基于餐飲訂單數(shù)據(jù)的菜品關(guān)聯(lián)分析 110
任務(wù)7.7 基于iris數(shù)據(jù)集的鳶尾花聚類分析 115
項目8 電商產(chǎn)品評論數(shù)據(jù)情感分析實戰(zhàn) 120
任務(wù)8.1 電商產(chǎn)品評論數(shù)據(jù)的分詞處理 121
任務(wù)8.2 電商產(chǎn)品評論數(shù)據(jù)的詞性標注 124
任務(wù)8.3 電商產(chǎn)品評論數(shù)據(jù)的停用詞去除 127
任務(wù)8.4 電商產(chǎn)品評論數(shù)據(jù)的文本分類 132
任務(wù)8.5 電商產(chǎn)品評論數(shù)據(jù)的文本相似度計算 138
任務(wù)8.6 電商產(chǎn)品評論數(shù)據(jù)的文本情感分析 142