Python數(shù)據(jù)科學(xué):技術(shù)詳解與商業(yè)實(shí)踐
定 價(jià):99 元
當(dāng)前圖書(shū)已被 17 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:常國(guó)珍 趙仁乾
- 出版時(shí)間:2018/7/1
- ISBN:9787111603092
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
本書(shū)共19章,第1章介紹數(shù)據(jù)科學(xué)中涉及的基本領(lǐng)域;第2~3章介紹與數(shù)據(jù)工作緊密相關(guān)的Python語(yǔ)言基礎(chǔ);第4章講解描述性統(tǒng)計(jì)分析在宏觀業(yè)務(wù)領(lǐng)域的分析;第5章講解數(shù)據(jù)規(guī)整、清洗的重要技能;第6章介紹數(shù)據(jù)科學(xué)領(lǐng)域?qū)嵱玫乃拇蠼y(tǒng)計(jì)檢驗(yàn);第7章講解當(dāng)被解釋變量為連續(xù)變量時(shí),如何使用線性回歸作預(yù)測(cè);第8章講解使用邏輯回歸作評(píng)分卡模型;第9章講解另外一個(gè)可解釋模型決策樹(shù)。第10~12章分別講解了BP神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、近鄰域、支持向量機(jī)的原理和在決策類(lèi)模型中的運(yùn)用;第13~14章作為一個(gè)整體講解商業(yè)分析場(chǎng)景下的信息壓縮;第15章以產(chǎn)品推薦作為案例,講解發(fā)現(xiàn)事件與事件伴生關(guān)系的關(guān)聯(lián)分析和序列分析算法;第16章使用欺詐識(shí)別案例講解當(dāng)被解釋變量分布極 端不平衡時(shí)的處理方法;第17章繼續(xù)使用欺詐識(shí)別案例講解集成學(xué)習(xí)算法;第18章講解了使用效應(yīng)分解和ARIMA方法實(shí)現(xiàn)宏觀業(yè)務(wù)指標(biāo)預(yù)測(cè);第19章用案例展現(xiàn)了分類(lèi)和聚類(lèi)模型的CRISP-DM和SEMMA流程。
(1)作者在IT行業(yè)有超過(guò)20年的研發(fā)經(jīng)驗(yàn),在金融和數(shù)據(jù)科學(xué)領(lǐng)域有超過(guò)12年的實(shí)踐經(jīng)驗(yàn),是金融界知名的數(shù)據(jù)科學(xué)家,在R/Python/SAS等技術(shù)領(lǐng)域有深厚的積累。
(2)本書(shū)從3個(gè)維度展開(kāi),技術(shù)維度:全面講解數(shù)據(jù)分析、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的核心技術(shù);業(yè)務(wù)維度,圍繞具體的業(yè)務(wù)生命周期展開(kāi)技術(shù)知識(shí)點(diǎn)的講解;實(shí)踐維度,列舉的全部是商業(yè)案例,通過(guò)案例為數(shù)據(jù)科學(xué)從業(yè)者提供工作模板。
前言本書(shū)是一本集數(shù)據(jù)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)為一體,面向商業(yè)實(shí)戰(zhàn)的養(yǎng)成式學(xué)習(xí)手冊(cè)。為有志從事數(shù)據(jù)科學(xué)工作的讀者提供系統(tǒng)化的學(xué)習(xí)路徑,使讀者掌握數(shù)據(jù)科學(xué)的理念、思路與分析步驟。
本書(shū)力圖淡化技術(shù),對(duì)于方法的介紹也盡量避免涉及過(guò)多的數(shù)學(xué)內(nèi)容,而且都輔以圖形進(jìn)行形象地展現(xiàn)。本書(shū)將不同算法看作功能各異的工具,比如用于煮飯的悶鍋、用于炒菜的炒鍋,每種工具的操作方式都應(yīng)該遵循相應(yīng)的說(shuō)明書(shū),因此對(duì)于每種算法我們強(qiáng)調(diào)其假設(shè)、適用條件與商業(yè)數(shù)據(jù)分析主題的匹配。我們?cè)趯?shí)踐教學(xué)中發(fā)現(xiàn),業(yè)務(wù)經(jīng)驗(yàn)豐富和有較好商業(yè)模式理解能力的學(xué)員,在掌握數(shù)據(jù)科學(xué)的技能方面具有明顯的優(yōu)勢(shì)。這主要是因?yàn)檫@類(lèi)學(xué)員有較強(qiáng)的思辨能力和分析能力,學(xué)習(xí)的目的性和質(zhì)量意識(shí)較強(qiáng),不只是簡(jiǎn)單地模仿和套用數(shù)學(xué)公式,所以本書(shū)也注重對(duì)讀者思辯能力和分析能力的培養(yǎng)。
本書(shū)相當(dāng)于Python的數(shù)據(jù)科學(xué)工具箱,專(zhuān)門(mén)提供了不同數(shù)據(jù)運(yùn)用主題的操作框架。不同于一般泛泛而講的運(yùn)用案例,落地性強(qiáng),便于讀者實(shí)際運(yùn)用。
本書(shū)不是一本教科書(shū)或案例集,而是一本提供數(shù)據(jù)挖掘路線圖與解決方案的實(shí)戰(zhàn)手冊(cè)。2014年我們編寫(xiě)了一套使用SAS進(jìn)行商業(yè)數(shù)據(jù)分析的書(shū),得到了讀者的認(rèn)可。2016年我們同時(shí)啟動(dòng)了R和Python數(shù)據(jù)科學(xué)方面的寫(xiě)作工作。我們?cè)赑ython上投入了數(shù)倍于R的精力,但是R的書(shū)如期問(wèn)世,而本書(shū)卻推遲了近一年,原因是Python目前還無(wú)法滿(mǎn)足精細(xì)數(shù)據(jù)分析的要求。
在數(shù)據(jù)分析領(lǐng)域,如果說(shuō)SAS是沖鋒槍?zhuān)荝就是手槍?zhuān)琍ython就是匕首。打過(guò)CS的同學(xué)都知道,使用沖鋒槍不需要槍法有多好,只要資金充足,新手都能得心應(yīng)手。而使用手槍的必定是槍法很準(zhǔn)的老手。出門(mén)使用匕首殺敵的,必定是神級(jí)選手。但是切記,不是使用匕首就是神級(jí),只有使用匕首殺敵并活下來(lái)的才是。Python雖然語(yǔ)法優(yōu)美,開(kāi)發(fā)效率和執(zhí)行效率均高,但是它是開(kāi)發(fā)工程師的語(yǔ)言,不是面向分析師的,因此分析師要想需要造很多輪子。Python雖然目前方興未艾,但是在數(shù)據(jù)科學(xué)領(lǐng)域的路還很漫長(zhǎng),投資于未來(lái)是艱苦而收益頗豐的。作為用好Python,一部由工作在一線的文科背景作者編寫(xiě)的數(shù)據(jù)科學(xué)圖書(shū),本書(shū)力圖降低Python的學(xué)習(xí)難度,嘗試提供不同分析主題的數(shù)據(jù)科學(xué)工作模板,滿(mǎn)足億萬(wàn)文科生的數(shù)字化轉(zhuǎn)型需求。
讀者對(duì)象(1)大數(shù)據(jù)營(yíng)銷(xiāo)分析人員營(yíng)銷(xiāo)是大數(shù)據(jù)落地項(xiàng)目最多的領(lǐng)域,也是數(shù)據(jù)科學(xué)活躍的重鎮(zhèn),數(shù)據(jù)分析能力將是衡量營(yíng)銷(xiāo)分析人員最重要的指標(biāo)?梢哉f(shuō)未來(lái)的每一位營(yíng)銷(xiāo)分析人員,都必須是數(shù)據(jù)科學(xué)工作者。
(2)顧客關(guān)系管理人員和數(shù)據(jù)產(chǎn)品經(jīng)理隨著工業(yè)40時(shí)代的到來(lái),標(biāo)準(zhǔn)化制造將逐步被定制化制造取代。因此對(duì)客戶(hù)價(jià)值、客戶(hù)滿(mǎn)意度與客戶(hù)忠誠(chéng)度的分析將會(huì)愈加重要,這些都需要使用到本書(shū)中介紹的數(shù)據(jù)科學(xué)工具。
(3)風(fēng)險(xiǎn)管控人員本書(shū)可以作為風(fēng)險(xiǎn)預(yù)測(cè)模型的工具箱使用。
(4)IT轉(zhuǎn)型人員在我們開(kāi)設(shè)的數(shù)據(jù)科學(xué)課程中,將近1/3的學(xué)員從事IT工作,學(xué)員們表示本書(shū)內(nèi)容對(duì)其轉(zhuǎn)型提供了很大的幫助。
(5)大中院校學(xué)生本書(shū)的內(nèi)容面向?qū)崙?zhàn),適合作為本碩階段的參考書(shū)。
如何閱讀本書(shū)本書(shū)有三種閱讀方式。
第一種方式:閱讀完第1章之后,直接閱讀第19章,以案例為導(dǎo)向,遇到不懂的知識(shí)點(diǎn)再翻閱之前的內(nèi)容。這個(gè)方式適合在崗的初級(jí)數(shù)據(jù)工作者。
第二種方式:按照客戶(hù)生命不同周期的數(shù)據(jù)分析主題,分別從本書(shū)中找到獲客營(yíng)銷(xiāo)、信用評(píng)級(jí)、客戶(hù)畫(huà)像、精準(zhǔn)營(yíng)銷(xiāo)、客戶(hù)分群、交叉銷(xiāo)售、流失預(yù)警等內(nèi)容并逐一學(xué)習(xí)。這個(gè)方式適合市場(chǎng)營(yíng)銷(xiāo)方向的工作者和學(xué)生使用。
第三種方式:按照章節(jié)逐一閱讀,按照知識(shí)點(diǎn)由易到難遞進(jìn)式學(xué)習(xí)。這個(gè)方式學(xué)習(xí)周期長(zhǎng),適合有教師帶領(lǐng)學(xué)習(xí)時(shí)使用。
勘誤和支持除封面署名的作者外,參加本書(shū)編審和校對(duì)工作的還有:吳璐、曾珂、錢(qián)小菲。由于作者的水平有限,編寫(xiě)時(shí)間倉(cāng)促,書(shū)中難免會(huì)出現(xiàn)一些錯(cuò)誤或者不準(zhǔn)確的地方,懇請(qǐng)讀者批評(píng)指正。另外有一些工作的點(diǎn)滴所獲,也希望與讀者第一時(shí)間分享,我們會(huì)不定時(shí)發(fā)布在作者的知乎頁(yè)面https://wwwzhihucom/people/CoolFarmer/。 。書(shū)中的全部源文件除可以從華章網(wǎng)站參見(jiàn)華章網(wǎng)站wwwhzbookcom編輯注。 下載外,還可以從知乎主頁(yè)下載,我們也會(huì)將相應(yīng)的功能更新及時(shí)發(fā)布出來(lái)。如果你有更多的寶貴意見(jiàn),也歡迎發(fā)送郵件至guozhenchang@qqcom,期待能夠得到你們的真摯反饋。
致謝常國(guó)珍在此感謝碩、博期間的兩位恩師北大社會(huì)學(xué)系周云教授和北大光華管理學(xué)院姜國(guó)華教授,前者引領(lǐng)我進(jìn)入社會(huì)科學(xué)的大門(mén),后者指導(dǎo)我以?xún)r(jià)值投資的理念對(duì)待工作和生活,解決安身立命之本。同時(shí)感謝我家人的關(guān)心和理解,尤其感謝我的妻子楊巧巧女士,正是她的付出,才能讓我安心寫(xiě)作。
趙仁乾在此感謝北京電信規(guī)劃設(shè)計(jì)院的領(lǐng)導(dǎo)與同事,他們給予了我項(xiàng)目機(jī)會(huì)和經(jīng)驗(yàn)傳承,讓我能夠更快成長(zhǎng)。感謝我的父母、妻子和孩子,正是在他們的關(guān)心和理解下,我才能專(zhuān)心于本書(shū)的寫(xiě)作。
張秋劍在此感謝星環(huán)的孫元浩、張?jiān)蛮i先生給予我的機(jī)遇;感謝沃趣的陳棟、李建輝先生給予我的信任;感謝優(yōu)網(wǎng)的馬建功、孟慧智先生給予我的栽培;感謝上海師范大學(xué)的王笑梅、李建國(guó)老師給予我的教誨。感謝我的家人給予我的堅(jiān)定支持,以及所有不能一一道謝的朋友們。
感謝機(jī)械工業(yè)出版社華章公司的編輯楊福川、張錫鵬為本書(shū)的出版付出的艱辛勞作。感謝上海市房屋土地資源信息中心的吳璐、第一車(chē)貸的曾珂為本書(shū)的修改提供的寶貴建議。
謹(jǐn)以此書(shū)獻(xiàn)給和我們一樣在摸索中繼續(xù)前行的朋友們!
常國(guó)珍 趙仁乾 張秋劍
作者簡(jiǎn)介
常國(guó)珍
數(shù)據(jù)科學(xué)專(zhuān)家和金融技術(shù)專(zhuān)家。北京大學(xué)會(huì)計(jì)學(xué)博士,中國(guó)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟專(zhuān)家委員會(huì)委員。
2005年進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,先后在亞信、德勤等企業(yè)從事電信、金融行業(yè)數(shù)據(jù)挖掘工作,現(xiàn)就職于中銀消費(fèi)金融有限公司數(shù)據(jù)管理部。專(zhuān)注于消費(fèi)金融領(lǐng)域的數(shù)據(jù)治理、客戶(hù)智能與風(fēng)險(xiǎn)智能。
趙仁乾
數(shù)據(jù)科學(xué)家,在電信大數(shù)據(jù)和機(jī)器學(xué)習(xí)領(lǐng)域有豐富的實(shí)踐經(jīng)驗(yàn)。
現(xiàn)就職于北京電信規(guī)劃設(shè)計(jì)院任高級(jí)經(jīng)濟(jì)師,負(fù)責(zé)通信、ICT項(xiàng)目工程與業(yè)務(wù)咨詢(xún),專(zhuān)注電信市場(chǎng)數(shù)據(jù)分析,重點(diǎn)研究方向包括離網(wǎng)用戶(hù)挖掘、市場(chǎng)細(xì)分與精準(zhǔn)營(yíng)銷(xiāo)、移動(dòng)網(wǎng)絡(luò)價(jià)值區(qū)域分析、大數(shù)據(jù)及人工智能運(yùn)營(yíng)規(guī)劃等。
張秋劍
大數(shù)據(jù)專(zhuān)家和金融行業(yè)技術(shù)專(zhuān)家,上海師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)碩士。
現(xiàn)任星環(huán)科技金融事業(yè)部總監(jiān),大數(shù)據(jù)技術(shù)架構(gòu)行業(yè)顧問(wèn)專(zhuān)家,云析學(xué)院發(fā)起人,AICUG社區(qū)聯(lián)合發(fā)起人,曾在IEEE等期刊發(fā)表多篇論文。目前主要為銀行、證券和保險(xiǎn)等行業(yè)客戶(hù)提供大數(shù)據(jù)平臺(tái)及人工智能平臺(tái)的整體規(guī)劃和項(xiàng)目建設(shè)等工作。
目錄
前言
第1章數(shù)據(jù)科學(xué)家的武器庫(kù)
1.1數(shù)據(jù)科學(xué)的基本概念
1.2數(shù)理統(tǒng)計(jì)技術(shù)
1.2.1描述性統(tǒng)計(jì)分析
1.2.2統(tǒng)計(jì)推斷與統(tǒng)計(jì)建模
1.3數(shù)據(jù)挖掘的技術(shù)與方法
1.4描述性數(shù)據(jù)挖掘算法示例
1.4.1聚類(lèi)分析客戶(hù)細(xì)分
1.4.2關(guān)聯(lián)規(guī)則分析
1.5預(yù)測(cè)性數(shù)據(jù)挖掘算法示例
1.5.1決策樹(shù)
1.5.2KNN算法
1.5.3Logistic回歸
1.5.4神經(jīng)網(wǎng)絡(luò)
1.5.5支持向量機(jī)
1.5.6集成學(xué)習(xí)
1.5.7預(yù)測(cè)類(lèi)模型講解
1.5.8預(yù)測(cè)類(lèi)模型評(píng)估概述
第2章Python概述
2.1Python概述
2.1.1Python簡(jiǎn)介
2.1.2Python與數(shù)據(jù)科學(xué)
2.1.3Python2與Python3
2.2Anaconda Python的安裝、使用
2.2.1下載與安裝
2.2.2使用Jupyter Notebook
2.2.3使用Spyder
2.2.4使用conda或pip管理
第三方庫(kù)
第3章數(shù)據(jù)科學(xué)的Python編程基礎(chǔ)
3.1Python的基本數(shù)據(jù)類(lèi)型
3.1.1字符串(str)
3.1.2浮點(diǎn)數(shù)和整數(shù)(float、int)
3.1.3布爾值(Bool:True/False)
3.1.4其他
3.2Python的基本數(shù)據(jù)結(jié)構(gòu)
3.2.1列表(list)
3.2.2元組(tuple)
3.2.3集合(set)
3.2.4字典(dict)
3.3Python的程序控制
3.3.1三種基本的編程結(jié)構(gòu)簡(jiǎn)介
3.3.2順承結(jié)構(gòu)
3.3.3分支結(jié)構(gòu)
3.3.4循環(huán)結(jié)構(gòu)
3.4Python的函數(shù)與模塊
3.4.1Python的函數(shù)
3.4.2Python的模塊
3.5Pandas讀取結(jié)構(gòu)化數(shù)據(jù)
3.5.1讀取數(shù)據(jù)
3.5.2寫(xiě)出數(shù)據(jù)
第4章描述性統(tǒng)計(jì)分析與繪圖
4.1描述性統(tǒng)計(jì)進(jìn)行數(shù)據(jù)探索
4.1.1變量度量類(lèi)型與分布類(lèi)型
4.1.2分類(lèi)變量的統(tǒng)計(jì)量
4.1.3連續(xù)變量的分布與集中趨勢(shì)
4.1.4連續(xù)變量的離散程度
4.1.5數(shù)據(jù)分布的對(duì)稱(chēng)與高矮
4.2制作報(bào)表與統(tǒng)計(jì)制圖
4.3制圖的步驟
第5章數(shù)據(jù)整合和數(shù)據(jù)清洗
5.1數(shù)據(jù)整合
5.1.1行列操作
5.1.2條件查詢(xún)
5.1.3橫向連接
5.1.4縱向合并
5.1.5排序
5.1.6分組匯總
5.1.7拆分、堆疊列
5.1.8賦值與條件賦值
5.2數(shù)據(jù)清洗
5.2.1重復(fù)值處理
5.2.2缺失值處理
5.2.3噪聲值處理
5.3RFM方法在客戶(hù)行為分析上的運(yùn)用
5.3.1行為特征提取的RFM方法論
5.3.2使用RFM方法計(jì)算變量
5.3.3數(shù)據(jù)整理與匯報(bào)
第6章數(shù)據(jù)科學(xué)的統(tǒng)計(jì)推斷基礎(chǔ)
6.1基本的統(tǒng)計(jì)學(xué)概念
6.1.1總體與樣本
6.1.2統(tǒng)計(jì)量
6.1.3點(diǎn)估計(jì)、區(qū)間估計(jì)和中心極限定理
6.2假設(shè)檢驗(yàn)與單樣本t檢驗(yàn)
6.2.1假設(shè)檢驗(yàn)
6.2.2單樣本t檢驗(yàn)
6.3雙樣本t檢驗(yàn)
6.4方差分析(分類(lèi)變量和連續(xù)變量關(guān)系檢驗(yàn))
6.4.1單因素方差分析
6.4.2多因素方差分析
6.5相關(guān)分析(兩連續(xù)變量關(guān)系檢驗(yàn))
6.5.1相關(guān)系數(shù)
6.5.2散點(diǎn)矩陣圖
6.6卡方檢驗(yàn)(二分類(lèi)變量關(guān)系檢驗(yàn))
6.6.1列聯(lián)表
6.6.2卡方檢驗(yàn)
第7章客戶(hù)價(jià)值預(yù)測(cè):線性回歸模型與診斷
7.1線性回歸
7.1.1簡(jiǎn)單線性回歸
7.1.2多元線性回歸
7.1.3多元線性回歸的變量篩選
7.2線性回歸診斷
7.2.1殘差分析
7.2.2強(qiáng)影響點(diǎn)分析
7.2.3多重共線性分析
7.2.4小結(jié)線性回歸診斷
7.3正則化方法
7.3.1嶺回歸
7.3.2LASSO回歸
第8章Logistic回歸構(gòu)建初始信用評(píng)級(jí)
8.1Logistic回歸的相關(guān)關(guān)系分析
8.2Logistic回歸模型及實(shí)現(xiàn)
8.2.1Logistic回歸與發(fā)生比
8.2.2Logistic回歸的基本原理
8.2.3在Python中實(shí)現(xiàn)Logistic回歸
8.3Logistic回歸的極大似然估計(jì)
8.3.1極大似然估計(jì)的概念
8.3.2Logistics回歸的極大似然估計(jì)
8.4模型評(píng)估
8.4.1模型評(píng)估方法
8.4.2ROC曲線的概念
8.4.3在Python中實(shí)現(xiàn)ROC曲線
第9章使用決策樹(shù)進(jìn)行初始信用評(píng)級(jí)
9.1決策樹(shù)概述
9.2決策樹(shù)算法
9.2.1ID3建樹(shù)算法原理
9.2.2C4.5建樹(shù)算法原理
9.2.3CART建樹(shù)算法原理
9.2.4決策樹(shù)的剪枝
9.3在Python中實(shí)現(xiàn)決策樹(shù)
9.3.1建模
9.3.2模型評(píng)估
9.3.3決策樹(shù)的可視化
9.3.4參數(shù)搜索調(diào)優(yōu)
第10章神經(jīng)網(wǎng)絡(luò)
10.1神經(jīng)元模型
10.2單層感知器
10.3BP神經(jīng)網(wǎng)絡(luò)
10.4多層感知器的scikitlearn代碼實(shí)現(xiàn)
第11章分類(lèi)器入門(mén):最近鄰域與樸素貝葉斯
11.1KNN算法
11.1.1KNN算法原理
11.1.2在Python中實(shí)現(xiàn)KNN算法
11.2樸素貝葉斯分類(lèi)
11.2.1貝葉斯公式
11.2.2樸素貝葉斯分類(lèi)原理
11.2.3樸素貝葉斯的參數(shù)估計(jì)
11.2.4在Python中實(shí)現(xiàn)樸素貝葉斯
第12章高級(jí)分類(lèi)器:支持向量機(jī)
12.1線性可分與線性不可分
12.2線性可分支持向量機(jī)
12.2.1函數(shù)間隔和幾何間隔
12.2.2學(xué)習(xí)策略
12.2.3對(duì)偶方法求解
12.2.4線性可分支持向量機(jī)例題
12.3線性支持向量機(jī)與軟間隔最大化
12.4非線性支持向量機(jī)與核函數(shù)
12.4.1核函數(shù)
12.4.2非線性支持向量機(jī)的學(xué)習(xí)
12.4.3示例與Python實(shí)現(xiàn)
12.5使用支持向量機(jī)的案例
第13章連續(xù)變量的特征選擇與轉(zhuǎn)換
13.1方法概述
13.2主成分分析
13.2.1主成分分析簡(jiǎn)介
13.2.2主成分分析原理
13.2.3主成分分析的運(yùn)用
13.2.4在Python中實(shí)現(xiàn)主成分分析
13.3基于主成分的冗余變量篩選
13.4因子分析
13.4.1因子分析模型
13.4.2因子分析算法
13.4.3在Python中實(shí)現(xiàn)因子分析
第14章客戶(hù)分群與聚類(lèi)
14.1聚類(lèi)算法概述
14.2聚類(lèi)算法基本概念
14.2.1變量標(biāo)準(zhǔn)化與分布形態(tài)轉(zhuǎn)換
14.2.2變量的維度分析
14.3聚類(lèi)模型的評(píng)估
14.4層次聚類(lèi)
14.4.1層次聚類(lèi)原理
14.4.2層次聚類(lèi)在Python中的實(shí)現(xiàn)
14.5基于劃分的聚類(lèi)
14.5.1kmeans聚類(lèi)原理
14.5.2kmeans聚類(lèi)