Python大數(shù)據(jù)分析——在勞動科學中的應用
定 價:69 元
在大數(shù)據(jù)和人工智能時代,大數(shù)據(jù)對科學研究的重要性日益顯現(xiàn)。本書基于Python這一學習難度較小的編程語言,選取勞動科學這一視角,系統(tǒng)介紹了如何對大數(shù)據(jù)進行收集、處理及分析。由淺入深是本書的一個特點。全書分為四個部分共 20 章,第一部分介紹了Python基礎知識,第二部分介紹了Python數(shù)據(jù)處理,第三部分介紹了爬蟲基礎知識,第四部分介紹了爬蟲技術(shù)應用的具體例子。內(nèi)容豐富、易于理解是本書的另一個特點。本書以應用為目的,每部分內(nèi)容都給出了詳細的代碼,便于讀者掌握數(shù)據(jù)挖掘技術(shù)。書中列舉了很多通俗易懂的例子,幫助讀者更好地理解各章內(nèi)容。本書實踐性強,配套教輔資源豐富,適合用作文科專業(yè)本科生、研究生教材,也適合對Python感興趣的人員自學。
葛玉好,北京大學經(jīng)濟學博士,中國人民大學勞動人事學院副教授,主要研究領(lǐng)域為勞動經(jīng)濟學、人口老齡化、微觀計量、Python編程及其應用等。在《經(jīng)濟研究》《經(jīng)濟學(季刊)》《人口研究》及China Economic Review等期刊上發(fā)表學術(shù)論文多篇,在B站上推出了《Python基本知識》《Python數(shù)據(jù)處理》《Python網(wǎng)絡爬蟲》《Python機器學習》《計量經(jīng)濟學》《經(jīng)濟學原理》等多套免費視頻教程。
第一部分Python基礎知識第1章 軟件安裝和相關(guān)學習資源1.1 Anaconda3的安裝1.2 PyCharm的安裝 第2章 內(nèi)置函數(shù)、變量、注釋和常見錯誤2.1 Python內(nèi)置函數(shù)2.2 變量2.3 Python的注釋2.4 Python的常見錯誤2.5 一個Python程序文件的例子:猜數(shù)字?py第3章基本的數(shù)據(jù)類型3.1 數(shù)值型3.2 字符串型第4章條件語句和循環(huán)語句4.1 條件語句4.2 循環(huán)語句第5章列表、元組和字典5.1 列表5.2 元組5.3 字典第6章函數(shù)6.1函數(shù)的定義6.2函數(shù)的調(diào)用6.3函數(shù)的參數(shù)6.4函數(shù)的返回值6.5函數(shù)的嵌套6.6函數(shù)名和匿名函數(shù)6.7高階函數(shù)6.8局部變量和全局變量6.9參數(shù)傳遞的其他方式第7章類7.1類的創(chuàng)建和實例7.2實例內(nèi)部的信息傳遞7.3使用外部變量作參數(shù)7.4實例屬性的修改7.5私有屬性和私有方法7.6封裝7.7繼承7.8多態(tài)7.9__str__()方法7.10類的屬性7.11類的方法7.12模塊第8章OS模塊、文件操作和異常處理8.1OS模塊8.2文件操作8.3異常處理第二部分Python數(shù)據(jù)處理第9章Numpy模塊的使用9.1Numpy模塊的安裝9.2數(shù)組的創(chuàng)建9.3數(shù)組的引用9.4數(shù)組的編輯9.5數(shù)組的運算9.6統(tǒng)計功能第10章Pandas模塊的使用10.1Pandas模塊的簡介和安裝10.2序列的創(chuàng)建和引用10.3數(shù)據(jù)框的創(chuàng)建10.4數(shù)據(jù)框的引用10.5數(shù)據(jù)框的編輯10.6數(shù)據(jù)框的統(tǒng)計第11章Matplotlib模塊的使用11.1Matplotlib模塊的簡介和安裝11.2使用Matplotlib繪圖的基本流程11.3改變線條的粗細11.4添加圖形標題11.5調(diào)整圖形的尺寸11.6調(diào)整坐標軸的范圍和設置標簽11.7設置坐標軸的刻度和刻度標簽11.8設置網(wǎng)格線11.10標注圖例、線條格式和標記樣式11.11繪制散點圖11.12繪制柱形圖11.13繪制餅狀圖11.14繪制三維圖第12章使用Python實現(xiàn)最小二乘估計12.1數(shù)據(jù)準備12.2矩陣的構(gòu)建12.3系數(shù)的估計12.4系數(shù)方差的估計12.5使用Stata軟件進行驗證12.6全部代碼第三部分爬蟲基礎知識第13章爬蟲與大數(shù)據(jù)采集13.1網(wǎng)絡爬蟲簡介13.2網(wǎng)絡爬蟲常見術(shù)語第14章Requests模塊的使用14.1Requests模塊的安裝和簡介14.2get()函數(shù)的使用14.3post()函數(shù)的使用第15章BeautifulSoup類和Xpath語法15.1BeautifulSoup的安裝和簡介15.2使用BeautifulSoup類創(chuàng)建實例15.3BeautifulSoup實例對象的select()方法15.4從標簽對象提取信息15.5Xpath的簡介和安裝15.6使用HTML類創(chuàng)建實例15.7xpath()方法的使用15.8Xpath語法15.9提取節(jié)點里面的內(nèi)容第16章正則表達式16.1Re模塊的函數(shù)16.2正則表達式的匹配規(guī)則16.3使用正則表達式的常見例子 16.4從html字符串提取信息第17章Selenium模塊的使用17.1Selenium模塊的安裝17.2Selenium模塊的使用第四部分爬蟲的具體例子第18章提取勞動人事學院教師信息18.1提取的信息18.2第一層次信息的提取18.3第二層次信息的提取18.4合并第一層次和第二層次的全部信息第19章爬取百度百科上的個人信息19.1確定