本書是作者基于其多年的科研經(jīng)驗而撰寫的聚類分析專著。全書從基礎(chǔ)知識和實際應(yīng)用兩方面系統(tǒng)地介紹了聚類分析方法。基礎(chǔ)知識部分闡述了聚類分析基本過程、數(shù)據(jù)預(yù)處理、相似度計算、驗證指標(biāo)、常見聚類方法原理和特點,并給出了應(yīng)用實例和程序供讀者參考。應(yīng)用部分則針對高維數(shù)據(jù)非監(jiān)督學(xué)習(xí)問題,分別以心電識別、腦電識別、行為識別以及智能材料
本書為一本大數(shù)據(jù)技術(shù)的入門書籍,介紹Hadoop大數(shù)據(jù)平臺和Spark大數(shù)據(jù)平臺及相關(guān)工具的原理,以及如何進(jìn)行部署和簡單開發(fā)。全書包含13章:第1、2章介紹如何為深入學(xué)習(xí)Hadoop和Spark做環(huán)境準(zhǔn)備,包括VMware虛擬機的創(chuàng)建和CentOS操作系統(tǒng)安裝。第3~6章介紹Hadoop大數(shù)據(jù)平臺的基本原理,包括HDF
數(shù)據(jù)管道通過整合、清理、分析、可視化等方式來管理初始收集的數(shù)據(jù)流。ApacheAirflow提供了一個統(tǒng)一的平臺,可以使用它設(shè)計、實施、監(jiān)控和維護(hù)數(shù)據(jù)的流動。Airflow具有易于使用的UI、即插即用的選項以及靈活的Python腳本,這些都使Airflow能夠非常輕松地完成任何數(shù)據(jù)管理任務(wù)。在《ApacheAirflo
本書基于“基礎(chǔ)知識”+“代碼示例”+“應(yīng)用案例”的模式編寫,共包括7個項目。項目1主要介紹互聯(lián)網(wǎng)數(shù)據(jù)采集的入門知識;項目2通過一個入門級的簡單案例,介紹互聯(lián)網(wǎng)數(shù)據(jù)采集的基本流程;項目3通過一個進(jìn)階的案例,詳細(xì)介紹在沒有給出官方開放API的情況下,如何通過抓包工具獲取XHR請求地址;項目4主要介紹HTML文檔數(shù)據(jù)的采集,
文本數(shù)據(jù)挖掘是通過機器學(xué)習(xí)、自然語言處理和推理等相關(guān)技術(shù)或方法,理解、分析和挖掘文本的內(nèi)容,從而完成信息抽取、關(guān)系發(fā)現(xiàn)、熱點預(yù)測、文本分類和自動摘要等具體任務(wù)的信息處理技術(shù)。《文本數(shù)據(jù)挖掘(第2版)》主要介紹與文本數(shù)據(jù)挖掘有關(guān)的基本概念、理論模型和實現(xiàn)算法,包括數(shù)據(jù)預(yù)處理、文本表示、文本分類、文本聚類、主題模型、情感分
本書系統(tǒng)介紹了智能調(diào)度領(lǐng)域的理論知識,清晰地勾勒出智能調(diào)度的知識體系。全書共7章,分別是:緒論、智能調(diào)度的理論基礎(chǔ)、單機調(diào)度問題、并行機調(diào)度問題、開放車間調(diào)度、流水車間調(diào)度和作業(yè)車間調(diào)度。全書系統(tǒng)、深入淺出地講解了智能調(diào)度的理論知識,同時強化了各調(diào)度類型的數(shù)學(xué)模型和優(yōu)化方法,重點培養(yǎng)分析問題與解決調(diào)度問題的能力。為幫助
本書為普通高等教育十一五國家級規(guī)劃教材。本書從工程應(yīng)用的角度出發(fā),注重基礎(chǔ)性、系統(tǒng)性和實用性,較深入地介紹計算機控制系統(tǒng)的基本知識、分析和設(shè)計方法。全書共10章,包括:緒論、計算機控制系統(tǒng)設(shè)計的硬件基礎(chǔ)、計算機控制系統(tǒng)的數(shù)學(xué)基礎(chǔ)、計算機控制系統(tǒng)特性分析、計算機控制系統(tǒng)的間接設(shè)計方法、計算機控制系統(tǒng)的直接設(shè)計方法、數(shù)字控
本書系統(tǒng)地介紹了Hadoop、Spark、Flink等開源大數(shù)據(jù)組件的相關(guān)知識和實踐技能。全書共9章,涉及大數(shù)據(jù)采集、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)處理與分析等大數(shù)據(jù)應(yīng)用生命周期中各階段典型組件的部署、使用和基本編程方法,內(nèi)容包括部署全分布模式Hadoop集群、HDFS實戰(zhàn)、MapReduce編程、部署ZooKeeper集群
本書介紹了克服日常面臨的各種挑戰(zhàn)的實踐知識,以及各種數(shù)據(jù)科學(xué)解決方案,主要包括數(shù)據(jù)科學(xué)概論,機器學(xué)習(xí)模型測試,人工智能基礎(chǔ),理想的數(shù)據(jù)科學(xué)團(tuán)隊,數(shù)據(jù)科學(xué)團(tuán)隊招聘面試,組建數(shù)據(jù)科學(xué)團(tuán)隊,創(chuàng)新管理,管理數(shù)據(jù)科學(xué)項目,數(shù)據(jù)科學(xué)項目的常見陷阱,創(chuàng)造產(chǎn)品與提升可重用性,實施ModelOps,建立技術(shù)棧和結(jié)論。本書的目標(biāo)讀者是希望
大計算是融合了算力生產(chǎn)、算力傳輸和算力服務(wù)的一個綜合體,通過深度應(yīng)用云計算、大數(shù)據(jù)、人工智能等新興技術(shù),有力支撐了我國數(shù)字經(jīng)濟(jì)發(fā)展。本書從技術(shù)和應(yīng)用兩個角度出發(fā),系統(tǒng)總結(jié)了作者多年來在云計算、大數(shù)據(jù)、人工智能、數(shù)據(jù)中心等領(lǐng)域的工作實踐經(jīng)驗,在闡述大計算相關(guān)理論的基礎(chǔ)上,結(jié)合國際最新技術(shù)發(fā)展方向及典型應(yīng)用案例進(jìn)行編寫,并