數(shù)據(jù)是最有價值的資源,發(fā)掘這一價值需要超越技術(shù)本身。本書拋開數(shù)據(jù)科學(xué)技術(shù)的細(xì)節(jié),致力于解決該主題研究中通常沒有涵蓋的數(shù)據(jù)科學(xué)“其余部分”的關(guān)鍵問題。包括確立正確問題,收集正確數(shù)據(jù),進(jìn)行正確分析,做出正確決策以及決策評估,與決策者建立信任,將數(shù)據(jù)科學(xué)團(tuán)隊(duì)置于正確的組織節(jié)點(diǎn),以及幫助公司實(shí)現(xiàn)數(shù)據(jù)驅(qū)動等內(nèi)容。這本書給出了數(shù)據(jù)
"《大數(shù)據(jù)平臺搭建與維護(hù)》以大數(shù)據(jù)平臺項(xiàng)目場景和工作任務(wù)驅(qū)動的方式搭建邏輯架構(gòu),以大數(shù)據(jù)平臺搭建與維護(hù)具體任務(wù)活動及工作步驟為核心構(gòu)建內(nèi)容體系,全書以工作手冊的形式進(jìn)行編寫!洞髷(shù)據(jù)平臺搭建與維護(hù)》共包括6個項(xiàng)目,介紹了Linux系統(tǒng)的安裝與配置、HadoopHDFS高可用集群搭建、HadoopYARN高可用集群搭建與
"本書以Hadoop及其周邊框架為主線,介紹了整個Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)組件以及平臺運(yùn)維。本書從零開始逐一講解大數(shù)據(jù)體系中的各種技術(shù),通過豐富的實(shí)戰(zhàn)案例闡述重點(diǎn)、難點(diǎn)知識,為初學(xué)者進(jìn)入大數(shù)據(jù)領(lǐng)域打好基礎(chǔ)。書中各個項(xiàng)目設(shè)計(jì)合理,在每個項(xiàng)目開頭設(shè)置導(dǎo)讀,首先介紹知識點(diǎn),然后緊跟實(shí)踐操作,最后在每個項(xiàng)目末尾通過課后
"本書是“新一代人工智能系列教材”之一,全面、詳細(xì)地介紹數(shù)據(jù)科學(xué)的基本問題、前沿技術(shù)及應(yīng)用系統(tǒng)。本書共分為11章。第1章概述數(shù)據(jù)科學(xué),介紹數(shù)據(jù)科學(xué)的現(xiàn)有技術(shù)與工具;第2章介紹數(shù)據(jù)治理,包括實(shí)體對齊、數(shù)據(jù)融合和數(shù)據(jù)清洗;第3章介紹數(shù)據(jù)定價,包括數(shù)據(jù)定價機(jī)制和模型定價機(jī)制;第4章至第7章介紹面向不同數(shù)據(jù)類型(地理空間數(shù)據(jù)、
本書編寫目的是向讀者介紹大數(shù)據(jù)技術(shù)的基本概念與應(yīng)用。本書一共10章,分別講述了大數(shù)據(jù)介紹、云計(jì)算與大數(shù)據(jù)、大數(shù)據(jù)架構(gòu)、大數(shù)據(jù)采集與清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析、大數(shù)據(jù)可視化、大數(shù)據(jù)治理、大數(shù)據(jù)安全、大數(shù)據(jù)的商業(yè)應(yīng)用以及綜合實(shí)訓(xùn)。本書將理論與實(shí)踐操作相結(jié)合,通過大量的案例及書中的二維碼幫助讀者快速了解和應(yīng)用大數(shù)據(jù)分析相關(guān)
"本書旨在引導(dǎo)讀者全面了解分布式系統(tǒng)的核心原理、關(guān)鍵技術(shù)和實(shí)際應(yīng)用。全書分為9章,內(nèi)容包括分布式系統(tǒng)概述、理論基礎(chǔ)、基礎(chǔ)架構(gòu),以及分布式文件系統(tǒng)HDFS、分布式計(jì)算模型MapReduce、分布式協(xié)調(diào)服務(wù)ZooKeeper、分布式數(shù)據(jù)庫HBase和分布式消息系統(tǒng)Kafka的工作原理與應(yīng)用,最后提供兩個實(shí)戰(zhàn)項(xiàng)目,幫助讀者將
"本書在第1版的基礎(chǔ)上,進(jìn)行了全面更新和擴(kuò)充,旨在反映測控技術(shù)的**發(fā)展和國家戰(zhàn)略需求。全書共分9章,第1章簡要介紹測控系統(tǒng)的基本概念、系統(tǒng)構(gòu)成以及發(fā)展趨勢;第2章介紹現(xiàn)代測控系統(tǒng)的理論方法;第3章介紹各種新型傳感器的原理及應(yīng)用;第4章介紹基于網(wǎng)絡(luò)的測控技術(shù)與系統(tǒng);第5章介紹基于計(jì)算機(jī)視覺的測控技術(shù)與系統(tǒng);第6、7章分
"大數(shù)據(jù)分析包括查詢型分析、描述性分析、探索性分析、挖掘型分析等。本書介紹基于R語言的大數(shù)據(jù)分析解決方案。全書分3篇共18章。第1篇R語言,包括第1~10章,分別為R語言概覽、表達(dá)式、字符串與正規(guī)表達(dá)式、函數(shù)、向量、矩陣、數(shù)據(jù)框、列表、面向?qū)ο蟪绦蛟O(shè)計(jì)、數(shù)據(jù)存儲;第2篇可視化,包括第11、12章,分別為統(tǒng)計(jì)繪圖、圖形文
《數(shù)據(jù)凈界》是一本由行業(yè)資深人士組成的團(tuán)隊(duì)撰寫的全面指南,旨在提供關(guān)于管理永久性和可持續(xù)性數(shù)據(jù)清除的詳盡指導(dǎo),同時確保符合監(jiān)管、法律和行業(yè)標(biāo)準(zhǔn)。本書深入探討了數(shù)據(jù)凈化的原因、方法和時機(jī),強(qiáng)調(diào)了數(shù)據(jù)凈化作為IT運(yùn)營中實(shí)現(xiàn)循環(huán)的重要組成部分。作者還討論了關(guān)于數(shù)據(jù)清除的幾個新標(biāo)準(zhǔn),包括IEEE和ISO即將發(fā)布的標(biāo)準(zhǔn)數(shù)據(jù)凈化如
大數(shù)據(jù)時代悄然來臨,帶來了信息技術(shù)發(fā)展的巨大變革,并深刻影響著社會生產(chǎn)和人民生活的方方面面。大數(shù)據(jù)專業(yè)人才的培養(yǎng)是新一輪科技較量的基礎(chǔ),高等院校承擔(dān)著大數(shù)據(jù)人才培養(yǎng)的重任。因此,各高等院校重視大數(shù)據(jù)課程的開設(shè),大數(shù)據(jù)課程已經(jīng)成為計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的重要核心課程。本書從大數(shù)據(jù)開發(fā)技術(shù)與行業(yè)應(yīng)用為切入點(diǎn),介紹了大數(shù)據(jù)的相