本書系統(tǒng)介紹了大數(shù)據(jù)基礎(chǔ)知識和相關(guān)技術(shù),全書分為大數(shù)據(jù)基礎(chǔ)、大數(shù)據(jù)存儲與管理篇、大數(shù)據(jù)采集與預(yù)處理、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)平臺Hadoop實踐與應(yīng)用案例5篇,共17章,主要內(nèi)容包括大數(shù)據(jù)基本概念、大數(shù)據(jù)平臺Hadoop基礎(chǔ)、大數(shù)據(jù)存儲與管理基本概念、大數(shù)據(jù)分布式文件系統(tǒng)HDFS、大數(shù)據(jù)分布式數(shù)據(jù)庫系統(tǒng)HBase、大數(shù)
《Hadoop海量數(shù)據(jù)處理》從Hadoop的基礎(chǔ)知識講起,逐步深入Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce分布式編程框架的核心技術(shù),幫助讀者全面、系統(tǒng)、深入地理解Hadoop海量數(shù)據(jù)處理技術(shù)的精髓。本書在講解技術(shù)原理時穿插大量的典型示例,并詳解兩個典型項目實戰(zhàn)案例,幫助讀者提高實際項目開發(fā)水平!禜a
本書通過魯棒優(yōu)化的核心原理和應(yīng)用,揭開不確定性的神秘面紗,為讀者提供應(yīng)對不可預(yù)測的挑戰(zhàn)所需的見解和工具。作者首先簡要介紹了不確定線性規(guī)劃,然后深入分析了適當不確定性集的構(gòu)建與經(jīng)典機會約束(概率)方法之間的相互聯(lián)系。接著,提出了針對不確定的錐二次優(yōu)化和半定優(yōu)化問題以及動態(tài)(多階段)問題的魯棒優(yōu)化理論。最后,通過來自金融、
本書第一章介紹了大數(shù)據(jù)分析的相關(guān)概念、大數(shù)據(jù)分析模型的建立方法;第二章介紹了Tempo平臺的功能模塊以及創(chuàng)建課堂、添加實驗、發(fā)布實驗等常用功能的快速入門;第三章介紹了數(shù)據(jù)預(yù)處理。第四章是分類分析實驗,涉及到?jīng)Q策樹分類、KNN分類、樸素貝葉斯分類、隨機森林和神經(jīng)網(wǎng)絡(luò)算法;第五章描述了聚類分析實驗,分別介紹了Kmeans算
本書采用項目任務(wù)式編寫方法,以合理的結(jié)構(gòu)、通俗易懂的語言、豐富實用的案例、學練結(jié)合的講解方式,全面系統(tǒng)、循序漸進地介紹了大數(shù)據(jù)存儲的相關(guān)技術(shù)和實際應(yīng)用。全書共分為7個項目,分別為大數(shù)據(jù)存儲概述、數(shù)據(jù)倉庫Hive、列式數(shù)據(jù)庫HBase、文檔數(shù)據(jù)庫MongoDB、圖數(shù)據(jù)庫Neo4j、鍵值數(shù)據(jù)庫Redis、NewSQL數(shù)據(jù)庫
本教材是大數(shù)據(jù)時代下,大數(shù)據(jù)行業(yè)蓬勃發(fā)展,大數(shù)據(jù)技術(shù)也在不斷涌現(xiàn)革新,本書對大數(shù)據(jù)體系架構(gòu)lambda進行梳理,介紹了一些重要的大數(shù)據(jù)平臺技術(shù)原理與編程實踐,包括數(shù)據(jù)收集層的Kafka,數(shù)據(jù)存儲層的HDFS、HBase,計算框架層的MapReduce、Spark、Flink,資源管理與協(xié)調(diào)層的YARN、ZooKeepe
本書首先介紹了大數(shù)據(jù)應(yīng)用基礎(chǔ):重點講解了如何搭建Hadoop分布式集群平臺,使用Java語言進行MapReduce分布式編程;HBase及Hive數(shù)據(jù)庫環(huán)境的安裝和數(shù)據(jù)的增、刪、改、查操作;Spark平臺的搭建、RDD操作及SparkSQL查詢;Flink平臺的搭建,Kafka消息中間件的使用及流批一體計算。其次對數(shù)據(jù)
本書共分兩部分:第一部分是網(wǎng)絡(luò)數(shù)據(jù)采集與預(yù)處理的基礎(chǔ)理論實踐,包括任務(wù)1-任務(wù)6,主要講解如何使用Python編寫網(wǎng)絡(luò)數(shù)據(jù)采集和預(yù)處理程序,內(nèi)容包括Python環(huán)境搭建,Python基礎(chǔ)語法、語句與函數(shù),網(wǎng)絡(luò)基礎(chǔ)知識,常用網(wǎng)絡(luò)數(shù)據(jù)采集與預(yù)處理庫和解析庫、數(shù)據(jù)持久化保存,以及requests庫、Numpy庫、Pandas
本書針對本科生控制理論課程中的典型難點問題開展了針對性的研究,包括物理建模、實驗辨識建模、動態(tài)誤差系數(shù)法、時滯系統(tǒng)穩(wěn)定性分析、描述函數(shù)法、串聯(lián)校正、狀態(tài)反饋和最優(yōu)控制數(shù)值解法等內(nèi)容。書中給出了典型案例的Matlab源程序及Simulink模型。通過對本書的學習,讀者能夠?qū)刂评碚撚懈忧逦陌盐,提高編程能力?/p>
機器學習應(yīng)用需要大量的數(shù)據(jù),因此有必要保護這些數(shù)據(jù)集中敏感信息的隱私和安全。從數(shù)據(jù)收集和導(dǎo)入到模型開發(fā)和部署,隱私保護發(fā)生在機器學習過程中的每個環(huán)節(jié)。這本實用的圖書將講授確保數(shù)據(jù)管道端到端安全所需的技能。 《隱私保護機器學習》通過面部識別、云數(shù)據(jù)存儲等真實世界中的用例來探討隱私保護技術(shù)。你將了解到現(xiàn)在就可以部署的切實