本書分八個項目,內(nèi)容包括:大數(shù)據(jù)概述、Hadoop部署與應(yīng)用、Ambari安裝與應(yīng)用、HDFS項目開發(fā)與應(yīng)用、MapReduce項目開發(fā)與應(yīng)用等。
本書圍繞全國職業(yè)技能大賽大數(shù)據(jù)技術(shù)與應(yīng)用賽項的技能要點:大數(shù)據(jù)平臺的搭建與運維、大數(shù)據(jù)的采集與存儲、大數(shù)據(jù)的處理、數(shù)據(jù)的分析、數(shù)據(jù)的可視化等內(nèi)容展開,詳細講述了Numpy數(shù)值分析、Pandas統(tǒng)計分析、基于Matplotlib的數(shù)據(jù)可視化、Hadoop平臺及組件部署、Spark組件部署、python數(shù)據(jù)采集方法等內(nèi)容,
本書針對目前大數(shù)據(jù)發(fā)展的方向,就數(shù)據(jù)獲取領(lǐng)域介紹數(shù)據(jù)獲取原理和技術(shù)而專門編寫的教材。本選題在講解理論的同時突出實踐,在實踐中理解爬蟲的原理、爬蟲庫的使用,在講解技術(shù)的同時輔以案例來幫助讀者領(lǐng)會和掌握技術(shù)。本選題分為三大板塊,分別是基礎(chǔ)篇、實踐篇和拓展篇;A(chǔ)篇主要講述了爬蟲的基本原理、爬蟲的基本配置以及爬蟲相關(guān)庫的使用
本書分為基礎(chǔ)篇和技術(shù)篇兩部分,在每部分的章節(jié)中貫穿課程思政,通過本書的學習,能夠讓讀者在了解和掌握大數(shù)據(jù)的基本知識和基本技能的基礎(chǔ)上,培養(yǎng)讀者的家國情懷、工匠精神;同時,本書系統(tǒng)、全面地介紹大數(shù)據(jù)相關(guān)專業(yè)在“數(shù)據(jù)經(jīng)濟”政策引領(lǐng)下的學習指導。以“數(shù)字經(jīng)濟”的大數(shù)據(jù)驅(qū)動為出發(fā)點,一是介紹大數(shù)據(jù)的基礎(chǔ)知識,包括大數(shù)據(jù)的概念及
近年來,多媒體技術(shù)的飛速發(fā)展,極大地促進了大數(shù)據(jù)數(shù)據(jù)的增長。人們對大數(shù)據(jù)的需求有著不同的應(yīng)用,如大數(shù)據(jù)信息檢索、識別與合成等。然而,在混合大數(shù)據(jù)中,相互干擾給大數(shù)據(jù)信息處理帶來了巨大的障礙。如何從混合大數(shù)據(jù)中提取所需信號已成為一個重要的研究課題。因此,本書主要研究魯棒主成分分析(RPCA)及其擴展模型的方法實現(xiàn)大數(shù)據(jù)分
本書著重分析了滿足高階內(nèi)模規(guī)律、存在多重非嚴格重復問題的被控系統(tǒng)的學習控制律設(shè)計問題。基于λ范數(shù),給出了一種P型迭代學習控制律設(shè)計的嚴格理論分析。在此基礎(chǔ)上,針對逐步復雜的分析對象,設(shè)計了幾種自適應(yīng)迭代學習控制律。研究對象從單輸入、單輸出,擴展到多輸入、多輸出,從系統(tǒng)中存在高階內(nèi)模變化的未知參數(shù)且跟蹤非嚴格重復變化的參
本書綜合當前數(shù)據(jù)挖掘領(lǐng)域的最新研究成果,系統(tǒng)地介紹了數(shù)據(jù)挖掘的基礎(chǔ)理論、技術(shù)原理、算法和應(yīng)用,以使讀者對數(shù)據(jù)挖掘有一個系統(tǒng)、全面的了解。本書主要介紹數(shù)據(jù)挖掘的基本概念和數(shù)據(jù)挖掘的過程;數(shù)據(jù)挖掘的主要技術(shù)、各類典型算法及其編程實現(xiàn),包括數(shù)據(jù)存儲、數(shù)據(jù)預處理技術(shù)、數(shù)據(jù)相似度與異常檢測、關(guān)聯(lián)規(guī)則挖掘技術(shù)、分類技術(shù)、聚類技術(shù)等
隨著互聯(lián)網(wǎng)和移動設(shè)備的普及,我們生產(chǎn)的數(shù)據(jù)越來越龐大,大數(shù)據(jù)的應(yīng)用也逐漸成為了各行各業(yè)的趨勢。特別是在決策分析領(lǐng)域,大數(shù)據(jù)的應(yīng)用能夠幫助我們更加準確、高效地做出決策,提高決策的成功率和效果。本書基于這一未來既定趨勢,從大數(shù)據(jù)基本理論開始介紹,意在幫助各行各業(yè)的人能夠認識大數(shù)據(jù),理解大數(shù)據(jù),意識到大數(shù)據(jù)給未來生產(chǎn)生活中帶
本書分四章,第一章介紹如何搭建一個以R為中心的語料庫研究和處理平臺,包括如何安裝和配置TreeTagger軟件以及Perl和Python解釋環(huán)境;第二章講解R編程的基本方法;第三章介紹用編程方式實現(xiàn)語料庫語言學的主要方法;第四章通過一些實例講解如何綜合運用這些方法,以實現(xiàn)更復雜的語料庫研究需求。
本書內(nèi)容涵蓋機械結(jié)構(gòu)、電氣線路、傳感器檢測等自動化生產(chǎn)線的基礎(chǔ)技術(shù),以及氣壓傳動、變頻調(diào)試、交流伺服等運動控制技術(shù),還包括自動化生產(chǎn)線基本組成單元的機電系統(tǒng)的裝調(diào)、PLC控制程序設(shè)計、人機界面設(shè)計、控制系統(tǒng)通信、系統(tǒng)運行及維護等方面的技術(shù)實踐操作。