本書共分8章,主要內(nèi)容如下:
第1章介紹數(shù)據(jù)的認(rèn)知與研究任務(wù),大數(shù)據(jù)概念特征及技術(shù)挑戰(zhàn)等。
第2章介紹大數(shù)據(jù)內(nèi)容、知識(shí)和結(jié)果表達(dá)概念,以及元數(shù)據(jù)和知識(shí)圖譜技術(shù)。
第3章介紹數(shù)據(jù)存儲(chǔ)基礎(chǔ)、大數(shù)據(jù)存儲(chǔ)要求以及應(yīng)對(duì)技術(shù)和典型系統(tǒng)。
第4章介紹數(shù)據(jù)管理基礎(chǔ),新型數(shù)據(jù)管理模型及其相應(yīng)大數(shù)據(jù)管理系統(tǒng)。
第5章介紹數(shù)據(jù)計(jì)算基礎(chǔ),大數(shù)據(jù)計(jì)算特點(diǎn),大數(shù)據(jù)的批量、流、圖等新計(jì)算模型和特點(diǎn),以及計(jì)算引擎的工作原理等。
第6章介紹大數(shù)據(jù)分析概念、分類聚類等數(shù)據(jù)分析的基本方法,以及深度學(xué)習(xí)等數(shù)據(jù)分析的高級(jí)方法。
第7章介紹數(shù)據(jù)可視化概念、可視化方法與常用工具,以及大數(shù)據(jù)可視化面臨的問(wèn)題及相應(yīng)方法。
第8章介紹大數(shù)據(jù)面臨的安全威脅和安全需求,以及針對(duì)大數(shù)據(jù)全生命周期不同階段的大數(shù)據(jù)安全技術(shù)。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
戰(zhàn)略支援部隊(duì)信息工程大學(xué)教授。長(zhǎng)期從事網(wǎng)絡(luò)數(shù)據(jù)分析方向的研究工作。
目錄
第1章 大數(shù)據(jù)概述1
1.1 認(rèn)知數(shù)據(jù)1
1.1.1 數(shù)據(jù)概念1
1.1.2 數(shù)據(jù)研究?jī)?nèi)容2
1.2 認(rèn)知大數(shù)據(jù)5
1.2.1 大數(shù)據(jù)形成6
1.2.2 大數(shù)據(jù)概念7
1.2.3 大數(shù)據(jù)技術(shù)9
1.3 大數(shù)據(jù)表達(dá)12
1.4 大數(shù)據(jù)面臨的挑戰(zhàn)14
1.4.1 數(shù)據(jù)復(fù)雜性帶來(lái)的挑戰(zhàn)14
1.4.2 計(jì)算復(fù)雜性帶來(lái)的挑戰(zhàn)15
1.4.3 系統(tǒng)復(fù)雜性帶來(lái)的挑戰(zhàn)15
思考題16
第2章 大數(shù)據(jù)表達(dá)方法17
2.1 元數(shù)據(jù)17
2.1.1 元數(shù)據(jù)形成18
2.1.2 元數(shù)據(jù)概念20
2.1.3 元數(shù)據(jù)體系22
2.2 大數(shù)據(jù)的元數(shù)據(jù)24
2.2.1 大數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)24
2.2.2 元數(shù)據(jù)管理25
2.3 知識(shí)表示26
2.3.1 知識(shí)的概念26
2.3.2 知識(shí)表示的概念26
2.3.3 命題邏輯與謂詞邏輯29
2.3.4 語(yǔ)義網(wǎng)絡(luò)32
2.3.5 本體33
2.3.6 語(yǔ)義Web35
2.4 知識(shí)圖譜39
2.4.1 知識(shí)圖譜概念40
2.4.2 知識(shí)圖譜的數(shù)據(jù)模型40
2.4.3 知識(shí)圖譜的向量表示43
思考題45
第3章 大數(shù)據(jù)存儲(chǔ)46
3.1 數(shù)據(jù)存儲(chǔ)基礎(chǔ)46
3.1.1 數(shù)據(jù)存儲(chǔ)概念46
3.1.2 磁盤存儲(chǔ)原理48
3.1.3 磁盤陣列52
3.1.4 磁盤卷58
3.1.5 存儲(chǔ)空間59
3.2 數(shù)據(jù)存儲(chǔ)系統(tǒng)62
3.2.1 基于數(shù)據(jù)塊的存儲(chǔ)系統(tǒng)62
3.2.2 基于文件的存儲(chǔ)系統(tǒng)64
3.2.3 基于對(duì)象的存儲(chǔ)系統(tǒng)69
3.3 大數(shù)據(jù)存儲(chǔ)現(xiàn)狀69
3.3.1 大數(shù)據(jù)存儲(chǔ)面對(duì)的挑戰(zhàn)70
3.3.2 云存儲(chǔ)71
思考題72
第4章 大數(shù)據(jù)管理73
4.1 數(shù)據(jù)管理相關(guān)知識(shí)73
4.1.1 數(shù)據(jù)管理概念73
4.1.2 數(shù)據(jù)管理模型75
4.1.3 數(shù)據(jù)管理系統(tǒng)76
4.2 大數(shù)據(jù)管理面臨的主要問(wèn)題79
4.3 分布式文件系統(tǒng)80
4.3.1 文件管理系統(tǒng)原理概述81
4.3.2 分布式文件管理系統(tǒng)原理85
4.3.3 典型的HDFS分布式文件系統(tǒng)90
4.4 NoSQL數(shù)據(jù)庫(kù)系統(tǒng)96
4.4.1 關(guān)系模型98
4.4.2 非關(guān)系模型99
4.4.3 NoSQL數(shù)據(jù)存儲(chǔ)109
4.4.4 NoSQL基本理論111
4.4.5 NoSQL體系框架112
思考題113
第5章 大數(shù)據(jù)計(jì)算115
5.1 計(jì)算系統(tǒng)及其體系結(jié)構(gòu)115
5.2 計(jì)算服務(wù)系統(tǒng)及其體系結(jié)構(gòu)118
5.3 大數(shù)據(jù)的計(jì)算類型及特點(diǎn)121
5.4 大數(shù)據(jù)的批量計(jì)算123
5.4.1 MapReduce及其計(jì)算123
5.4.2 Spark及其計(jì)算127
5.5 大數(shù)據(jù)的流式計(jì)算133
5.5.1 流數(shù)據(jù)概念及特點(diǎn)133
5.5.2 Spark Streaming及其流計(jì)算134
5.5.3 Storm及其流計(jì)算138
5.6 大數(shù)據(jù)的圖計(jì)算141
5.6.1 BSP模型142
5.6.2 圖計(jì)算系統(tǒng)Pregel145
思考題146
第6章 大數(shù)據(jù)分析148
6.1 大數(shù)據(jù)分析概念148
6.2 數(shù)據(jù)分析的基本方法149
6.2.1 數(shù)據(jù)分類算法149
6.2.2 數(shù)據(jù)聚類方法157
6.2.3 關(guān)聯(lián)規(guī)則算法163
6.2.4 圖數(shù)據(jù)分析168
6.3 數(shù)據(jù)分析的高級(jí)方法173
6.3.1 深度學(xué)習(xí)173
6.3.2 強(qiáng)化學(xué)習(xí)178
6.3.3 遷移學(xué)習(xí)180
思考題181
第7章 大數(shù)據(jù)可視化182
7.1 數(shù)據(jù)可視化概述182
7.1.1 可視化與可視化技術(shù)182
7.1.2 數(shù)據(jù)可視化概念183
7.1.3 數(shù)據(jù)可視化作用184
7.2 數(shù)據(jù)可視化技術(shù)186
7.2.1 數(shù)據(jù)基本統(tǒng)計(jì)特征的可視化186
7.2.2 高維數(shù)據(jù)的可視化189
7.2.3 面向大數(shù)據(jù)主流應(yīng)用的信息可視化192
7.3 常用數(shù)據(jù)可視化工具198
7.3.1 基于Excel的數(shù)據(jù)可視化198
7.3.2 基于Tableau的數(shù)據(jù)可視化201
7.3.3 基于JavaScript開(kāi)發(fā)的數(shù)據(jù)可視分析205
7.4 大數(shù)據(jù)可視化面臨問(wèn)題與挑戰(zhàn)211
思考題212
第8章 大數(shù)據(jù)安全213
8.1 大數(shù)據(jù)安全概覽213
8.1.1 大數(shù)據(jù)安全形勢(shì)213
8.1.2 大數(shù)據(jù)安全威脅214
8.1.3 大數(shù)據(jù)安全需求214
8.2 大數(shù)據(jù)安全技術(shù)215
8.2.1 匿名認(rèn)證技術(shù)215
8.2.2 訪問(wèn)控制安全技術(shù)220
8.2.3 數(shù)據(jù)存儲(chǔ)完整性證明技術(shù)225
8.2.4 數(shù)據(jù)處理安全技術(shù)228
8.2.5 數(shù)據(jù)發(fā)布隱私保護(hù)技術(shù)234
思考題238
參考文獻(xiàn)239