隨著大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,作為一種新興的技術(shù),數(shù)據(jù)可視化顯得愈發(fā)重要,社會對數(shù)據(jù)可視化設(shè)計、研發(fā)人才的要求也進一步提高,對數(shù)據(jù)可視化分析人才的需求也在逐步擴大。本書以知識體系層次結(jié)構(gòu)化與工程化案例展示相結(jié)合的方法來介紹可視化分析技術(shù),依次詳細介紹了數(shù)據(jù)可視化的意義與發(fā)展趨勢、基本理論,以及需要遵守的相關(guān)設(shè)計原則;在此基礎(chǔ)上,分類介紹了大量實用的數(shù)據(jù)可視化方法,并且詳細介紹了幾種常用的數(shù)據(jù)可視化工具,如Tableau、ECharts、D3等,通過具體的操作步驟和案例演示提升讀者的實戰(zhàn)能力。此外,為了全面提升讀者綜合運用所學知識進行數(shù)據(jù)可視化研發(fā)的能力,本書最后部分深入淺出地介紹了兩個數(shù)據(jù)可視化綜合應(yīng)用案例。本書通過系統(tǒng)化的理論講解與豐富的實踐案例的結(jié)合,幫助讀者掌握數(shù)據(jù)可視化的基本理論和實用方法,同時致力于培養(yǎng)讀者將理論知識應(yīng)用于實際項目的能力,為讀者在數(shù)據(jù)可視化領(lǐng)域的發(fā)展打下堅實的基礎(chǔ)! ”緯m合作為普通高校大數(shù)據(jù)、人工智能相關(guān)專業(yè)本科生課程的教材或參考書,也可作為相關(guān)領(lǐng)域技術(shù)人員的培訓或自學教材! ”緯溆蠵PT課件、習題答案和教學大綱等教學資源,歡迎選用本書作教材的教師登錄www.cmpedu.com注冊后下載,或發(fā)郵件至jinacmp@163.com索取。
本書遵循教指委相關(guān)指導文件和高等院校學生學習規(guī)律編寫而成。踐行四新理念,融入思政元素,注重理論與實踐相結(jié)合。
前 言FOREWORD提到可視化,大家并不陌生,在日常生活、學習、工作中隨處可見各種可視化圖表。然而,隨著大數(shù)據(jù)、人工智能時代的到來,傳統(tǒng)面向結(jié)果的可視化方法已經(jīng)難以滿足日益增長的數(shù)據(jù)挖掘分析的需求。目前,可視化已經(jīng)成為各類數(shù)據(jù)分析的理論框架和應(yīng)用中的要素,并且成為科學計算、商業(yè)智能、信息安全等領(lǐng)域的普惠技術(shù)。隨著大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,作為一種新興的技術(shù),可視化分析顯得愈發(fā)重要,社會對數(shù)據(jù)可視化設(shè)計、研發(fā)人才的知識、技能、工程實踐能力的綜合要求也進一步提高,對數(shù)據(jù)可視化分析人才的需求也在逐步擴大?梢暬哂兄R點多、實踐性強的特點。本書從工程實用性出發(fā),兼顧知識體系的完備性,全面介紹了數(shù)據(jù)可視化的原理、過程,以及設(shè)計、實現(xiàn)各個環(huán)節(jié)所需的基本知識,具有較強的應(yīng)用價值。本書每一章開始都設(shè)置了“導讀”和“本章知識點”,分別提出了每一章的具體學習要求;每一章結(jié)尾都設(shè)置了“本章小結(jié)”和“習題”。本書通過實際的數(shù)據(jù)可視化案例進行完整的需求分析、可視化設(shè)計、編程實現(xiàn)和案例分析,引導讀者深入學習和掌握案例涉及的知識點,實現(xiàn)可視化分析相關(guān)知識和工程能力的綜合提升。本書由從事大數(shù)據(jù)分析與可視化教學科研工作多年、具備豐富實踐經(jīng)驗的一線教師北京工業(yè)大學張勇、才智、杜曉林、樸星霖、李小勇,北京化工大學郭旦懷,山東大學宋然,東北大學秦皇島分校萬聰、王聰共同編寫。編寫過程中得到了北京工業(yè)大學部分學生的大力支持和幫助,在此一并表示衷心的感謝。由于數(shù)據(jù)可視化技術(shù)發(fā)展非常迅速,同時鑒于編者的學識和能力有限,書中難免存在疏漏與不足之處,懇請廣大讀者不吝指教和斧正。編 者
高等院校教師
前言第1章 數(shù)據(jù)可視化概述 11.1 數(shù)據(jù) 11.1.1 數(shù)據(jù)的概念 11.1.2 數(shù)據(jù)的多樣性 21.1.3 數(shù)據(jù)的可解釋性 41.2 可視化 61.2.1 日常生活中的可視化 71.2.2 數(shù)據(jù)可視化分類 101.2.3 可視化數(shù)據(jù)分析 151.2.4 與其他學科和領(lǐng)域的關(guān)系 161.3 數(shù)據(jù)可視化的意義 191.4 數(shù)據(jù)可視化的經(jīng)典案例及發(fā)展趨勢 23本章小結(jié)31習題31第2章 數(shù)據(jù)處理可視化 332.1 數(shù)據(jù)處理流程 332.2 數(shù)據(jù)獲取可視化 352.3 數(shù)據(jù)預(yù)處理可視化 372.3.1 數(shù)據(jù)清洗可視化 382.3.2 數(shù)據(jù)集成可視化 402.3.3 數(shù)據(jù)變換可視化 422.3.4 數(shù)據(jù)歸約可視化 442.4 數(shù)據(jù)存儲與管理可視化 492.4.1 關(guān)系數(shù)據(jù)庫 492.4.2 非關(guān)系數(shù)據(jù)庫 492.4.3 知識圖譜可視化 502.5 數(shù)據(jù)挖掘與分析可視化 512.5.1 探索性數(shù)據(jù)分析與可視化 522.5.2 數(shù)據(jù)挖掘與可視化 542.5.3 聯(lián)機分析處理與可視化 58本章小結(jié)60習題60第3章 數(shù)據(jù)可視化設(shè)計 623.1 可視化分析模型 623.2 視覺感知原理 653.2.1 視覺感知過程 653.2.2 顏色刺激理論 663.2.3 色彩空間 683.2.4 格式塔理論 733.3 視覺編碼方法 773.3.1 視覺通道 773.3.2 視覺隱喻 803.3.3 坐標系 843.3.4 標尺 873.3.5 背景信息 873.4 可視化設(shè)計方法 893.4.1 增強圖表的可讀性 893.4.2 去除不必要的非數(shù)據(jù)元素 913.4.3 選擇交互能力強的視圖 933.4.4 采用動畫與過渡 953.5 基本的可視化圖表 973.5.1 柱狀圖 973.5.2 直方圖 993.5.3 餅圖 1003.5.4 折線圖 1013.5.5 散點圖 102本章小結(jié)103習題103第4章 可視化方法 1054.1 文本可視化 1054.1.1 文本可視化流程 1064.1.2 文本內(nèi)容可視化 1084.1.3 文本關(guān)系可視化 1114.2 空間數(shù)據(jù)可視化 1134.2.1 點數(shù)據(jù)的可視化 1134.2.2 線數(shù)據(jù)的可視化 1144.2.3 面數(shù)據(jù)的可視化 1154.3 時變數(shù)據(jù)可視化 1164.3.1 時間屬性數(shù)據(jù)的可視化 1174.3.2 多元時序數(shù)據(jù)的可視化 1204.3.3 流數(shù)據(jù)的可視化 1214.4 層次和網(wǎng)絡(luò)數(shù)據(jù)可視化 1234.4.1 層次數(shù)據(jù)可視化 1234.4.2 網(wǎng)絡(luò)數(shù)據(jù)可視化 1304.5 跨媒體數(shù)據(jù)可視化 1364.5.1 圖像可視化 1374.5.2 視頻可視化 1394.5.3 聲音可視化 1424.5.4 跨媒體可視化 1444.6 面向領(lǐng)域的可視化 1454.6.1 商業(yè)智能可視化 1454.6.2 社交網(wǎng)絡(luò)可視化 1464.6.3 交通監(jiān)測可視化 1484.6.4 氣象監(jiān)測可視化 1504.6.5 科學計算可視化 151本章小結(jié) 152習題 152第5章 可視化工具與軟件 1545.1 非編程類可視化工具 1545.2 編程類可視化工具 1565.3 Tableau可視化案例 1605.4 ECharts可視化編程案例 1685.5 D3可視化編程案例 1795.6 Python可視化編程案例 1905.7 R語言可視化編程案例 194本章小結(jié)200習題200第6章 數(shù)據(jù)可視化案例 2016.1 面向科學文獻同名消歧的可視化分析系統(tǒng) 2016.1.1 需求分析 2016.1.2 可視化任務(wù)分析 2026.1.3 整體框架 2036.1.4 視圖設(shè)計 2046.1.5 案例分析 2106.1.6 總結(jié) 2136.2 面向?qū)W生校園大數(shù)據(jù)的可視化分析系統(tǒng) 2146.2.1 需求分析 2146.2.2 可視化任務(wù)分析 2146.2.3 整體框架 2156.2.4 視圖設(shè)計 2176.2.5 案例分析 2216.2.6 總結(jié) 225本章小結(jié)225習題225參考文獻 226