本書專注于使用R語言進行數據分析和可視化,主要目標是幫助讀者掌握R語言這一強大的數據科學工具,以在科技領域中更好地處理數據、分析數據以及呈現結果。本書面向的讀者群體廣泛,無論是初學者還是有經驗的數據科學家,都能夠從中獲取豐富的知識和技能,以在科技領域取得成功。本書中包含了實用的示例和練習,可以幫助讀者掌握數據分析和可視化的關鍵概念和實際操作。
關東升,一個在IT領域摸爬滾打20多年的老程序員、軟件架構師、高級培訓師。精通多種信息技術。曾參與設計和開發(fā)北京市公交一卡通系統(tǒng)、國家農產品追溯系統(tǒng)、金融系統(tǒng)微博等移動客戶端項目。長期為中國移動、中國聯通、中國南方航空、中國工商銀行和天津港務局等企事業(yè)單位提供培訓服務。
第1章 R語言入門
1.1 R語言簡介
1.1.1 R語言歷史
1.1.2 R語言特點
1.1.3 如何獲得幫助
1.2 R語言環(huán)境搭建
1.2.1 下載和安裝R語言環(huán)境
1.2.2 下載和安裝RStudio
1.3 編寫第一個R程序
1.3.1 交互式方式運行
1.3.2 腳本文件運行程序
1.4 R語言語法基礎
1.4.1 標識符
1.4.2 關鍵字
1.4.3 語句
1.4.4 變量
1.4.5 注釋
1.5 數據類型
1.5.1 數值型
1.5.2 整數型
1.5.3 復數型
1.5.4 邏輯型
1.5.5 字符型
1.5.6 原始型
1.5.7 數據類型轉換
1.6 運算符
1.6.1 算術運算符
1.6.2 關系運算符
1.6.3 邏輯運算符
1.6.4 賦值運算符
1.7 本章總結
第2章 程序流程控制
2.1 決策語句
2.1.1 if語句
2.1.2 switch語句
2.2 循環(huán)語句
2.2.1 for循環(huán)
2.2.2 while循環(huán)
2.2.3 repeat 循環(huán)
2.3 跳轉語句
2.3.1 break語句
2.3.2 next語句
2.4 本章總結
第3章 數據結構
3.1 向量
3.1.1 創(chuàng)建向量
3.1.2 向量屬性
3.1.3 訪問向量元素
3.1.4 遍歷向量
3.1.5 檢查向量中是否存在指定的元素
3.2 列表
3.2.1 創(chuàng)建列表
3.2.2 訪問列表元素
3.2.3 修改列表元素
3.2.4 向列表中添加元素
3.2.5 刪除列表中的元素
3.3 矩陣
3.3.1 創(chuàng)建矩陣
3.3.2 訪問矩陣中的元素
3.3.3 矩陣屬性
3.3.4 矩陣轉置
3.4 數組
3.4.1 創(chuàng)建數組
3.4.2 訪問數組元素
3.5 數據框
3.5.1 創(chuàng)建數據框
3.5.2 從數據框中提取數據
3.5.3 添加行和列
3.5.4 刪除行和列
3.6 因子
3.6.1 創(chuàng)建因子
3.6.2 因子屬性
3.7 字符串
3.7.1 創(chuàng)建字符串
3.7.2 字符串操作
3.8 本章總結
第4章 函數
4.1 定義函數
4.2 調用函數
4.2.1 按位置調用函數
4.2.2 按名稱調用函數
4.2.3 使用默認參數調用函數
4.3 變量作用域
4.3.1 局部變量
4.3.2 全局變量
4.4 嵌套函數
4.5 函數遞歸
4.6 本章總結
第5章 科技領域中的數據分析
5.1 數據接口
5.1.1 工作目錄
5.1.2 讀取CSV文件
5.1.3 寫入CSV文件
5.1.4 R語言的包的使用
5.1.5 讀取Excel文件
5.1.6 寫入Excel文件
5.1.7 讀取JSON 文件
5.1.8 寫入JSON 文件
5.2 數據清洗
5.2.1 R語言中的內置數據集
5.2.2 缺失值處理
5.2.3 異常值處理
5.3 數據的統(tǒng)計分析方法
5.3.1 描述統(tǒng)計分析
5.3.2 相關性分析
5.3.3 時間序列分析
5.4 本章總結
第6章 單變量圖形的繪制
6.1 R繪圖基礎
6.1.1 R繪圖包
6.1.2 圖形基本構成要素
6.1.3 圖形的圖層
6.1.4 圖形主題
6.1.5 R圖形分類
6.2 直方圖
6.2.1 繪制圖形一般步驟
6.2.2 示例:繪制空氣溫度分布直方圖
6.3 箱線圖
6.3.1 箱線圖應用
6.3.2 示例:繪制嬰兒出生數據箱線圖
6.4 密度圖
6.4.1 密度圖應用
6.4.2 示例:德國每日電力消耗密度圖
6.5 小提琴圖
6.5.1 小提琴圖與密度圖比較
6.5.2 示例:德國每日電力消耗小提琴圖
6.5.3 示例:繪制嬰兒出生數據小提琴圖
6.6 餅圖
6.6.1 創(chuàng)建餅圖
6.6.2 示例:繪制嬰兒性別比例餅圖
6.7 本章總結
第7章 雙變量圖形繪制
7.1 散點圖
7.1.1 散點圖應用
7.1.2 示例:繪制汽車馬力與燃油效率散點圖
7.2 折線圖
7.2.1 折線圖應用
7.2.2 示例:嬰兒出生數據折線圖
7.3 雙變量面積圖
7.3.1 雙變量面積圖應用
7.3.2 示例:繪制嬰兒出生數據雙變量面積圖
7.4 柱狀圖
7.4.1 柱狀圖應用
7.4.2 示例:繪制不同汽車型號的燃油效率柱狀圖
7.5 條形圖
7.5.1 條形圖與柱狀圖的區(qū)別
7.5.2 示例:繪制不同汽車型號的燃油效率條形圖
7.6 熱力圖
7.6.1 熱力圖應用
7.6.2 創(chuàng)建熱力圖
7.6.3 示例:繪制不同汽車型號的性能相關性熱力圖
7.7 核密度圖
7.7.1 核密度圖應用
7.7.2 示例:繪制鳶尾花花萼長度核密度圖
7.8 線性回歸圖
7.8.1 線性回歸圖應用
7.8.2 示例:繪制汽車燃油效率與重量的線性回歸圖
7.9 本章總結
第8章 多變量圖形的繪制
8.1 氣泡圖
8.1.1 氣泡圖應用
8.1.2 氣泡圖與散點圖的區(qū)別
8.1.3 示例:繪制空氣質量氣泡圖
8.2 雷達圖
8.2.1 雷達圖應用
8.2.2 創(chuàng)建雷達圖
8.2.3 示例:繪制問卷調查結果雷達圖
8.3 網狀圖
8.3.1 創(chuàng)建網狀圖
8.3.2 示例:繪制蛋白質相互
網狀圖
8.4 堆疊折線圖
8.4.1 堆疊折線圖應用
8.4.2 示例:繪制蘋果公司股票O(jiān)HLC堆疊折線圖
8.5 堆疊面積圖
8.5.1 堆疊面積圖應用
8.5.2 示例:繪制蘋果公司股票O(jiān)HLC堆疊面積圖
8.6 堆疊柱狀圖
8.6.1 堆疊柱狀圖應用
8.6.2 示例:繪制不同氣缸數下的平均MPG柱狀圖
8.7 平行坐標圖
8.7.1 平行坐標圖應用
8.7.2 示例:繪制高溫和低溫條件下的數據差異平行坐標圖
8.8 矩陣圖
8.8.1 相關性矩陣圖
8.8.2 散點矩陣圖
8.9 分面網格分類圖
8.9.1 分面網格分類圖應用
8.9.2 示例:繪制不同氣缸數和齒輪類型組合下的燃油效率和重量比較分面網格分類圖
8.10三元相圖
8.10.1 三元相圖應用
8.10.2 創(chuàng)建三元相圖
8.10.3 示例:繪制銅鋅鎳合金三元相圖
8.11 本章總結
第9章 3D圖形的繪制
9.1 繪制3D圖形包
9.2 3D散點圖
9.2.1 3D散點圖應用
9.2.2 繪制3D散點圖
9.2.3 示例:繪制汽車性能數據散點圖
9.3 3D線圖
9.3.1 3D線圖應用
9.3.2 示例:繪制鳶尾花花萼和花瓣關系的3D線圖
9.4 3D曲面圖
9.4.1 3D曲面圖應用
9.4.2 創(chuàng)建3D曲面圖
9.4.3 示例:伊甸火山3D曲面圖
9.5 3D網格圖
9.5.1 3D網格圖與3D曲面圖的區(qū)別
9.5.2 創(chuàng)建3D網格圖
9.5.3 示例:伊甸火山3D網格圖
9.6 本章總結
第10章科技數據的地理信息可視化
10.1 地圖散點圖
10.2 添加地圖
10.3 地圖熱力圖
10.3.1 創(chuàng)建地圖熱力圖
10.3.2 示例:加利福尼亞州城市人口密度熱力圖
10.4 等值線圖
10.4.1 創(chuàng)建等值線圖
10.4.2 示例:繪制伊甸火山地形圖的等值線圖
10.5 本章總結
第11章數據學術報告、論文和出版
11.1 使用R Markdown創(chuàng)建定制化報告
11.1.1 R Markdown簡介
11.1.2 創(chuàng)建R Markdown報告
11.1.3 R Markdown基本語法
11.1.4 輸出定制化報告
11.2 使用ChatGPT工具輔助制作報告
11.2.1 使用ChatGPT制作思維導圖
11.2.2 使用ChatGPT制作電子表格
11.3 本章總結
第12章 實戰(zhàn)訓練營
12.1 案例1:t檢驗法評估X藥品治療效果對比分析
12.1.1 步驟1:數據準備
12.1.2 步驟2:假設檢驗
12.1.3 步驟3:結果解釋
12.1.4 步驟4:可視化
12.2 案例2:采用MA分析蘋果公司股票的價格走勢
12.2.1 步驟1:數據準備
12.2.2 步驟2:清洗數據
12.2.3 步驟3:計算移動平均
12.2.4 步驟4:使用移動平均線分析蘋果公司股票價格趨勢
12.3 本章總結
附錄1 R常用包和函數快速參考指南
1.1 R常用包
1.2 R常用函數
附錄2 科研論文配圖的繪制與配色
2.1 選擇合適的插圖類型
2.2 善于把握色彩
2.3 字體和字號
2.4 標注清晰
2.5 分辨率足夠
2.6 風格一致