本書從學習者行為特征入手,利用智能視覺計算的方法研究學習者行為分析與視頻理解關(guān)鍵技術(shù),構(gòu)建學習者行為的系列專用數(shù)據(jù)集,在此基礎(chǔ)上提出基于智能視覺計算的目標檢測、身份認證、行為識別、時序動作檢測和視覺場景描述新技術(shù)、新模型和新方法,在傳統(tǒng)教室、計算機實驗室、標準化考場等真實教育教學場景進行仿真實驗和方法驗證。
更多科學出版社服務(wù),請掃碼獲取。
SAR圖像處理關(guān)鍵技術(shù)研究及應(yīng)用, 陜西省科學技術(shù)獎二等獎,2009年,排名第6。
目錄
第一篇 學習者行為與智能視覺計算
第1章 緒論 3
1.1 研究背景 3
1.2 國內(nèi)外研究現(xiàn)狀 4
1.2.1 學習者行為表征 5
1.2.2 目標檢測與行為分析 7
1.2.3 行為動作的內(nèi)容描述 9
1.3 主要內(nèi)容與章 節(jié)組織 11
1.4 小結(jié) 12
參考文獻 12
第2章 智能視覺計算 16
2.1 計算機視覺和機器視覺 16
2.2 智能視覺計算的定義 16
2.3 智能視覺計算的應(yīng)用 18
2.3.1 智能安防 18
2.3.2 智能交通 18
2.3.3 智能制造 19
2.3.4 智能醫(yī)療 19
2.3.5 智能家居 19
2.4 學習者行為相關(guān)的智能視覺計算技術(shù) 20
2.4.1 目標檢測 21
2.4.2 行為識別 21
2.4.3 動作檢測 22
2.4.4 視覺場景描述 22
2.5 視覺計算相關(guān)的科技名企 23
2.6 小結(jié) 26
參考文獻 26
第二篇 學習者目標檢測與身份認證
第3章 學習者目標檢測 31
3.1 引言 31
3.2 目標檢測研究概述 31
3.2.1 常見方法與模型 31
3.2.2 相關(guān)基準數(shù)據(jù)集 33
3.2.3 性能評價指標 35
3.3 考試場景下的學習者目標檢測 36
3.3.1 學習者目標檢測專用數(shù)據(jù)集構(gòu)建 36
3.3.2 基于SSD網(wǎng)絡(luò)及其改進網(wǎng)絡(luò)的目標檢測方法 40
3.3.3 基于級聯(lián)注意力的全卷積目標檢測方法 60
3.3.4 基于瓶頸注意模塊的小樣本目標檢測方法 73
3.4 小結(jié) 79
參考文獻 80
第4章 學習者身份認證 84
4.1 引言 84
4.2 身份認證研究概述 84
4.2.1 常見方法與模型 84
4.2.2 相關(guān)基準數(shù)據(jù)集 87
4.2.3 性能評價指標 88
4.3 學習場景下基于人臉特征分析的學習者身份認證 88
4.3.1 學習者身份認證專用數(shù)據(jù)集構(gòu)建 88
4.3.2 基于人臉檢測的身份認證方法 91
4.3.3 基于人臉識別的身份認證方法 98
4.3.4 基于人臉識別及類別平衡的身份認證方法 102
4.4 小結(jié) 110
參考文獻 110
第三篇 學習者行為識別與時序動作檢測
第5章 學習者行為識別 117
5.1 引言 117
5.2 行為識別研究概述 117
5.2.1 常見方法與模型 117
5.2.2 相關(guān)基準數(shù)據(jù)集 120
5.2.3 性能評價指標 122
5.3 學習場景下的學習者行為識別 122
5.3.1 學習者行為識別專用數(shù)據(jù)集構(gòu)建 122
5.3.2 基于解耦注意力和多特征融合的行為識別方法 127
5.3.3 基于尺度感知目標檢測器的行為識別方法 136
5.3.4 基于姿態(tài)估計器的行為識別方法 147
5.4 小結(jié) 161
參考文獻 161
第6章 學習者時序動作檢測 166
6.1 引言 166
6.2 時序動作檢測研究概述 166
6.2.1 常見方法與模型 166
6.2.2 相關(guān)基準數(shù)據(jù)集 169
6.2.3 性能評價指標 170
6.3 學習場景下的學習者時序動作檢測 171
6.3.1 學習者時序動作檢測專用數(shù)據(jù)集構(gòu)建 171
6.3.2 基于增強解耦的單階段時序動作檢測方法 177
6.3.3 基于Timeception與超事件的時序動作檢測方法 188
6.3.4 基于雙流完整性建模的弱監(jiān)督時序動作檢測方法 203
6.4 小結(jié) 217
參考文獻 217
第四篇 學習者行為的視覺場景描述
第7章 學習者行為圖像描述 225
7.1 引言 225
7.2 圖像描述研究概述 225
7.2.1 常見方法與模型 225
7.2.2 相關(guān)基準數(shù)據(jù)集 227
7.2.3 性能評價指標 228
7.3 考試場景下學習者行為圖像單句描述 230
7.3.1 學習者行為的圖像單句描述專用數(shù)據(jù)集構(gòu)建 230
7.3.2 CNN+LSTM框架下的圖像單句描述方法 233
7.4 學習場景下學習者行為圖像密集描述 238
7.4.1 學習者行為圖像密集描述專用數(shù)據(jù)集構(gòu)建 238
7.4.2 CNN+LL+LSTM框架下的圖像密集描述方法 242
7.4.3 Y0L0v3+LSTM框架下的圖像密集描述方法 251
7.5 小結(jié) 256
參考文獻 257
第8章 學習者行為視頻描述 261
8.1 引言 261
8.2 視頻描述研究概述 261
8.2.1 常見方法與模型 261
8.2.2 相關(guān)基準數(shù)據(jù)集 264
8.2.3 性能評價指標 264
8.3 學習場景下學習者行為視頻描述 265
8.3.1 學習者行為視頻描述專用數(shù)據(jù)集 265
8.3.2 基于多特征編碼的視頻描述方法 268
8.3.3 基于動態(tài)目標感知與二階段融合的視頻描述方法 277
8.3.4 基于多模態(tài)特征的視頻密集描述方法 289
8.4 小結(jié) 303
參考文獻 303
第9章 總結(jié)與展望 310
9.1 研究工作總結(jié) 310
9.2 未來研究展望 312
彩圖