近年來,隨著人工智能技術(shù)的不斷發(fā)展,智能對話系統(tǒng)開始在私人助理、智能客服、現(xiàn)代搜索引擎等領(lǐng)域逐漸應(yīng)用,為大眾提供不同程度的智能高效服務(wù)。本書旨在指導初學者輕松進入智能對話領(lǐng)域,并逐步深入實戰(zhàn)中,同時通過項目案例將理論與實戰(zhàn)相結(jié)合,使讀者不僅能系統(tǒng)地學習智能對話的基本理論,還能快速地將其應(yīng)用于實踐。
本書共分為12章,分為三部分。第一部分是理論基礎(chǔ)篇,主要介紹了概率統(tǒng)計、統(tǒng)計學習、深度學習和強化學習等方面的基本理論。第二部分是技術(shù)篇,著重講解了智能對話系統(tǒng)中常見的功能系統(tǒng)及幾個著名企業(yè)的智能問答架構(gòu)實現(xiàn),幫助讀者理解智能對話的工程架構(gòu)和實踐理論。這里的常見功能系統(tǒng)包括FAQ問答、知識圖譜問答、任務(wù)型問答和表格問答等內(nèi)容。第三部分是實踐篇,涵蓋了智能對話開源框架和問答系統(tǒng)實例介紹,從多個角度讓讀者完整地了解對話系統(tǒng)的架構(gòu)實現(xiàn),并具備自己搭建智能對話系統(tǒng)的能力。
本書內(nèi)容通俗易懂,案例豐富,實用性強,特別適合對智能對話系統(tǒng)感興趣的入門讀者和進階讀者閱讀,也適合初中級自然語言處理(NLP)工程師或人工智能(AI)算法工程師等其他編程愛好者閱讀。此外,本書也適合作為大專院校及相關(guān)培訓機構(gòu)的教材使用。
吳科
----------------------------
吳科,博士,八維教育集團人工智能學院院長。曾任阿里巴巴搜索研發(fā)專家,智齒科技首席科學家和AI研究院負責人,天壤智能高級研究員,上海交通大學教師。THU-EE第9屆清華大學自然語言處理研討會和2021企業(yè)數(shù)據(jù)智能峰會演講嘉賓。曾獲微軟亞洲研究院明日之星稱號,擁有多項中美專利、深度學習譯著一部。
目錄
第1章 概率統(tǒng)計基礎(chǔ) 5
1.1 概率基礎(chǔ) 6
1.1.1 從概率到條件概率 6
1.1.2 隨機事件的關(guān)系 7
1.1.3 貝葉斯定理 9
1.2 隨機變量 11
1.2.1 隨機變量的引入 11
1.2.2 常見概率分布 13
1.2.3 多元隨機變量(聯(lián)合、邊緣與條件 | 獨立與相關(guān)) 17
1.2.3 多元正態(tài)分布 23
1.3 統(tǒng)計推斷 24
1.3.1 最大似然 25
1.3.2 最大后驗 26
1.4 隨機過程 27
1.4.1 馬爾可夫鏈 27
1.4.2 馬爾可夫鏈的極限與穩(wěn)態(tài) 29
1.4.3 馬爾可夫鏈蒙特卡洛方法 30
1.5 本章小結(jié) 32
第2章 統(tǒng)計學習 33
2.1 樸素貝葉斯 33
2.2 支持向量機 36
2.2.1 支持向量機的理論基礎(chǔ) 36
2.2.2 SMO算法原理 37
2.3 最大熵 39
2.3.1 信息熵 40
2.3.2 最大熵推導 41
2.3.3 最大熵模型 41
2.4 條件隨機場 43
2.4.1 馬爾可夫隨機場 43
2.4.2 條件隨機場原理 45
2.4.3 推斷算法 46
2.5 本章小結(jié) 48
第3章 深度學習 48
3.1 神經(jīng)網(wǎng)絡(luò) 48
3.1.1 神經(jīng)元 48
3.1.2 網(wǎng)絡(luò)結(jié)構(gòu) 53
3.1.3 反向傳播算法 55
3.2 卷積神經(jīng)網(wǎng)絡(luò) 57
3.2.1 卷積層 57
3.2.2 匯聚層 58
3.2.3 CNN句子建模 59
3.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 62
3.3.1 簡單循環(huán)網(wǎng)絡(luò) 63
3.3.2 長短期記憶網(wǎng)絡(luò) 64
3.3.3 LSTM句子建模 66
3.4 Attention機制 68
3.4.1 什么是注意力機制 69
3.4.2 Encoder-Decoder框架 70
3.4.3 Attention模型 71
3.4.4 Attention機制的原理 73
3.5 預訓練模型 74
3.5.1 非上下文感知模型 75
3.5.2 上下文感知模型 79
3.6 本章小結(jié) 88
第4章 強化學習 89
4.1 什么是強化學習 89
4.1.1 強化學習的組成要素 90
4.1.2 馬爾可夫決策過程 92
4.1.3 最優(yōu)價值函數(shù)和最優(yōu)策略 97
4.1.4 價值迭代和策略迭代 98
4.2 深度強化學習: 從Q-Learning到DQN 101
4.2.1 Q-Learning 101
4.2.2 價值函數(shù)近似 102
4.2.3 DQN 104
4.3 策略梯度 107
4.3.1 基本原理 107
4.3.2 策略參數(shù)化 111
4.3.3 Actor-Critic方法 113
4.4 探索策略 116
4.4.1 ??貪心策略 116
4.4.2 置信區(qū)間上界策略 117
4.4 本章小結(jié) 118
第5章 FAQ問答 118
5.1 基本概念 119
5.1.1 知識庫相關(guān)概念 119
5.1.2 FAQ問答系統(tǒng)的業(yè)務(wù)架構(gòu) 121
5.1.3 FAQ問答引擎 122
5.2 文本匹配模型 123
5.2.1 規(guī)則匹配 124
5.2.2 字面特征的匹配 125
5.2.3 深度學習語義匹配 130
5.3 本章小結(jié) 149
第6章 知識圖譜問答 150
6.1 什么是知識圖譜 150
6.1.1 知識圖譜定義 150
6.1.2 知識圖譜的數(shù)據(jù)模型 152
6.1.3 知識圖譜的存儲方式 156
6.2 基于模板的方法 164
6.3 基于語義分析的方法 167
6.3.1 語義表示 167
6.3.2 邏輯表達式生成 168
6.3.3 語義分析實例 172
6.4 基于答案排序的方法 176
6.4.1 基于特征的答案排序 177
6.4.2 基于子圖匹配的答案排序 179
6.5 本章小結(jié) 181
第7章 任務(wù)型問答 181
7.1 管道方法 182
7.1.1 自然語言理解 182
7.1.2 對話狀態(tài)跟蹤 186
7.1.3 對話策略學習 190
7.1.4 自然語言生成 201
7.2 端到端方法 203
7.2.1 復制機制 203
7.2.2 記憶網(wǎng)絡(luò) 204
7.2.3 GLMP模型 205
7.3 本章小結(jié) 209
第8章 表格問答 210
8.1 什么是表格問答 210
8.2 表格檢索 211
8.3 語義解析 212
8.3.1 規(guī)則模板 212
8.3.2 端到端模型 214
8.3.3 文法模型 218
8.4 本章小結(jié) 223
第9章 企業(yè)級智能問答的架構(gòu)實現(xiàn) 224
9.1 阿里小蜜 224
9.2 微軟小冰 226
9.3 美團智能客服 231
9.4 本章小結(jié) 236
第10章 人工智能標記語言(AIML) 236
10.1 AIML基礎(chǔ) 237
10.1.1 基本標簽 237
10.1.2 上下文能力 239
10.1.3 同義能力 242
10.1.4 標準啟動文件 244
10.2 源碼框架剖析 245
10.2.1 核心代碼組成 245
10.2.2 語法解析 246
10.2.3 核心問答代碼 248
10.3 設(shè)計與實現(xiàn) 253
10.3.1 中文適配處理 253
10.3.2 知識庫設(shè)計 256
10.3.3 運行展示 261
10.4 本章小結(jié) 261
第11章 Rasa多輪對話開源框架 261
11.1 Rasa基礎(chǔ)概要 262
11.1.1 Rasa系統(tǒng)結(jié)構(gòu) 262
11.1.2 Rasa環(huán)境部署 263
11.2 Rasa NLU 265
11.2.1 NLU管道 265
11.2.2 NLU訓練數(shù)據(jù) 270
11.3 Rasa Core 276
11.3.1 故事 277
11.3.2 規(guī)則 281
11.3.3 動作 283
11.3.4 表單 289
11.3.5 策略 292
11.4 多輪對話設(shè)計實現(xiàn) 295
11.4.1 基于對話驅(qū)動的開發(fā) 295
11.4.2 對話設(shè)計 297
11.4.3 簡單的訂餐示例 304
11.5 本章小結(jié) 307
第12章 問答系統(tǒng)幾個實例 308
12.1 FAQ問答實例講解 308
12.1.1 問題分析 309
12.1.2 檢索 311
12.1.3 匹配 312
12.1.4 重排 314
12.1.5 索引模塊 314
12.1.6 SimNet模塊 316
12.2 圖譜問答實例講解 318
12.2.1 圖譜介紹 318
12.2.2 主代碼介紹 320
12.3 基于RL的問答系統(tǒng)實例講解 323
12.3.1 訓練架構(gòu)介紹 324
12.3.2 DQN智能體 330
12.3.3 對話狀態(tài)跟蹤器 334
12.3.4 用戶模擬 341
12.3.5 錯誤模型控制器 350
12.3.6 智能體運行 352
12.4 本章小結(jié) 354