全書首先概要介紹了傳統(tǒng)語音識別理論和經(jīng)典的深度神經(jīng)網(wǎng)絡核心算法。接著全面而深入地介紹了深度學習在語音識別中的應用,包括"深度神經(jīng)網(wǎng)絡-隱馬爾可夫混合模型”的訓練和優(yōu)化,特征表示學習、模型融合、自適應,以及以循環(huán)神經(jīng)網(wǎng)絡為代表的若干先進深度學習技術(shù)。
俞棟博士是國際電氣電子工程師學會會士(IEEE Fellow)、國際計算機學會杰出科學家(ACM Distinguished Scientist)。他現(xiàn)任騰訊人工智能實驗室副主任、騰訊公司杰出科學家,并兼任香港中文大學(深圳)、上海交通大學、浙江大學等多所高校的客座/兼職教授。加入騰訊前,他是微軟雷德蒙研究院語音與對話系統(tǒng)首席研究員。他是語音識別和深度學習方向的著名學者,出版了兩本專著和200多篇論文(google scholar 引用近3萬)。他是80余項專利的發(fā)明人以及深度學習開源軟件CNTK的發(fā)起人和主要作者之一。他在基于深度學習的語音識別和分離技術(shù)上的一系列開創(chuàng)性工作,極大的推動了語音處理領域的發(fā)展。他的工作獲得了2005年ACMSE最佳論文獎以及2013年和2016年IEEE 信號處理學會最佳論文獎。俞棟博士曾擔任IEEE語音語言處理專業(yè)委員會委員、IEEE西雅圖分會副主席、和APSIPA杰出講師,也曾任IEEE/ACM音頻、語音及語言處理匯刊和IEEE信號處理雜志等期刊的副編輯、以及多個國際會議的技術(shù)委員會和組織委員會成員。