本書貫穿了信號(hào)的獲取、處理、分析和識(shí)別整條鏈路所需的關(guān)鍵知識(shí)點(diǎn),以聲信號(hào)為研究對(duì)象,闡述了傳統(tǒng)信號(hào)處理、自適應(yīng)信號(hào)處理、機(jī)器學(xué)習(xí)等信號(hào)處理和智能分析設(shè)計(jì)等知識(shí)要點(diǎn)。全書總共16章,第1~4章介紹了經(jīng)典信號(hào)處理與分析方法,第5~11章闡述了先進(jìn)信號(hào)處理方法、人工特征的獲取原理和方法,第12~16章主要說明了深度學(xué)習(xí)、混合
本書系統(tǒng)地介紹了語(yǔ)音處理的起源、發(fā)展歷史及應(yīng)用現(xiàn)狀;語(yǔ)音處理的相關(guān)原理;Anaconda集成環(huán)境的安裝與使用;科學(xué)仿真MATLAB工具安裝與使用;Ffmpeg的安裝與使用、語(yǔ)音數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注;語(yǔ)音開源平臺(tái)百度AI和科大訊飛;語(yǔ)音處理工程方法;并提供了多個(gè)語(yǔ)音處理實(shí)戰(zhàn)。本書是一本面向初級(jí)和中級(jí)讀者的基礎(chǔ)教程
本書包括三個(gè)部分:第一部分從最基本的錄音操作入手,詳細(xì)介紹個(gè)人工作室的設(shè)備組成、配置及錄音操作步驟,讓讀者快速熟悉錄音相關(guān)操作,同時(shí)也借此引出錄音過程中所涉及的音頻技術(shù)相關(guān)術(shù)語(yǔ)。第二部分介紹音頻技術(shù)的基本概念,讓讀者了解錄音需具備的各種音頻技術(shù)的基礎(chǔ)知識(shí)。第三部分則將前兩部分的內(nèi)容聯(lián)系起來(lái),介紹錄音相關(guān)設(shè)備,讓讀者可以
本書主要介紹語(yǔ)音識(shí)別原理及其相關(guān)應(yīng)用。全書共9章,分為五大部分:第一部分(第1章)介紹語(yǔ)音識(shí)別的發(fā)展歷史和語(yǔ)音識(shí)別領(lǐng)域常用的數(shù)據(jù)集與工具箱;第二部分(第2章)介紹在語(yǔ)音識(shí)別領(lǐng)域常用的語(yǔ)音信號(hào)基礎(chǔ)知識(shí)和聲學(xué)特征的提取;第三部分(第3章至第7章)詳細(xì)介紹語(yǔ)音識(shí)別的聲學(xué)模型、語(yǔ)言模型、解碼工具,并對(duì)語(yǔ)音識(shí)別領(lǐng)域的研究熱點(diǎn)(端
花暉:博士,上海交通大學(xué)媒體與傳播學(xué)院副教授。智能傳播系列教材。本書牢牢把握融媒體背景下,聲音創(chuàng)作藝術(shù)、技術(shù)與學(xué)術(shù)共融的專業(yè)特征,厚理論、重實(shí)踐、求創(chuàng)新。一方面闡述聲音創(chuàng)作的美學(xué)原理與表現(xiàn)規(guī)律,幫助學(xué)生夯實(shí)影音美學(xué)理論基礎(chǔ)、扎實(shí)專業(yè)核心,在跨學(xué)科語(yǔ)境下,了解融媒體系統(tǒng)的運(yùn)行方式、掌握數(shù)字聲音制作的全崗位要求;另一方面?zhèn)?/p>
本書牢牢把握融媒體背景下,聲音創(chuàng)作藝術(shù)、技術(shù)與學(xué)術(shù)共融的專業(yè)特征,厚理論、重實(shí)踐、求創(chuàng)新,力求做到理論與實(shí)踐相結(jié)合,開拓讀者的專業(yè)視野,增強(qiáng)讀者的創(chuàng)新能力、協(xié)作能力與自主學(xué)習(xí)能力。為順應(yīng)技術(shù)迭代與新媒體的發(fā)展,本書將重點(diǎn)以互聯(lián)網(wǎng),尤其是移動(dòng)媒體端應(yīng)用廣泛的播客為例,手把手由創(chuàng)意策劃到錄制剪輯,再到輸出發(fā)布,講授全流程創(chuàng)
本書主要介紹關(guān)于人工智能語(yǔ)音測(cè)試的各方面知識(shí)點(diǎn)和實(shí)戰(zhàn)技術(shù)。全書共分為9章,第1章和第2章詳細(xì)介紹人工智能語(yǔ)音測(cè)試各種知識(shí)點(diǎn)和人工智能語(yǔ)音交互原理;第3章和第4章介紹人工智能語(yǔ)音產(chǎn)品需求和評(píng)價(jià)指標(biāo)及其相對(duì)應(yīng)的驗(yàn)收標(biāo)準(zhǔn);第5章介紹如何準(zhǔn)備語(yǔ)音數(shù)據(jù),包括準(zhǔn)備方案和具體方法;第6~9章介紹人工智能語(yǔ)音測(cè)試涉及的4大模塊,即黑盒
本書圍繞語(yǔ)音識(shí)別的原理和應(yīng)用講解,理論結(jié)合實(shí)際,采用大量插圖,輔以實(shí)例,力求深入淺出,讓讀者能較快地理解語(yǔ)音識(shí)別的基礎(chǔ)理論和關(guān)鍵技術(shù)。為了幫助讀者動(dòng)手操作,提高實(shí)戰(zhàn)技能,本書最后還結(jié)合Kaldi、ESPnet和WeNet等開源工具,介紹了具體的工程實(shí)踐方法。
以高端先進(jìn)聲、光、影視技術(shù)及設(shè)備為代表的高科技不斷在舞臺(tái)演出、會(huì)展、藝術(shù)中心和文旅演藝等領(lǐng)域中大顯身手,傳統(tǒng)和新興藝術(shù)借助高科技發(fā)生質(zhì)變,顯著增強(qiáng)現(xiàn)場(chǎng)感染力和藝術(shù)表現(xiàn)力,營(yíng)造氛圍令參與者和觀眾享受沉浸式體驗(yàn)。藝術(shù)表現(xiàn)需要技術(shù)支持,本書介紹當(dāng)前主流的沉浸式3D音視頻和燈光技術(shù),力求將現(xiàn)實(shí)工程案例與理論結(jié)合,將該技術(shù)脈絡(luò)一
本書以高等職業(yè)教育的人工智能類專業(yè)人才培養(yǎng)基本要求為指導(dǎo),以培養(yǎng)學(xué)生掌握智能語(yǔ)音信號(hào)處理及應(yīng)用為目標(biāo),以“必須、夠用”為原則,采用“項(xiàng)目教學(xué)法”,系統(tǒng)介紹了智能語(yǔ)音信號(hào)處理的基本理論、方法以及Python在語(yǔ)音信號(hào)處理中的應(yīng)用。全書包含六個(gè)教學(xué)項(xiàng)目,其中,項(xiàng)目1介紹了智能語(yǔ)音的概念樂展、未來(lái)趨勢(shì)以及應(yīng)用,語(yǔ)音信號(hào)的采集