總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 自動化基礎理論
 
 
 
 
圖解語音識別
 叢書名稱: 圖靈程序設計叢書
 作  者: (日)荒木雅弘
 出版單位: 人民郵電
 出版日期: 2020.04
 進貨日期: 2020/6/3
 ISBN: 9787115528711
 開  本: 32 開    
 定  價: 443
 售  價: 236
  會 員 價: 236
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

125張圖解輕鬆入門 一本書掌握語音識別基礎知識

1.全面 網羅基礎知識點,語音識別研究入門佳作
2.易懂 深入淺出,技術領域的“科普書”
3.直觀 圖文並茂、全彩印刷,閱讀起來不費勁 知識點涵蓋: 語音學/統計模式識別/有限狀態自動機/特徵提取/聲學模型 語言模型/搜索算法/WFST合成與轉換/語義分析/語音對話系統


內容簡介:

《圖解語音識別》從語音識別的歷史和基礎知識講起,通過圖解的方式對語音識別技術進行了盡可能簡單的解釋。內容涉及語音學基礎知識、統計模式識別、有限狀態自動機、語音特徵的提取、聲學模型和語言模型、搜索算法和基於WFST 的語音識別技術等。 此外,本書沒有將語音識別限定在“將語音轉換成文本”的傳統範疇內,而是在此基礎上,還講解了從語音識別技術到人機對話技術的演進過程和方法。內容涉及語義分析和語音對話系統的實現。


作者簡介:

荒木雅弘(作者) 1964年出生於日本大阪。1993年完成 了日本京都大學研究生院研究科信息工程專業博士課程的學習。先後擔任過京都大學工學部助教和京都大學綜合信息媒體中心講師。1999年開始擔任日本京都工藝纖維大學工藝系助理教授,2007年晉升為研究生院工藝科學研究科副教授。目前正在開發以語義網為知識庫的對話系統,研究用於多模態對話系統的描述語言。 陳舒揚(譯者) 軟件開發工程師,任職於某日企,從事軟件開發工作。熱愛編程和遊戲,崇尚開源精神,對機器學習領域的東西都很著迷。 楊文剛(譯者) 長期從事軟件開發和系統運維工作。現任職於某世界五百強企業,探索數字化轉型業務,內容涉及大數據、機器學習、深度學習等技術。


圖書目錄:

第 1章 開篇

1.1 什麼是語音識別 2

1.2 語音識別的歷史 4

1.3 語音識別的用處 6

1.4 為什麼很難 8

1.5 本書的目標 10

1.6 小結 12

第 2章 什麼是語音

2.1 語音學 16

2.2 聲音是如何產生的——發音語音學 16

2.3 聲音的真面目——聲學語音學 23

2.4 聲音是如何被感知的——感知語音學 29

2.5 總結 32

第3章 統計模式識別

3.1 什麼是模式識別 34

3.2 統計模式識別的思路 36

3.3 生成模型的訓練 40

3.4 判別模型的訓練 44

3.5 統計語音識別的概要 45

3.6 總結 48

第4章 有限狀態自動機

4.1 什麼是有限狀態自動機 50

4.2 用有限狀態自動機表達的語言 53

4.3 各種各樣的有限狀態自動機 55

4.4 有限狀態自動機的性質 58

4.5 總結 59



第5章 語音特徵的提取

5.1 特徵提取的步驟 62

5.2 語音信號的數字化 64

5.3 人類聽覺模擬——頻譜分析 67

5.4 另一個精巧設計——倒譜分析 69

5.5 噪聲去除 72

5.6 總結 73

第6章 語音識別:基本聲學模型

6.1 聲學模型的單位 76

6.2 什麼是隱馬爾可夫模型 78

6.3 隱馬爾可夫模型的概率計算 81

6.4 狀態序列的估計 83

6.5 參數訓練 85

6.6 總結 89

第7章 語音識別:高級聲學模型

7.1 實際的聲學模型 92

7.2 判別訓練 94

7.3 深度學習 96

7.4 總結 98

第8章 語音識別:語言模型

8.1 基於語法規則的語言模型 100

8.2 統計語言模型的思路 101

8.3 統計語言模型的建立方法 103

8.4 總結 108

第9章 語音識別:搜索算法

9.1 填補聲學模型和語言模型之間的空隙 112

9.2 狀態空間搜索 113

9.3 用樹形字典減少浪費 115

9.4 用集束搜索縮小範圍 116

9.5 用多次搜索提高精度 118

9.6 總結 120

第 10章 語音識別:WFST運算

10.1 WFST的合成運算 124

10.2 確定化 129

10.3 權重移動 133

10.4 最小化 134

10.5 總結 135

第 11章 語音識別:使用 WFST進行語音識別

11.1 WFST轉換 138

11.2 聲學模型的 WFST轉換 139

11.3 發音字典的 WFST轉換 141

11.4 語言模型的 WFST轉換 142

11.5 WFST的搜索 144

11.6 總結 145

第 12章 語義分析

12.1 什麼是語義表示 148

12.2 基於規則的語義分析處理 151

12.3 基於統計的語義分析處理 153

12.4 智能手機的語音服務 156

12.5 總結 159

第 13章 語音對話系統的實現

13.1 對話系統的開發方法 162

13.2 基於規則的對話管理 164

13.3 針對對話管理的統計方法 166

13.4 總結 170

第 14章 終篇

14.1 語音分析工具 WaveSurfer 174

14.2 HMM構建工具 HTK 175

14.3 大詞彙量連續語音識別引擎 Julius 177

14.4 虛擬代理對話工具 MMDAgent 179

14.5 深入學習之路 180



思考題的解答 182

參考文獻 188

後 記 191

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。