總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 自動化基礎理論
 
 
 
 
scikit-learn機器學習:常用算法原理及編程實戰
 作  者: 黃永昌
 出版單位: 機械工業
 出版日期: 2018.03
 進貨日期: 2018/4/10
 ISBN: 9787111590248
 開  本: 16 開    
 定  價: 443
 售  價: 354
  會 員 價 : 325

目前無補書計畫,訂書請洽門市或使用留言版訂書功能詢價

推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

阿媔陷洈幫洁B百度、蒙牛乳業、神州數碼等知名公司的6位技術專家力薦

手寫識別程式怎麼做?

如何實現人臉識別系統?

如何過濾垃圾郵件?

電子商務網站上猜你喜歡的商品是什麼原理?如何實現?

電影網站如何去推薦符合用戶喜好的電影?

如何利用機器學習對消費者的特性進行細分,從而更好地服務各細分市場的消費者?

銀行如何去檢測用戶的信用卡可能被盜了?

……

通過閱讀本書,你將瞭解這些複雜問題背後的原理,甚至你都可以自己解決這些問題。

本書對讀者的數學基礎要求低,讓讀者可以以較低的門檻入門機器學習


內容簡介:

本書通過通俗易懂的語言、豐富的圖示和生動的實例,撥開了籠罩在機器學習上方複雜的數學“烏雲”,讓讀者以較低的代價和門檻入門機器學習。

本書共分為11章,介紹了在Python環境下學習scikit-learn機器學習框架的相關知識,涵蓋的主要內容有機器學習概述、Python機器學習軟體包、機器學習理論基礎、k-近鄰演算法、線性回歸演算法、邏輯回歸演算法、決策樹、支持向量機、樸素貝葉斯演算法、PCA演算法和k-均值演算法等。

本書適合有一定編程基礎的讀者閱讀,尤其適合想從事機器學習、人工智慧、深度學習及機器人相關技術的程式員和愛好者閱讀。另外,相關院校和培訓機構也可以將本書作為教材使用。



30秒極速瞭解本書精華內容:

1. 理論基礎

機器學習的應用場景

機器學習編程的典型步驟

Python機器學習開發包:numpy、pandas和matplotlib

演算法模型性能評估的指標和評估方法

2. 八大常用機器學習演算法

k-近鄰演算法

線性回歸演算法

邏輯回歸演算法

決策樹

支持向量機

樸素貝葉斯

PCA演算法

k-均值演算法

3. 七大實戰演練案例

糖尿病檢測

預測房價

乳腺癌檢測

泰坦尼克號倖存者預測

文檔類別預測

人臉識別

文檔自動分類


作者簡介:

黃永昌 2004年畢業於廈門大學自動化系。畢業後一直在夏新電子從事手機系統軟體的研發,直至2009年轉向Android系統軟體開發。熟悉C、Python、Java和JavaScript 等多種開發語言。對數據處理及分析有濃厚的興趣,於2014年開始學習和研究機器學習及數據挖掘領域的相關知識。2015年加入ABB集團,從事智能家居系統的開發,通過分析伺服器及客戶端日誌數據,為智能家居系統開發智能決策模型。


圖書目錄:

前言

第1章 機器學習介紹 1

1.1 什麼是機器學習 1

1.2 機器學習有什麼用 2

1.3 機器學習的分類 3

1.4 機器學習應用開發的典型步驟 4

1.4.1 數據採集和標記 4

1.4.2 數據清洗 5

1.4.3 特徵選擇 5

1.4.4 模型選擇 5

1.4.5 模型訓練和測試 5

1.4.6 模型性能評估和優化 5

1.4.7 模型使用 6

1.5 復習題 6

第2章 Python機器學習軟體包 7

2.1 開發環境搭建 7

2.2 IPython簡介 8

2.2.1 IPython基礎 8

2.2.2 IPython圖形介面 13

2.3 Numpy簡介 15

2.3.1 Numpy數組 15

2.3.2 Numpy運算 19

2.4 Pandas簡介 32

2.4.1 基本數據結構 32

2.4.2 數據排序 34

2.4.3 數據訪問 34

2.4.4 時間序列 36

2.4.5 數據可視化 36

2.4.6 檔讀寫 38

2.5 Matplotlib簡介 38

2.5.1 圖形樣式 38

2.5.2 圖形對象 40

2.5.3 畫圖操作 46

2.6 scikit-learn簡介 51

2.6.1 scikit-learn示例 51

2.6.2 scikit-learn一般性原理和通用規則 55

2.7 復習題 56

2.8 拓展學習資源 57

第3章 機器學習理論基礎 58

3.1 過擬合和欠擬合 58

3.2 成本函數 59

3.3 模型準確性 60

3.3.1 模型性能的不同表述方式 61

3.3.2 交叉驗證數據集 61

3.4 學習曲線 62

3.4.1 實例:畫出學習曲線 62

3.4.2 過擬合和欠擬合的特徵 65

3.5 演算法模型性能優化 65

3.6 查準率和召回率 66

3.7 F1 Score 67

3.8 復習題 67

第4章 k-近鄰演算法 69

4.1 演算法原理 69

4.1.1 演算法優缺點 69

4.1.2 演算法參數 70

4.1.3 演算法的變種 70

4.2 示例:使用k-近鄰演算法進行分類 70

4.3 示例:使用k-近鄰演算法進行回歸擬合 72

4.4 實例:糖尿病預測 74

4.4.1 加載數據 74

4.4.2 模型比較 75

4.4.3 模型訓練及分析 77

4.4.4 特徵選擇及數據可視化 78

4.5 拓展閱讀 80

4.5.1 如何提高k-近鄰演算法的運算效率 80

4.5.2 相關性測試 80

4.6 復習題 81

第5章 線性回歸演算法 83

5.1 演算法原理 83

5.1.1 預測函數 83

5.1.2 成本函數 84

5.1.3 梯度下降演算法 84

5.2 多變量線性回歸演算法 86

5.2.1 預測函數 86

5.2.2 成本函數 87

5.2.3 梯度下降演算法 88

5.3 模型優化 89

5.3.1 多項式與線性回歸 89

5.3.2 數據歸一化 89

5.4 示例:使用線性回歸演算法擬合正弦函數 90

5.5 示例:測算房價 92

5.5.1 輸入特徵 92

5.5.2 模型訓練 93

5.5.3 模型優化 94

5.5.4 學習曲線 95

5.6 拓展閱讀 96

5.6.1 梯度下降迭代公式推導 96

5.6.2 隨機梯度下降演算法 96

5.6.3 標準方程 97

5.7 復習題 97

第6章 邏輯回歸演算法 98

6.1 演算法原理 98

6.1.1 預測函數 98

6.1.2 判定邊界 99

6.1.3 成本函數 100

6.1.4 梯度下降演算法 102

6.2 多元分類 102

6.3 正則化 103

6.3.1 線性回歸模型正則化 103

6.3.2 邏輯回歸模型正則化 104

6.4 演算法參數 104

6.5 實例:乳腺癌檢測 106

6.5.1 數據採集及特徵提取 106

6.5.2 模型訓練 108

6.5.3 模型優化 110

6.5.4 學習曲線 111

6.6 拓展閱讀 113

6.7 復習題 114

第7章 決策樹 115

7.1 演算法原理 115

7.1.1 資訊增益 116

7.1.2 決策樹的創建 119

7.1.3 剪枝演算法 120

7.2 演算法參數 121

7.3 實例:預測泰坦尼克號倖存者 122

7.3.1 數據分析 122

7.3.2 模型訓練 123

7.3.3 優化模型參數 124

7.3.4 模型參數選擇工具包 127

7.4 拓展閱讀 130

7.4.1 熵和條件熵 130

7.4.2 決策樹的構建演算法 130

7.5 集合演算法 131

7.5.1 自助聚合演算法Bagging 131

7.5.2 正向激勵演算法boosting 131

7.5.3 隨機森林 132

7.5.4 ExtraTrees演算法 133

7.6 復習題 133

第8章 支持向量機 134

8.1 演算法原理 134

8.1.1 大間距分類演算法 134

8.1.2 鬆弛係數 136

8.2 核函數 138

8.2.1 最簡單的核函數 138

8.2.2 相似性函數 140

8.2.3 常用的核函數 141

8.2.4 核函數的對比 142

8.3 scikit-learn堛搴VM 144

8.4 實例:乳腺癌檢測 146

8.5 復習題 149

第9章 樸素貝葉斯演算法 151

9.1 演算法原理 151

9.1.1 貝葉斯定理 151

9.1.2 樸素貝葉斯分類法 152

9.2 一個簡單的例子 153

9.3 概率分佈 154

9.3.1 概率統計的基本概念 154

9.3.2 多項式分佈 155

9.3.3 高斯分佈 158

9.4 連續值的處理 159

9.5 實例:文檔分類 160

9.5.1 獲取數據集 160

9.5.2 文檔的數學表達 161

9.5.3 模型訓練 163

9.5.4 模型評價 165

9.6 復習題 167

第10章 PCA演算法 168

10.1 演算法原理 168

10.1.1 數據歸一化和縮放 169

10.1.2 計算協方差矩陣的特徵向量 169

10.1.3 數據降維和恢復 170

10.2 PCA 演算法示例 171

10.2.1 使用Numpy模擬PCA計算過程 171

10.2.2 使用sklearn進行PCA降維運算 173

10.2.3 PCA的物理含義 174

10.3 PCA 的數據還原率及應用 175

10.3.1 數據還原率 175

10.3.2 加快監督機器學習演算法的運算速度 176

10.4 實例:人臉識別 176

10.4.1 加載數據集 176

10.4.2 一次失敗的嘗試 179

10.4.3 使用PCA來處理數據集 182

10.4.4 最終結果 185

10.5 拓展閱讀 189

10.6 復習題 189

第11章 k-均值演算法 190

11.1 演算法原理 190

11.1.1 k-均值演算法成本函數 191

11.1.2 隨機初始化聚類中心點 191

11.1.3 選擇聚類的個數 192

11.2 scikit-learn堛榭-均值演算法 192

11.3 使用k-均值對文檔進行聚類分析 195

11.3.1 準備數據集 195

11.3.2 加載數據集 196

11.3.3 文本聚類分析 197

11.4 聚類演算法性能評估 200

11.4.1 Adjust Rand Index 200

11.4.2 齊次性和完整性 201

11.4.3 輪廓係數 203

11.5 復習題 204

後記 205


章節試讀:

前言

機器學習是近年來非常熱門的方向,然而普通的程式員想要轉行機器學習卻困難重重。回想起來,筆者在剛開始學習機器學習時,一上來就被一大堆數學公式和推導過程所折磨,這樣的日子至今還歷歷在目。當時筆者也覺得機器學習是個門檻非常高的學科。但實際上,在機器學習的從業人員堙A究竟有多少人需要從頭去實現一個演算法?又有多少人有機會去發明一個新演算法?從一開始就被細節和難點纏住,這嚴重打擊了想進入機器學習領域新人的熱情和信心。

本書就是要解決這個問題。筆者希望儘量通過通俗的語言去描述演算法的工作原理,並使用scikit-learn工具包演示演算法的使用,以及演算法所能解決的問題,給那些非科班出身而想半路“殺進”人工智慧領域的程式員,以及對機器學習感興趣的人提供一本入門的書籍。

當然,這堣ㄛO否認數學和演算法實現的重要性,畢竟它們是人工智慧領域的基礎學科方向。萬事開頭難,只有打開了一扇門,才能發現一個新的五彩繽紛的世界。在這個世界堙A我們可以吃到新口味的麵包,也能認識那些做麵包給別人吃的人。希望這本書能幫助讀者打開機器學習的這扇門。

本書特色

1.用通俗易懂的語言介紹機器學習演算法的原理,符合初學者的認知規律

本書講解時首先會用通俗易懂的語言介紹常用的機器學習演算法,幫助讀者直觀地理解每個演算法的基本原理,然後用大量的圖示及實例介紹如何使用scikit-learn工具包解決現實生活中的機器學習問題。這種由淺入深、循序漸進的講授方式,完全遵循了初學者對機器學習演算法的認知規律。

2.豐富的示例圖片,可以幫助讀者更加直觀地理解演算法背後的原理

機器學習以其背後複雜的數學原理及異常複雜的演算法推導和證明過程而嚇退了一大批讀者。一圖勝千言,本書給出了大量的圖示,用圖片的方式形象地介紹了演算法的基本原理,讓讀者對演算法有更加直觀的理解。這樣就把複雜的數學公式和冗長的文字描述濃縮到一張張圖片中,有效地降低了學習的門檻。

3.實例豐富,可以幫助讀者使用機器學習演算法解決工程應用問題

手寫識別程式怎麼做?怎麼實現人臉識別系統?怎麼過濾垃圾郵件?電子商務網站上猜你喜歡的商品是什麼原理?怎麼實現的?電影網站怎樣去推薦符合用戶喜好的電影?怎麼利用機器學習對消費者的特性進行細分,從而更好地服務好各細分市場的消費者?銀行怎樣去檢測用戶的信用卡可能被盜了?通過閱讀本書,讀者將瞭解到這些複雜問題背後的原理,甚至你都可以自己解決這些問題。

本書內容介紹

第1章機器學習介紹,涵蓋了機器學習的定義、應用場景及機器學習的分類,並通過一個簡單的示例,讓讀者瞭解機器學習的典型步驟和機器學習領域的一些專業術語。

第2章Python機器學習軟體包,介紹了scikit-learn開發環境的搭建步驟,以及IPython、Numpy、Pandas和Matplotlib等軟體包的基礎知識,並通過一個scikit-learn機器學習實例介紹了scikit-learn的一般性原理和通用規則。

第3章機器學習理論基礎,介紹了演算法模型性能評估的指標和評估方法等理論基礎。本章內容是本書最關鍵的理論基礎知識,對理解本書其他章節的內容非常重要。

第4章k-近鄰演算法,介紹了一個有監督的機器學習演算法,即k-近鄰演算法。該演算法可以解決分類問題,也可以解決回歸問題。

第5章線性回歸演算法,介紹了單變數線性回歸演算法和多變量線性回歸演算法的原理,以及通過梯度下降演算法迭代求解線性回歸模型,並給出一個房價預測的實例。另外,本章對成本函數和使用線性回歸演算法對數據進行擬合也做了講解。

第6章邏輯回歸演算法,介紹了邏輯回歸演算法的原理及成本函數。在本章中主要解決的問題有:邏輯回歸演算法的原理是什麼?怎樣使用梯度下降演算法解決迭代求解邏輯回歸演算法的模型參數?什麼是正則化?正則化能解決什麼問題?L1範數和 L2 範數作為模型正則項有什麼區別?如何使用邏輯回歸演算法解決乳腺癌檢測問題?

第7章決策樹,主要介紹了決策樹的演算法原理和演算法參數,並給出了一個預測實例,最後對集合演算法做了必要講解。

第8章支持向量機,主要介紹了支持向量機的基本演算法原理及常用核函數,並給出了用支持向量機來解決乳腺癌檢測問題的實例。

第9章樸素貝葉斯演算法,首先從貝葉斯定理談起,引入了樸素貝葉斯分類法;然後通過一個簡單的例子說明了演算法的基本原理;接著介紹了概率分佈的概念及幾種典型的概率分佈;最後通過一個文檔分類實例來說明樸素貝葉斯演算法的應用。

第10章PCA演算法,首先介紹了PCA的演算法原理;然後通過一個簡單的模擬運算過程幫助讀者理解該演算法的原理和實現步驟;最後介紹了PCA演算法背後的物理含義。本章在講解的過程中順便給讀者推薦了一些優秀的線性代數資源,供讀者參考。

第11章k-均值演算法,首先介紹了該演算法的基本原理及關鍵迭代步驟;然後通過一個簡單的例子,介紹了如何使用scikit-learn中的k-均值演算法解決聚類問題;最後使用一個文本聚類分析的例子介紹了k-均值演算法的應用,並介紹了典型的無監督機器學習演算法的性能評估指標。

如何更好地使用本書

如果你只是好奇機器學習背後的原理,大可只閱讀書中的文字部分,而跳過代碼實現環節;如果你是想用本書敲開機器學習這扇大門,並且未來想從事這一行業,那麼建議你系統地閱讀本書,而且要親自動手完成書中的所有實例。本書提供了書中所有實例的完整源代碼,建議你認真閱讀這些源代碼,並親自動手運行這些代碼,還可以調整參數,看看結果有什麼變化,最後再獨立把這些實例實現一遍。

閱讀本書需要的知識儲備

閱讀本書,建議你最好學習過Python 語言,即便是兩年前學的,學過後就算沒怎麼用也沒有關係。如果你不熟悉Python語言,那麼最好有其他編程語言基礎,如C 或Java語言等。

本書讀者對象

1.有一定編程經驗,而不滿足於永遠在“搬磚”的軟體工程師

你是不是厭倦了每天重複“搬磚”的過程?你是不是想提高職業的溢價?本書或許可以幫助你打開一扇大門。人工智慧在可以預見的未來有巨大的發展前景。特別是近幾年,層出不窮的開源機器學習框架不斷湧現出來,雲計算和分佈式計算能力的進一步提升,為人工智能應用於更廣泛的領域提供了必要的基礎。在可以預見的未來,人工智慧領域對機器學習工程師的需求將急劇上升。如果本書能幫助你打開機器學習領域的這扇大門,讓你能利用機器學習的知識解決實際問題,這將是筆者最大的榮耀。

2.對這個世界充滿好奇的人

筆者之前在某電商網站上搜索了某款手機,之後上網時有大量的網站廣告都在向筆者展示手機及其相關產品。這些網站是怎麼知道筆者近期想買手機的?筆者常去的電影網站每次都能給筆者推薦一些符合筆者“口味”的電影。這是如何做到的?本書便可以讓你以很低的門檻瞭解這些問題背後的原理,甚至你也可以自己動手做一個,玩一玩。

本書雖然有大量的程式示例代碼,但是筆者通過通俗易懂的講述,並配以大量的圖示,讓這本書的閱讀門檻很低,甚至可以作為本科普讀物去閱讀。可以說,這本書幾乎適合所有對這個世界充滿好奇的人閱讀,尤其是那些對人工智慧充滿好奇的人,以及對機器學習演算法感興趣的人。

本書源代碼獲取方式

本書涉及的源代碼檔需要讀者自行下載。請讀者登錄機械工業出版社華章公司的網站www.hzbook.com,然後搜索到本書頁面,找到下載模組下載即可。

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 部分書籍附贈配件(如音頻mp3或dvd等)已無實體光碟提供,需以QR CODE 連結至出版社提供的網站註冊並通過驗證程序,方可下載使用。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。