總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
 
 
 
 
Python應用實戰:爬蟲•文本分析與可視化(配件另行下載)
 作  者: 張麗/張鵬/彭笛
 出版單位: 電子工業
 出版日期: 2020.03
 進貨日期: 2020/6/4
 ISBN: 9787121380136
 開  本: 16 開    
 定  價: 315
 售  價: 168
  會 員 價: 168
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
內容簡介:

歡迎來到Python的世界。
  《Python應用實戰:爬蟲、文本分析與可視化》介紹了Python的語法、數據結構等基礎知識,以及經典的Python爬蟲、網頁文本分析及可視化。
  在《Python應用實戰:爬蟲、文本分析與可視化》中,讀者不僅可以與Python“結識”,還會遇到新“朋友”———瀏覽器的開發者工具,通過它來了解HTML編寫網頁的語言,並進行結構化的網頁分析和所需數據的提取。
  拿來主義特別適合來類比Python語言中的庫,Python將與re、requests、lxml等經典的庫組合在一起,自動抓取網頁數據的爬蟲。Pandas這個工具會對抓取的數據進行文本分析,並實現將枯燥的數據進行漂亮的可視化呈現。
  千里之行,始於足下,歡迎進入《Python應用實戰:爬蟲、文本分析與可視化》的奇妙之旅。


作者簡介:

張麗,女,電子科技大學大數據研究中心教師,主要從事數據分析、Python語言的應用以及項目開發等相關課程的教學和科研。


圖書目錄:

第1章 初識Python 1
1.1 使用IDLE 1
1.2 從字符串著手 4
1.3 複雜數據的福音──列表 7
1.3.1 創建列表 7
1.3.2 列表的操作 7
1.4 處理數據──條件判斷 9
1.5 處理數據──循環 11
1.6 處理數據進階──嵌套語句 12
1.7 函數 14
1.8 拿來就用──模塊 16
1.9 文件 17
1.10 處理異常 18
第2章 網頁 20
2.1 工具準備 20
2.2 從URL開始 21
2.2.1 簡單獲取URL 22
2.2.2 鏈接與URL 24
2.3 編寫網頁的語言──HTML 25
2.3.1 創建自己的第一個網頁 26
2.3.2 標籤──創建網頁的方塊 27
2.3.3 標籤屬性 30
2.4 CSS與class 31
2.5 JavaScript和id 33
2.6 網頁分析工具 36
2.6.1 谷歌開發者工具 36
2.6.2 查看網頁結構 38
2.6.3 定位指定的元素 39
2.6.4 篩選不同的資源 41
2.7 網頁的快遞──HTTP 44
2.7.1 HTTP請求 45
2.7.2 HTTP響應 46
2.7.3 HTTP的應用──Cookie和Session 47
2.7.4 實戰──HTTP的交互過程 49
2.8 以URL結束 52
2.9 本章總結 55
第3章 數據抓取 56
3.1 工具準備 56
3.2 Xpath和lxml.html 58
3.2.1 網頁分析利器──lxml 58
3.2.2 XPath 59
3.2.3 XPath使用實例 60
3.2.4 XPath演示 61
3.3 關於robots.txt 62
3.4 小試牛刀 64
3.4.1 過程分析 64
3.4.2 動手敲代碼 67
3.4.3 小結 68
3.4.4 擴展 68
3.5 獲取電影數據(上) 69
3.5.1 過程分析 70
3.5.2 動手敲代碼 73
3.5.3 小結 74
3.6 獲取電影數據(下) 75
3.6.1 過程分析 76
3.6.2 動手敲代碼 76
3.6.3 考慮加強代碼的健壯性 78
3.6.4 小結 80
3.7 另類的網頁抓取 80
3.7.1 過程分析 81
3.7.2 動手敲代碼 84
3.7.3 小結 85
3.8 爬蟲與網絡機器人 85
3.9 本章總結 86
第4章 文本處理 87
4.1 正則表達式 87
4.1.1 怎樣進行匹配 87
4.1.2 常用的元字符 88
4.2 更強的文本工具──Python的 re庫 89
4.2.1 匹配對象怎麼用 91
4.2.2 使用regex來搜索 91
4.2.3 使用regex來替換 93
4.2.4 更方便查找 95
4.2.5 re庫中的控制標誌 95
4.2.6 replace()和re.sub() 98
4.2.7 實現更高級的strip()方法 99
4.2.8 新的拆分方法re.split() 100
4.2.9 怎樣提取中文 101
4.3 電影數據的處理 102
4.3.1 提取之前的觀察 104
4.3.2 需要獲取哪些數據 104
4.3.3 多樣化的方法 111
4.3.4 格式化的數據 112
4.4 本章總結 115
第5章 數據分析 116
5.1 工具準備 116
5.1.1 配置Jupyter Notebook 116
5.1.2 數據生成幫手──Numpy 116
5.1.3 Pandas中的數據結構 118
5.2 像一維數組的Series 118
5.2.1 獲取Series信息 120
5.2.2 Series進行數學運算 123
5.2.3 對Series進行一些操作 124
5.2.4 方法串聯 128
5.2.5 操作Series中的字符串數據 129
5.2.6 小結一下Series 130
5.3 DataFrame 131
5.3.1 創建DataFrame 132
5.3.2 對齊 133
5.3.3 了解DataFrame 134
5.3.4 常用DataFrame操作 137
5.3.5 數據的導入與導出 141
5.4 簡單數據分析 145
5.4.1 電影評分分布 145
5.4.2 電影產量趨勢 146
5.4.3 評論人數最多的電影 147
5.4.4 發行電影最多的國家 148
5.5 看得見的數據 153
5.5.1 線圖 153
5.5.2 柱狀圖 155
5.5.3 餅圖 157


章節試讀:

打開本書,請記下今天的日期,同時記住30天內要完成本書內容的學習。那麼Python是什麼?為什麼要學習Python?我作為一名受益者,親歷了從一個編程小白到學會使用Python進行自動化的工具開發,以及編寫自己工作中需要代碼的過程。
  大學學習C語言編程的時候,老師上課講的知識我都聽懂了,但我就是不會編寫程序。這個問題困擾了我很久。現在回頭想想學習編程有兩種境界:痴迷和崩潰。我應該就是學到崩潰了吧。參加工作以後,我因為工作需要自學了Python,看著編寫的代碼運行起來,心情也跟著放飛了,即使過程中遇到各種錯誤和異常狀況,我也會專注地投入去解決問題。
  初學編程語言很容易陷入複雜的邏輯中而一籌莫展,久而久之就會逐步放棄,所以選擇一門好的編程語言就是成功的一半。使用Python編程不用很費勁就能實現想要的代碼功能,編寫的代碼也清晰易懂,並且能夠保持自己的編碼風格。
  本書圍繞學會編程並能使用編程語言進行程序設計、圍繞數據進行處理的主題,介紹編程和相關的知識。
  學以致用是一條很幸福的學習道路。本書面向那些希望學習一門編程語言並想對數據進行處理的讀者。如果你是Python語言的小白,那麼請從第1章開始學習;如果你已經具備Python編程的基礎,那麼請跳過第1章,從第2章開始學習。僅憑幾行代碼搞定複雜的文本處理任務,是不是很酷?快速進行項目實戰,就不會失去學習的興奮點。
  保持幽默是Python語言和社區的傳統,你在學習的過程中,輸入importthis後就會體驗到了。那麼就按照importthis輸出的箴言前進吧。好了,祝你編程愉快,30天后見。
  本書特色
  本書能讓你在30天內將Python、HTML、爬蟲、數據抓取、文本分析和數據可視化等技術,從應用流程上將各個知識點串聯起來。30天后,你將有如下收穫。
  1.獲得Python語言的基礎技能,學會用程序員的思維來處理問題。
  2.了解HTML,學會使用強大的網頁分析工具,輕鬆獲取網頁中的數據。在面對大量數據時,會藉助Python,學習怎樣自動抓取。
  3.當抓取的數據(文本)雜亂無章時,文本分析的方法可對數據進行清洗,你將了解到正則表達式的強大。
  4.當乾淨的數據被導入後,你會學習分析這些數據,將枯燥的數據轉化為可視化的、生動的圖片。
  通過上述學習之後,你能夠對Python工具生態圈有一個完整的認識,了解自己在這個生態圈中的定位,決定自己後續的升級(學習)方向。

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。