總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
教育教輔 論文寫作
 
 
 
 
知識圖譜:概念與技術
 作  者: 肖仰華
 出版單位: 電子工業
 出版日期: 2020.01
 進貨日期: 2020/5/13
 ISBN: 9787121371080
 開  本: 16 開    
 定  價: 885
 售  價: 472
  會 員 價: 472
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

· 有深度也有廣度,力求涵蓋知識圖譜相關的基本概念與關鍵技術。

· 梳理前沿成果,總結了十多個知識圖譜工程項目的落地經驗。

· 寫作團隊成員均為國內知名高校和研究所AI相關專業教師和研究員。

· 內容歷經一年打磨,並曾在多所高校試講,根據聽眾反饋迭代改進。


內容簡介:

知識圖譜是一種大規模語義網絡,已經成為大數據時代知識工程的代表性進展。知識圖譜技術是實現機器認知智能和推動各行業智能化發展的關鍵基礎技術。知識圖譜也成為大規模知識工程的代表性實踐,其學科日益完善。

本書是一本系統介紹知識圖譜概念、技術與實踐的書籍。全書共5篇,由16 章構成,力求涵蓋知識圖譜相關的基本概念與關鍵技術。“基礎篇”介紹知識圖譜的基本概念、內涵與外延、歷史沿革、應用價值,以及相關的基礎知識。“構建篇”重點介紹大規模高質量知識圖譜的自動化構建技術,涵蓋詞彙挖掘、實體識別、關係抽取及概念圖譜構建、百科圖譜構建、眾包構建與質量控制等專題。“管理篇”系統地闡述了知識圖譜建模與存儲、查詢與檢索,以及圖數據管理系統。“應用篇”對於基於知識圖譜的關鍵應用技術展開介紹,包括搜索與推薦、自然語言問答,以及基於知識圖譜的自然語言理解。“實踐篇”介紹知識圖譜實踐中的基本原則和有用實踐,初步討論了知識圖譜實踐中的開放性問題。

本書可作為高年級本科生、碩士生或者博士生的教材,也適合企業與行業智能化的從業人員閱讀。


作者簡介:

肖仰華 博士,復旦大學教授、博士生導師、復旦大學知識工場實驗室創始人。曾擔任多家企業高級技術顧問與首席科學家。曾獲得十多個國家、省/市、企業級的研究獎項,曾承擔三十多項國家、省/市、企業級研發項目。在國際Ding級學術會議與期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、ACL、TKDE等)發表論文百餘篇,授權近20項知識圖譜專利。擔任多個國際期刊編委,百餘次為國際/國內學術機構/會議提供學術服務工作。領導構建了知識工場平台,發布了一系列知識圖譜包括CN-DBpedia、CN-Probase等。


圖書目錄:

第1篇 基礎篇

第1章 知識圖譜概述... 2

1.1 知識圖譜的基本概念... 2

1.1.1 知識圖譜的狹義概念... 3

1.1.2 知識圖譜的廣義概念... 8

1.2 知識圖譜的歷史沿革... 10

1.2.1 知識圖譜溯源... 10

1.2.2 大數據知識工程... 13

1.3 知識圖譜的研究意義... 16

1.3.1 知識圖譜是認知智能的基石... 16

1.3.2 知識引導成為解決問題的重要方式之一... 19

1.4 知識圖譜的應用價值... 20

1.4.1 數據分析... 20

1.4.2 智慧搜索... 21

1.4.3 智能推薦... 22

1.4.4 自然人機交互... 23

1.4.5 決策支持... 23

1.5 知識圖譜的分類... 24

1.5.1 知識圖譜中的知識分類... 25

1.5.2 知識圖譜的領域特性... 26

1.5.3 典型知識圖譜... 30

本章小結 38

思考題... 39

參考文獻 40

第2章 基礎知識... 43

2.1 概述 43

2.2 知識表示... 45

2.2.1 基本概念... 45

2.2.2 知識圖譜的圖表示... 47

2.2.3 知識圖譜的數值表示... 49

2.2.4 其他相關知識表示... 54

2.3 機器學習... 64

2.3.1 機器學習的基本概念... 65

2.3.2 深度學習概述... 67

2.3.3 卷積神經網絡... 70

2.3.4 循環神經網絡... 71

2.3.5 注意力機制... 72

2.4 自然語言處理... 73

2.4.1 基本概念... 74

2.4.2 文本的向量化表示... 76

本章小結 78

思考題... 79

參考文獻 80

第2篇 構建篇

第3章 詞彙挖掘與實體識別... 84

3.1 概述 84

3.2 領域短語挖掘... 86

3.2.1 問題描述... 87

3.2.2 領域短語挖掘方法... 88

3.2.3 統計指標特徵... 91

3.3 同義詞挖掘... 95

3.3.1 概述... 95

3.3.2 典型方法... 96

3.4 縮略詞抽取... 101

3.4.1 縮略詞的概念與形式... 101

3.4.2 縮略詞的檢測與抽取... 103

3.4.3 縮略詞的預測... 105

3.5 實體識別... 109

3.5.1 概述... 109

3.5.2 傳統的NER方法... 110

3.5.3 基於深度學習的NER方法... 114

3.5.4 近期的一些方法... 120

本章小結 121

思考題... 122

參考文獻 122

第4章 關係抽取... 127

4.1 概述 127

4.1.1 關係抽取的問題和方法分類... 128

4.1.2 關係抽取常用數據集... 130

4.1.3 關係抽取評估方法... 131

4.2 基於模式的抽取... 133

4.2.1 基於字符模式的抽取... 134

4.2.2 基於語法模式的抽取... 135

4.2.3 基於語義模式的抽取... 135

4.2.4 自動化模式獲取:自舉法... 136

4.2.5 基於模式抽取的質量評估... 138

4.3 基於學習的抽取... 139

4.3.1 基於監督學習的關係抽取... 140

4.3.2 基於遠程監督學習的關係抽取... 142

4.3.3 基於深度學習的關係抽取... 144

4.4 開放關係抽取... 150

4.4.1 TextRunner 151

4.4.2 ReVerb. 152

4.4.3 Ollie. 154

本章小結 154

思考題... 156

參考文獻 157

第5章 概念圖譜構建... 160

5.1 概述 160

5.1.1 常見的概念圖譜... 163

5.1.2 概念圖譜的應用... 166

5.2 isA關係抽取... 168

5.2.1 基於在線百科的方法... 169

5.2.2 基於模式的方法... 170

5.2.3 中文概念圖譜的構建... 172

5.3 isA關係補全... 175

5.3.1 isA關係缺失的成因... 176

5.3.2 基於isA關係傳遞性的概念圖譜補全... 177

5.3.3 基於協同過濾思想的概念圖譜補全... 179

5.4 isA關係糾錯... 181

5.4.1 錯誤的成因... 182

5.4.2 基於支持度的糾錯... 183

5.4.3 基於圖模型的糾錯... 184

本章小結 185

思考題... 186

參考文獻 187

第6章 百科圖譜構建... 189

6.1 概述 189

6.1.1 什麼是百科圖譜... 189

6.1.2 百科圖譜的意義... 190

6.1.3 百科圖譜的分類... 191

6.2 基於單源的百科圖譜構建... 192

6.2.1 數據獲取... 193

6.2.2 屬性抽取... 195

6.2.3 關係構建... 200

6.2.4 概念層級體系構建... 201

6.2.5 實體分類... 201

6.3 基於多源的百科圖譜融合... 207

6.3.1 基於多個知識圖譜的融合方法... 207

6.3.2 基於多源異構數據的融合方法... 215

本章小結 216

思考題... 217

參考文獻 217

第7章 知識圖譜的眾包構建... 221

7.1 概述 221

7.2 知識型眾包的基本概念... 223

7.3 知識型眾包研究的問題... 226

7.3.1 What(對什麼任務進行眾包)... 226

7.3.2 Whom(將任務交予誰完成)... 229

7.3.3 How(如何完成眾包)... 230

7.4 基於眾包的知識圖譜構建與精化... 235

7.4.1 本體構建階段的人工介入... 235

7.4.2 知識圖譜構建階段的人工介入... 237

7.4.3 知識圖譜精化階段的人工介入... 242

本章小結 244

思考題... 245

參考文獻 246

第8章 知識圖譜的質量控制... 250

8.1 概述 251

8.1.1 知識圖譜質量評估的維度... 251

8.1.2 知識圖譜質量評估的方法... 253

8.1.3 知識圖譜質量控制全週期概覽... 254

8.2 缺失知識的發現與補全... 260

8.2.1 類型補全... 260

8.2.2 關係補全... 263

8.2.3 屬性值補全... 268

8.3 錯誤知識的發現與糾正... 270

8.3.1 錯誤實體類型檢測... 271

8.3.2 錯誤實體關係檢測... 271

8.3.3 錯誤屬性值檢測... 273

8.4 過期知識的更新... 274

8.4.1 基於更新頻率預測的更新機制... 275

8.4.2 基於時間標籤的更新機制... 276

8.4.3 基於熱點事件發現的更新機制... 277

本章小結 278

思考題... 279

參考文獻 280

第3篇 管理篇

第9章 知識圖譜的建模與存儲... 286

9.1 概述 286

9.2 知識圖譜的數據模型... 287

9.2.1 知識圖譜的三元組模型... 287

9.2.2 知識圖譜的圖模型... 291

9.3 知識圖譜的物理存儲... 296

9.3.1 知識圖譜數據的基本操作... 296

9.3.2 知識圖譜的關係表存儲... 297

9.3.3 知識圖譜的圖存儲... 302

9.3.4 分布式計算環境下的知識圖譜數據存儲... 305

本章小結 309

思考題... 310

參考文獻 310

第10章 知識圖譜的查詢與檢索... 314

10.1 概述 314

10.2 查詢語言:SPARQL. 315

10.2.1 簡單查詢... 315

10.2.2 SPARQL查詢機制及知識圖譜上的推理... 321

10.3 子圖查詢... 324

10.3.1 子圖查詢基本知識... 324

10.3.2 近似子圖查詢... 326

10.3.3 Top-k查詢... 331

10.3.4 索引結構... 334

10.4 其他查詢... 335

10.4.1 路徑查詢... 335

10.4.2 關鍵詞查詢... 337

10.4.3 社團搜索... 339

本章小結 342

思考題... 343

參考文獻 343

第11章 圖數據管理系統... 347

11.1 概述 347

11.2 知識圖譜與圖數據管理系統... 348

11.2.1 大圖管理的挑戰... 350

11.2.2 圖數據管理系統的重要性... 352

11.2.3 圖數據管理系統管理知識圖譜的挑戰... 354

11.3 圖數據管理系統的基本架構和設計原則... 357

11.4 典型的圖數據管理系統... 360

11.4.1 通用圖數據管理系統... 361

11.4.2 知識圖譜專用圖數據管理系統... 364

11.4.3 圖數據管理系統使用實例... 366

本章小結 370

思考題... 371

參考文獻 371

第4篇 應用篇

第12章 基於知識圖譜的語言認知... 374

12.1 概述 375

12.1.1 語言理解的挑戰... 375

12.1.2 語言理解需要知識圖譜... 376

12.1.3 語言理解的任務... 377

12.2 實體理解... 378

12.2.1 基本模型... 379

12.2.2 局部實體鏈接分數... 380

12.2.3 全局實體鏈接分數... 381

12.2.4 模型計算... 382

12.2.5 短文本實體鏈接... 388

12.2.6 跨語言實體鏈接... 389

12.3 概念理解... 391

12.3.1 單實例概念理解... 391

12.3.2 多實例概念理解... 393

12.3.3 短語概念理解... 395

12.3.4 關係對概念理解... 397

12.3.5 概念理解應用舉例... 398

12.4 屬性理解... 399

本章小結 401

思考題... 402

參考文獻 402

第13章 基於知識圖譜的搜索與推薦... 405

13.1 概述 405

13.2 基於知識圖譜的搜索... 408

13.2.1 搜索概述... 408

13.2.2 搜索意圖理解... 411

13.2.3 目標查找... 413

13.2.4 結果呈現... 413

13.2.5 實體探索... 414

13.3 基於知識圖譜的推薦... 419

13.3.1 推薦的基本問題與挑戰... 419

13.3.2 基於知識圖譜的物品畫像... 422

13.3.3 基於知識圖譜的用戶畫像... 427

13.3.4 基於知識圖譜的跨領域推薦... 429

13.3.5 基於知識圖譜的可解釋推薦... 432

本章小結 433

思考題... 435

參考文獻 435

第14章 基於知識圖譜的問答... 438

14.1 概述 438

14.1.1 問答系統... 438

14.1.2 KBQA.. 441

14.2 基於模板的KBQA.. 449

14.2.1 基於模板的意圖識別... 449

14.2.2 基於模板的屬性關聯... 451

14.3 基於圖模型的KBQA.. 453

14.3.1 監督學習方法... 453

14.3.2 無監督方法... 455

14.4 基於深度學習的KBQA.. 457

14.4.1 表示學習... 458

14.4.2 分類模型... 459

14.4.3 生成模型... 461

本章小結 462

思考題... 463

參考文獻 464

第5篇 實踐篇

第15章 知識圖譜實踐... 468

15.1 概述 468

15.1.1 知識圖譜應用的推動力... 469

15.1.2 知識圖譜應用與產業現狀... 471

15.1.3 知識圖譜實踐的系統工程觀念... 472

15.1.4 知識圖譜助力行業智能化的演進路徑... 474

15.2 知識圖譜系統... 476

15.2.1 知識圖譜系統的外部環境... 476

15.2.2 知識圖譜系統的關鍵要素... 477

15.2.3 知識圖譜系統的典型架構... 479

15.3 知識圖譜工程... 485

15.3.1 基本原則... 486

15.3.2 過程模型... 489

15.3.3 可行性分析... 491

15.3.4 實踐建議... 495

本章小結 499

思考題... 499

參考文獻 500

第16章 開放性問題... 501

16.1 知識表示... 501

16.1.1 與其他知識表示相聯合的語義增強... 501

16.1.2 過程語義增強... 502

16.1.3 時空語義增強... 503

16.1.4 跨模態語義增強... 504

16.2 知識獲取... 504

16.2.1 低成本知識獲取... 505

16.2.2 複雜知識的獲取... 506

16.2.3 知識獲取中的人機協作與評測... 508

16.3 知識應用... 509

16.3.1 知識圖譜上的推理... 509

16.3.2 符號知識增強機器學習... 510

16.3.3 基於知識圖譜的可解釋人工智能... 511

16.3.4 知識圖譜的個性化問題... 511

本章小結 512

思考題... 513

參考文獻 513


章節試讀:







自2012年Google發布知識圖譜以來,知識圖譜技術飛速發展,其理論體系日趨完善,應用效果日益明顯。在知識圖譜技術的引領下,知識工程新的歷史篇章——大數據知識工程已初具輪廓;在知識圖譜技術的推動下,各行各業的智能化升級與轉型的宏偉畫卷正逐步展開。回溯半個多世紀,以物理符號系統為代表的人工智能符號主義理論思潮與以專家系統建設為核心的知識工程實踐相得益彰、大放異彩。再回溯到2000多年前,追根溯源,古希臘哲學三賢開創了偉大的邏輯思維時代,其思想直接或間接地影響了從符號主義到知識工程再到知識圖譜的歷史延承與發展。

發生在當下的以大數據、人工智能為代表的一系列技術革命很可能是人類誕生以來最為宏大也是影響最為深遠的技術革命。站在當下這一重要時間節點,回望過去,展望未來,每個親歷者都不免心潮澎湃,感慨時代變遷之偉大,個人沉浮之渺小。然而,偉大的時代往往是由星星點點的思想與細小而堅實的實踐鑄就而成的。本書就是這樣一支涓涓細流,願其最終匯入時代的大江大河。

從鴉片戰爭時國門被迫打開,到五四運動時民眾自發覺醒,再到新中國成立後西方優質思想被積極引進,西學東漸的進程綿延不絕、持續至今。直到今天,我們對於整個西方思想的吸收與消化仍在進行。在某種程度上,知識圖譜技術及其背後的思想也源自西方人工智能思想。在當下中國的知識圖譜技術實踐過程中,簡單地消化與吸收西方人工智能思想已經難以滿足國家與社會的發展需求。在越來越多的應用領域和核心技術方面,我們需要來自中國的創新,需要形成中國自身的話語權與主導權。我國各行業的智能化發展對於原創性理論與技術提出了迫切需求,我國的研發不僅需要面向實際問題,更需要足夠前沿,才有可能支撐行業的智能化發展。我們必須從西方思想的傳聲筒轉變成自己思想體系的架構者與踐行者,言必稱西方應該成為過去時。研究環境的這一變化對於本書的編寫提出了全新的要求。本書希望在梳理西方思想體系與應用實踐的基礎之上,對發生在當下中國的一些前沿實踐、關鍵技術、實用方法,以及這些實踐背後的思想體系,進行全面的總結,為一線的從業人員、教學人員提供必要的理論與技術論支撐。

可以言說的即是可以思考的,可以思考的問題終究是簡單的問題。隨著人工智能的發展,越來越多難以言說的“難題”逐漸浮出水面,比如意識難題。突破思維的邊界對於解決人工智能難題而言顯得日益重要。縱觀歷史,任何一家之言終究會湮沒在歷史洪流之中。在此成書之際,筆者提醒讀者不要將自己的思維囿於任何一隅,即便某個思潮、某種技術、某個方法在當下如火如荼。如果將人工智能的實現視作一場曠日持久的戰爭,我們可能還要發起很多次衝鋒才能取得這場戰爭的決定性勝利。而每一次衝鋒都將是某一種思想、某一類技術在人工智能發展史中的一次華麗亮相。



肖仰華

2019年11月於復旦大學





前言





近年來,隨著知識圖譜技術研究與應用的深化,知識圖譜技術吸引了來自工業界與學術界的廣泛關注。知識圖譜領域涌現出大量的理論與技術研究成果,以及一批優秀的工程實踐案例。一方面,對於這些理論工作與工程實踐,需要進行系統性的梳理;另一方面,隨著研究與應用的深入,業界也迫切需要一本系統性的知識圖譜教材。鑒於此,本書編寫團隊投入巨大的資源與精力完成了本書。

本書的內容體系基本成型於2018年8月,從2017年到2019年,其先後兩次在復旦大學相關課程中進行講授,2018年8月和12月其分別在上海財經大學和北京理工大學面向全國公開講授,累計近千人次完成了課程的學習。從2018年年底至今,本書編寫組完成了書稿,並經多輪修改,最終形成大家手中的這個版本。

下面將對本書的編寫動機、行文思路、內容架構、內容選擇與使用方式等做簡要的介紹,以方便讀者了解本書的成書背景和使用方式。

編寫動機

大量的應用實踐需要有專業的圖書作為參考和指導,大量的學術成果需要有圖書進行系統的梳理,這些是作者團隊編寫本書的直接原因。除此之外,還有以下幾點原因需要說明。首先,知識圖譜已經成為一門獨立學科,設置在我國新增的人工智能學學科目錄下。建設一門新興學科,首先需要釐清這門學科的知識體系。而完成這一任務的第一步即是編寫一本系統性的知識圖譜教材。其次,知識圖譜作為一門工程學科,其具體方法大都來自計算機或人工智能的其他領域,比如自然語言處理、機器學習、數據庫,那麼還有什麼知識是這些傳統技術領域沒有涵蓋的呢?如果不澄清這一問題,知識圖譜圖書的編寫便是無源之水,我們只需要學習各個分支領域的知識即可;如果不澄清這一問題,知識圖譜圖書的編寫很容易變成言知識圖譜之名,行其他技術之實。下面對這一問題進行簡要回答。

知識圖譜作為一個大規模知識工程,是面向應用落地的,也是系統工程。這兩點決定了知識圖譜是典型的應用學科。一門面向應用的學科旨在解決現實世界的複雜問題。工程落地中最重要的問題在於選擇,在於策略。這就好比廚師做菜,食材原料多種多樣,至於每種食材是如何培育出來的,不是廚師主要關心的問題。廚師關心的是如何選擇好的食材,如何利用這些好的食材做出可口的菜肴。對於同樣的問題,不同的學科有著不同的解法。在當前的技術條件下,哪一個方法能更經濟、務實地解決問題,就是我們選擇“食材”的最高標準。有了食材之後,如何做成一道美味佳肴,則是擺在廚師面前的第二個問題。此時,策略、過程,也就是菜肴製作的工藝過程,則是決定最終成品質量的關鍵。因此,我們需要一本系統性的知識圖譜圖書,講授技術選型、策略選擇、過程優化、系統架構等內容。

也正因此,本書作者在構思以及行文寫作時,時刻提醒自己緊密圍繞知識圖譜開展知識體系的梳理,盡量突出知識圖譜與相關學科(特別是自然語言處理、語義網與數據庫等學科)的差別。如果不能清晰地界定知識圖譜與各分支學科的根本不同,毋寧少一本浪費讀者時間與金錢的讀物。

行文思路

本書的編寫力求體現以下基本原則。

重視對過程的闡述。

教學的過程不但需要陳述,更需要解釋。有些書強調對結果或者結論的傳授,側重於對知識體系的清晰梳理與知識的高效灌輸,但很少顧及學生的學習方式,忽略了對過程的闡述。因此,作者試圖在勾勒出知識圖譜學科知識體系的同時,盡可能地呈現出相關概念與技術發展的脈絡。

重視對架構的敘述。

從人才培養的角度而言,知識圖譜的落地不僅需要解決具體問題的工程師,更需要能做出合理抉擇與規劃的管理性人才,需要熟知人工智能領域各分支技術並能熟練掌握和利用這些技術的綜合性人才。知識圖譜的知識體系不僅包含模型與算法,更涉及思想與方法、策略與過程。技術細節固然重要,但是對於知識圖譜學科而言,對宏觀架構的把握更是不可或缺。為此,本書單列出第15章介紹具體技術之外的流程、策略與過程。每章的“概述”部分大多是對於該章內容宏觀基本面的介紹,閱讀這部分內容能對知識圖譜的全貌有基本的把握。

循序漸進、逐步深入。

本書在編寫時採取了逐層遞進的思路。比如在詞彙挖掘、實體識別、關係抽取等很多模塊中,都會涉及類似的模型與思路(諸如基於模式的抽取、基於學習模型的抽取等),那麼先出現的章節往往側重於闡述這些問題的基本模型,而當後面的章節再次提及相關模型時,則會進一步深入介紹一些技術細節與數學細節。

問題驅動、應用引領。

全書堅持問題驅動的寫作思路,側重對於問題本身的分析與闡述。從問題出發闡釋所需的技術,便於讀者明確每個模型、技術、方案所能解決的問題範疇。每章開始的“內容提示”部分會告訴讀者,這一章將回答什麼問題,其中的概念與技術能夠解決怎樣的實際問題。

內容架構

全書共五篇,由16章構成,其架構如圖1所示,力求涵蓋知識圖譜相關的基本概念與關鍵技術。

第1篇 基礎篇

包含前兩章。第1章介紹知識圖譜的基本概念、歷史沿革、研究意義、應用價值等。第2章介紹知識圖譜所必需的基礎知識,主要介紹與知識圖譜密切相關的知識表示、機器學習、自然語言處理的基本概念。

第2篇 構建篇

介紹知識圖譜的構建。大規模高質量知識圖譜的構建是整個知識圖譜技術落地的核心,因此也是整本書的重點。本篇的核心是第3章與第4章。在這兩章中,我們介紹了知識圖譜中知識獲取的兩個核心問題。其中一個是點的識別與建立,知識圖譜中的點可以是詞彙與實體,因此第3章重點介紹了詞彙挖掘與實體識別。有了知識圖譜中的點之後,建立點之間的關係是知識圖譜構建的核心問題。為此,第4章主要介紹了關係抽取(從文本中獲取關係實例)。

在此基礎上,第2篇進一步對兩類重要的知識圖譜,即概念圖譜(第5章)與百科圖譜(第6章)的構建展開了具體介紹。這兩類知識圖譜在知識圖譜技術發展歷程中有著突出地位,有很多實際應用。最後,第2篇再對其中的兩個專題:眾包構建(第7章)與質量控制(第8章)展開介紹。當前的知識圖譜構建還離不開人,如何把人力用好是第7章的主題。質量控制是知識圖譜構建的核心,第8章從質量視角再次盤點整個知識圖譜構建的全流程。

可以看出,我們在構建部分濃墨重彩,從構建的關鍵環節(詞彙挖掘、實體識別、關係抽取)、兩類重要知識圖譜的構建,以及構建的兩個專題等三個切麵對知識圖譜構建進行了全方位的論述。其目的在於向讀者立體式地呈現知識圖譜構建的完整體系。這也從一個側面說明了知識圖譜知識體系的龐雜。

第3篇 管理篇

介紹知識圖譜的建模與存儲(第9章)、查詢與檢索(第10章)以及圖數據管理系統(第11章)。這一篇旨在從數據管理的角度系統闡述知識圖譜如何建模、如何存儲、如何查詢、如何檢索,以及如何實現系統性的高效管理。

第4篇 應用篇

把知識圖譜構建好、管理好的目的還是為了應用好。第4篇對於基於知識圖譜的應用技術展開介紹,包括搜索與推薦(第13章)、自然語言問答(第14章)。這些應用本質上都依賴基於知識圖譜的自然語言理解,因此這一專題也單獨成章(第12章)。

第5篇 實踐篇

知識圖譜實踐有哪些基本原則和最佳實踐(第15章),以及在知識圖譜應用過程中還存在哪些挑戰(第16章),都會在這一篇中回答。

內容選擇

本書力求全面介紹知識圖譜相關的重要概念與關鍵技術。選材的第一個考慮因素是內容與知識圖譜是否密切相關。本書將知識圖譜視作一類大數據驅動的、以自動化知識獲取為根本特點的新型知識工程。因此,盡量迴避了屬於傳統知識工程範疇或者其他領域的內容,讀者可以參考其他相關圖書來學習它們。選材的第二個考慮因素是相關技術能否落地,或者具有落地的可能性。但凡前景不明、尚無明確落地可能性的技術,本書都選擇了刻意迴避,以免誤導讀者。本書有兩項內容未涵蓋,特此說明如下。

第一,知識圖譜上的推理尚未單獨成章。符號知識的一個重要優點在於可以實現符號化推理,但是知識圖譜上的推理在本書中並未以單獨一章的篇幅加以介紹,這樣的處理出於以下幾點考慮。首先,本書對知識圖譜上的推理並非完全沒有討論,在書中的知識圖譜向量化表示以及知識圖譜上的查詢語言部分略有涉及。但是基於向量化表示的推理只是一種弱語義的推理,只能用作相關關係推理,無法勝任複雜語義推理任務。也正因此,大部分基於知識圖譜表示學習的推理只能用於是否存在關聯關係的預測(也就是鏈接預測)。其次,有些專家曾建議對於傳統符號推理展開介紹以彌補這一不足,然而知識圖譜作為大數據知識工程的代表有其應有之義,知識圖譜不應該盜用基於傳統符號的推理。因此,總體上作者傾向於認為知識圖譜上的推理還是一個有待深入研究的問題,其在實際應用落地中並未超出傳統知識工程的推理範疇,讀者可以參考傳統符號推理的相關圖書。

第二,知識圖譜上的結構挖掘尚未單獨成章。在很多領域,特別是金融、安全等相關領域,會建立實體之間的關聯網絡,並通過圖結構分析、識別風險因素。一些學者或者從業人員將其歸為知識圖譜的一種應用。事實上,這一思路是圖數據分析、複雜網絡分析領域的經典研究問題,早在“知識圖譜”一詞出現之前其就已經得到廣泛研究。只不過因為最近幾年各行業大數據準備工作完成,平台基本成型,使得大規模圖分析成為可能。因此,本書並未涵蓋這一內容。讀者若對其感興趣,可以參考圖分析、複雜網絡分析相關的專業圖書。

使用方式

本書在內容編排上,力求每章均具備獨立性,同時各章之間又能組成有機整體。這一編排方式旨在讓每章能夠獨立地解決一類問題,而全書內容又不失系統性與完整性。除了第1章是基礎,其他任何一章,讀者都可以根據自身情況進行選擇性閱讀。比如,對於第2章,有相關基礎的讀者就可以直接跳過。“構建篇”的第3章和第4章是核心,而對於第5章和第6章,讀者則可以根據需要進行選擇性學習。書中的第7章、第8章、第12章、第16章是相對較新的專題,適合研究生、博士生層次的研討性教學。這幾章的內容很多都還只是一家之言,有著巨大的研究空間。

對於不同的讀者群體,本書可以有不同的閱讀方式。對於學生群體,高年級本科生可以選擇第1~4章、第9章、第10章、第13章、第14章進行學習。對於碩士生或者博士生,則可以進一步閱讀第5~8章、第12章、第16章。對於工業界從業人員,完全可以根據自己的業務需要選擇感興趣的內容閱讀,比如可以跳過第9章、第10章的技術介紹,直接了解圖數據管理系統的使用方法,也就是第11章的內容。知識圖譜涉及企業與行業的智能化轉型,這將是企業戰略決策的重要內容。對於很多從事此類工作的人員而言,急需在盡可能短的時間內對知識圖譜的全貌以及知識圖譜能解決什麼問題有所了解。此類人員可以選擇第1章、第3~14章的概述,以及第15章、第16章進行學習。

最後需要說明的是,知識圖譜是一門綜合性強、涉及多學科的新型交叉學科。不同學科背景的學者看待知識圖譜有著不同的視角,很容易得出不同的觀點與結論。我們對待知識圖譜這樣的新興學科應該秉持開放包容、兼收並蓄的心態,靜待時間來檢驗真理。



致謝





本書是整個編寫團隊通力合作的結果。全書由復旦大學肖仰華教授策劃、組織並負責統稿,共有10位作者參與了本書的編寫工作,其分工如下。復旦大學肖仰華教授完成了第1、2、3、4、5、12、15、16章的編寫,東華大學徐波博士負責第6章,華東師範大學林欣研究員負責第7章,蘇州大學李直旭副教授負責第8章,湖南大學彭鵬博士負責第9章,復旦大學鄭衛國研究員負責第10章,微軟亞洲研究院何亮博士與邵斌博士負責第11章,復旦大學陽德青副教授負責第13章,上海財經大學崔萬雲博士負責第14章。此外,復旦大學知識工場實驗室的博士研究生梁家卿、劉井平、陳礪寒、蔣思航、蔣海雲、陳江捷,碩士研究生王麗、馮桫、周元輔、杜雨燕、陳金棟、程浩、黃君揚對相關章節材料的組織與選編做了大量細緻工作。知識工場實驗室的其他研究生以及《知識圖譜:概念與技術》課程的很多學員對本書給予了很多有益的反饋,在此一併致謝。



肖仰華

2019年11月10日

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。