工學博士、副教授撰寫的人工智能稀有書籍清單,并附有 PDF 版本的鏈接。
機器學習
在機器學習方面,我首先要推薦的兩本書是李航博士的《統計學習方法》和周志華教授的《機器學習》。
《統計學習方法》采用“一般-具體-一般”的結構,在梳理統計學習的基本概念后,系統全面地介紹了統計學習中的10種主要方法,最后對這些算法進行了總結和比較。本書以數學公式為主,在介紹每種方法時,都給出了詳細的數學推導,幾乎沒有廢話,因此對讀者的數學功底要求也很高。
相比之下,《機器學習》涵蓋的范圍更廣,入門性更強,有助于了解機器學習的全貌。書中幾乎涵蓋了機器學習中所有算法類別的基本思想、適用范圍、優缺點、主要實現方法等,并穿插了大量通俗易懂的實例。
如果說《統計學習方法》勝在深度,那么《機器學習》勝在廣度。鑒于它的廣度,你可以在《機器學習》提供的豐富參考資料的基礎上繼續深入挖掘。
讀完以上兩本書,可以再讀一些經典著作。第一本經典著作是 Tom Mitchell 的《Machine Learning》,中譯本名為《機器學習》。這本書寫于 1997 年,雖然難以涵蓋機器學習的最新進展,但對基礎理論和核心算法的討論還是精辟的,畢竟經典理論經得起時間的考驗。這本書的重點也是廣度,沒有涉及很多復雜的數學推導,是一本理想的入門書。作者曾在主頁上表示,這本書將出新版本,并增加了一些章節,或許在未來兩年內,我們就能期待新版本的面世。
另一本經典書籍是 Trevor Hastie 等人撰寫的 Elements of Statistical Learning,2016 年出版了第二版。這本書沒有中文翻譯版,只有影印本。專家寫的書不會用大量復雜的數學公式嚇唬人(專門講算法推導的書除外),這本書也不例外。它更強調各種學習方法的內涵和外延。相比于具體的推導,從方法的起源和發展來理解其應用場景和發展方向或許更為重要。
最后一本登上舞臺的書是 Christopher Bishop 的《模式識別與機器學習》。這本書出版于 2007 年,至今沒有中文譯本。或許是因為翻譯這樣一本氣勢磅礴的書需要無數個深夜。這本書的特點是將機器學習視為一個整體,無論是基于頻率的方法還是貝葉斯方法,無論是回歸模型還是分類模型,都只是問題的不同方面。作者可以開拓出一個上帝視角,將各種機器學習納入一張巨網。可惜的是,大多數讀者跟不上他的高深思維(包括我自己)。
最后推薦的一本書是 David JC MacKay 的 Information Theory, Inference and Learning Algorithms,出版于 2003 年,中譯本名為《信息論、推理與學習算法》。這本書的作者是一位多才多藝的科學家。這本書并不是一本機器學習的專著,而是將多個相關學科合二為一,內容相當廣泛。相比于那些正面寫著一張臉的教科書,閱讀這本書感覺就像在和作者聊天,他會在談話中拋出各種問題讓你思考。話題的廣泛性讓這本書的閱讀體驗并不輕松,但可以作為一種拓展視野的方式。