电竞比分网-中国电竞赛事及体育赛事平台

分享

【薦書】提升機器學(xué)習(xí)數(shù)學(xué)基礎(chǔ),這7本書一定要讀(附pdf資源)

 昵稱16619343 2019-04-17

新智元報道

大多數(shù)人學(xué)習(xí)數(shù)據(jù)科學(xué)的人都會把重點放在編程上,實際上編程能力確實是機器學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域的重要技能。但是,要真正精通數(shù)據(jù)科學(xué)和機器學(xué)習(xí),必然不能忽視的數(shù)據(jù)科學(xué)背后的數(shù)學(xué)基礎(chǔ)。

出于這個目的,本文介紹了七本在注重打好數(shù)據(jù)科學(xué)的數(shù)學(xué)基礎(chǔ)上的技術(shù)讀物。當(dāng)然,涉及到數(shù)學(xué),往往閱讀體驗可能不會很舒服,但要搞好機器學(xué)習(xí),數(shù)學(xué)基礎(chǔ)是必須要打牢的,所以努力讀書吧!

先說一說為什么在數(shù)據(jù)科學(xué)學(xué)習(xí)時打好數(shù)學(xué)基礎(chǔ)。

以下是我總結(jié)的幾個原因:

AI領(lǐng)域無時無刻不在迅速變化。Hinton認為,我們也許應(yīng)該重新思考反向傳播。掌握牢固的數(shù)學(xué)知識有助于更好地理解AI的演變。一個數(shù)學(xué)基礎(chǔ)深厚的人,對AI的理解和認識與其他僅從表面認識AI的人有很大的區(qū)別。此外,掌握數(shù)學(xué)知識還能更好地了解AI技術(shù)帶來知識產(chǎn)權(quán)的潛力。最后,了解數(shù)據(jù)科學(xué)背后的數(shù)學(xué)知識,也可以讓人更容易獲得AI和數(shù)據(jù)科學(xué)的高端職位。

此外,作者推薦這幾本書,還有兩點個人原因:

1.作者在牛津大學(xué)教授物聯(lián)網(wǎng)數(shù)據(jù)科學(xué)的課程,也包括一些AI技術(shù)應(yīng)用方面的教學(xué)事務(wù),在教學(xué)過程中涉及到數(shù)學(xué)基礎(chǔ)知識和課程。

2.其次,作者在寫一本書來簡述人工智能,從數(shù)學(xué)的角度入手,目標(biāo)讀者是14到18歲的少年。要深入了解數(shù)學(xué)科學(xué)和人工智能數(shù)學(xué)的數(shù)學(xué)基礎(chǔ),你需要了解四個方面知識:線性代數(shù),概率論,多元微積分和優(yōu)化。目前在高中階段至少會教授這些課程的一部分內(nèi)容。因此,我試圖將高中數(shù)學(xué)與人工智能和數(shù)據(jù)科學(xué)聯(lián)系起來,重點是數(shù)學(xué)建模。

下面進入正題:

(1) The Nature Of Statistical Learning Theory 《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》

作者:Vladimir Vapnik

PDF資源:

如果說要列一份關(guān)于數(shù)學(xué)的書單,這本書是繞不過去的。本書單中排名第一的就是俄羅斯著名數(shù)學(xué)家Vladimir Vapnik的《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》。在這份清單中的所有書籍中,Vapnik這本是最不好找的。Vladimir Vapnik是支持向量機(SVM)的創(chuàng)始人。他的維基百科頁面中提供了更多關(guān)于他研究成果的介紹。

(2) Pattern Classification (2007-12-24)《模式分類》

作者:Richard O Duda

PDF資源:

就像Vapnik的著作一樣,Duda的著作時另一個時代的另一部經(jīng)典。本書初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。時隔近二十年,本書仍然是一個重要資源。本書采用模式識別方法,并涵蓋了廣泛的算法。

(3)

Machine Learning: An Algorithmic Perspective,Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition)

《機器學(xué)習(xí):算法視角》

PDF資源:

https://doc./science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf

這本書現(xiàn)在已經(jīng)出版了第二版。此書第一版是我讀過的最早的書關(guān)于機器學(xué)習(xí)和算法的著作之一,第二版增加了更多Python代碼。與前兩本書一樣,本書也非常強調(diào)算法。

(4)

The Elements of Statistical Learning: DataMining, Inference, and Prediction, Second Edition

《統(tǒng)計學(xué)習(xí)基礎(chǔ):數(shù)據(jù)挖掘、推理和預(yù)測》(第二版)

作者:Trevor Hastie,Robert Tibshirani,Jerome Friedman

PDF資源:https://web./~hastie/Papers/ESLII.pdf

另一本經(jīng)典之作,可以作為參考書。

(5)Pattern Recognition and Machine Learning (Information Science and Statistics)

《模式識別與機器學(xué)習(xí)(信息科學(xué)與統(tǒng)計)》

作者:Christopher M. Bishop

PDF資源:http://users.isr.ist./~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

Christopher M.Bishop的模式識別和機器學(xué)習(xí)(信息科學(xué)和統(tǒng)計學(xué))也是一本深入而精心設(shè)計的參考書。

我喜歡Peter Flach的書,盡管亞馬遜網(wǎng)站上的一些評論說這書寫得太羅嗦,而且代碼量顯得不足。我特別喜歡這本書中的算法分組(邏輯模型,線性模型,概率模型)章節(jié)以及這些主題的整體講述方式。

最后,是我最推薦的一本書:

(7) Deep Learning 《深度學(xué)習(xí)》

相關(guān)資源:https://www./

如果你在找一本值得逐頁讀完的書,就是它了!這本書既詳細,又有現(xiàn)代感,書中內(nèi)容幾乎涵蓋了你能想到的關(guān)于深度學(xué)習(xí)的一切知識。

補充兩本書:

A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami

作者:Simon Rogers,Mark Girolami

Machine Learning: A Probabilistic Perspective

作者:Kevin Murphy

這本書中評價也很高,但我個人沒有讀過(因此沒有收集)。

寫在最后:

除了最后一本《深度學(xué)習(xí)》之外,我建議其他書不必逐頁閱讀,而是將其作為參考書,根據(jù)需要按相應(yīng)主題閱讀相應(yīng)的書籍。這些書教會了我時刻保持謙遜。無論我們現(xiàn)在知道了多少,掌握了多少知識,都總能在閱讀過程中發(fā)現(xiàn),這個領(lǐng)域原來是如此的龐大和復(fù)雜。

這些書已經(jīng)超越了時間。Vladimir Vapnik現(xiàn)年已經(jīng)81歲。Duda的著作初版于1973年。我預(yù)計50年以后,這個行業(yè)里的人們?nèi)匀粫喿x這些著作。就像與那些經(jīng)歷了時間考驗的老朋友們重逢一樣。多年之后,也許你會發(fā)現(xiàn),在眼花繚亂的技術(shù)、模型和框架背后,數(shù)學(xué)是永恒的。

原文鏈接:

【加入社群】

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多