神譯局是36氪旗下編譯團(tuán)隊(duì),關(guān)注科技、商業(yè)、職場(chǎng)、生活等領(lǐng)域,重點(diǎn)介紹國(guó)外的新技術(shù)、新觀點(diǎn)、新風(fēng)向。
編者按:為方便對(duì)數(shù)據(jù)科學(xué)(DATA SCIENCE)感興趣的愛(ài)好者和實(shí)操者的學(xué)習(xí),本文作者分享了 8 類關(guān)于數(shù)據(jù)科學(xué)的書(shū)籍,包括統(tǒng)計(jì)/概率論類、機(jī)器學(xué)習(xí)類、數(shù)據(jù)可視化與分析類、深度學(xué)習(xí)類、自然語(yǔ)言處理(NLP)類、計(jì)算機(jī)視覺(jué)類、人工智能類和工具/語(yǔ)言類。在分享書(shū)籍的同時(shí),作者還提出以下忠告:在數(shù)據(jù)科學(xué)領(lǐng)域有多種成功的途徑,而我們要選擇的途徑應(yīng)該是足夠簡(jiǎn)單,足以幫助我們快速上手的。
我們之所以在選擇學(xué)習(xí)方法上不知所措,往往是因?yàn)槲覀兘佑|的信息量太大了。與其花更多的時(shí)間思考如何獲得研究數(shù)據(jù)科學(xué)的技能,不如根據(jù)實(shí)際需要,從分享的書(shū)中挑選一本,然后開(kāi)始學(xué)習(xí)。關(guān)鍵是要始終如一地采取行動(dòng),堅(jiān)持閱讀。閱讀的目的是,學(xué)習(xí)和發(fā)現(xiàn)隱藏于書(shū)中的真實(shí)思想。對(duì)數(shù)據(jù)科學(xué)感興趣的朋友們,如果你還沒(méi)選好學(xué)習(xí)材料,就請(qǐng)閱讀作者推薦的這些頂級(jí)書(shū)籍吧。本文來(lái)自編譯,希望對(duì)您有幫助。因篇幅原因,本篇文章分三部分刊出,此為第一部分:
我們從某人的聲音中不能找到的東西,很可能會(huì)在他(她)的作品中發(fā)現(xiàn)?!獰o(wú)名氏
在知識(shí)爆炸的今天,關(guān)于數(shù)據(jù)科學(xué)的學(xué)習(xí)資源太多了,這會(huì)讓我們?cè)谶x擇時(shí)無(wú)從下手吧?不要緊,以下是最新的數(shù)據(jù)科學(xué)必讀書(shū)籍集錦。
圖1. 眾多學(xué)習(xí)書(shū)源
我在網(wǎng)上自學(xué)時(shí),總是更傾向于選擇視頻教程或講座。因?yàn)槲野l(fā)現(xiàn)這種選擇使學(xué)習(xí)變得更簡(jiǎn)單,不那么麻煩(和大多數(shù)人的選擇一樣)。
我一直都覺(jué)得在網(wǎng)絡(luò)上自學(xué)時(shí)選擇視頻教程或講座更加簡(jiǎn)便易行,直到幾年前我偶然讀到了一本關(guān)于統(tǒng)計(jì)學(xué)的書(shū),才讓我改變了對(duì)看書(shū)學(xué)習(xí)的看法(從“無(wú)聊”到“神奇而有趣”)。我要向這本書(shū)的作者和出版商致敬。
在挑選關(guān)于數(shù)據(jù)科學(xué)的頂級(jí)書(shū)籍之前,我事先做了廣泛的研究。今天,我將這些書(shū)籍分享給所有有抱負(fù)的數(shù)據(jù)愛(ài)好者和實(shí)踐者。大家在讀了這些書(shū)之后,一定會(huì)讓自己陷入深深的思考之中。
讓我們開(kāi)始看看這個(gè)書(shū)單吧……
我按這些書(shū)所涉及的領(lǐng)域?qū)⑺鼈儎澐譃橐韵?8 類來(lái)詳細(xì)介紹,以方便大家選擇:
*統(tǒng)計(jì)/概率論類書(shū)籍
*機(jī)器學(xué)習(xí)類書(shū)籍
*數(shù)據(jù)可視化和分析類書(shū)籍
*深度學(xué)習(xí)類書(shū)籍
*自然語(yǔ)言處理(NLP)類書(shū)籍
*計(jì)算機(jī)視覺(jué)類書(shū)籍
*人工智能類書(shū)籍
*工具/語(yǔ)言類書(shū)籍
作者:加雷斯·詹姆斯,丹妮拉·維滕,特來(lái)沃爾·黑斯蒂,羅伯特·蒂施萊尼(Gareth James, Daniela Witten, Trevor Hastie,Robert Tibshirani).
一直以來(lái),這本書(shū)都是經(jīng)典書(shū)籍。它涵蓋了基本的統(tǒng)計(jì)學(xué)知識(shí)以及機(jī)器學(xué)習(xí)技術(shù)。這本書(shū)吸睛的地方在于,每一個(gè)概念都用 R 語(yǔ)言做案例分析。所以,我們一旦掌握了編程的技巧,在讀這本書(shū)時(shí),就會(huì)快速回憶起每一個(gè)概念及其在程序中的操作方法。
圖2. 《統(tǒng)計(jì)學(xué)學(xué)習(xí)概論》
作者:艾倫·B·唐尼(Allen B. Downey)
這本書(shū)在眾多數(shù)據(jù)科學(xué)書(shū)籍中是首選書(shū)籍。它提供了大量的資源。尤其是對(duì)于有一定 Python 基礎(chǔ)知識(shí)的人,它特別實(shí)用,可以用來(lái)做數(shù)據(jù)分析。
圖3. 《思考統(tǒng)計(jì):程序員的概率論和統(tǒng)計(jì)學(xué)》
作者:大衛(wèi)·斯皮格爾霍爾特(David Spiegelhalter)
這本書(shū)最大的亮點(diǎn)是采用了淺顯易懂的案例來(lái)講解理論。這本書(shū)不僅層層剖析了特定的問(wèn)題,還給問(wèn)題提供了具有漸進(jìn)性和一致性的統(tǒng)計(jì)解決方案。簡(jiǎn)而言之,它使統(tǒng)計(jì)學(xué)的學(xué)習(xí)變得簡(jiǎn)單了!
圖4. 《統(tǒng)計(jì)學(xué)的藝術(shù):從數(shù)據(jù)中學(xué)習(xí)》
作者:大衛(wèi)·莫蘭(David Morin)
圖5. 《概率論:狂熱初學(xué)者入門》
這是一本概率論初學(xué)者的理想讀物。它涵蓋了所有的基礎(chǔ)知識(shí),包括組合學(xué),概率規(guī)則,貝葉斯定理,期望值,方差,概率密度,公共分布,大數(shù)定律,中心極限定理,相關(guān)性,回歸分析等等。
圖6. 《概率論入門》
作者:J·勞里·斯奈爾,查爾斯·米勒·格林斯特德(J. Laurie Snell,Charles Miller Grinstead)
這又是一本介紹概率概念的書(shū)籍。和《概率論:狂熱初學(xué)者入門》一樣,這本書(shū)是為研究生而寫(xiě)的綜合教材。
作者:查爾斯·韋蘭(Charles Wheelan)
統(tǒng)計(jì)學(xué)有時(shí)候是一個(gè)令人生畏的話題。在這本書(shū)中,作者以一種風(fēng)趣而簡(jiǎn)潔的方式闡明了關(guān)鍵概念,如推理、相關(guān)性和回歸分析等。
圖7. 《赤裸裸的統(tǒng)計(jì)——從數(shù)據(jù)中剝離恐懼》
圖8. 《百頁(yè)機(jī)器學(xué)習(xí)書(shū)》
作者:安德烈·博爾科夫(Andriy Burkov)
我真心喜歡這本書(shū)。在讀到它之前,我閱讀了大量的試圖從不同角度和不同層面講授機(jī)器學(xué)習(xí)的書(shū)籍。我絞盡腦汁地想從這些書(shū)中找到一個(gè)方法,希望它能夠簡(jiǎn)潔地概括難以理解的話題和難以理解的方程式??墒牵钡阶x了安德里·布爾科夫用大約 100 多頁(yè)的篇幅寫(xiě)出來(lái)的這本書(shū),我才找到了這個(gè)方法。這本書(shū)文筆優(yōu)美,易于理解,已經(jīng)得到了許多人的認(rèn)可。
作者:戴維·西倫(Davy Cielen)等
出版商:曼寧(Manning)
圖9. 《數(shù)據(jù)科學(xué)介紹》
我喜歡這本書(shū)有一個(gè)特殊的原因,那就是,這些書(shū)不僅包含了我們常見(jiàn)的關(guān)于數(shù)據(jù)科學(xué)的主題,它還包括了數(shù)據(jù)科學(xué)整個(gè)領(lǐng)域的其他方面。我強(qiáng)烈推薦閱讀這本書(shū),它會(huì)或多或少地會(huì)讓我們熟悉數(shù)據(jù)科學(xué)的全貌。
作者:?jiǎn)虪枴じ耵斔梗↗oel Grus)
出版商:奧萊利(O’Reilly)
圖10. 《從頭開(kāi)始的數(shù)據(jù)科學(xué)》
這本書(shū)的第二版已經(jīng)發(fā)布了,因?yàn)樗依烁鞣N基本原理。也是因此,它已經(jīng)成為一本倍受歡迎的書(shū)。這相當(dāng)于是一個(gè)完整的一攬子交易,讀了一本就等于讀了很多本,十分推薦本書(shū)。
作者:杰克·范德普拉斯(Jake VanderPlas)
出版商:奧萊利
圖11. 《Python數(shù)據(jù)科學(xué)手冊(cè)》
這本書(shū)最適合那些剛開(kāi)始做數(shù)據(jù)分析或數(shù)據(jù)科學(xué)的人閱讀,這正是他們所需要的那本能夠參見(jiàn)所有技術(shù)的書(shū)。本書(shū)能夠強(qiáng)化你對(duì) python 的掌握程度,并可促進(jìn)你在數(shù)據(jù)科學(xué)上的工作。
作者:艾米麗·羅賓遜,杰奎琳·諾里斯(Emily Robinson,Jacqueline Nolis)
出版商:曼寧
圖12. 《在數(shù)據(jù)科學(xué)領(lǐng)域建立職業(yè)生涯》
這本書(shū)于2020年出版,主要陳述了與學(xué)習(xí)數(shù)據(jù)科學(xué)相關(guān)的技術(shù)內(nèi)容。我們必讀這本書(shū)的原因是,它教我們?nèi)绾卧跀?shù)據(jù)科學(xué)行業(yè)工作。
作者:羅杰·D·彭,伊麗莎白·松井(Roger D. Peng, Elizabeth Matsui)
這本書(shū)不僅對(duì)數(shù)據(jù)分析工作流程做了完美的概述,還清楚地闡述了一個(gè)觀點(diǎn)——盡管存在許多工具、復(fù)雜的一步步的信息迭代過(guò)程,數(shù)據(jù)分析從根本上講依然是一門藝術(shù)。
圖13. 《數(shù)據(jù)科學(xué)的藝術(shù)——給任何與數(shù)據(jù)打交道的人的指南》
作者:克勞斯·沃克(Claus O. Wilke)
本書(shū)采用舉出正面和反面例子加以對(duì)比的方式,介紹了數(shù)據(jù)可視化的基本原則。它可以幫助我們理解有效的可視化背后的基本原理,并教會(huì)我們?cè)O(shè)計(jì)更有意義的模塊來(lái)傳達(dá)正確的信息。
圖14. 《數(shù)據(jù)可視化的基礎(chǔ)——信息豐富且引人注目的數(shù)字制作入門》
作者:朱莉·斯蒂爾,諾亞·伊林斯基(Julie Steele, Noah Iliinsky)
網(wǎng)站:奧萊利媒體|亞馬遜(O "Reilly Media| Amazon)
圖15. 《美麗的可視化,通過(guò)專家的眼睛看數(shù)據(jù)》
“可視化”是讓數(shù)據(jù)說(shuō)話的一種新方式,通過(guò)顏色等視覺(jué)指標(biāo)達(dá)到溝通的目的,并通過(guò)一定的研究方法將數(shù)據(jù)和視覺(jué)指標(biāo)整合在一起。
這本書(shū)講述了一些著名的可視化設(shè)計(jì)和開(kāi)發(fā)產(chǎn)品。
作者:安迪·克里貝爾(Andy Kriebel)
此書(shū)是周一改頭換面(MakeOverMonday)項(xiàng)目的擴(kuò)展,在這個(gè)項(xiàng)目中,數(shù)據(jù)可視化社區(qū)的成員可以分享他們對(duì)現(xiàn)有圖表和數(shù)據(jù)的改進(jìn)。它強(qiáng)調(diào),雖然在設(shè)計(jì)可視化中存在可變性,但有一些關(guān)鍵技術(shù)可以遵循,以確保自己的圖表是有作用和有意義的。
圖16. 《周一改頭換面——每次用一張圖表改進(jìn)我們可視化和分析數(shù)據(jù)的方式》
作者:科爾·努斯鮑默·克納菲奇(Cole Nussbaumer Knaflic)
對(duì)于任何一個(gè)想要更好地以清晰、簡(jiǎn)潔和圖形化的方式呈現(xiàn)信息的人來(lái)說(shuō),這是一本必讀的書(shū)。這本書(shū)教給我們數(shù)據(jù)可視化的基礎(chǔ)知識(shí),以及如何有效地使用數(shù)據(jù),并舉出了大量現(xiàn)實(shí)的例子。
圖17. 《用數(shù)據(jù)講故事——商務(wù)專業(yè)人士的數(shù)據(jù)可視化指南》
作者:?jiǎn)碳{森·施瓦比什(Jonathan Schwabish)
此書(shū)包括三個(gè)部分。第一部分簡(jiǎn)要介紹了數(shù)據(jù)可視化的最佳實(shí)操方式。第二部分是本書(shū)的主要部分,講述了圖表類型。施瓦比什深入研究了不同類型的圖表,這些圖表遠(yuǎn)遠(yuǎn)超出了直線和條形的標(biāo)準(zhǔn)。
圖18. 《更好的數(shù)據(jù)可視化:學(xué)者、研究人員和書(shū)蟲(chóng)的學(xué)習(xí)指南》
相關(guān)閱讀:學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書(shū)籍(中)
學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書(shū)籍(下)
譯者:甜湯
關(guān)鍵詞: 機(jī)器學(xué)習(xí) 數(shù)據(jù)分析 改頭換面