久久久久久久久久久久久久久久久久网,玩弄放荡人妇系列av在线网站,人妻伊人,午夜一区二区国产好的精华液,久久久久丫

學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書(shū)籍(上)

來(lái)源:36氪時(shí)間:2022-05-14 09:31:34

神譯局是36氪旗下編譯團(tuán)隊(duì),關(guān)注科技、商業(yè)、職場(chǎng)、生活等領(lǐng)域,重點(diǎn)介紹國(guó)外的新技術(shù)、新觀點(diǎn)、新風(fēng)向。

編者按:為方便對(duì)數(shù)據(jù)科學(xué)(DATA SCIENCE)感興趣的愛(ài)好者和實(shí)操者的學(xué)習(xí),本文作者分享了 8 類關(guān)于數(shù)據(jù)科學(xué)的書(shū)籍,包括統(tǒng)計(jì)/概率論類、機(jī)器學(xué)習(xí)類、數(shù)據(jù)可視化與分析類、深度學(xué)習(xí)類、自然語(yǔ)言處理(NLP)類、計(jì)算機(jī)視覺(jué)類、人工智能類和工具/語(yǔ)言類。在分享書(shū)籍的同時(shí),作者還提出以下忠告:在數(shù)據(jù)科學(xué)領(lǐng)域有多種成功的途徑,而我們要選擇的途徑應(yīng)該是足夠簡(jiǎn)單,足以幫助我們快速上手的。

我們之所以在選擇學(xué)習(xí)方法上不知所措,往往是因?yàn)槲覀兘佑|的信息量太大了。與其花更多的時(shí)間思考如何獲得研究數(shù)據(jù)科學(xué)的技能,不如根據(jù)實(shí)際需要,從分享的書(shū)中挑選一本,然后開(kāi)始學(xué)習(xí)。關(guān)鍵是要始終如一地采取行動(dòng),堅(jiān)持閱讀。閱讀的目的是,學(xué)習(xí)和發(fā)現(xiàn)隱藏于書(shū)中的真實(shí)思想。對(duì)數(shù)據(jù)科學(xué)感興趣的朋友們,如果你還沒(méi)選好學(xué)習(xí)材料,就請(qǐng)閱讀作者推薦的這些頂級(jí)書(shū)籍吧。本文來(lái)自編譯,希望對(duì)您有幫助。因篇幅原因,本篇文章分三部分刊出,此為第一部分:

我們從某人的聲音中不能找到的東西,很可能會(huì)在他(她)的作品中發(fā)現(xiàn)?!獰o(wú)名氏

在知識(shí)爆炸的今天,關(guān)于數(shù)據(jù)科學(xué)的學(xué)習(xí)資源太多了,這會(huì)讓我們?cè)谶x擇時(shí)無(wú)從下手吧?不要緊,以下是最新的數(shù)據(jù)科學(xué)必讀書(shū)籍集錦。

圖1. 眾多學(xué)習(xí)書(shū)源

我在網(wǎng)上自學(xué)時(shí),總是更傾向于選擇視頻教程或講座。因?yàn)槲野l(fā)現(xiàn)這種選擇使學(xué)習(xí)變得更簡(jiǎn)單,不那么麻煩(和大多數(shù)人的選擇一樣)。

我一直都覺(jué)得在網(wǎng)絡(luò)上自學(xué)時(shí)選擇視頻教程或講座更加簡(jiǎn)便易行,直到幾年前我偶然讀到了一本關(guān)于統(tǒng)計(jì)學(xué)的書(shū),才讓我改變了對(duì)看書(shū)學(xué)習(xí)的看法(從“無(wú)聊”到“神奇而有趣”)。我要向這本書(shū)的作者和出版商致敬。

在挑選關(guān)于數(shù)據(jù)科學(xué)的頂級(jí)書(shū)籍之前,我事先做了廣泛的研究。今天,我將這些書(shū)籍分享給所有有抱負(fù)的數(shù)據(jù)愛(ài)好者和實(shí)踐者。大家在讀了這些書(shū)之后,一定會(huì)讓自己陷入深深的思考之中。

讓我們開(kāi)始看看這個(gè)書(shū)單吧……

我按這些書(shū)所涉及的領(lǐng)域?qū)⑺鼈儎澐譃橐韵?8 類來(lái)詳細(xì)介紹,以方便大家選擇:

*統(tǒng)計(jì)/概率論類書(shū)籍

*機(jī)器學(xué)習(xí)類書(shū)籍

*數(shù)據(jù)可視化和分析類書(shū)籍

*深度學(xué)習(xí)類書(shū)籍

*自然語(yǔ)言處理(NLP)類書(shū)籍

*計(jì)算機(jī)視覺(jué)類書(shū)籍

*人工智能類書(shū)籍

*工具/語(yǔ)言類書(shū)籍

1.統(tǒng)計(jì)/概率論類書(shū)籍

(1)《統(tǒng)計(jì)學(xué)學(xué)習(xí)概論》(Introduction to Statistical Learning)

作者:加雷斯·詹姆斯,丹妮拉·維滕,特來(lái)沃爾·黑斯蒂,羅伯特·蒂施萊尼(Gareth James, Daniela Witten, Trevor Hastie,Robert Tibshirani).

一直以來(lái),這本書(shū)都是經(jīng)典書(shū)籍。它涵蓋了基本的統(tǒng)計(jì)學(xué)知識(shí)以及機(jī)器學(xué)習(xí)技術(shù)。這本書(shū)吸睛的地方在于,每一個(gè)概念都用 R 語(yǔ)言做案例分析。所以,我們一旦掌握了編程的技巧,在讀這本書(shū)時(shí),就會(huì)快速回憶起每一個(gè)概念及其在程序中的操作方法。

圖2. 《統(tǒng)計(jì)學(xué)學(xué)習(xí)概論》

(2)《思考統(tǒng)計(jì):程序員的概率論和統(tǒng)計(jì)學(xué)》(Think Stats: Probability and Statistics for Programmers)

作者:艾倫·B·唐尼(Allen B. Downey)

這本書(shū)在眾多數(shù)據(jù)科學(xué)書(shū)籍中是首選書(shū)籍。它提供了大量的資源。尤其是對(duì)于有一定 Python 基礎(chǔ)知識(shí)的人,它特別實(shí)用,可以用來(lái)做數(shù)據(jù)分析。

圖3. 《思考統(tǒng)計(jì):程序員的概率論和統(tǒng)計(jì)學(xué)》

(3)《統(tǒng)計(jì)學(xué)的藝術(shù):從數(shù)據(jù)中學(xué)習(xí)》(The Art of Statistics: Learning from Data)

作者:大衛(wèi)·斯皮格爾霍爾特(David Spiegelhalter)

這本書(shū)最大的亮點(diǎn)是采用了淺顯易懂的案例來(lái)講解理論。這本書(shū)不僅層層剖析了特定的問(wèn)題,還給問(wèn)題提供了具有漸進(jìn)性和一致性的統(tǒng)計(jì)解決方案。簡(jiǎn)而言之,它使統(tǒng)計(jì)學(xué)的學(xué)習(xí)變得簡(jiǎn)單了!

圖4. 《統(tǒng)計(jì)學(xué)的藝術(shù):從數(shù)據(jù)中學(xué)習(xí)》

(4)《概率論:狂熱初學(xué)者入門》(Probability: For the Enthusiastic Beginner)

作者:大衛(wèi)·莫蘭(David Morin)

圖5. 《概率論:狂熱初學(xué)者入門》

這是一本概率論初學(xué)者的理想讀物。它涵蓋了所有的基礎(chǔ)知識(shí),包括組合學(xué),概率規(guī)則,貝葉斯定理,期望值,方差,概率密度,公共分布,大數(shù)定律,中心極限定理,相關(guān)性,回歸分析等等。

(5)《概率論入門》(Introduction to Probability)

圖6. 《概率論入門》

作者:J·勞里·斯奈爾,查爾斯·米勒·格林斯特德(J. Laurie Snell,Charles Miller Grinstead)

這又是一本介紹概率概念的書(shū)籍。和《概率論:狂熱初學(xué)者入門》一樣,這本書(shū)是為研究生而寫(xiě)的綜合教材。

(6)《赤裸裸的統(tǒng)計(jì)——從數(shù)據(jù)中剝離恐懼》(Naked Statistics — Stripping the Dread from the Data)

作者:查爾斯·韋蘭(Charles Wheelan)

統(tǒng)計(jì)學(xué)有時(shí)候是一個(gè)令人生畏的話題。在這本書(shū)中,作者以一種風(fēng)趣而簡(jiǎn)潔的方式闡明了關(guān)鍵概念,如推理、相關(guān)性和回歸分析等。

圖7. 《赤裸裸的統(tǒng)計(jì)——從數(shù)據(jù)中剝離恐懼》

2.機(jī)器學(xué)習(xí)類書(shū)籍

(1)《百頁(yè)機(jī)器學(xué)習(xí)書(shū)》(The Hundred-Page Machine Learning Book)

圖8. 《百頁(yè)機(jī)器學(xué)習(xí)書(shū)》

作者:安德烈·博爾科夫(Andriy Burkov)

我真心喜歡這本書(shū)。在讀到它之前,我閱讀了大量的試圖從不同角度和不同層面講授機(jī)器學(xué)習(xí)的書(shū)籍。我絞盡腦汁地想從這些書(shū)中找到一個(gè)方法,希望它能夠簡(jiǎn)潔地概括難以理解的話題和難以理解的方程式??墒牵钡阶x了安德里·布爾科夫用大約 100 多頁(yè)的篇幅寫(xiě)出來(lái)的這本書(shū),我才找到了這個(gè)方法。這本書(shū)文筆優(yōu)美,易于理解,已經(jīng)得到了許多人的認(rèn)可。

(2)《數(shù)據(jù)科學(xué)介紹》(Introducing Data Science)

作者:戴維·西倫(Davy Cielen)等

出版商:曼寧(Manning)

圖9. 《數(shù)據(jù)科學(xué)介紹》

我喜歡這本書(shū)有一個(gè)特殊的原因,那就是,這些書(shū)不僅包含了我們常見(jiàn)的關(guān)于數(shù)據(jù)科學(xué)的主題,它還包括了數(shù)據(jù)科學(xué)整個(gè)領(lǐng)域的其他方面。我強(qiáng)烈推薦閱讀這本書(shū),它會(huì)或多或少地會(huì)讓我們熟悉數(shù)據(jù)科學(xué)的全貌。

(3)《從頭開(kāi)始的數(shù)據(jù)科學(xué)》(Data Science from Scratch)

作者:?jiǎn)虪枴じ耵斔梗↗oel Grus)

出版商:奧萊利(O’Reilly)

圖10. 《從頭開(kāi)始的數(shù)據(jù)科學(xué)》

這本書(shū)的第二版已經(jīng)發(fā)布了,因?yàn)樗依烁鞣N基本原理。也是因此,它已經(jīng)成為一本倍受歡迎的書(shū)。這相當(dāng)于是一個(gè)完整的一攬子交易,讀了一本就等于讀了很多本,十分推薦本書(shū)。

(4)《Python數(shù)據(jù)科學(xué)手冊(cè)》(Python Data Science Handbook)

作者:杰克·范德普拉斯(Jake VanderPlas)

出版商:奧萊利

圖11. 《Python數(shù)據(jù)科學(xué)手冊(cè)》

這本書(shū)最適合那些剛開(kāi)始做數(shù)據(jù)分析或數(shù)據(jù)科學(xué)的人閱讀,這正是他們所需要的那本能夠參見(jiàn)所有技術(shù)的書(shū)。本書(shū)能夠強(qiáng)化你對(duì) python 的掌握程度,并可促進(jìn)你在數(shù)據(jù)科學(xué)上的工作。

(5)《在數(shù)據(jù)科學(xué)領(lǐng)域建立職業(yè)生涯》(Build a Career in Data Science)

作者:艾米麗·羅賓遜,杰奎琳·諾里斯(Emily Robinson,Jacqueline Nolis)

出版商:曼寧

圖12. 《在數(shù)據(jù)科學(xué)領(lǐng)域建立職業(yè)生涯》

這本書(shū)于2020年出版,主要陳述了與學(xué)習(xí)數(shù)據(jù)科學(xué)相關(guān)的技術(shù)內(nèi)容。我們必讀這本書(shū)的原因是,它教我們?nèi)绾卧跀?shù)據(jù)科學(xué)行業(yè)工作。

(6)《數(shù)據(jù)科學(xué)的藝術(shù)——給任何與數(shù)據(jù)打交道的人的指南》(The Art of Data Science — A Guide for Anyone Who Works With Data)

作者:羅杰·D·彭,伊麗莎白·松井(Roger D. Peng, Elizabeth Matsui)

這本書(shū)不僅對(duì)數(shù)據(jù)分析工作流程做了完美的概述,還清楚地闡述了一個(gè)觀點(diǎn)——盡管存在許多工具、復(fù)雜的一步步的信息迭代過(guò)程,數(shù)據(jù)分析從根本上講依然是一門藝術(shù)。

圖13. 《數(shù)據(jù)科學(xué)的藝術(shù)——給任何與數(shù)據(jù)打交道的人的指南》

3.數(shù)據(jù)可視化與分析類書(shū)籍

(1)《數(shù)據(jù)可視化的基礎(chǔ)——信息豐富且引人注目的數(shù)字制作入門》(Fundamentals of Data Visualization — A Primer on Making Informative and Compelling Figures)

作者:克勞斯·沃克(Claus O. Wilke)

本書(shū)采用舉出正面和反面例子加以對(duì)比的方式,介紹了數(shù)據(jù)可視化的基本原則。它可以幫助我們理解有效的可視化背后的基本原理,并教會(huì)我們?cè)O(shè)計(jì)更有意義的模塊來(lái)傳達(dá)正確的信息。

圖14. 《數(shù)據(jù)可視化的基礎(chǔ)——信息豐富且引人注目的數(shù)字制作入門》

(2)《美麗的可視化,通過(guò)專家的眼睛看數(shù)據(jù)》(Beautiful Visualization, Looking at Data Through the Eyes of Experts)

作者:朱莉·斯蒂爾,諾亞·伊林斯基(Julie Steele, Noah Iliinsky)

網(wǎng)站:奧萊利媒體|亞馬遜(O "Reilly Media| Amazon)

圖15. 《美麗的可視化,通過(guò)專家的眼睛看數(shù)據(jù)》

“可視化”是讓數(shù)據(jù)說(shuō)話的一種新方式,通過(guò)顏色等視覺(jué)指標(biāo)達(dá)到溝通的目的,并通過(guò)一定的研究方法將數(shù)據(jù)和視覺(jué)指標(biāo)整合在一起。

這本書(shū)講述了一些著名的可視化設(shè)計(jì)和開(kāi)發(fā)產(chǎn)品。

(3)《周一改頭換面——每次用一張圖表改進(jìn)我們可視化和分析數(shù)據(jù)的方式》(MakeoverMonday — Improving How We Visualize and Analyze Data, One Chart at a Time)

作者:安迪·克里貝爾(Andy Kriebel)

此書(shū)是周一改頭換面(MakeOverMonday)項(xiàng)目的擴(kuò)展,在這個(gè)項(xiàng)目中,數(shù)據(jù)可視化社區(qū)的成員可以分享他們對(duì)現(xiàn)有圖表和數(shù)據(jù)的改進(jìn)。它強(qiáng)調(diào),雖然在設(shè)計(jì)可視化中存在可變性,但有一些關(guān)鍵技術(shù)可以遵循,以確保自己的圖表是有作用和有意義的。

圖16. 《周一改頭換面——每次用一張圖表改進(jìn)我們可視化和分析數(shù)據(jù)的方式》

(4)《用數(shù)據(jù)講故事——商務(wù)專業(yè)人士的數(shù)據(jù)可視化指南》(Storytelling with Data — A Data Visualization Guide for Business Professionals)

作者:科爾·努斯鮑默·克納菲奇(Cole Nussbaumer Knaflic)

對(duì)于任何一個(gè)想要更好地以清晰、簡(jiǎn)潔和圖形化的方式呈現(xiàn)信息的人來(lái)說(shuō),這是一本必讀的書(shū)。這本書(shū)教給我們數(shù)據(jù)可視化的基礎(chǔ)知識(shí),以及如何有效地使用數(shù)據(jù),并舉出了大量現(xiàn)實(shí)的例子。

圖17. 《用數(shù)據(jù)講故事——商務(wù)專業(yè)人士的數(shù)據(jù)可視化指南》

(5)《更好的數(shù)據(jù)可視化:學(xué)者、研究人員和書(shū)蟲(chóng)的學(xué)習(xí)指南》(BETTER DATA VISUALIZATIONS: A Guide for Scholars, Researchers, and Wonks》

作者:?jiǎn)碳{森·施瓦比什(Jonathan Schwabish)

此書(shū)包括三個(gè)部分。第一部分簡(jiǎn)要介紹了數(shù)據(jù)可視化的最佳實(shí)操方式。第二部分是本書(shū)的主要部分,講述了圖表類型。施瓦比什深入研究了不同類型的圖表,這些圖表遠(yuǎn)遠(yuǎn)超出了直線和條形的標(biāo)準(zhǔn)。

圖18. 《更好的數(shù)據(jù)可視化:學(xué)者、研究人員和書(shū)蟲(chóng)的學(xué)習(xí)指南》

相關(guān)閱讀:學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書(shū)籍(中)

學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書(shū)籍(下)

譯者:甜湯

關(guān)鍵詞: 機(jī)器學(xué)習(xí) 數(shù)據(jù)分析 改頭換面

責(zé)任編輯:FD31
上一篇:
下一篇: