AI 時代的 R 語言AI 時代的 R 語言_第1頁
AI 時代的 R 語言AI 時代的 R 語言_第2頁
AI 時代的 R 語言AI 時代的 R 語言_第3頁
AI 時代的 R 語言AI 時代的 R 語言_第4頁
AI 時代的 R 語言AI 時代的 R 語言_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1/ChinaR10thAIAI時代的R數(shù)據(jù)數(shù)據(jù)的時代新時代的2017中國R語言會議(上海華東師范大20171202數(shù)據(jù)的數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科目2/ChinaR10th1數(shù)據(jù)的時1統(tǒng)計學(xué)的濫信息時代的數(shù)據(jù)科2新時代的21數(shù)據(jù)的時1統(tǒng)計學(xué)的濫信息時代的數(shù)據(jù)科2新時代的2數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科2/ChinaR10th概率論的發(fā)1494年,現(xiàn)代會計學(xué)之父帕西奧利提出獎金分配問概率論的發(fā)假設(shè)兩個人A和B在玩一種游戲,勝者得10分,負(fù)者得0分,先得60分者獲勝。如果突然游戲終止,而此時A的得分是50分,B的得分是30分,獎金應(yīng)該如何分配給AB1654年,帕斯卡正式創(chuàng)立概率32歲的帕斯卡和54歲的費馬通信討論獎金分配的問題,得到了正確的答案7:1。1812年,拉普拉斯完善了古典概率數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)PAGE3/ChinaR10th計學(xué)的濫觴信息時代的數(shù)據(jù)科蒲豐投針LyL2D蒲豐投針LyL2D TimesofDropping:數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE4/ChinaR10thPlayfairPlayfair的線圖數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE5/ChinaR10th赫歇赫歇爾的散點圖位置 100120140 位置 100120140年倫敦倫敦霍亂防治圖南丁南丁格爾的玫瑰圖目1數(shù)據(jù)的時目1統(tǒng)計學(xué)的濫信息時代的數(shù)據(jù)科2新時代的2數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE9/ChinaR10th統(tǒng)計學(xué)的起凱特勒,近代統(tǒng)計學(xué)之統(tǒng)計學(xué)的起高爾頓,早期的統(tǒng)計大1855年發(fā)現(xiàn)了父子的遺傳身高向平均值回歸的現(xiàn)象。1969律,發(fā)表了專著《遺傳天才1892年發(fā)表了專著《指紋學(xué)1901年,高爾頓資助并與其學(xué)生皮爾遜等人聯(lián)合創(chuàng)辦了科學(xué)提勒,數(shù)理統(tǒng)計的先19世紀(jì)時就發(fā)現(xiàn)了很多現(xiàn)代統(tǒng)計學(xué)中的成果,但是由于論都是丹麥語,很多先驅(qū)性的工作當(dāng)時沒被重視,直到年后才廣為人知也是精算領(lǐng)域的先驅(qū),在最初的精算師國際組織中擔(dān)任要職推斷統(tǒng)計卡爾·皮爾推斷統(tǒng)計1857年出生于英國,被譽為是“數(shù)理統(tǒng)計的創(chuàng)始人1895年提出皮爾遜分布族,1900年提出卡方檢驗皮爾遜以傾斜分布的方式提出了革命性的思想,對19世紀(jì)費希1890年出生于英國,被譽為是“推斷統(tǒng)計之父1912年提出了最大似然估計。1925年出版的《研究者用的統(tǒng)計方法》是第一本推斷統(tǒng)計學(xué)的教科書,對統(tǒng)計方法的奈1894年出生于俄國,區(qū)間估計和假設(shè)檢驗理論的創(chuàng)始人。和艾貢·皮爾遜(卡爾·皮爾遜之子)共同做了很多偉大的數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE10/ChinaR10th目1數(shù)據(jù)的時目1統(tǒng)計學(xué)的濫信息時代的數(shù)據(jù)科2新時代的2數(shù)據(jù)數(shù)據(jù)的時代新時代的什么是數(shù)據(jù)科學(xué)數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE10/ChinaR10th數(shù)據(jù)科學(xué)的來C.F.JeffWu于1997年非常旗幟鮮明地提出了“Statistics=DataScience?”從2008年DJatil和JeffHammerbacher把他們在LinedIn和acebook的工作職責(zé)定義為“數(shù)據(jù)科學(xué)家”的那段時期開始,數(shù)據(jù)科學(xué)開始在業(yè)界流行起來。定Wikipedia上的定義:數(shù)據(jù)科學(xué)是一門利用數(shù)據(jù)學(xué)習(xí)知識的數(shù)據(jù)數(shù)據(jù)的時代新時代的什么是數(shù)據(jù)科學(xué)數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE11/ChinaR10thScience,機機器學(xué)計算科統(tǒng)計數(shù)據(jù)科商業(yè)智傳數(shù)據(jù)分領(lǐng)域知a圖形摘自《數(shù)據(jù)科學(xué)中的R語言數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE12/ChinaR10th計算機的發(fā)計算機的發(fā)世界上第一臺通用計算機,1946年在美國的賓夕法尼亞大學(xué)美國國防部用它來進行彈道計算,占地170平方米,重達噸,每秒鐘可進行5000次運算ENIAC以電子管作為元器件(一共用了18000個電子管UNIVAC世界上第一臺商用計算機,1951年研制成功并交付給美國人是第二代計算機的代表數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE13/ChinaR10th早期的AI時人早期的AI時1940年,控制論之父維納研究計算機如何像大腦一樣工作1950年,人工智能之父的圖靈提出了著名的“圖靈測試1956年,達特茅斯大學(xué)的會議上正式使用了“人工智能”這神經(jīng)網(wǎng)1943年,心理學(xué)家WarrenMcCulloch和數(shù)理邏輯學(xué)WalterPitts提出神經(jīng)元的數(shù)學(xué)模型1957年,康內(nèi)爾大學(xué)教授FrankRosenblatt提出的“感知1969年,MarvinMinsky和SeymourPapert出版了《感知機:1986年,Hinton和DavidRumelhart發(fā)表了BP算法“第五代計算機”時日本第五代“第五代計算機”時1978年,日本通產(chǎn)省委托東京大學(xué)計算機中心主任TohruMoto-Oka研究下一代計算機系統(tǒng)1981年,TohruMoto-Oka為首的委員會提交了報告《知識信日本人選擇了邏輯程序語言Prolog,走的是規(guī)則和邏輯路線。1992年,日本政府宣布第五代計算機研制失敗。數(shù)據(jù)挖掘時Data數(shù)據(jù)挖掘時上個世界90年代開始流行,世紀(jì)之交時跟隨人們對知識爆商業(yè)智能時BusinessIntelligence商業(yè)智能時上個世界90年代末開始在業(yè)界出現(xiàn),本世紀(jì)初非常火熱,通常指用數(shù)據(jù)倉庫、OLAP行數(shù)據(jù)分析以實現(xiàn)商業(yè)價值。數(shù)數(shù)據(jù)的時代新時代的數(shù)據(jù)中的科學(xué)統(tǒng)計學(xué)的濫觴信息時代的數(shù)據(jù)科PAGE17/ChinaR10th大數(shù)大數(shù)據(jù)時AIAI時數(shù)據(jù)的數(shù)據(jù)的時代新時代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建目19/ChinaR10th1數(shù)據(jù)的時12新時代的2R的發(fā)展歷R的使用建議1數(shù)據(jù)的時12新時代的2R的發(fā)展歷R的使用建議數(shù)數(shù)據(jù)的時代新時代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建PAGE19/ChinaR10thR的誕生S語言是R語言R的誕生S語言誕生于20世紀(jì)70年代由JohnM.Chambers領(lǐng)導(dǎo)的1998年美國計算機學(xué)會(ACM)授予了S語言的主要設(shè)計者JohnM.Chambers“軟件系統(tǒng)獎。1993年,S語言的許可證被MathSoft公司買斷,S-PLUS成2008年,TIBCO收購了已改名的Insightful公司R語言吸收了很多Scheme語言的特Scheme語言誕生于1975年的MIT,是LISP語言的一個方有一次R語言的作者Ross準(zhǔn)備用Scheme向別人演示詞法作用域的時候,由于手邊沒有Scheme的書,就用S來演示卻失敗了,這讓他萌生了改進S語言的想法。R的誕生1993年,R語R的誕生1992年RossIhaka和RobertGentleman在奧克蘭大學(xué)成為言;而他們名字的首字母都是R,于是R便成為這門語言的1993年,Ross和Robert將R的部分二進制文件放到了卡耐基·梅隆大學(xué)統(tǒng)計系的Statlib中,并在S語言的新聞列表蘇黎世理工學(xué)院的MartinM極力勸說兩位原作者公布源代R成為自由軟件。于是19956R的源代碼正式發(fā)布到了自由軟件協(xié)會的FTP上。1997年,R核心團隊成1997年第一批核心團隊的成員數(shù)目為11位2008年R核心團隊成員數(shù)目增加到了19位2011年開始,R核心團隊成員數(shù)目達到20位R的特JohnM.Chambers2009年第一期《RJournal》上對R的R的特aninterfacetocomputationalproceduresofmanykinds(各類;interactive,hands-oninrealtime(具有可交互性,可以實時;functionalinitsmodelofprogramming(函數(shù)式編程模式;“;modular,builtfromstandardizedpieces(模塊化,由標(biāo)準(zhǔn)化;數(shù)數(shù)據(jù)的時代新時代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建VB.NET、PHP、Delphi、AssemblyLanguageVB.NET、PHP、Delphi、AssemblyLanguageChinaR10thPAGE22/R在數(shù)據(jù)分析應(yīng)用領(lǐng)域的發(fā)KDNuggets關(guān)于“數(shù)據(jù)分析/數(shù)據(jù)挖掘R在數(shù)據(jù)分析應(yīng)用領(lǐng)域的發(fā)R2011KDNuggets調(diào)查數(shù)據(jù)分析類編程語言開始就排名第一,從2012年開始,在關(guān)于“數(shù)據(jù)挖掘和數(shù)據(jù)分析”工具的調(diào)查中,也超過了Excel和Rapidminer成為第一。2017年8月的“數(shù)據(jù)科學(xué)和機器學(xué)習(xí)平臺”的調(diào)查中,Python超過R成為第一IEEE熱門編程語言排行20178月發(fā)布的排行版中,R排名第6,前10名的編程語言為Python、C、Java、C++、C#、R、JavaScript、TIOBE編程語言排行201711月發(fā)布的排行版中,R語言排名第11,前10名的編程語言為Java、C、C++、Python、C#、JavaScript數(shù)數(shù)據(jù)的時代新時代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建PAGE23/ChinaR10th目1數(shù)據(jù)的時目12新時代的2R的發(fā)展歷R的使用建議數(shù)數(shù)據(jù)的時代新時代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建PAGE23/ChinaR10th統(tǒng)計計簡統(tǒng)計計最早版本的RFortran編寫,當(dāng)前版本主要是C/C++。R包可以很方便地支持C/C++和Fortran的開發(fā)。R的優(yōu)R語言編程容易,代碼易讀性能相對較差,不過可以通過集C/C++或Fortran的庫來解決矩陣式編簡矩陣式編早期的R常被拿來和Matlab、進行比較R的優(yōu)數(shù)據(jù)可視簡數(shù)據(jù)可視早期的R受歡迎的重要原因是可以生編程靈活,是自定義統(tǒng)計圖形的首選R的優(yōu)可視化資源非常豐富,其中g(shù)gplot2包實現(xiàn)了“TheGrammarofGraphics”中主流的JavaScript有很好的結(jié)合,社區(qū)中存在很多像recharts這樣的優(yōu)秀第三統(tǒng)計學(xué)方簡統(tǒng)計學(xué)方R語言崛起之初常被拿來和SAS比較。業(yè)界中RSAS可以進行很好的配合R的優(yōu)蒙特卡洛方簡蒙特卡洛方R的優(yōu)最優(yōu)化方簡最優(yōu)化方早期R的優(yōu)化功能很弱,常被用來和R的優(yōu)開源免費,資源豐富,編程靈活雜的方法,但是可以結(jié)合COIN-OR進行擴展機器學(xué)簡機器學(xué)早期機器學(xué)習(xí)資源不如Python豐富,導(dǎo)致很多R用戶投入了Python陣營。流工具的作者直接參與了R包的開發(fā)比如xgboostR的優(yōu)學(xué)習(xí)門檻低,代碼易讀直接使用的運算性能相對較差深度學(xué)簡深度學(xué)習(xí)框架很少直接提供R的支持。MXNet對R提供了完美的原生支持,在RStudio的貢獻下,目前也有了Tensorflow和Keras的R包R的優(yōu)在R的框架下可以完美地融合到分析流程中,Windows下的安裝和使用非常文學(xué)化編簡文學(xué)化編早期的R就引入了文學(xué)化編程的思想謝益輝的knitr發(fā)布后顛覆了這個領(lǐng)域,后續(xù)的bookdown有可能會改變科技類R的優(yōu)資源非常豐富,功能非常強大Markdown框架的話可以比較容易系統(tǒng)架簡系統(tǒng)架早期的R并未向后臺服務(wù)器方向發(fā)展,在業(yè)界通常是和Java進行整合。Shiny問世后擁有了完美的服務(wù)器框架,此外fiery包也可以提供強大的后臺服R的優(yōu)Shiny框架非常簡潔,可能是門檻最低的網(wǎng)站系統(tǒng)構(gòu)建工具,與JavaScript可性能較差,一般不用作生產(chǎn)系統(tǒng)數(shù)數(shù)據(jù)的時代新時代的R的發(fā)展歷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論