統(tǒng)計軟件和R語言_第1頁
統(tǒng)計軟件和R語言_第2頁
統(tǒng)計軟件和R語言_第3頁
統(tǒng)計軟件和R語言_第4頁
統(tǒng)計軟件和R語言_第5頁
已閱讀5頁,還剩190頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、整理ppt統(tǒng)統(tǒng)計計軟軟件件和和R語語言言裝了裝了R沒有?沒有?整理ppt一個廣泛接受的統(tǒng)計定義為:一個廣泛接受的統(tǒng)計定義為:統(tǒng)計統(tǒng)計是用以收集是用以收集數(shù)據(jù)數(shù)據(jù)、分析分析數(shù)據(jù)數(shù)據(jù)和由和由數(shù)據(jù)數(shù)據(jù)得得出結(jié)論的一組概念、出結(jié)論的一組概念、原則和方法原則和方法.整理ppt這個定義決定了統(tǒng)計的命運:這個定義決定了統(tǒng)計的命運:和數(shù)學(xué)及音樂不同和數(shù)學(xué)及音樂不同, 統(tǒng)計統(tǒng)計不能欣賞自己不能欣賞自己, 它不為實它不為實際服務(wù)就際服務(wù)就沒有存在必要沒有存在必要統(tǒng)計必須統(tǒng)計必須為各個領(lǐng)域服務(wù)為各個領(lǐng)域服務(wù)統(tǒng)計必須和統(tǒng)計必須和數(shù)據(jù)數(shù)據(jù)打交道打交道因此因此,統(tǒng)計必須和統(tǒng)計必須和計算機計算機結(jié)合結(jié)合整理ppt搞搞“理論

2、統(tǒng)計理論統(tǒng)計”是否是否用不著動手搞數(shù)據(jù)呢用不著動手搞數(shù)據(jù)呢?如果倒退如果倒退幾十年幾十年就可以就可以.整理ppt如果沒有應(yīng)用背景如果沒有應(yīng)用背景文章沒人要文章沒人要, 基金無人給基金無人給. 現(xiàn)在一些人即使瞎編也要編現(xiàn)在一些人即使瞎編也要編出一個應(yīng)用背景來出一個應(yīng)用背景來.純純理論統(tǒng)計理論統(tǒng)計存在嗎?存在嗎?整理ppt統(tǒng)計和計算機統(tǒng)計和計算機 現(xiàn)代生活已離不開計算機了?,F(xiàn)代生活已離不開計算機了。但最早使用計算機的是統(tǒng)計。但最早使用計算機的是統(tǒng)計。最初的計算機最初的計算機僅僅是為科學(xué)計僅僅是為科學(xué)計算而建造的。大型計算機的最算而建造的。大型計算機的最早一批用戶就包含統(tǒng)計。早一批用戶就包含統(tǒng)計。而

3、現(xiàn)在統(tǒng)計仍然是進行數(shù)字計而現(xiàn)在統(tǒng)計仍然是進行數(shù)字計算最多的用戶。算最多的用戶。整理ppt統(tǒng)計和計算機統(tǒng)計和計算機 計算機現(xiàn)在早已脫離了僅有計算計算機現(xiàn)在早已脫離了僅有計算功能的單一模式,而成為功能的單一模式,而成為百姓生百姓生活的一部分活的一部分。 計算機的使用,也從過去必須學(xué)計算機的使用,也從過去必須學(xué)會計算機語言到只需要會計算機語言到只需要“傻瓜式傻瓜式”地點擊鼠標。結(jié)果也從單純的數(shù)地點擊鼠標。結(jié)果也從單純的數(shù)字輸出到包括漂亮的表格和圖形字輸出到包括漂亮的表格和圖形的各種形式。的各種形式。整理ppt統(tǒng)計軟件統(tǒng)計軟件統(tǒng)計軟件的發(fā)展,也使得統(tǒng)統(tǒng)計軟件的發(fā)展,也使得統(tǒng)計從統(tǒng)計學(xué)家的圈內(nèi)游戲變計從

4、統(tǒng)計學(xué)家的圈內(nèi)游戲變成了大眾的游戲。成了大眾的游戲。只要輸入數(shù)據(jù),點幾下鼠標,只要輸入數(shù)據(jù),點幾下鼠標,做一些選項,馬上就得到令做一些選項,馬上就得到令人驚嘆的人驚嘆的漂亮結(jié)果了漂亮結(jié)果了。整理ppt統(tǒng)計軟件統(tǒng)計軟件是否傻瓜式的統(tǒng)計軟件使用是否傻瓜式的統(tǒng)計軟件使用可以代替統(tǒng)計課程了?可以代替統(tǒng)計課程了?當然不是。當然不是。數(shù)據(jù)的整理和識別,方法的數(shù)據(jù)的整理和識別,方法的選用,計算機輸出結(jié)果的理選用,計算機輸出結(jié)果的理解都不象使用傻瓜相機那樣解都不象使用傻瓜相機那樣簡單可靠。簡單可靠。整理ppt統(tǒng)計軟件的問題統(tǒng)計軟件的問題諸如法律和醫(yī)學(xué)的軟件都有不少諸如法律和醫(yī)學(xué)的軟件都有不少警告,不時提醒你去

5、咨詢專家。警告,不時提醒你去咨詢專家。這是注意飯碗的律師和大夫的高這是注意飯碗的律師和大夫的高明之處。明之處。但統(tǒng)計軟件則不那么負責。只要但統(tǒng)計軟件則不那么負責。只要數(shù)據(jù)格式無誤、方法不矛盾而且數(shù)據(jù)格式無誤、方法不矛盾而且不用零作為除數(shù)就一定給你結(jié)果,不用零作為除數(shù)就一定給你結(jié)果,而且而且沒有任何警告沒有任何警告。可能統(tǒng)計學(xué)家缺乏商業(yè)頭腦。可能統(tǒng)計學(xué)家缺乏商業(yè)頭腦。整理ppt統(tǒng)計軟件的問題統(tǒng)計軟件的問題另外,統(tǒng)計軟件另外,統(tǒng)計軟件輸出的結(jié)果太多輸出的結(jié)果太多;即使是同樣的方法,不同軟件輸即使是同樣的方法,不同軟件輸出的內(nèi)容還不一樣;有時同樣的出的內(nèi)容還不一樣;有時同樣的內(nèi)容名稱也不一樣。內(nèi)容名

6、稱也不一樣。這就使得使用者大傷腦筋。即使這就使得使用者大傷腦筋。即使統(tǒng)計學(xué)家也不一定能解釋所有的統(tǒng)計學(xué)家也不一定能解釋所有的輸出。輸出。因此,就應(yīng)該特別留神,明白自因此,就應(yīng)該特別留神,明白自己是在干什么。己是在干什么。不要在得到一堆不要在得到一堆毫無意義的垃圾之后還沾沾自喜。毫無意義的垃圾之后還沾沾自喜。 整理pptdata test;input x;cards;1231760run;proc univariate freq normal;run;隨意鍵入幾行隨意鍵入幾行SAS語句和語句和5個數(shù)目個數(shù)目.得到下面結(jié)果得到下面結(jié)果,一共一共50多個數(shù)目多個數(shù)目(你能夠解釋多少你能夠解釋多少?你

7、需要你需要多少多少?). 整理ppt The SAS System 15:33 Friday, September 12, 2003 1Univariate ProcedureVariable=X Moments Quantiles(Def=5) N 5 Sum Wgts 5 100% Max 60 99% 60 Mean 16.6 Sum 83 75% Q3 17 95% 60 Std Dev 25.12568 Variance 631.3 50% Med 3 90% 60 Skewness 1.899804 Kurtosis 3.563057 25% Q1 2 10% 1 USS 3903

8、 CSS 2525.2 0% Min 1 5% 1 CV 151.3595 Std Mean 11.23655 1% 1 T:Mean=0 1.477322 Pr|T| 0.2136 Range 59 Num = 0 5 Num 0 5 Q3-Q1 15 M(Sign) 2.5 Pr=|M| 0.0625 Mode 1 Sgn Rank 7.5 Pr=|S| 0.0625 W:Normal 0.726472 PrW 0.0197 Extremes Lowest Obs Highest Obs 1( 1) 1( 1) 2( 2) 2( 2) 3( 3) 3( 3) 17( 4) 17( 4) 6

9、0( 5) 60( 5) Frequency Table Percents Percents Value Count Cell Cum Value Count Cell Cum 1 1 20.0 20.0 17 1 20.0 80.0 2 1 20.0 40.0 60 1 20.0 100.0 3 1 20.0 60.0原始的原始的5個數(shù)目清楚個數(shù)目清楚, 還還是這是這50多個數(shù)目清楚多個數(shù)目清楚?這些輸出都有意義嗎這些輸出都有意義嗎?整理ppt實際上實際上 對于一個統(tǒng)計數(shù)據(jù),如果選擇對于一個統(tǒng)計數(shù)據(jù),如果選擇“傻瓜傻瓜”軟件適合該數(shù)據(jù)的選軟件適合該數(shù)據(jù)的選項的全部輸出,那么項的全部輸出,那么

10、 其中可能包含(很多,甚至多其中可能包含(很多,甚至多數(shù))沒有意義的結(jié)果數(shù))沒有意義的結(jié)果(比如(比如SPSS中的對數(shù)線性模型、非參中的對數(shù)線性模型、非參數(shù)檢驗中的多重相關(guān)樣本的檢數(shù)檢驗中的多重相關(guān)樣本的檢驗等等,各種回歸中的適合正驗等等,各種回歸中的適合正態(tài)樣本的檢驗)態(tài)樣本的檢驗)整理ppt而且而且這些眾多的輸出,給了那些這些眾多的輸出,給了那些諸如檢驗中的諸如檢驗中的“少數(shù)服從多少數(shù)服從多數(shù)數(shù)”的的“創(chuàng)新者創(chuàng)新者”以似是而以似是而非的非的“論據(jù)論據(jù)”。許多許多“傻瓜傻瓜”軟件的輸出找軟件的輸出找不到確切數(shù)學(xué)背景。只有使不到確切數(shù)學(xué)背景。只有使用編程軟件才能夠核對其真用編程軟件才能夠核對其

11、真實意義。實意義。整理ppt統(tǒng)計軟件的種類統(tǒng)計軟件的種類統(tǒng)計軟件的種類很多。統(tǒng)計軟件的種類很多。有些功能齊全,有些價格便有些功能齊全,有些價格便宜;有些容易操作,有些需宜;有些容易操作,有些需要更多的實踐才能掌握。要更多的實踐才能掌握。還有些是專門的軟件,只處還有些是專門的軟件,只處理某一類統(tǒng)計問題。理某一類統(tǒng)計問題。最常見有幾種。最常見有幾種。 整理ppt統(tǒng)計軟件的種類統(tǒng)計軟件的種類SPSS:這是一個很受歡迎的這是一個很受歡迎的統(tǒng)計軟件;統(tǒng)計軟件;它容易操作,它容易操作,輸出漂亮,輸出漂亮,功能齊全,功能齊全,價格合理。價格合理。對于非統(tǒng)計工作者是很好的對于非統(tǒng)計工作者是很好的選擇。選擇。整

12、理ppt統(tǒng)計軟件的種類統(tǒng)計軟件的種類 Excel:嚴格說來不是統(tǒng)計軟件,嚴格說來不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟件,必然有一定但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計計算功能。統(tǒng)計計算功能。 注意,多數(shù)裝注意,多數(shù)裝Office時沒有裝數(shù)據(jù)時沒有裝數(shù)據(jù)分析的功能,畫圖功能都具備分析的功能,畫圖功能都具備(雖雖然不好看然不好看)。 對于簡單分析,對于簡單分析,Excel還算方便,還算方便,但隨著問題的深入,就不那么但隨著問題的深入,就不那么“傻傻瓜瓜”,需要很麻煩地使用函數(shù),甚,需要很麻煩地使用函數(shù),甚至根本沒有相應(yīng)的方法了。至根本沒有相應(yīng)的方法了。整理ppt統(tǒng)計軟件的種類統(tǒng)計軟件的種類 SAS:這是功

13、能這是功能非常非常齊全的軟件;齊全的軟件; 美國政府政策傾斜美國政府政策傾斜(“權(quán)威性權(quán)威性”) 許多美國公司使用。許多美國公司使用。 價格不菲價格不菲,每年交費每年交費.即使贈送即使贈送,條條件苛刻件苛刻 SAS公司傲慢無禮公司傲慢無禮 盡管現(xiàn)在已經(jīng)盡量盡管現(xiàn)在已經(jīng)盡量“傻瓜化傻瓜化”,仍然需要一定的訓(xùn)練才可以進入。仍然需要一定的訓(xùn)練才可以進入。 對于基本統(tǒng)計課程則不那么方便。對于基本統(tǒng)計課程則不那么方便。整理ppt統(tǒng)計軟件的種類統(tǒng)計軟件的種類 S-plus:這是:這是統(tǒng)計學(xué)家統(tǒng)計學(xué)家喜愛的軟件。喜愛的軟件。 功能齊全,功能齊全, 圖形漂亮圖形漂亮 有不斷加入有不斷加入的各個方向統(tǒng)計學(xué)家編寫

14、的統(tǒng)的各個方向統(tǒng)計學(xué)家編寫的統(tǒng)計軟件包。也可以自己加入算法計軟件包。也可以自己加入算法. 強大而又方便的編程功能強大而又方便的編程功能,使得研究人員,使得研究人員可以編制自己的程序來實現(xiàn)自己的理論和可以編制自己的程序來實現(xiàn)自己的理論和方法。方法。 它也在進行它也在進行“傻瓜化傻瓜化”以爭取顧客。但主以爭取顧客。但主要以其要以其方便的編程方便的編程為顧客所青睞。為顧客所青睞。 在在R軟件之前軟件之前是是統(tǒng)計學(xué)家統(tǒng)計學(xué)家的首選軟件。的首選軟件。 但是對于不會編程者但是對于不會編程者,不那么不那么“傻瓜傻瓜”整理ppt統(tǒng)計軟件的種類統(tǒng)計軟件的種類 R軟件:軟件:免費的免費的,志愿者管理的軟件。志愿者

15、管理的軟件。 其編程語言與其編程語言與S-plus所基于的所基于的S語言一樣,語言一樣, 編程方便,語言靈活,圖形功能強大編程方便,語言靈活,圖形功能強大 有不斷加入的各個方向統(tǒng)計學(xué)家編寫的統(tǒng)計軟件有不斷加入的各個方向統(tǒng)計學(xué)家編寫的統(tǒng)計軟件包。包。也可以自己加入自己算法的軟件包也可以自己加入自己算法的軟件包. 從網(wǎng)上可以不斷更新和增加有關(guān)的軟件包、數(shù)據(jù)從網(wǎng)上可以不斷更新和增加有關(guān)的軟件包、數(shù)據(jù)和程序??梢允褂闷渌浖幹频某绦颉:统绦???梢允褂闷渌浖幹频某绦颉?可以通過網(wǎng)上服務(wù)把程序變成機器語言可以通過網(wǎng)上服務(wù)把程序變成機器語言 這是這是發(fā)展最快發(fā)展最快的軟件,受到世界上統(tǒng)計師生的歡的軟件

16、,受到世界上統(tǒng)計師生的歡迎。迎。是用戶量增加最快的統(tǒng)計軟件是用戶量增加最快的統(tǒng)計軟件。 對于一般非統(tǒng)計工作者來說,主要問題是它沒有對于一般非統(tǒng)計工作者來說,主要問題是它沒有“傻瓜化傻瓜化”。(后面對后面對R語言還要專門介紹語言還要專門介紹)整理ppt其他有關(guān)軟件其他有關(guān)軟件 Minitab:這個軟件是很方便的功能強大這個軟件是很方便的功能強大而又齊全的軟件,也已經(jīng)而又齊全的軟件,也已經(jīng)“傻瓜化傻瓜化”,在我國用的不如在我國用的不如SPSS與與SAS那么普遍。那么普遍。 Statistica:也是功能強大而齊全的也是功能強大而齊全的“傻傻瓜化瓜化”的軟件,在我國用的也不如的軟件,在我國用的也不如

17、SAS與與SPSS那么普遍。那么普遍。 Eviews:這是一個主要處理回歸和時間這是一個主要處理回歸和時間序列的軟件。序列的軟件。 Systat: 已經(jīng)被已經(jīng)被SPSS購買而消失購買而消失 GAUSS:這是一個很好用的統(tǒng)計軟件,這是一個很好用的統(tǒng)計軟件,許多搞經(jīng)濟的喜歡它。主要也是編程功許多搞經(jīng)濟的喜歡它。主要也是編程功能強大。目前在我國使用的人不多。能強大。目前在我國使用的人不多。整理ppt其他有關(guān)軟件其他有關(guān)軟件 MATLAB:這也是應(yīng)用于各個領(lǐng)域的以編這也是應(yīng)用于各個領(lǐng)域的以編程為主的軟件,在工程上應(yīng)用廣泛。程為主的軟件,在工程上應(yīng)用廣泛。編程編程類似于類似于S和和R。但是統(tǒng)計方法不多。

18、但是統(tǒng)計方法不多。 FORTRAN:這是應(yīng)用于各個領(lǐng)域的歷史這是應(yīng)用于各個領(lǐng)域的歷史很長的非常優(yōu)秀的編程軟件,功能強大,很長的非常優(yōu)秀的編程軟件,功能強大,有大量數(shù)學(xué)軟件包及一定的統(tǒng)計軟件包。有大量數(shù)學(xué)軟件包及一定的統(tǒng)計軟件包。計算速度比前面介紹的都快得多。但需要計算速度比前面介紹的都快得多。但需要編程和編譯。操作不那么容易。編程和編譯。操作不那么容易。 C/C+: 是許多軟件是許多軟件,諸如諸如SAS的基礎(chǔ)的基礎(chǔ);但沒但沒有軟件包有軟件包,編程不方便編程不方便.整理ppt使用傻瓜軟件的問題使用傻瓜軟件的問題.無法無法任意取出任意取出計算過程中產(chǎn)生的計算過程中產(chǎn)生的任何任何中間結(jié)果中間結(jié)果;

19、;只能輸出軟件規(guī)定只能輸出軟件規(guī)定的輸出的輸出. .無法在中間無法在中間插入任何算法插入任何算法. . 無法實現(xiàn)軟件所無法實現(xiàn)軟件所沒有的沒有的計算計算. .無法無法實現(xiàn)任何方法或計算方面的創(chuàng)新實現(xiàn)任何方法或計算方面的創(chuàng)新. .是輸入輸出皆有限制的是輸入輸出皆有限制的黑盒子黑盒子. .用語句的任何計算用語句的任何計算( (即使即使1+1=2) 1+1=2) 都需類似八股文的都需類似八股文的 “花架子花架子”. .整理ppt搞統(tǒng)計是否搞統(tǒng)計是否不需要不需要學(xué)習編程語言,學(xué)習編程語言,可以不學(xué)習可以不學(xué)習, ,如果你如果你搞純粹數(shù)學(xué)推導(dǎo)的搞純粹數(shù)學(xué)推導(dǎo)的, ,只搞只搞“理論理論”, ,不面對數(shù)據(jù)不

20、面對數(shù)據(jù), , 不用計算機不用計算機覺得歲數(shù)太大覺得歲數(shù)太大, ,學(xué)不會學(xué)不會“非傻瓜非傻瓜”的計算的計算不想有創(chuàng)新不想有創(chuàng)新, ,僅使用現(xiàn)成方法套用僅使用現(xiàn)成方法套用想永遠依賴會編程的學(xué)生或別的想永遠依賴會編程的學(xué)生或別的什么人什么人整理ppt但如果你要創(chuàng)新但如果你要創(chuàng)新你需要反復(fù)試驗?zāi)愕男路椒阈枰磸?fù)試驗?zāi)愕男路椒ㄐ枰酶鞣N數(shù)據(jù)來檢驗?zāi)愕男枰酶鞣N數(shù)據(jù)來檢驗?zāi)愕男路椒ㄐ路椒ㄐ枰涯愕姆椒ê屠戏椒ㄟM需要把你的方法和老方法進行比較行比較需要介紹自己的新方法需要介紹自己的新方法使用編程語言不可避免使用編程語言不可避免整理ppt沒有任何別的選擇沒有任何別的選擇整理ppt現(xiàn)代統(tǒng)計學(xué)家都自己編程現(xiàn)代

21、統(tǒng)計學(xué)家都自己編程, ,比如比如 Brockwell & Davis (時間序列時間序列) Bruce & Gao (小波分析小波分析) Bickel, et al. (非線性回歸非線性回歸) Hastie (廣義可加模型廣義可加模型) Silverman (非參數(shù)密度估計非參數(shù)密度估計) McCullagh & Nelder (廣義線性模型廣義線性模型) Hardell 、 Marron、范劍青、范劍青(非參數(shù)回歸非參數(shù)回歸) Diggle , et al. (縱向數(shù)據(jù)縱向數(shù)據(jù)) .整理ppt毫無例外,沒有任何毫無例外,沒有任何新的重要統(tǒng)計方法是新的重要統(tǒng)計方法是利用

22、諸如利用諸如SAS或或 SPSS等傻瓜軟件產(chǎn)等傻瓜軟件產(chǎn)生的。生的。整理ppt多數(shù)多數(shù)SAS或或 SPSS等等的新統(tǒng)計方法軟件包,的新統(tǒng)計方法軟件包,是改寫統(tǒng)計學(xué)家通過是改寫統(tǒng)計學(xué)家通過自己編程所發(fā)展的方自己編程所發(fā)展的方法而來的。法而來的。整理ppt在美國,很難想象一在美國,很難想象一個統(tǒng)計學(xué)研究生不會個統(tǒng)計學(xué)研究生不會使用編程語言使用編程語言整理ppt使用什么軟件編程呢?使用什么軟件編程呢? SAS、SPSS、Minitab等也有程序,等也有程序,但很難學(xué),不好記,也沒有任何普遍但很難學(xué),不好記,也沒有任何普遍性和規(guī)律性。性和規(guī)律性。 而而S (S-plus,R)、Matlab、Gauss

23、、Fortran、C (C+)、Pascal、Basic等等語言有很多共性。容易舉一反三。語言有很多共性。容易舉一反三。 有些具有統(tǒng)計軟件包,對統(tǒng)計學(xué)家則有些具有統(tǒng)計軟件包,對統(tǒng)計學(xué)家則很方便。特別是很方便。特別是S-plus軟件、軟件、R軟件和軟件和Gauss軟件。軟件。整理ppt使用編程軟件容易嗎?使用編程軟件容易嗎? 以以R軟件為例軟件為例. 非常好學(xué),極易入門非常好學(xué),極易入門 基本功能簡單,和寫公式一樣基本功能簡單,和寫公式一樣 能在一個小時學(xué)會基本運算語句能在一個小時學(xué)會基本運算語句 在一天內(nèi)學(xué)會編寫函數(shù)在一天內(nèi)學(xué)會編寫函數(shù)(子程序子程序)和和利用軟件包利用軟件包. 往往困難的反而

24、是統(tǒng)計內(nèi)容本身往往困難的反而是統(tǒng)計內(nèi)容本身整理pptSAS專家專家很難實現(xiàn)下面很難實現(xiàn)下面并非復(fù)雜并非復(fù)雜的運算的運算 考慮考慮6060個觀測值的回歸個觀測值的回歸, , 其中其中X和和Y=2+3X1 1-2X2+e e隨機產(chǎn)生隨機產(chǎn)生, ,X1來自來自U(10,20), X2來自來自U(-5,-8), e e來自來自N(0,1),n=60. 回歸回歸20次次, 每一次回歸之后把每一次回歸之后把x15的值的值在目前的基礎(chǔ)上加在目前的基礎(chǔ)上加0.1個原始的個原始的x15值值, 輸出殘差輸出殘差e5和矩陣和矩陣P=X(XX)-1X的第的第5個對角線元素個對角線元素h5的值的值,并分別點出這并分別點

25、出這20個個h5和和e5的散點圖于一張圖中的散點圖于一張圖中; ; 計算這計算這20個個h5和和e5的的相關(guān)系數(shù)相關(guān)系數(shù). .整理ppt而對于而對于R或者或者S-plus初學(xué)者可很快用下面幾行初學(xué)者可很快用下面幾行來解決來解決( (不用任何軟件包不用任何軟件包):): x1=rnorm(60,10,20);x2=runif(60,-8,-5);x=cbind(1,x1,x2);y=2+3*x1-2*x2+rnorm(60);h=NULL;e=h;i=1;while (i=20)P=x%*%solve(t(x)%*%x)%*%t(x); h=c(h,diag(P)5);e=c(e,(y-P%*%

26、y)5);x5,1=x5,1+x15*0.1;i=i+1;par(mfrow=c(1,2);plot(h);plot(e);cor(h,e)整理ppt510150.81.0Indexh51015200.00.51.0Indexe結(jié)果為結(jié)果為它們的相關(guān)系數(shù)為它們的相關(guān)系數(shù)為-0.9486753整理pptR-語言語言/軟件軟件整理ppt R免費免費 R 資源公開資源公開(不是黑盒子不是黑盒子,也不是吝嗇鬼也不是吝嗇鬼) R可以在可以在UNIX, Windows和和Macintosh運行運行. R 有優(yōu)秀的有優(yōu)秀的內(nèi)在幫助系統(tǒng)內(nèi)在幫助系統(tǒng). R有優(yōu)秀的有優(yōu)秀的畫圖功能畫圖功能

27、學(xué)生能夠輕松地學(xué)生能夠輕松地轉(zhuǎn)轉(zhuǎn)到商業(yè)支持的到商業(yè)支持的 S-Plus程序程序(如果需要使用商業(yè)軟件如果需要使用商業(yè)軟件) R語言有一個語言有一個強大的強大的,容易學(xué)習容易學(xué)習的語法的語法,有許多內(nèi)在的統(tǒng)計函數(shù)有許多內(nèi)在的統(tǒng)計函數(shù).整理ppt 通過用戶通過用戶自編程序自編程序, R語言很容易語言很容易延延伸和擴大伸和擴大. 它就是這樣成長的它就是這樣成長的. R 是計算機編程語言是計算機編程語言. 類似于類似于UNIX語言語言,C語言語言,Pascal,Gauss語言等語言等. 對于熟練的編程者對于熟練的編程者, 它將覺得該語它將覺得該語言言比其他語言更熟悉比其他語言更熟悉. 而對計算機初學(xué)者

28、而對計算機初學(xué)者, 學(xué)習學(xué)習R語言語言使得使得學(xué)習下一步的其他編程不那么困難學(xué)習下一步的其他編程不那么困難. 那些傻瓜軟件那些傻瓜軟件(SAS,SPSS等等)語言的語言的語法則完全不同語法則完全不同.整理pptR的缺點的缺點不如不如S-Plus在編輯輸出在編輯輸出的畫圖那樣好的畫圖那樣好沒有商業(yè)支持沒有商業(yè)支持 (但有網(wǎng)但有網(wǎng)上支持上支持) 需要編程需要編程, 不傻瓜不傻瓜.整理pptR的歷史的歷史 S語言在語言在1980年代后期在年代后期在AT&T實驗室開發(fā)實驗室開發(fā). R 項目由項目由Auckland 大學(xué)統(tǒng)計系大學(xué)統(tǒng)計系的的Robert Gentleman和和Ross Ihaka

29、于于1995年開始的年開始的. 它很快得到廣泛用戶的歡迎它很快得到廣泛用戶的歡迎. 目目前它是由前它是由R核心發(fā)展團隊維持核心發(fā)展團隊維持;它它是一個由志愿者組成的工作努力是一個由志愿者組成的工作努力的國際團隊的國際團隊整理pptR里面有什么里面有什么? 整理pptPackages (每個都有大量數(shù)據(jù)和可(每個都有大量數(shù)據(jù)和可以讀寫修改的函數(shù)以讀寫修改的函數(shù)/程序)程序)base The R base packageboot Bootstrap R (S-Plus) Functions (Canty)class Functions for classificationcluster Funct

30、ions for clustering (by Rousseeuw et al.)ctest Classical Testseda Exploratory Data Analysisforeign Read data stored by Minitab, SAS, SPSS, .grid The Grid Graphics PackageKernSmooth Functions for kernel smoothing for Wand & Jones (1995)lattice Lattice Graphicslqs Resistant Regression and Covarian

31、ce EstimationMASS Main Library of Venables and Ripleys MASSmethods Formal Methods and Classesmgcv Multiple smoothing parameter estimation and GAMs by GCV整理pptPackages (繼續(xù))繼續(xù)) modreg Modern Regression: Smoothing and Local Methodsmva Classical Multivariate Analysisnlme Linear and nonlinear mixed effec

32、ts modelsnls Nonlinear regressionnnet Feed-forward neural networks and multinomial log-linear modelsrpart Recursive partitioningspatial functions for kriging and point pattern analysissplines Regression Spline Functions and Classesstepfun Step Functions, including Empirical Distributionssurvival Sur

33、vival analysis, including penalised likelihood.tcltk Interface to Tcl/Tktools Tools for Package Development and Administrationts Time series functions整理ppt所有這些所有這些Packages都是在都是在base package上添加的上添加的 Base包含所有固有的應(yīng)用和數(shù)據(jù)包含所有固有的應(yīng)用和數(shù)據(jù) 而其他的而其他的packages包含各統(tǒng)計學(xué)包含各統(tǒng)計學(xué)家自己發(fā)展的方法和數(shù)據(jù)。家自己發(fā)展的方法和數(shù)據(jù)。 希望你是下一個加盟這些希望你是下一個加盟

34、這些packages的作者之一。的作者之一。整理ppt賦值和運算賦值和運算 z = rnorm(1000000,4,0.1) median(z) “=”可以用可以用“-”代替代替xy-w簡單數(shù)學(xué)運算有簡單數(shù)學(xué)運算有+,-,*,/,%*%,%等等等等整理ppt序列和向量序列和向量 z=seq(-1,10,length=100) z=seq(-1,10, len=100) z=seq(10,-1,-1) z=10:-1 x=rep(3,1:3) x=rep(3:5,1:3) x 1 3 4 4 5 5 5 x=rep(c(1,10),c(4,5) w=c(1,3,x,z);w3整理ppt分布和產(chǎn)生

35、隨機數(shù)分布和產(chǎn)生隨機數(shù) 正態(tài)分布正態(tài)分布: pnorm(1.2,2,1);dnorm(1.2,2,1); qnorm(.7,2,1);rnorm(10,0,1)#rnorm(10) t分布分布:pt(1.2,1);dt(1.2,2);qt(.7,1);rt(10,1) 此外還有此外還有指數(shù)分布、指數(shù)分布、F分布、分布、“卡方卡方”分布、分布、Beta分布、二項分布、分布、二項分布、Cauchy分布、分布、Gamma分布、幾何分布、超幾何分布、對分布、幾何分布、超幾何分布、對數(shù)正態(tài)分布、數(shù)正態(tài)分布、Logistic分布、負二項分布、分布、負二項分布、Poisson分布、均勻分布、分布、均勻分布、

36、Weibull分布、分布、Willcoxon分布等分布等 變元可以是向量變元可以是向量!整理ppt向量運算向量運算 x=rep(0,10);z=1:3;x+z 1 1 2 3 1 2 3 1 2 3 1 Warning message: longer object length is not a multiple of shorter object length in: x + z x*z 1 0 0 0 0 0 0 0 0 0 0 Warning message: longer object length is not a multiple of shorter object length

37、in: x * z rev(x) z=c(no cat,has ,nine,tails) z1=no cat 1 TRUE整理ppt向量名字和向量名字和append x=1:3;names(x)=LETTERS1:3 x A B C 1 2 3 append(x,runif(3),after=2) A B C 1.0000000 2.0000000 0.3107987 0.7505149 0.5752226 3.0000000 整理ppt向量賦值向量賦值 z=1:5 z7=8;z 1 1 2 3 4 5 NA 8 z=NULL zc(1,3,5)=1:3; z 1 1 NA 2 NA 3 rn

38、orm(10)c(2,5) z-c(1,3) #去掉第去掉第1、3元素元素. z(length(z)-4):length(z) #最后五個元素最后五個元素.整理ppt向量的大小次序向量的大小次序 z = s a m p l e ( 1 : 1 0 0 , 1 0 ) ; z#比較比較sample(1:100,10,rep=T) 1 75 68 28 42 17 21 96 34 69 47 order(z) 1 5 6 3 8 4 10 2 9 1 7 zorder(z) 1 17 21 28 34 42 47 68 69 75 96 sort(z) 1 17 21 28 34 42 47 6

39、8 69 75 96 which(z=max(z)#給出下標給出下標整理pptMatrix x=matrix(runif(20),4,5) x ,1 ,2 ,3 ,4 ,51, 0.7983678 0.04607601 0.04555323 0.8594483 0.730895002, 0.6559851 0.79562222 0.02948270 0.1453364 0.795528383, 0.6759171 0.56193147 0.48286653 0.2419931 0.560699884, 0.1183701 0.80652627 0.49405167 0.6523137 0.08

40、345406 x=matrix(1:20,4,5);x ,1 ,2 ,3 ,4 ,51, 1 5 9 13 172, 2 6 10 14 183, 3 7 11 15 194, 4 8 12 16 20 x=matrix(1:20,4,5,byrow=T);x ,1 ,2 ,3 ,4 ,51, 1 2 3 4 52, 6 7 8 9 103, 11 12 13 14 154, 16 17 18 19 20整理ppt一些簡單函數(shù)一些簡單函數(shù) max,min,length,mean,median, fivenum,quantile,unique,sd,var,range,rep,diff,sort

41、,order,sum,cumsum,prod,cumprod,rev,print,sample,seq,exp,pi整理ppt矩陣的行和列矩陣的行和列(子集子集) nrow(x); ncol(x);dim(x)#行列數(shù)目行列數(shù)目 x=matrix(rnorm(24),4,6) xc(2,1),#第第2和第和第1行行 x,c(1,3) #第第1和第和第3列列 x2,1 #第第2,1元素元素 xx,10,1 #第第1列大于列大于0的元素的元素 sum(x,10) #第第1列大于列大于0的元素的個數(shù)的元素的個數(shù) sum(x,10&x,30|x,1.51,1 #第第1中小于中小于.51或者或者

42、相相應(yīng)于第應(yīng)于第2列中大于列中大于0的元素的元素(“或或”) x!x,2, , =, =, !=;&, |, ! x=rnorm(10) all(x0);all(x!=0);any(x0);(1:10)x0 x=sample(1:7,5,rep=T);unique(x)整理ppt矩陣的轉(zhuǎn)置和逆矩陣矩陣的轉(zhuǎn)置和逆矩陣 x=matrix(runif(9),3,3);x ,1 ,2 ,31, 0.6747652 0.9954731 0.75245022, 0.3090199 0.2390141 0.24729613, 0.5102675 0.9515505 0.6082803 t(x) ,1

43、 ,2 ,31, 0.6747652 0.3090199 0.51026752, 0.9954731 0.2390141 0.95155053, 0.7524502 0.2472961 0.6082803 solve(x) # solve(a,b)可以解可以解ax=b方方程程 ,1 ,2 ,31, -12.313293 15.125819 9.0823002, -8.459725 3.627898 8.9898643, 23.563034 -18.363808 -20.037986整理ppt警告警告:計算機中的計算機中的0是什么是什么? x%*%solve(x) ,1 ,2 ,31, 1.00

44、0000e+00 -9.454243e-17 -3.911801e-162, 5.494737e-16 1.000000e+00 3.248270e-163, -3.018419e-16 1.804980e-15 1.000000e+00 要用線性代數(shù)的知識來判斷諸如有要用線性代數(shù)的知識來判斷諸如有多少非零特征根等問題多少非零特征根等問題.假定假定v是特是特征 值 組 成 的 向 量征 值 組 成 的 向 量 , 不 能 用 諸 如不 能 用 諸 如sum(v!=0) 等方法來判斷非零特征等方法來判斷非零特征根的數(shù)目根的數(shù)目!整理pptMatrix & Array x=array(ru

45、nif(20),c(4,5); x ,1 ,2 ,3 ,4 ,51, 0.5474306 0.2362356 0.687007107 0.4036998 0.52558392, 0.8234363 0.4922711 0.960554564 0.4704976 0.13278703, 0.1861151 0.8461655 0.390523424 0.2202575 0.40576074, 0.8117521 0.5375946 0.004505845 0.4821567 0.7644741 is.matrix(x)1 TRUE x1,2 x1, x,2 dim(x)#得到維數(shù)得到維數(shù)(4,5

46、)整理pptArray x=array(runif(24),c(4,3,2) is.matrix(x) #可由可由dim(x)得到維數(shù)得到維數(shù)(4,3,2)1 FALSE x, , 1 ,1 ,2 ,31, 0.3512615 0.7270611 0.0090555222, 0.1444965 0.2527673 0.6979770273, 0.6658176 0.6638542 0.7737475424, 0.4258436 0.4168940 0.634235148, , 2 ,1 ,2 ,31, 0.3664152 0.9633497 0.56280062, 0.3466645 0.50

47、36830 0.15429863, 0.4552553 0.1289775 0.84230174, 0.1074899 0.3841463 0.7648297整理pptArray的子集的子集 x=array(1:24,c(4,3,2) xc(1,3), , 1 ,1 ,2 ,31, 1 5 92, 3 7 11, , 2 ,1 ,2 ,31, 13 17 212, 15 19 23整理ppt矩陣乘法及行列運算矩陣乘法及行列運算 x=matrix(1:30,5,6);y=matrix(rnorm(20),4,5) y%*%x ,1 ,2 ,3 ,4 ,5 ,61, -3.231808 -8.13

48、791204 -13.044017 -17.950121 -22.856225 -27.7623302, -14.072030 -39.33640851 -64.600787 -89.865165 -115.129543 -140.3939213, -1.750057 -0.02764783 1.694761 3.417170 5.139578 6.8619874, 5.862412 9.78064218 13.698872 17.617103 21.535333 25.453563 apply(x,1,mean)1 13.5 14.5 15.5 16.5 17.5 apply(x,2,sum

49、)1 15 40 65 90 115 140 apply(x,2,prod)1 120 30240 360360 1860480 6375600 17100720整理pptArray的維運算的維運算 x=array(1:24,c(4,3,2) apply(x,1,mean) 1 11 12 13 14 apply(x,1:2,sum) ,1 ,2 ,31, 14 22 302, 16 24 323, 18 26 344, 20 28 36 apply(x,c(1,3),prod) ,1 ,21, 45 46412, 120 55443, 231 65554, 384 7680整理ppt矩陣與向

50、量之間的運算矩陣與向量之間的運算 sweep(x,1,1:5,*) ,1 ,2 ,3 ,4 ,5 ,61, 1 6 11 16 21 262, 4 14 24 34 44 543, 9 24 39 54 69 844, 16 36 56 76 96 1165, 25 50 75 100 125 150 x*1:5 sweep(x,2,1:6,+) ,1 ,2 ,3 ,4 ,5 ,61, 2 8 14 20 26 322, 3 9 15 21 27 333, 4 10 16 22 28 344, 5 11 17 23 29 355, 6 12 18 24 30 36整理pptArray和矩陣和矩

51、陣/向量向量/array之間的運算之間的運算 z=array(1:24,c(2,3,4)#注意排列次序注意排列次序 z, , 1 ,1 ,2 ,31, 1 3 52, 2 4 6, , 2 ,1 ,2 ,31, 7 9 112, 8 10 12, , 3 ,1 ,2 ,31, 13 15 172, 14 16 18, , 4 ,1 ,2 ,31, 19 21 232, 20 22 24整理pptArray和矩陣和矩陣/向量向量/array之間的運算之間的運算 sweep(z,1,1:2,-), , 1 ,1 ,2 ,31, 0 2 42, 0 2 4, , 2 ,1 ,2 ,31, 6 8 1

52、02, 6 8 10, , 3 ,1 ,2 ,31, 12 14 162, 12 14 16, , 4 ,1 ,2 ,31, 18 20 222, 18 20 22整理pptArray和矩陣和矩陣/向量向量/array之間的運算之間的運算 sweep(z,c(1,2),matrix(1:6,2,3),-), , 1 ,1 ,2 ,31, 0 0 02, 0 0 0, , 2 ,1 ,2 ,31, 6 6 62, 6 6 6, , 3 ,1 ,2 ,31, 12 12 122, 12 12 12, , 4 ,1 ,2 ,31, 18 18 182, 18 18 18整理ppt外積外積(產(chǎn)生矩陣或

53、產(chǎn)生矩陣或array) outer(1:2,rep(1,2) ,1 ,21, 1 12, 2 2 outer(1:2,matrix(rep(1,6),3,2), , 1 ,1 ,2 ,31, 1 1 12, 2 2 2, , 2 ,1 ,2 ,31, 1 1 12, 2 2 2整理pptList(set of objects) list可以是任何對象的集合可以是任何對象的集合(包括包括lists) z=list(1:3,Tom=c(1:2, a=list(R,letters1:5),w=hi!) z1;z2;z$T;z$T$a2;z$T3;z$T$wattributes(z)#屬性屬性!$na

54、mes1 Tom attributes(matrix(1:6,2,3)$dim1 2 3整理ppt矩陣矩陣,array及其維名字及其維名字 x=matrix(1:12,nrow=3,dimnames=list(c(I,x=matrix(1:12,nrow=3,dimnames=list(c(I,II,III),paste(X,1:4,sep=)II,III),paste(X,1:4,sep=) X1 X2 X3 X4I 1 4 7 10II 2 5 8 11III 3 6 9 12 y=array(1:12,c(3,2,2),dimnames=list(c(Iy=array(1:12,c(3,

55、2,2),dimnames=list(c(I , I I , I I I ) , p a s t e ( X , 1 : 2 , I I , I I I ) , p a s t e ( X , 1 : 2 sep=),paste(Y,1:2, sep=)sep=),paste(Y,1:2, sep=), , Y1 X1 X2I 1 4II 2 5III 3 6, , Y2 X1 X2I 7 10II 8 11III 9 12整理pptdata.frame x=matrix(1:6,2,3) x=as.data.frame(x);xV1 V2 V31 1 3 52 2 4 6 x$V21 3 4

56、 x$V21 3 4 attributes(x)$names1 V1 V2 V3$s1 1 2$class1 data.frame整理pptdata.frame names(x)=c(TOYOTA,GM,HUNDA) s(x)=c(2001,2002) x TOYOTA GM HUNDA2001 1 3 52002 2 4 6 x$GM 1 3 4整理pptdata.frame attach(x) GM 1 3 4 detach(x) GM Error: Object GM not found整理ppt直接手工輸入和編輯數(shù)據(jù)直接手工輸入和編輯數(shù)據(jù) 直接敲入直接敲

57、入:x=c(1,2,7,8,) 或者或者 x=scan() 1 2 7 8 .(以以“Enter”兩次來結(jié)束兩次來結(jié)束) fix(x)(通過編輯修改數(shù)據(jù)通過編輯修改數(shù)據(jù))整理pptCategorical dataA survey asks people if they smoke or not. The data is Yes, No, No, Yes, Yesx=c(Yes,No,No,Yes,Yes)table(x);xfactor(x)整理pptBarplot:Suppose, a group of 25 people are surveyed as to their beer-drin

58、king preference. The categories were (1) Domestic can, (2) Domestic bottle, (3) Microbrew and (4) import. The raw data is 3 4 1 1 3 4 3 3 1 3 2 1 2 1 2 3 2 3 1 1 1 1 4 3 1beer = scan() 3 4 1 1 3 4 3 3 1 3 2 1 2 1 2 3 2 3 1 1 1 1 4 3 1barplot(beer) # this isnt correctbarplot(table(beer) # Yes, call w

59、ith summarized databarplot(table(beer)/length(beer) # divide by n for proportiontable(beer)/length(beer)整理pptCEO salaries: Suppose, CEO yearly compensations are sampled and the following are found (in millions). (This is before being indicted for cooking the books.) 12 .4 5 2 50 8 3 1 4 0.25sals = s

60、can() # read in with scan12 .4 5 2 50 8 3 1 4 0.25mean(sals) ;var(sals) :sd(sals) ;median(sals)fivenum(sals) # min, lower hinge, Median, upper hinge, maxsummary(sals) data=c(10, 17, 18, 25, 28,28); summary(data); quantile(data,.25); quantile(data,c(.25,.75) 整理pptsort(sals); fivenum(sals);summary(sals)mean(sals,trim=1/10) ;mean(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論