環(huán)境數(shù)理統(tǒng)計(jì)-緒論_第1頁(yè)
環(huán)境數(shù)理統(tǒng)計(jì)-緒論_第2頁(yè)
環(huán)境數(shù)理統(tǒng)計(jì)-緒論_第3頁(yè)
環(huán)境數(shù)理統(tǒng)計(jì)-緒論_第4頁(yè)
環(huán)境數(shù)理統(tǒng)計(jì)-緒論_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 環(huán)境與生態(tài)統(tǒng)計(jì)-R語(yǔ)言的應(yīng)用 Song S. Qian著曾思育譯 高等教育出版社2011年 環(huán)境統(tǒng)計(jì)學(xué)與MATLAB應(yīng)用 聶慶華 Keith C. Clarke編著 高等教育出版社 2010年 環(huán)境統(tǒng)計(jì)分析 楊曉華 劉瑞民 曾勇編著 北京師范大學(xué)出版社 環(huán)境數(shù)據(jù)統(tǒng)計(jì)分析基礎(chǔ) 程子峰等編著 化學(xué)工業(yè)出版社 2006年 數(shù)據(jù)的收集、整理和描述 概率論基本概念和統(tǒng)計(jì)學(xué)基礎(chǔ) 總體參數(shù)的估計(jì) 總體參數(shù)的假設(shè)性檢驗(yàn) 非參數(shù)檢驗(yàn)方法 方差分析 回歸分析(一元線性與非線性回歸) 時(shí)間序列分析初步* 你想過下面的問題嗎? 如何通過問卷調(diào)查來得到性別、年齡、職業(yè)、收入等各種因素與公眾對(duì)建設(shè)項(xiàng)目的環(huán)境保護(hù)的態(tài)度的

2、關(guān)系呢? 如何通過已有的環(huán)境監(jiān)測(cè)的歷史數(shù)據(jù)對(duì)環(huán)境質(zhì)量未來的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)呢? 如何才能客觀地反映我們所居住的環(huán)境的質(zhì)量的優(yōu)劣呢? 通過對(duì)比國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展數(shù)據(jù)和環(huán)境質(zhì)量數(shù)據(jù),如何尋找兩者(或多者)之間的聯(lián)系? 統(tǒng)計(jì)是什么? 其實(shí),這些都是統(tǒng)計(jì)應(yīng)用的例子。這樣的例子太多了,無法一一列舉。因?yàn)榻y(tǒng)計(jì)學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域。 上面的例子并沒有明確說出什么是統(tǒng)計(jì)。其實(shí)很簡(jiǎn)單。上面的所有例子都要通過各種直接或間接的手段來收集數(shù)據(jù)(data);都要利用一些方法來整理和分析數(shù)據(jù);最后通過分析得到結(jié)論。 因此,統(tǒng)計(jì)學(xué)(statistics)是用以收集數(shù)據(jù)分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。

3、現(xiàn)實(shí)中的隨機(jī)性和規(guī)律性 從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等。 但是在許多領(lǐng)域,很難用如此確定的公式或論述來描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個(gè)吸煙、喝酒、不鍛煉的人可能比一個(gè)很少得病、生活習(xí)慣良好的人活得長(zhǎng)。因此,可以說,活得長(zhǎng)短有一定的隨機(jī)性(randomness)。這種隨機(jī)性可能和人的經(jīng)歷、基因、習(xí)慣等無數(shù)不易說清的因素都有關(guān)系。 但是從總體來說,我國(guó)公民的平均預(yù)期壽命卻是非常穩(wěn)定的,而且由于生活水平提高在逐步增長(zhǎng);比如1996年平均預(yù)期壽命為70.80歲,而2000年為71.40歲。這就是規(guī)律性。一個(gè)人可能活過

4、這個(gè)平均年齡,也可能活不到這個(gè)年齡,這是隨機(jī)的。但是總體來說,預(yù)期壽命的穩(wěn)定性,卻說明了隨機(jī)之中有規(guī)律性。這種規(guī)律就是統(tǒng)計(jì)規(guī)律。 概率和機(jī)會(huì) 你可能經(jīng)常聽到概率(probability)這個(gè)名詞。最常見的是在天氣預(yù)報(bào)中提到的降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說來,概率描述了某件事情發(fā)生的機(jī)會(huì)。顯然,這種概率不可能超過百分之百,也不可能少于百分之零。換言之,概率是在0和1之間(也可能是0或1)的一個(gè)數(shù),說明某事件發(fā)生的機(jī)會(huì)有多大。 有些概率是無法精確推斷的。比如你對(duì)別人說你下一個(gè)周末去公園的概率是百分之八十。有些概率

5、是可以大體知道的。比如擲骰子。這也說明隨機(jī)結(jié)果也具有規(guī)律;而且有可能通過試驗(yàn)等方法來推測(cè)其規(guī)律。 變量和數(shù)據(jù) 比如一個(gè)班上注冊(cè)的學(xué)生有200人,這是一個(gè)固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,如果猜測(cè)今天這個(gè)班有多少人會(huì)來上課,那就沒準(zhǔn)了。這有隨機(jī)性??赡苡姓?qǐng)病假或事假的,也可能有逃課的。這樣,就要來上課的人數(shù)是個(gè)變量(variable)。 當(dāng)變量按照隨機(jī)規(guī)律所取的值是數(shù)量時(shí)該變量稱為定量變量或數(shù)量變量(quantitative variable);因?yàn)槭请S機(jī)的,也稱為隨機(jī)變量(random variable)。 象性別,觀點(diǎn)之類的取非數(shù)量值的變量就稱為定性變量或?qū)傩宰兞炕蚍诸?/p>

6、變量(qualitative variable,categorical variable)。 什么是數(shù)據(jù) 有了變量的概念,什么是數(shù)據(jù)呢?拿擲骰子來說,擲骰子會(huì)得到什么值,是個(gè)隨機(jī)變量;而每次取得1至6點(diǎn)中任意某點(diǎn)數(shù)的概率在理論上都是六分之一(如果骰子沒有作假)。這依賴于在擲骰子背后的理論或假定;而在實(shí)際擲骰子過程中,如果擲100次,會(huì)得到100個(gè)由1至6點(diǎn)組成的數(shù)字串;再擲100次,又得到一個(gè)數(shù)字串,和前一次的結(jié)果多半不一樣。這些試驗(yàn)結(jié)果就是數(shù)據(jù)。 所以說數(shù)據(jù)是關(guān)于變量的觀測(cè)值。 通過數(shù)據(jù)可以驗(yàn)證有關(guān)的理論或假定。 定量變量間的關(guān)系 19892000年成都市經(jīng)濟(jì)增長(zhǎng)和水環(huán)境污染水平時(shí)間1989

7、19901991199219931994經(jīng)濟(jì)增長(zhǎng)(元)171519242232278938834854水環(huán)境污染水平0.0770.3110.8180.6921.2800.417時(shí)間199519961997199819992000經(jīng)濟(jì)增長(zhǎng)(元)7388890610224111031189713020水環(huán)境污染水平0.624-0.192-0.040-1.638-0.882-1.470成都市地表水環(huán)境庫(kù)茲涅茨曲線水質(zhì)污染程度 人均國(guó)民生產(chǎn)總值(元)02000400060008000100001200014000-2.0-1.5-1.0-0.50.00.51.01.5 Y =0.03693+3.014

8、86E-4 X-3.35826E-8 X2R2=0.8014觀測(cè)值折線圖擬合的環(huán)境庫(kù)茲涅茨曲線 可以看到的: 兩個(gè)變量是否有關(guān)系? 如果有關(guān)系,它們的關(guān)系是否顯著? 它是一個(gè)什么關(guān)系?(線性/非線性) 這個(gè)關(guān)系是否帶有普遍性? 這個(gè)關(guān)系是否為因果關(guān)系? 關(guān)系一詞是沒有嚴(yán)格的統(tǒng)計(jì)定義的,一個(gè)類似的描述術(shù)語(yǔ)叫“相關(guān)”。 定性變量間的關(guān)系 下面是對(duì)123人進(jìn)行關(guān)于某項(xiàng)政策調(diào)查所得結(jié)果的一個(gè)簡(jiǎn)單的三維表,它顯示了人們的收入和性別對(duì)該項(xiàng)政策的觀點(diǎn)。 不同收入和不同性別人群對(duì)某項(xiàng)政策的觀點(diǎn)觀點(diǎn):反對(duì)觀點(diǎn):支持性別低收入中收入高收入低收入中收入高收入男581020105女27925157 統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)

9、軟件 現(xiàn)代生活越來越離不開計(jì)算機(jī)了。最早使用計(jì)算機(jī)的統(tǒng)計(jì)當(dāng)然更離不開計(jì)算機(jī)了。事實(shí)上,最初的計(jì)算機(jī)僅僅是為科學(xué)計(jì)算而設(shè)計(jì)和建造的。 計(jì)算機(jī)的最早一批用戶就包含統(tǒng)計(jì)?,F(xiàn)在,統(tǒng)計(jì)仍然是進(jìn)行數(shù)字計(jì)算最多的用戶。 當(dāng)然計(jì)算機(jī)現(xiàn)在早已脫離了僅有數(shù)字計(jì)算功能的單一模式,而成為百姓生活的一部分。計(jì)算機(jī)的使用,也從過去必須學(xué)會(huì)計(jì)算機(jī)語(yǔ)言到只需要“傻瓜式”地點(diǎn)擊鼠標(biāo)。結(jié)果也從單純的數(shù)字輸出到包括漂亮的表格和圖形在內(nèi)的各種形式。 統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件 統(tǒng)計(jì)軟件的發(fā)展,也使得統(tǒng)計(jì)從統(tǒng)計(jì)學(xué)家的圈內(nèi)游戲變成了大眾的游戲。只要輸入你的數(shù)據(jù),點(diǎn)幾下鼠標(biāo),做一些選項(xiàng),馬上就得到令人驚嘆的漂亮結(jié)果了。人們可能會(huì)問,是否傻瓜式

10、統(tǒng)計(jì)軟件的使用可以代替統(tǒng)計(jì)課程了?當(dāng)然不是。 數(shù)據(jù)的整理和識(shí)別,方法的選用,計(jì)算機(jī)輸出結(jié)果的理解都不象使用傻瓜相機(jī)那樣簡(jiǎn)單可靠。有些諸如法律和醫(yī)學(xué)方面的軟件都有不少警告,不時(shí)提醒你去咨詢專家。但統(tǒng)計(jì)軟件則不那么負(fù)責(zé)。只要數(shù)據(jù)格式無誤、選項(xiàng)不矛盾而且不用零作為除數(shù)就一定給你結(jié)果,而且?guī)缀鯖]有任何警告。 統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件 另外,統(tǒng)計(jì)軟件輸出的結(jié)果太多;即使是同樣的方法,不同軟件輸出的內(nèi)容還不一樣,有時(shí)同樣的內(nèi)容名稱也不一樣。這就使得使用者大傷腦筋。 即使是統(tǒng)計(jì)學(xué)家也不一定能解釋所有的輸出。因此,就應(yīng)該特別留神,明白自己是在干什么。不要在得到一堆毫無意義的垃圾之后還沾沾自喜。 統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)

11、計(jì)軟件 統(tǒng)計(jì)軟件的種類很多。有些功能齊全,有些價(jià)格便宜;有些容易操作,有些需要更多的實(shí)踐才能掌握。還有些是專門的軟件,只處理某一類統(tǒng)計(jì)問題。面對(duì)太多的選擇往往給決策帶來困難。這里介紹最常見的幾種。 SPSS: 這是一個(gè)很受歡迎的統(tǒng)計(jì)軟件;它容易操作,輸出漂亮,功能齊全,價(jià)格合理。它也有自己的程序語(yǔ)言,但基本上已經(jīng)“傻瓜化”。它對(duì)于非專業(yè)統(tǒng)計(jì)工作者是很好的選擇。 Excel: 它嚴(yán)格說來并不是統(tǒng)計(jì)軟件,但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計(jì)計(jì)算功能。而且凡是有Microsoft Office的計(jì)算機(jī),基本上都裝有Excel。 但要注意,有時(shí)在裝Office時(shí)沒有裝數(shù)據(jù)分析的功能,那就必須裝了才行。當(dāng)

12、然,畫圖功能是已經(jīng)具備的了。對(duì)于簡(jiǎn)單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”,需要使用宏命令來編程;這時(shí)就沒有相應(yīng)的簡(jiǎn)單選項(xiàng)了。 多數(shù)專門一些的統(tǒng)計(jì)推斷問題還需要其他專門的統(tǒng)計(jì)軟件來處理。 SAS: 這是功能非常齊全的軟件;盡管價(jià)格相當(dāng)不菲,許多公司,特別是美國(guó)制藥公司都在使用,這多半因?yàn)槠涔δ鼙姸嗪湍承┟绹?guó)政府機(jī)構(gòu)一些人的偏愛。盡管現(xiàn)在已經(jīng)盡量“傻瓜化”,但仍然需要一定的訓(xùn)練才可以進(jìn)入。也可以對(duì)它編程;但對(duì)于基本統(tǒng)計(jì)課程則不那么方便。 MATLAB: 這也是應(yīng)用于各個(gè)領(lǐng)域的以編程為主的軟件,在工程上應(yīng)用廣泛。不僅由于其功能齊全,而且由于其強(qiáng)大而又方便的編程功能,使得研究人員可以編制他們的程序來實(shí)現(xiàn)其自己創(chuàng)造的理論和方法。但是統(tǒng)計(jì)函數(shù)不多。 R語(yǔ)言 這是一款專用于數(shù)理統(tǒng)計(jì)和數(shù)據(jù)處理的自由軟件,由專業(yè)人員維護(hù)。 不僅由于其功能齊全,而且由于其強(qiáng)大而又方便的編程功能,使得研究人員可以編制他們的程序來實(shí)現(xiàn)其自己創(chuàng)造的理論和方法。 使用上對(duì)R語(yǔ)言有一定要求,比商業(yè)軟件的使用復(fù)雜,有難度。 下載地址:/ 這一章主要描述了統(tǒng)計(jì)領(lǐng)域的輪廓,還說明了隨機(jī)性所可能包含的規(guī)律性。概率是對(duì)不確定性的度量。統(tǒng)計(jì)研究的對(duì)象是變量。有了變量,特別是隨機(jī)變量,才能夠有目的地收集與該變量有關(guān)的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行分析,并且得到人們感興趣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論