試驗統(tǒng)計-試驗數(shù)據(jù)整理_第1頁
試驗統(tǒng)計-試驗數(shù)據(jù)整理_第2頁
試驗統(tǒng)計-試驗數(shù)據(jù)整理_第3頁
試驗統(tǒng)計-試驗數(shù)據(jù)整理_第4頁
試驗統(tǒng)計-試驗數(shù)據(jù)整理_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第二章試驗數(shù)據(jù)的整理第四節(jié)基本統(tǒng)計量第一節(jié)總體和樣本的概念第五節(jié)正態(tài)分布檢驗

第二節(jié)試驗資料的屬性第三節(jié)次數(shù)分布1、總體(Population)

根據(jù)研究目的確定的,凡是符合指定條件的具有共同性質的全部觀察對象稱為總體。例如:(1)要了解中國農(nóng)科院研究生院所有學生的健康狀況,那么所有研究生院的學生就構成了一個總體。(2)要了解我們SAS班所有學生的健康狀況,則所有SAS班的學生就構成了一個總體。第一節(jié)總體和樣本的概念按總體中的個體數(shù)目可分為:無限總體有限總體2、個體構成總體的每一個成員稱個體。第一節(jié)總體和樣本的概念上例中的中國農(nóng)科院研究生院的每一個學生就是這個總體中的成員,稱為一個個體。3、樣本(Sample)從總體中抽取出來進行研 究的若干個體的集合稱為樣本。例:在中國農(nóng)科院研究生院的學生中隨機抽取100個學生測量健康狀況,那么這100個學生就構成了一個樣本。5、觀測值(Observation)每個個體的性狀、特性的測定數(shù)值稱觀測值。第一節(jié)總體和樣本的概念例:中的中國農(nóng)科院研究生院的每一個學生的身高、體重、血壓等就是一個觀測值。4、樣本容量樣本中包含的個體數(shù)量

(樣本含量)樣本的容量越大,越能代表總體。例:上例中的樣本容量為1007、樣本統(tǒng)計量

根據(jù)樣本觀察值算出的樣本特征數(shù)稱為樣本統(tǒng)計量。樣本統(tǒng)計量常用英文字母表示。如:樣本平均數(shù)、樣本標準差S等。6、總體參數(shù)

根據(jù)總體全體觀察值算出的總體特征數(shù)稱為總體參數(shù)。常用希臘字母表示。 如:總體平均數(shù)μ、總體標準差σ等。第一節(jié)總體和樣本的概念第二節(jié)試驗資料的屬性一、試驗資料的性質(可分為兩大類):1、數(shù)量性狀資料(Numeric)

能夠用測量、稱量或計數(shù)的方法表示的性狀

的資料。(1)連續(xù)型數(shù)量資料(可量資料Interval)通常用稱量、度量或測量的方法得到的

數(shù)據(jù)都可以視為連續(xù)型隨機變量資料。

它們在某個區(qū)間內(nèi)是連續(xù)的。例如:體重(公斤)、株高(厘米)、產(chǎn)量(克)、千粒重(克)等。(2)離散型(間斷型)數(shù)量資料(可數(shù)資料Nominal)通常用計數(shù)方法得到的數(shù)據(jù)。

它們在數(shù)軸上表現(xiàn)為不連續(xù),只能取整數(shù)。第二節(jié)試驗資料的屬性例如:發(fā)芽的種子數(shù)、成活的樹苗數(shù)、死亡的

昆蟲頭數(shù)、分蘗數(shù)、穗數(shù)和每穗粒數(shù)等。第二節(jié)試驗資料的屬性2、質量(屬性)性狀資料(CharacterNominal)

不能直接測量,只能觀測的屬性性狀資料。例如:蟲子的成活與死亡、葉片形狀、花的顏色、小麥的芒性、接種病菌的感染與否等。一、次數(shù)分布表把次數(shù)分布以圖的形式繪出,得次數(shù)分布圖。第三節(jié)次數(shù)分布為了初步研究試驗資料的分布規(guī)律性,將眾多的試驗資料按類別或區(qū)間進行分組,把這些不同類別或各個區(qū)間出現(xiàn)的個體頻數(shù)叫次數(shù)分布。把次數(shù)分布以表的形式列出,得次數(shù)分布表。(一)離散性變量資料的整理1、變量可取值個數(shù)不多時以自然單位進行分組因為取值個數(shù)只有15、16、17、18、19、20六種,所以按自然單位分組。每穗小穗數(shù)(x)次數(shù)(f)1561615173218251917205總次數(shù)(n)100第三節(jié)次數(shù)分布2、若變量可取值個數(shù)太多,則可按取值大小,從小到大相鄰若干個值合為一組的方法進行整理(一般要求組距相等)。例3.2

調查200個稻穗,每穗粒數(shù)資料中,最小的一穗有27粒稻谷,最多的一穗有83粒。利用此數(shù)據(jù)制作次數(shù)分布表。

表3.2200個稻穗每穗谷粒數(shù)2730……323541……53……………………6783……75第三節(jié)次數(shù)分布1.求極差:2.確定組數(shù):3.確定組距:4.確定組限,制表頭:

步驟如下:5.資料歸組:R=Max(X)-Min(X)=83-27=56組距=極差/組數(shù)=56/12

=4.7≈5本例中擬分12組樣本容量適宜分組數(shù)樣本容量適宜分組數(shù)50—100—200—5~108~1610~20300—500—1000—12~2415~3020~40第三節(jié)次數(shù)分布200個稻穗每穗粒數(shù)的次數(shù)分布表組限次數(shù)(f)26~30131~35336~401041~452146~503251~5541…………71~75876~80381~852合計200(二)連續(xù)型變量資料的整理步驟與離散型變量的第二種方法相似。例3.3調查140行水稻(每行1.33m)的產(chǎn)量(g)數(shù)據(jù)如表3.3所示。利用此數(shù)據(jù)制作次數(shù)分布表。第三節(jié)次數(shù)分布表3.3140行水稻(每行1.33m)的產(chǎn)量(g)177215……104161214……165……………………192231……159R=Max(x)-Min(x)=254-75=179本例中,擬分為12組利用例3.3此數(shù)據(jù)制作次數(shù)分布表。1.求極差:2.確定組數(shù):3.確定組距:4.確定組限,制表頭:步驟如下:5.資料歸組:組距=179÷12=14.9≈15注:以最小值做第一組的組中值,可以多出半組,所以最終往往多出1組。第三節(jié)次數(shù)分布(三)屬性變量資料的整理按屬性類別分組:第三節(jié)次數(shù)分布1.直方圖2.條形圖3.餅圖第三節(jié)次數(shù)分布二、次數(shù)分布圖1.直方圖第三節(jié)次數(shù)分布適用于表示連續(xù)型變量的次數(shù)分布以表3.3的數(shù)據(jù)分布為例說明。2.條形圖第三節(jié)次數(shù)分布適用于表示離散性和屬性變量的資料以表3.2的數(shù)據(jù)分布為例說明。3.餅圖適用于表示間斷性和屬性變量的資料第三節(jié)次數(shù)分布以表3.4的數(shù)據(jù)分布為例說明。第四節(jié)基本統(tǒng)計量樣本基本統(tǒng)計量主要有:一、平均數(shù)類:(表征中心位置)算術平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)等。二、變異數(shù)類:(表征變異程度)極差、樣本標準差、樣本方差、樣本平均數(shù)標準差(即標準誤)樣本變異系數(shù)等。第四節(jié)基本統(tǒng)計量一、平均數(shù)類:

1、平均數(shù)的意義和種類

平均數(shù)的意義:(1)用于表示變數(shù)的集中趨勢,指示資料的中心位置,反映資料的一般質量水平。(2)作為一組數(shù)據(jù)的代表值與其它數(shù)據(jù)作比較。第四節(jié)基本統(tǒng)計量1、算術平均數(shù)(Mean)

所有資料觀察值的總和除以觀察值個數(shù)所得的商。有極端值時不夠穩(wěn)健。平均數(shù)的種類:2、中位數(shù)(Median)

將資料所有觀察值排序后,居于中間位置

的那個觀察值(當觀察值數(shù)目為偶數(shù)時,居于中間位置的那兩個觀察值的平均數(shù))。3、眾數(shù)(mode)

資料中最常見的一數(shù),或次數(shù)分布表中次數(shù)最多的那組的組中值。例1:2,4,6,5,9,5,4,5,1,10,3眾數(shù)是5例2:小麥小穗數(shù)眾數(shù)是17每穗小穗數(shù)(x)次數(shù)(f)1561615173218251917205總次數(shù)(n)100第四節(jié)基本統(tǒng)計量第四節(jié)基本統(tǒng)計量4、平均數(shù)的計算1、總體平均數(shù)(populationmean):第四節(jié)基本統(tǒng)計量2、樣本平均數(shù)(Samplemean):5、算術平均數(shù)的局限性

平均數(shù)有時其代表性很差。例如下面的兩組人,平均年齡都是25歲,能說這兩組人的年齡是一樣嗎?24歲26歲25歲25歲49歲1歲第四節(jié)基本統(tǒng)計量第四節(jié)基本統(tǒng)計量

由此可見:樣本變異大,平均數(shù)的代表性就差;樣本變異小,平均數(shù)的代表性就較好。因此,需要引進一個新的統(tǒng)計量來反映資料的變異程度。第四節(jié)基本統(tǒng)計量1、極差(全距,Range)

一組數(shù)據(jù)的最大值與最小值之差。即:R=Max(x)-Min(x)上例中:第一組數(shù)據(jù)的極差為:R1=26-24=2第二組數(shù)據(jù)的極差為:R2=49-1=48可見第二組人的年齡變異大的多。二、變異數(shù)類:2、方差(Variance)

又稱均方(MeanSquare)

其功用是反映資料的離散變異程度??傮w方差σ2樣本方差S

2第四節(jié)基本統(tǒng)計量1)總體方差計算第四節(jié)基本統(tǒng)計量2)樣本方差計算第四節(jié)基本統(tǒng)計量第四節(jié)基本統(tǒng)計量方差計算

五株水稻的單株粒重為:2,8,7,5,4(克)單株粒重28754-3.22.81.8-0.2-1.110.247.843.240.041.44總和26022.80平均5.23、標準差(StandardDeviation)

其功用是反映資料的離散變異程度,它是方差的正平方根值,其度量單位與觀察值相同。第四節(jié)基本統(tǒng)計量總體標準差σ(PopulationSD):樣本標準差S(SampleSD):

a、總體標準差的計算:b、樣本標準差的計算:第四節(jié)基本統(tǒng)計量4、標準誤(StdError,StdMean)樣本平均數(shù)的標準(誤)差,反應樣本平均數(shù)的變異程度,即抽樣誤差的大小。實質上是樣本平均數(shù)構成的樣本的標準差。標準誤較小表示樣本均數(shù)與總體均數(shù)比較接近,為了保證樣本代表總體比較可靠,就得適當增大樣本含量。第四節(jié)基本統(tǒng)計量5、變異系數(shù)(CoefficientofVariation)

在比較兩組平均數(shù)相差很大或數(shù)據(jù)單位不同的資料的變異程度時,則需要用到變異系數(shù)的概念。記為(

CV

),是指資料的標準差與平均數(shù)之比。第四節(jié)基本統(tǒng)計量

平均數(shù)相差很大的例子:甲測量排球場長度三次,得乙測量足球場長度三次,得

第四節(jié)基本統(tǒng)計量

雖然兩組數(shù)據(jù)的s

都等于1,但不能認為兩組數(shù)據(jù)的變異程度相同。乙測量得顯然比甲精確。2、矯正平方和(CSS)三、其它統(tǒng)計量1、未矯正平方和(USS)第四節(jié)基本統(tǒng)計量3、偏度(Skewness)第四節(jié)基本統(tǒng)計量考察資料的左右對稱性的分布情況:

Sk

=0對稱分布

Sk

>0右(正)偏分布,向右側分散更遠

Sk

<0左(負)偏分布,向左側分散更遠第四節(jié)基本統(tǒng)計量4、峰度(Kurtosis)以正態(tài)分布為標準考察資料陡峭分布的情況:

Ku

=0數(shù)據(jù)正態(tài)分布

Ku

>0數(shù)據(jù)尖峰分布,向中間集中

Ku

<0數(shù)據(jù)扁平分布,含有較多極端值5、百分位數(shù)(Percentile)第四節(jié)基本統(tǒng)計量是中位數(shù)的推廣,n個數(shù)據(jù)排序后,處于p%位置的值xp稱為第p百分位數(shù),表示有p%的數(shù)不超過這個值。當np/100是整數(shù)當np/100不是整數(shù)其中,i=[np/100],即np/100取整分位數(shù)的一些概念第四節(jié)基本統(tǒng)計量中位數(shù)即是第50百分位數(shù)最小值即是第0百分位數(shù)最大值即是第100百分位數(shù)下四分位數(shù)即是第25百分位數(shù),記為Q1上四分位數(shù)即是第75百分位數(shù),記為Q3四分位極差為上四分位數(shù)與下四分位數(shù)的差 值,即Q3-Q1第五節(jié)正態(tài)分布檢驗檢驗數(shù)據(jù)資料是否服從正態(tài)分布。正態(tài)分布檢驗有多種方法:1)偏度、峰度、Q-Q圖、正態(tài)概率紙檢驗2)卡方擬合優(yōu)度檢驗3)Shapiro-Wilk檢驗4)經(jīng)驗分布擬合優(yōu)度檢驗1、正態(tài)分布檢驗第五節(jié)正態(tài)分布檢驗1)偏度、峰度、Q-Q圖、正態(tài)概率紙檢驗比較直觀,但有些粗略。2)卡方擬合優(yōu)度檢驗分組不同,擬合的結果可能不同。需要有足夠大的樣本含量。對于連續(xù)型變量的優(yōu)度擬合,卡方檢驗并不是理想的方法。將數(shù)據(jù)排序后一分為二折返配對,計算差值,查系數(shù)表ak(n),構造W統(tǒng)計量。Shapiro-WilkW

統(tǒng)計量2、Shapiro-Wilk檢驗法(小樣本8≤n≤50)第五節(jié)正態(tài)分布檢驗統(tǒng)計量W的取值范圍為[0,1]在原假設H0:數(shù)據(jù)服從正態(tài)分布下,統(tǒng)計量W應該接近于1,反之應接近于0,在給定顯著性水平α下,使得:第五節(jié)正態(tài)分布檢驗其拒絕域為:2、S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論