資料的整理與特征數(shù)的計(jì)算_第1頁(yè)
資料的整理與特征數(shù)的計(jì)算_第2頁(yè)
資料的整理與特征數(shù)的計(jì)算_第3頁(yè)
資料的整理與特征數(shù)的計(jì)算_第4頁(yè)
資料的整理與特征數(shù)的計(jì)算_第5頁(yè)
已閱讀5頁(yè),還剩92頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于資料的整理與特征數(shù)的計(jì)算第1頁(yè),共97頁(yè),2023年,2月20日,星期六在生物學(xué)試驗(yàn)及調(diào)查中,通過(guò)對(duì)某種具體事物或現(xiàn)象觀察獲得的結(jié)果稱(chēng)為資料。原始數(shù)據(jù)無(wú)序有序統(tǒng)計(jì)分析資料整理揭示事物本質(zhì)第2頁(yè),共97頁(yè),2023年,2月20日,星期六一、試驗(yàn)資料的類(lèi)型二、試驗(yàn)資料的搜集三、試驗(yàn)資料的整理第一節(jié)試驗(yàn)資料的搜集與整理第3頁(yè),共97頁(yè),2023年,2月20日,星期六對(duì)試驗(yàn)資料進(jìn)行分類(lèi)是統(tǒng)計(jì)歸納的基礎(chǔ)。數(shù)量性狀資料質(zhì)量性狀資料(屬性性狀資料)計(jì)數(shù)資料(非連續(xù)變量資料)計(jì)量資料(連續(xù)變量資料)變量定量變量定性變量連續(xù)變量非連續(xù)變量資料第4頁(yè),共97頁(yè),2023年,2月20日,星期六

數(shù)量性狀(quantitativecharacter)是指能夠以計(jì)數(shù)和測(cè)量或度量的方式表示其特征的性狀。觀察測(cè)定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料

(dataofquantitativecharacteristics)。數(shù)量性狀資料的獲得有計(jì)數(shù)和測(cè)量?jī)煞N方式,因而數(shù)量性狀資料又分為計(jì)數(shù)資料和計(jì)量資料兩種。一、數(shù)量性狀資料第5頁(yè),共97頁(yè),2023年,2月20日,星期六

1、計(jì)數(shù)資料(非連續(xù)變量資料、間斷變量資料、離散變量資料)

指用計(jì)數(shù)方式獲得的數(shù)量性狀資料。在這類(lèi)資料中,它的各個(gè)觀察值只能以整數(shù)表示,在兩個(gè)相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn),因此各觀察值是不連續(xù)的,所以該類(lèi)資料也稱(chēng)為非連續(xù)變量資料或間斷變量資料或離散變量資料。第6頁(yè),共97頁(yè),2023年,2月20日,星期六2、計(jì)量資料

(連續(xù)變量資料)

指用測(cè)量或度量法獲得的數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測(cè)定獲得的數(shù)據(jù)資料。其數(shù)據(jù)是用長(zhǎng)度、重量、容積、溫度、濃度等來(lái)表示,要帶單位。這種資料的各個(gè)觀測(cè)值不一定是整數(shù),兩個(gè)相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精確度而定,它們之間的變異是連續(xù)性的,因此計(jì)量資料也稱(chēng)為連續(xù)變量資料。第7頁(yè),共97頁(yè),2023年,2月20日,星期六

二、質(zhì)量性狀資料(屬性性狀資料)

質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測(cè)量的性狀。觀察質(zhì)量性狀而獲得的數(shù)據(jù)就是質(zhì)量性狀資料(dataofqualitativecharacteristics)。這類(lèi)性狀本身不能直接用數(shù)值表示,要獲得這類(lèi)性狀的數(shù)據(jù)資料,須對(duì)其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:第8頁(yè),共97頁(yè),2023年,2月20日,星期六1、統(tǒng)計(jì)次數(shù)法

在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類(lèi)別統(tǒng)計(jì)其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,在研究豌豆的花色遺傳時(shí),紅花與白花雜交,子二代中紅花、紫花和白花的株數(shù)分類(lèi)統(tǒng)計(jì)如下表。株數(shù)頻率紅花26626.6%紫花49449.4%白花24024.0%總計(jì)1000100.0%這種由質(zhì)量性狀數(shù)量化得來(lái)的資料又叫次數(shù)資料。第9頁(yè),共97頁(yè),2023年,2月20日,星期六2、評(píng)分法

對(duì)某一質(zhì)量性狀分成不同級(jí)別,對(duì)不同級(jí)別進(jìn)行評(píng)分來(lái)表示其性狀差異的方法。從而將質(zhì)量性狀進(jìn)行數(shù)量化,以便統(tǒng)計(jì)分析。例如,試劑pH值由酸到堿分成14個(gè)等級(jí),取待測(cè)試劑滴在pH試紙上,與pH標(biāo)準(zhǔn)色版對(duì)比,由紅到紫分別定義為1-14

的數(shù)值。第10頁(yè),共97頁(yè),2023年,2月20日,星期六

兩種不同類(lèi)型的資料相互間是有區(qū)別的,但有時(shí)可根據(jù)研究的目的和統(tǒng)計(jì)方法的要求將一種類(lèi)型資料轉(zhuǎn)化成另一種類(lèi)型的資料。例如,檢測(cè)個(gè)體的白細(xì)胞總數(shù)得到的資料屬于計(jì)數(shù)資料,根據(jù)化驗(yàn)的目的,可按白細(xì)胞總數(shù)過(guò)高、正?;蜻^(guò)低分為三組,清點(diǎn)各組的次數(shù),計(jì)數(shù)資料就轉(zhuǎn)化為質(zhì)量性狀次數(shù)資料。第11頁(yè),共97頁(yè),2023年,2月20日,星期六一、試驗(yàn)資料的類(lèi)型二、試驗(yàn)資料的搜集三、試驗(yàn)資料的整理第一節(jié)試驗(yàn)資料的搜集與整理第12頁(yè),共97頁(yè),2023年,2月20日,星期六調(diào)查試驗(yàn)資料搜集的方法第13頁(yè),共97頁(yè),2023年,2月20日,星期六一、調(diào)查

調(diào)查是對(duì)已經(jīng)存在的事情的資料按某種方案進(jìn)行收集的方法。如地質(zhì)調(diào)查、水樣調(diào)查、河南省內(nèi)的昆蟲(chóng)調(diào)查等等。資料的調(diào)查又可以分為兩種:普查和抽樣調(diào)查。1、普查

是對(duì)研究對(duì)象的全部個(gè)體逐一進(jìn)行調(diào)查的方法。普查一般要求在一定的時(shí)間或范圍進(jìn)行,要求準(zhǔn)確和全面。如人口普查、土壤普查等等。普查可以為制定行業(yè)政策提供理論依據(jù)。第14頁(yè),共97頁(yè),2023年,2月20日,星期六2、抽樣調(diào)查

是根據(jù)一定的原則從研究對(duì)象中抽取一部分具有代表性的個(gè)體進(jìn)行調(diào)查的方法。通過(guò)抽樣將獲得的樣本資料進(jìn)行統(tǒng)計(jì)處理,然后利用樣本的特征數(shù)對(duì)總體進(jìn)行推斷。生物學(xué)研究中,進(jìn)行普查的情況較少,多數(shù)情況下還是進(jìn)行抽樣調(diào)查。抽樣的方法有多種,主要有:機(jī)械抽樣法、隨機(jī)抽樣法、分層抽樣法,一般情況下在統(tǒng)計(jì)學(xué)中常常采用隨機(jī)抽樣的方法。

隨機(jī)抽樣必須滿(mǎn)足2個(gè)條件:一是總體中每個(gè)個(gè)體被抽中的機(jī)會(huì)是均等的;二是總體中任意一個(gè)個(gè)體是相互獨(dú)立的,是否被抽中不受其他個(gè)體的影響。第15頁(yè),共97頁(yè),2023年,2月20日,星期六二、試驗(yàn)

試驗(yàn)是對(duì)已有的或沒(méi)有的事物加以處理的方法。采用合理的試驗(yàn)設(shè)計(jì)能夠以較少的投入獲得較大的收獲,起到“事半功倍”的效果。常見(jiàn)的試驗(yàn)設(shè)計(jì)方法有:對(duì)比設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、平衡不完全區(qū)組設(shè)計(jì)、裂區(qū)設(shè)計(jì)、拉丁方設(shè)計(jì)、正交設(shè)計(jì)、正交旋轉(zhuǎn)設(shè)計(jì)等等。試驗(yàn)設(shè)計(jì)須遵循的三大原則是:隨機(jī)、重復(fù)和局部控制。第16頁(yè),共97頁(yè),2023年,2月20日,星期六一、試驗(yàn)資料的類(lèi)型二、試驗(yàn)資料的搜集三、試驗(yàn)資料的整理第一節(jié)試驗(yàn)資料的搜集與整理第17頁(yè),共97頁(yè),2023年,2月20日,星期六(一)原始資料的檢查與核對(duì)調(diào)查試驗(yàn)原始數(shù)據(jù)核對(duì):數(shù)據(jù)本身是否有錯(cuò)誤檢查:取樣是否有差錯(cuò)訂正:不合理數(shù)據(jù)的訂正第18頁(yè),共97頁(yè),2023年,2月20日,星期六檢查和核對(duì)原始資料的目的:確保原始資料的完整性和正確性。完整性:是指原始資料無(wú)遺缺或重復(fù)。正確性:是指原始資料的測(cè)量和記載無(wú)差錯(cuò)或未進(jìn)行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專(zhuān)業(yè)知識(shí)作出判斷)。對(duì)于有重復(fù)、異?;蜻z漏的資料,應(yīng)予以刪除或補(bǔ)齊;對(duì)有錯(cuò)誤、相互矛盾的資料應(yīng)進(jìn)行更正,必要時(shí)進(jìn)行復(fù)查或重新試驗(yàn)。第19頁(yè),共97頁(yè),2023年,2月20日,星期六不必分組,直接進(jìn)行統(tǒng)計(jì)分析小樣本n<30將數(shù)據(jù)分成若干組以便統(tǒng)計(jì)分析大樣本n≥30次數(shù)分布表次數(shù)分布圖統(tǒng)計(jì)分析樣本大小第20頁(yè),共97頁(yè),2023年,2月20日,星期六(二)次數(shù)分布表統(tǒng)計(jì)表的結(jié)構(gòu)和要求:結(jié)構(gòu)簡(jiǎn)單,層次分明,安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確??倷M標(biāo)目(或空白)縱標(biāo)目1縱標(biāo)目2……橫標(biāo)目1橫標(biāo)目2數(shù)字資料……表號(hào)標(biāo)題1、標(biāo)題簡(jiǎn)明扼要、準(zhǔn)確地說(shuō)明表的內(nèi)容,有時(shí)須注明時(shí)間、地點(diǎn)。2、標(biāo)目標(biāo)目分橫標(biāo)目和縱標(biāo)目?jī)身?xiàng)。橫標(biāo)目列在表的左側(cè),縱標(biāo)目列在表的上端,標(biāo)目需注明計(jì)算單位,如%、kg、cm等等。3、數(shù)字一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致,無(wú)數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫(xiě)“0”。4、線條多用三線表,上下兩條邊線略粗。第21頁(yè),共97頁(yè),2023年,2月20日,星期六1計(jì)數(shù)資料的整理計(jì)數(shù)資料基本上采用單項(xiàng)式分組法進(jìn)行整理。特點(diǎn):用樣本變量自然值進(jìn)行分組,每組用一個(gè)或幾個(gè)變量值來(lái)表示。第22頁(yè),共97頁(yè),2023年,2月20日,星期六1712141314121114131614141317151414161414151514141411131214131413151413151413141516161413141513151315151514141614151713161416151314141414161213121412151615161413151714131412171415表2-1

100只來(lái)亨雞每月的產(chǎn)蛋數(shù)11~17來(lái)亨雞每月產(chǎn)蛋數(shù)變動(dòng)范圍:分為7組統(tǒng)計(jì)各組次數(shù)計(jì)算頻率和累積頻率制表第23頁(yè),共97頁(yè),2023年,2月20日,星期六每月產(chǎn)蛋數(shù)次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.28

14350.350.6315210.210.8416110.110.951750.051.00表2-2

100只來(lái)亨雞每月產(chǎn)蛋數(shù)次數(shù)分布表1自然值進(jìn)行分組,最大值17,最小值11。2數(shù)據(jù)主要集中在14,向兩側(cè)分布逐漸減少。第24頁(yè),共97頁(yè),2023年,2月20日,星期六表2-3小麥品種300個(gè)麥穗穗粒數(shù)的次數(shù)分布表每穗粒數(shù)次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent

18-2230.01000.010023-27180.06000.0700

28-32

380.12670.1967

33-37510.17000.3667

38-42680.22670.5934

43-47530.17660.7700

48-52410.13670.906753-57220.07330.980058-6260.02001.000045組?9組第25頁(yè),共97頁(yè),2023年,2月20日,星期六2計(jì)量資料的整理計(jì)量資料一般采用組距式(組限式)分組法。全距組數(shù)組距組限歸組制表第26頁(yè),共97頁(yè),2023年,2月20日,星期六表2-4

150尾鰱魚(yú)體長(zhǎng)(cm)56496278414765455855596569627352526051627866455858605752514856465870727677566658585553506563576585

5958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263(1)求全距,又稱(chēng)極差

(range):R=Xmax-Xmin

=85-37=48(cm)第27頁(yè),共97頁(yè),2023年,2月20日,星期六(2)確定組數(shù)和組距(classboundary)組數(shù)是根據(jù)樣本觀測(cè)數(shù)的多少及組距的大小來(lái)確定的,同時(shí)考慮到對(duì)資料要求的精確度以及進(jìn)一步計(jì)算是否方便。組數(shù)組距多小統(tǒng)計(jì)數(shù)精確,計(jì)算不方便少大統(tǒng)計(jì)數(shù)不精確,計(jì)算方便第28頁(yè),共97頁(yè),2023年,2月20日,星期六組數(shù)的確定樣本容量分組數(shù)

30~60

5~860~100

7~10100~200

9~12200~500

10~18>500

15~30表2-5樣本容量與分組數(shù)的關(guān)系組距的確定即每組內(nèi)的上下限范圍。組距=全距/組數(shù)=48/10=4.810組5cm第29頁(yè),共97頁(yè),2023年,2月20日,星期六(3)確定組限(classlimit)和組中值(classmidvalue)組限

是指每個(gè)組變量值的起止界限。上限下限組中值是兩個(gè)組限的中間值。組中值=下限+上限2=組距2下限+=組距2上限-第一組的組中值最好接近于資料的最小值第30頁(yè),共97頁(yè),2023年,2月20日,星期六表2-4

150尾鰱魚(yú)體長(zhǎng)(cm)56496278414765455855596569627352526051627866455858605752514856465870727677566658585553506563576585

5958546248634661625738585254556652485675725737

467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263最小一組的下限必須小于資料中的最小值,最大一組的上限必須大于資料中的最大值;組限可取到10分位或5分位上;臨界值就高不就低。35~,40~,45~,…,85~。第31頁(yè),共97頁(yè),2023年,2月20日,星期六(4)分組確定好組數(shù)和各組上下限后,可按原始資料中各觀測(cè)值的次序,將各個(gè)數(shù)值歸于各組,計(jì)算各組的觀測(cè)數(shù)次數(shù)、頻率、累積頻率,制成一個(gè)次數(shù)分布表。計(jì)數(shù)的方法卡片法唱票法畫(huà)“正”字畫(huà)“”第32頁(yè),共97頁(yè),2023年,2月20日,星期六

組限組中值次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent35~37.530.02000.020040~42.540.02670.046745~47.5170.11330.160050~52.5280.18670.3467

55~57.540

0.26660.613360~62.5250.16670.780065~67.5170.11330.897370~72.560.04000.933375~77.570.04670.980080~82.520.01330.993385~87.510.00671.0000表2-6

150尾鰱魚(yú)體長(zhǎng)的次數(shù)分布表第33頁(yè),共97頁(yè),2023年,2月20日,星期六(三)次數(shù)分布圖和頻率分布圖定義:把次數(shù)(頻率)分布資料畫(huà)成統(tǒng)計(jì)圖形。特點(diǎn):直觀、形象包括:條形圖、餅圖、直方圖、多邊形圖和散點(diǎn)圖第34頁(yè),共97頁(yè),2023年,2月20日,星期六統(tǒng)計(jì)圖繪制的基本要求:(1)標(biāo)題簡(jiǎn)明扼要,列于圖的下方;(2)縱、橫兩軸應(yīng)有刻度,注明單位;(3)橫軸由左至右,縱軸由下而上,數(shù)值由小到大;圖形長(zhǎng)寬比例約5:4或6:5;(4)圖中需用不同顏色或線條代表不同事物時(shí),應(yīng)有圖例說(shuō)明。第35頁(yè),共97頁(yè),2023年,2月20日,星期六圖2.1月產(chǎn)蛋數(shù)次數(shù)分布柱形圖圖2.2月產(chǎn)蛋數(shù)頻率分布柱形圖條形圖(barchart),又稱(chēng)柱形圖計(jì)數(shù)資料特點(diǎn):柱形之間要間隔一定的距離屬性資料第36頁(yè),共97頁(yè),2023年,2月20日,星期六2餅圖(piechart)圖1來(lái)亨雞月產(chǎn)蛋次數(shù)分布圖計(jì)數(shù)資料屬性資料第37頁(yè),共97頁(yè),2023年,2月20日,星期六圖2.3鰱魚(yú)體長(zhǎng)次數(shù)分布圖3直方圖(histogram),又稱(chēng)矩形圖計(jì)量資料354045505560657075808590特點(diǎn):各組之間沒(méi)有距離第38頁(yè),共97頁(yè),2023年,2月20日,星期六圖2.3鰱魚(yú)體長(zhǎng)次數(shù)分布圖354045505560657075808590組中值第39頁(yè),共97頁(yè),2023年,2月20日,星期六4多邊形圖(polygon),又稱(chēng)折線圖(broken-linechart)計(jì)量資料圖2.3鰱魚(yú)體長(zhǎng)次數(shù)分布圖第40頁(yè),共97頁(yè),2023年,2月20日,星期六5散點(diǎn)圖(scatter)123456432112345643211234564321a.正向直線關(guān)系b.負(fù)向直線關(guān)系c.曲線關(guān)系第41頁(yè),共97頁(yè),2023年,2月20日,星期六搜集、歸納原始數(shù)據(jù)用表格、圖形來(lái)表達(dá)數(shù)據(jù)用量化的統(tǒng)計(jì)學(xué)指標(biāo)來(lái)描述一組定量數(shù)據(jù)的分布特征第42頁(yè),共97頁(yè),2023年,2月20日,星期六圖2.1月產(chǎn)蛋數(shù)次數(shù)分布柱形圖圖2.3鰱魚(yú)體長(zhǎng)次數(shù)分布直方圖354045505560657075808590集中離散第43頁(yè),共97頁(yè),2023年,2月20日,星期六第二節(jié)試驗(yàn)資料特征數(shù)的計(jì)算集中性

是變量在趨勢(shì)上有著向某一中心聚集,或者說(shuō)以某一數(shù)值為中心而分布的性質(zhì)。離散性

是變量有著離中分散變異的性質(zhì)。變量的分布具有兩種明顯的基本特征:集中性和離散性。第44頁(yè),共97頁(yè),2023年,2月20日,星期六集中性離散性平均數(shù)變異數(shù)算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)極差方差標(biāo)準(zhǔn)差變異系數(shù)調(diào)和平均數(shù)特征數(shù)第45頁(yè),共97頁(yè),2023年,2月20日,星期六一、平均數(shù)平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,是計(jì)量資料的代表值,表示資料中觀測(cè)數(shù)的中心位置,并且可作為資料的代表與另一組相比較,以確定二者的差異情況。第46頁(yè),共97頁(yè),2023年,2月20日,星期六(一)平均數(shù)的種類(lèi)算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)調(diào)和平均數(shù)一、平均數(shù)第47頁(yè),共97頁(yè),2023年,2月20日,星期六1.算術(shù)平均數(shù)(arithmeticmean)定義:總體或樣本資料中所有觀測(cè)數(shù)的總和除以觀測(cè)數(shù)的個(gè)數(shù)所得的商,簡(jiǎn)稱(chēng)平均數(shù)、均數(shù)或均值。總體:樣本:一、平均數(shù)第48頁(yè),共97頁(yè),2023年,2月20日,星期六2.中位數(shù)(median)

資料中所有觀測(cè)數(shù)依大小順序排列,居于中間位置的觀測(cè)數(shù)稱(chēng)為中位數(shù)或中數(shù)。Md

中位數(shù)將該組數(shù)值分為兩半,理論上有50%的變量小于md,,有50%的變量值大于

md,故又稱(chēng)百分之五十位數(shù),記為P50。一、平均數(shù)第49頁(yè),共97頁(yè),2023年,2月20日,星期六1、當(dāng)觀測(cè)值個(gè)數(shù)n為奇數(shù)時(shí),(n+1)/2位置的觀測(cè)值,即x(n+1)/2為中位數(shù):

Md=

2、當(dāng)觀測(cè)值個(gè)數(shù)為偶數(shù)時(shí),n/2和(n/2+1)位置的兩個(gè)觀測(cè)值之和的1/2為中位數(shù),即:

第50頁(yè),共97頁(yè),2023年,2月20日,星期六高招生考試或水平考試:0.3~0.4平常測(cè)驗(yàn):

0.2~0.25m1mdm2區(qū)分度=m1Tm2T-m2-m1T=考試中第51頁(yè),共97頁(yè),2023年,2月20日,星期六中位數(shù)是一個(gè)位置平均數(shù),可以免受資料中由于非常因素造成的極端值的影響。但中位數(shù)的決定只與居于中間位置的一個(gè)或兩個(gè)觀察值有關(guān),沒(méi)能用到全部觀察值提供的信息,所以與算術(shù)平均數(shù)有一定的出入。當(dāng)數(shù)據(jù)的分布較為對(duì)稱(chēng)時(shí),二者相近或相等;當(dāng)數(shù)據(jù)分布偏斜時(shí),二者相差較大,此時(shí)中位數(shù)對(duì)數(shù)據(jù)趨中性的度量比算術(shù)平均數(shù)為優(yōu)。第52頁(yè),共97頁(yè),2023年,2月20日,星期六3.眾數(shù)(mode)

資料中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值或中點(diǎn)值。M0注意:(1)對(duì)于某些數(shù)據(jù)而言,如均勻分布,并不存在眾數(shù);(2)對(duì)于某些數(shù)據(jù)存在兩個(gè)或兩個(gè)以上的眾數(shù);(3)主要用來(lái)描述頻率分布。一、平均數(shù)第53頁(yè),共97頁(yè),2023年,2月20日,星期六由于中位數(shù)只能代表一個(gè)、最多兩個(gè)觀察值,而眾數(shù)卻代表著大多數(shù)觀察值的數(shù)量水平。用眾數(shù)描述統(tǒng)計(jì)資料的數(shù)量水平,其代表性要優(yōu)于中位數(shù)。間斷性變量由于樣本內(nèi)的各觀察值易于集中于某一數(shù)值,所以眾數(shù)易于確定;連續(xù)性變量由于連接兩個(gè)整數(shù)區(qū)間之內(nèi),可有多個(gè)數(shù)值存在,樣本內(nèi)各值不易集中于某一數(shù)值,因此不易確定眾數(shù)。連續(xù)性資料眾數(shù)的確定,常需在次數(shù)分布表的基礎(chǔ)上,由出現(xiàn)次數(shù)最多一組的組中值決定。第54頁(yè),共97頁(yè),2023年,2月20日,星期六4.幾何平均數(shù)(geometricmean)資料中有n個(gè)觀測(cè)數(shù),其乘積開(kāi)n次方所得數(shù)值。GG=一、平均數(shù)第55頁(yè),共97頁(yè),2023年,2月20日,星期六4.幾何平均數(shù)(geometricmean)GG實(shí)際就是觀察值對(duì)數(shù)的算術(shù)平均數(shù)的反對(duì)數(shù)。它適用于變量x為對(duì)數(shù)正態(tài)分布,經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈正態(tài)分布的資料。主要用于以百分率、比例表示的數(shù)據(jù)資料,在計(jì)算平均增長(zhǎng)率方面具有獨(dú)特的應(yīng)用價(jià)值。G=一、平均數(shù)第56頁(yè),共97頁(yè),2023年,2月20日,星期六5.調(diào)和平均數(shù)(harmonicmean)資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。H適用范圍:主要用于反映生物不同階段的平均增長(zhǎng)率或不同規(guī)模的平均規(guī)模。H=1一、平均數(shù)第57頁(yè),共97頁(yè),2023年,2月20日,星期六(二)算術(shù)平均數(shù)的計(jì)算方法直接計(jì)算法減去常數(shù)法加權(quán)平均法一、平均數(shù)第58頁(yè),共97頁(yè),2023年,2月20日,星期六1、直接計(jì)算法

樣本含量n<30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。例:隨機(jī)抽取20株小麥測(cè)量它們的株高(cm)分別為:

79858486848382838384818081828182828280

求小麥的平均株高。第59頁(yè),共97頁(yè),2023年,2月20日,星期六2、減去(加上)常數(shù)法若變量的值都比較大(或都比較?。医咏骋怀?shù)a時(shí),可將它們的值都減去(或加上)常數(shù)a,得到一組新的數(shù)據(jù),計(jì)算其平均數(shù),再重新加上(或減去)常數(shù)a。例:設(shè)a為80(cm)則有:

798584868483828383

2-154643233818081828182828280

4101212220“-80”第60頁(yè),共97頁(yè),2023年,2月20日,星期六3、加權(quán)平均法通常對(duì)樣本容量n≥30且已分組的資料,多在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù)。第i組的次數(shù)fi是權(quán)衡第i個(gè)自然值xi在資料中所占比重大小的數(shù)量,因此將fi

稱(chēng)為是xi的“權(quán)數(shù)”,加權(quán)法也由此而得名。若為計(jì)數(shù)資料,此時(shí)直接用自然值乘以次數(shù)來(lái)計(jì)算,即第61頁(yè),共97頁(yè),2023年,2月20日,星期六式中:—第i組的組中值;

—第i組的次數(shù);

—分組數(shù)

若為分組資料,則用每組組中值乘以該組次數(shù)之和再除以總次數(shù)來(lái)計(jì)算,計(jì)算公式為:第62頁(yè),共97頁(yè),2023年,2月20日,星期六例株高x次數(shù)ffx791798021608132438264928332498432528518586186第63頁(yè),共97頁(yè),2023年,2月20日,星期六例:將100頭長(zhǎng)白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)平均數(shù)。

表100頭長(zhǎng)白母豬仔豬一月窩重次數(shù)分布表組別組中值(x)次數(shù)(f)fx10~1534520~25615030~352691040~4530135050~5524132060~65852070~753225合計(jì)1004520即這100頭長(zhǎng)白母豬仔豬一月齡平均窩重為45.2kg第64頁(yè),共97頁(yè),2023年,2月20日,星期六

計(jì)算若干個(gè)來(lái)自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)采用加權(quán)法計(jì)算。設(shè)是n1個(gè)數(shù)的平均數(shù),是n2個(gè)數(shù)的平均數(shù),那么全部n1+n2個(gè)數(shù)的算術(shù)平均數(shù)是:第65頁(yè),共97頁(yè),2023年,2月20日,星期六此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以?xún)蓚€(gè)牛群牛的頭數(shù)為權(quán)數(shù),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即:

例:某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體重為多少?

第66頁(yè),共97頁(yè),2023年,2月20日,星期六(三)算術(shù)平均數(shù)的重要性質(zhì)算術(shù)平均數(shù)與樣本內(nèi)的每個(gè)值都相關(guān),它的大小受每個(gè)值的影響;若每個(gè)Xi都乘以相同的數(shù)k,則原平均數(shù)亦應(yīng)乘以k;若每個(gè)Xi都加上相同的數(shù)a,則原平均數(shù)亦可直接加上a。一、平均數(shù)第67頁(yè),共97頁(yè),2023年,2月20日,星期六離均差之和等于零。這一性質(zhì)表明:一組資料的觀察值是圍繞其算術(shù)平均數(shù)作上下波動(dòng)的。第68頁(yè),共97頁(yè),2023年,2月20日,星期六離均差平方和最小。樣本中觀察值與其平均數(shù)的離差平方和較各個(gè)觀察值與其他任意數(shù)值的離差平方和為最小。該性質(zhì)表明:算術(shù)平均數(shù)對(duì)資料的代表最強(qiáng)。第69頁(yè),共97頁(yè),2023年,2月20日,星期六(四)算術(shù)平均數(shù)的作用(1)指出一組數(shù)據(jù)資料內(nèi)變量的中心位置,標(biāo)志著資料所代表性狀的數(shù)量水平和質(zhì)量水平。(2)作為樣本或資料的代表數(shù)與其它資料進(jìn)行比較。(3)通過(guò)平均數(shù)提供計(jì)算樣本變異數(shù)的基本數(shù)據(jù)。(4)用樣本的平均數(shù)估計(jì)總體平均數(shù)。一、平均數(shù)第70頁(yè),共97頁(yè),2023年,2月20日,星期六用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測(cè)值變異程度的影響。如果各觀測(cè)值變異小,則平均數(shù)對(duì)樣本的代表性強(qiáng);如果各觀測(cè)值變異大,則平均數(shù)對(duì)樣本的代表性弱。三組同年齡、同性別兒童體重(kg)的數(shù)據(jù):

I組:2628303234

II組:2025303540

III組:2327303337三組的平均數(shù)均為30,變異如何體現(xiàn)?例:如果各觀測(cè)值沒(méi)有變異,則平均數(shù)可完全代表整個(gè)樣本。第71頁(yè),共97頁(yè),2023年,2月20日,星期六

集中趨勢(shì)是數(shù)據(jù)分布的一個(gè)重要特征,但單有集中趨勢(shì)還不能很好地描述數(shù)據(jù)的分布規(guī)律。

僅用平均數(shù)對(duì)一個(gè)資料的特征作統(tǒng)計(jì)描述是不全面的,還需要引入一個(gè)表示資料中觀測(cè)值變異程度大小的統(tǒng)計(jì)量。變異性指標(biāo)第72頁(yè),共97頁(yè),2023年,2月20日,星期六變異數(shù)的種類(lèi)極差方差標(biāo)準(zhǔn)差變異系數(shù)二、變異數(shù)第73頁(yè),共97頁(yè),2023年,2月20日,星期六(一)極差(全距,range)

極差是數(shù)據(jù)分布的兩端變異的最大范圍,即樣本變量值最大值和最小值之差,用R表示。它是資料中各觀測(cè)值變異程度大小的最簡(jiǎn)便的統(tǒng)計(jì)量。例:150尾鰱魚(yú)體長(zhǎng)R=85-37=48(cm)R=max{x1,x2,……,xn}-min{x1,x2,……,xn}={x1,x2,……,xn}max-{x1,x2,……,xn}min二、變異數(shù)第74頁(yè),共97頁(yè),2023年,2月20日,星期六三組同年齡、同性別兒童體重(kg)的數(shù)據(jù):

I組:26283032348

II組:202530354020

III組:232730333714例:極差第75頁(yè),共97頁(yè),2023年,2月20日,星期六簡(jiǎn)單明了當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用極差。(1)除最大、最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異。優(yōu)點(diǎn)缺點(diǎn)用途(2)樣本較大時(shí)抽到較大值與較小值的可能性也較大,因而樣本極差也較大,故樣本含量相差較大時(shí),不宜用極差來(lái)比較分布的離散度。極差第76頁(yè),共97頁(yè),2023年,2月20日,星期六如何準(zhǔn)確地表示樣本內(nèi)各個(gè)觀測(cè)值的變異程度平均數(shù)可以求出各個(gè)觀測(cè)值與平均數(shù)的離差,即離均差。離均差可以反映出一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度。離均差之和為零。?二、變異數(shù)第77頁(yè),共97頁(yè),2023年,2月20日,星期六平方和(SS)平方和的平均數(shù)二、變異數(shù)第78頁(yè),共97頁(yè),2023年,2月20日,星期六平方和的平均數(shù)二、變異數(shù)方差第79頁(yè),共97頁(yè),2023年,2月20日,星期六自由度(degreeoffreedom,df)二、變異數(shù)第80頁(yè),共97頁(yè),2023年,2月20日,星期六自由度指當(dāng)以樣本的統(tǒng)計(jì)量來(lái)估計(jì)總體的參數(shù)時(shí),樣本中可以自由變動(dòng)的觀察值的個(gè)數(shù)。自由度=樣本個(gè)數(shù)-樣本數(shù)據(jù)受約束條件的個(gè)數(shù)在總體平均數(shù)未知時(shí),要計(jì)算標(biāo)準(zhǔn)差就必須先知道樣本平均數(shù),而樣本平均數(shù)和n都知道的情況下,數(shù)據(jù)的總和就是一個(gè)常數(shù)了。所以,“最后一個(gè)”樣本數(shù)據(jù)就不可以變了,因?yàn)樗亲儯偤途妥兞?,而這是不允許的。自由度一詞源于物理學(xué)。第81頁(yè),共97頁(yè),2023年,2月20日,星期六均方(meansquare,MS)方差(variance)二、變異數(shù)第82頁(yè),共97頁(yè),2023年,2月20日,星期六(二)方差(Variance)樣本總體二、變異數(shù)第83頁(yè),共97頁(yè),2023年,2月20日,星期六樣本方差帶有原觀測(cè)單位的平方單位,在僅表示一個(gè)資料中各觀測(cè)值的變異程度而不作其它分析時(shí),常需要與平均數(shù)配合使用,這時(shí)應(yīng)將平方單位還原,即求出樣本方差的平方根。標(biāo)準(zhǔn)差二、變異數(shù)第84頁(yè),共97頁(yè),2023年,2月20日,星期六(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)樣本總體二、變異數(shù)第85頁(yè),共97頁(yè),2023年,2月20日,星期六二、變異數(shù)第86頁(yè),共97頁(yè),2023年,2月20日,星期六二、變異數(shù)第87頁(yè),共97頁(yè),2023年,2月20日,星期六x=411x2=18841X’=6X’2=76

表2-89名男子前臂長(zhǎng)(cm)標(biāo)準(zhǔn)差計(jì)算前臂長(zhǎng)x2x’=x-45x’245202500421764-39441936

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論