版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二章 統(tǒng)計2.1.1簡單隨機抽樣1總體和樣本 總體:在統(tǒng)計學(xué)中 , 把研究對象的全體叫做總體個體:把每個研究對象叫做個體總體容量:把總體中個體的總數(shù)叫做總體容量為了研究總體的有關(guān)性質(zhì),一般從總體中隨機抽取一部分:, , , 研究,我們稱它為樣本其中個體的個數(shù)稱為樣本容量。2簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨 機地抽取調(diào)查單位。特點:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少時,才采用這種方法。3簡單隨機抽樣常用的方
2、法: (1)抽簽法;隨機數(shù)表法;計算機模擬法;使用統(tǒng)計軟件直接抽取。在簡單隨機抽樣的樣本容量設(shè)計中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。4抽簽法: (1)給調(diào)查對象群體中的每一個對象編號; (2)準備抽簽的工具,實施抽簽 (3)對樣本中的每一個個體進行測量或調(diào)查 例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。5隨機數(shù)表法: 例:利用隨機數(shù)表在所在的班級中抽取10位同學(xué)參加某項活動。2.1.2系統(tǒng)抽樣1系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)
3、/n(樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應(yīng)是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調(diào)查指標相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。2.1.3分層抽樣1分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或?qū)?/p>
4、次,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:1先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。分層標準:(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標準。(2)以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有
5、明顯分層區(qū)分的變量作為分層變量。3分層的比例問題: (1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。 (2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。三種抽樣方法的比較類 別共同點各自特點聯(lián) 系適 用范 圍簡 單隨 機抽 樣(1)抽樣過程中每個個體被抽到的可能性相等(2)每次抽出個體后不再將它放回,即不放回抽樣從總體中逐個抽取總體個
6、數(shù)較少將總體均分成幾部 分,按預(yù)先制定的規(guī)則在各部分抽取在起始部分樣時采用簡隨機抽樣總體個數(shù)較多系 統(tǒng)抽 樣將總體分成幾層,分層進行抽取分層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成分 層抽 樣2.2.1 頻率分布直方圖與莖葉圖1、我們把樣本抽取后,要對樣本進行分析來研究總體的分布情況,對樣本進行分析常采取兩種方式:列頻率分布表; 頻率分布直方圖.頻率分布是指一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。畫頻率分布直方圖一般步驟為:求極差(即樣本中的最大值與最小值的差);決定組距與組數(shù)();將數(shù)據(jù)分組;列頻率分布表.(5)畫頻率分布直方圖根據(jù)
7、頻率分布表做頻率分布直方圖應(yīng)注意兩點:縱軸的意義:橫軸的意義:樣本內(nèi)容(每個矩形下面是組距).頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖2.莖葉圖:當數(shù)據(jù)是兩位有效數(shù)字時,用中間的數(shù)字表示十位數(shù),即第一個有效數(shù)字,兩邊的數(shù)字表示個位數(shù),即第二個有效數(shù)字,它的中間部分像植物的莖,兩邊部分像植物莖上長出來的葉子,因此通常把這樣的圖叫做莖葉圖。(見課本P6例子)制作莖葉圖的方法是:先將數(shù)據(jù)按大小進行排列,再將所有兩位數(shù)的十位數(shù)字作為“莖”,個位數(shù)字作為“葉”,莖相同者共用一個莖,莖按從小到大的順序從上向下列出,共莖的葉一般按從大到?。ɑ驈男〉酱螅┑捻樞蛲辛谐?注
8、意:在制作莖葉圖時,重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏,特別是“葉”部分;同一數(shù)據(jù)出現(xiàn)幾次,就要在圖中體現(xiàn)幾次.莖葉圖的特征:()用莖葉圖表示數(shù)據(jù)有兩個優(yōu)點:一是從統(tǒng)計圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時記錄,隨時添加,方便記錄與表示。()莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個以上的數(shù)據(jù)雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰??傮w分布指的是總體取值的頻率分布規(guī)律,由于總體分布不易知道,因此我們往往用樣本的頻率分布去估計總體的分布。4.總體的分布分兩種情況:當總體中的個體取值很少時,用莖葉圖估計總體的
9、分布;當總體中的個體取值較多時,將樣本數(shù)據(jù)恰當分組,用各組的頻率分布描述總體的分布,方法是用頻率分布表或頻率分布直方圖。制作頻率分布表時,若容量是n, 可按公式將數(shù)據(jù)分成大約 K=1+lg n 段。(這類的經(jīng)驗公式只對分段起參考作用)二、典例精析例1:下表給出了某校500名12歲男孩中用隨機抽樣得出的120人的身高(單位) (1)列出樣本頻率分布表(2)一畫出頻率分布直方圖;(3)估計身高小于134的人數(shù)占總?cè)藬?shù)的百分比.。2.3.1用樣本的數(shù)字特征估計總體的數(shù)字特征1、眾數(shù)、中位數(shù)、平均數(shù):眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個數(shù)據(jù)(或
10、中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù)。平均數(shù):2、樣本標準差:3方差在刻畫樣本數(shù)據(jù)的分散程度上,方差和標準差是一樣的,但在解決實際問題時,一般多采用標準差。用樣本的數(shù)字特征估計總體的數(shù)字特征分兩類:a) 用樣本平均數(shù)估計總體平均數(shù)。b) 用樣本標準差估計總體標準差。樣本容量越大,估計就越精確。特點:(1)平均數(shù)對數(shù)據(jù)有“取齊”的作用,代表一組數(shù)據(jù)的平均水平。(2)標準差描述一組數(shù)據(jù)圍繞平均數(shù)波動的大小,反映了一組數(shù)據(jù)變化的幅度。4用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分
11、布、均值和標準差并不是總體的真正的分布、均值和標準差,而只是一個估計,但這種估計是合理的,特別是當樣本量很大時,它們確實反映了總體的信息。4(1)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標準差不變(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標準差變?yōu)樵瓉淼膋倍(3)一組數(shù)據(jù)中的最大值和最小值對標準差的影響,區(qū)間的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理2.3.2兩個變量的線性相關(guān)1、概念: 如果散點圖中點的分布從整體看大致分布在一條直線的附近,我們稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線. (1)回歸直線方程 :,(*) , 其中b是回歸方程的斜率,a是截距.系數(shù)4.求線性回歸方程的步驟:(1)計算平均數(shù);(2)計算的積,求;(3)計算;(4)將結(jié)果代入公式,求b;(5)用 ,求a;(6)寫出回歸方程 2最小二乘法3直線回歸方程的應(yīng)用 (1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系 (2)利用回歸方程進行預(yù)測;把預(yù)報因子(即自變量x)代入回歸方程對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中語文古詩詞誦讀《燕歌行并序》(同步教學(xué)課件)
- 2024屆上海市寶山區(qū)建峰附屬高中高考壓軸數(shù)學(xué)試題
- DB11-T 2105-2023 特定地域單元生態(tài)產(chǎn)品價值核算及應(yīng)用指南
- 5年中考3年模擬試卷初中道德與法治九年級下冊07中考道德與法治真題分項精練(七)
- 2024-2025學(xué)年高考聯(lián)考語文試題及參考答案
- 安全知識課件教學(xué)課件
- 閥門配件生產(chǎn)線技改項目可行性研究報告寫作模板-備案審批
- 《凝鑄時光》課件 2024-2025學(xué)年湘美版(2024)初中美術(shù)七年級上冊
- (統(tǒng)考版)2023版高考化學(xué)一輪復(fù)習(xí)課時作業(yè)35分子結(jié)構(gòu)與性質(zhì)
- DB11-T 1901-2021 政務(wù)服務(wù)事項編碼及要素規(guī)范
- 失智老年人分類及護理課件
- 期權(quán)開戶考試考點及試題(含答案)
- 斷裂力學(xué)課件
- 理想人才是以仁為主還是以智為主
- 廣東省佛山市南海外國語學(xué)校2023-2024學(xué)年八年級上學(xué)期期中考試物理試卷
- 空靈鼓社團教學(xué)計劃
- 大一個人總結(jié)600字(3篇)
- 宣布干部任命簡短講話3篇
- 廣西桂林市桂電中學(xué)2023-2024學(xué)年高二上學(xué)期期中考試物理試卷(無答案)
- 小學(xué)家長進課堂課件-認識橋梁
- 人教版歷史八年級上冊期中測試題附答案
評論
0/150
提交評論