1抽樣方法(1)簡單隨機抽樣抽簽法_第1頁
1抽樣方法(1)簡單隨機抽樣抽簽法_第2頁
1抽樣方法(1)簡單隨機抽樣抽簽法_第3頁
1抽樣方法(1)簡單隨機抽樣抽簽法_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、PAGE PAGE - 131 -統(tǒng) 計1.抽樣方法:(1)簡單隨機抽樣(抽抽簽法、隨機數(shù)表表法)常常用于總總體個數(shù)較少時,它它的特征是從總體體中逐個抽??;(2)系系統(tǒng)抽樣也叫等距距離抽樣,常用于于總體個數(shù)較多時時,它的主要特征征是均衡成若干部部分,每部分只取取一個;(3)分分層抽樣,主要特特征是分層按比例例抽樣,主要用于于總體中有明顯差差異,它們的共同同點:每個個體被被抽到的概率都相相等,體現(xiàn)了抽樣樣的客觀性和平等等性。如(1)某社區(qū)有500個個家庭,其中高收收入家庭125戶戶,中等收入家庭庭280戶,低收收入家庭95。為為了調查社會購買買力的某項指標,要要從中抽取一個容容量為100戶的的樣

2、本,把這種抽抽樣記為A;某中中學高中一年級有有12名女排運動動員,要從中選取取3人調查學習負負擔的情況,把這這種抽樣記為B,那那么完成上述兩項項調查應分別采用用的抽樣方法:A為為_,B為_。(答:分層層抽樣,簡單隨機機抽樣);(3)某中學有高一學生400人人,高二學生300人人,高三學生300人人,現(xiàn)通過分層抽抽樣抽取一個容量量為n的樣本,已已知每個學生被抽抽到的概率為0.2,則則n= _(答:200);(4)容量為100的樣本拆拆分成10組,前7組的頻率之和為為0.79,而剩下的三三組的頻數(shù)組成等等比數(shù)列,且其公公比不為1,則剩下的三組組中頻數(shù)最大的一一組的頻率是_(答:0.16);(5)用

3、簡單隨機抽樣樣的方法從含有10個個個體的總體中,抽抽取一個容量為2的的樣本,則某一個個體“第一次被抽到的的概率”,“第一次未被抽到到,第二次被抽到到的概率”,“在整個抽樣過程程中被抽到的概率率”分別是_(答:);2.總體分布的估計:用樣本估計總體體,是研究統(tǒng)計問問題的一個基本思思想方法,即用樣樣本平均數(shù)估計總總體平均數(shù)(即總總體期望值描述一個總體體的平均水平);用樣本方差估計計總體方差(方差差和標準差是描述述一個樣本和總體體的波動大小的特特征數(shù),方差或標標準差越小,表示示這個樣本或總體體的波動越小,即即越穩(wěn)定)。一般般地,樣本容量越越大,這種估計就就越精確。總體估估計要掌握:(1)“表”(頻率

4、分布表);(2)“圖”(頻率分布直方圖圖)。頻率分布直方圖的特征征:(1)從頻率分布直方方圖可以清楚的看看出數(shù)據(jù)分布的總總體趨勢。(2)從頻率分布直方方圖得不出原始的的數(shù)據(jù)內容,把數(shù)數(shù)據(jù)表示成直方圖圖后,原有的具體體數(shù)據(jù)信息就被抹抹掉了。頻率直方圖的作法: (1)算數(shù)據(jù)據(jù)極差 (2)決定組組距和組數(shù); (3)決定分分點; (4)列頻率率分布表; (5)畫頻率率直方圖。 提醒:直方圖圖的縱軸(小矩形形的高)一般是頻頻率除以組距的商商(而不是頻率),橫軸一般是數(shù)數(shù)據(jù)的大小,小矩矩形的面積表示頻頻率。組數(shù)的決定方法是是:設數(shù)據(jù)總數(shù)目目為n,時,分為為組;時,分為組.如(1)一個容量為20的的樣本數(shù)據(jù)

5、,分組組后組距與頻數(shù)如如下: (10,20,2;(20,30,3;(30,40,4;(40,50,5;(50,60,4;(60,70,2;則樣本在在區(qū)間上的頻率為為A5% B25% C50% D70%(答:D);(2)已知樣本:10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 ,那么么頻率為0.3的的范圍是A5.57.5 B7.59.5 C9.511.5 D11.513.5(答:B);(3)觀察新生兒的體體重,其頻率分布布直方圖如圖所示示,則新生兒的體體重在2700,3000的頻率為_(答:0.3);O2400270036003300300

6、03900體重(g)0.001(4)如圖,是一次數(shù)學考試試成績的樣本頻率率分布直方圖(樣樣本容量n=200),若若成績不低于60分分為及格,則樣本本中的及格人數(shù)是是_(答:120); 分數(shù)頻率/組距0204060801000.0180.0120.0090.0060.005(5) 有同一型號的的汽車100輛,為為了解這種汽車每每蠔油1L所行路程的情情況,現(xiàn)從中隨即即抽出10輛在同同一條件下進行蠔蠔油1L所行路程實驗驗,得到如下樣本本數(shù)據(jù)(單位:km):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,其其分組如下:分組頻數(shù)頻率12.45,12.9

7、5)12.95,13.45)13.45,13.95)13.95,14.45)合計101.0(1)完成上面頻率分分布表;(2)根據(jù)上表,在給給定坐標系中畫出出頻率分布直線圖圖,并根據(jù)樣本估估計總體數(shù)據(jù)落在在12.95,13.95)中中的概率;(3)根據(jù)樣本,對總總體的期望值進行行估計解:(1)頻率分布表表:分組頻數(shù)頻率12.45,12.95)20.212.95,13.45)30.313.45,13.95)40.413.95,14.45)10.1合計101.0(2)頻率分布直方圖圖:估計總體數(shù)據(jù)落在12.95,13.95)中中的概率為0.7(3)13.4因此,總體的期望值進進行估計約為13.4.

8、(6)為了了解高一學學生的體能情況,某某校抽取部分學生生進行一分鐘跳繩繩次數(shù)次測試,將將所得數(shù)據(jù)整理后后,畫出頻率分布布直方圖(如圖),圖中從左到右右各小長方形面積積之比為2:4:17:15:9:3,第二小組頻頻數(shù)為12.90100110120130140150次數(shù)o0.0040.0080.0120.0160.0200.0240.028頻率/組距0.0320.036第二小組的頻率是多少少?樣本容量是多多少?若次數(shù)在110以上(含含110次)為達達標,試估計該學學校全體高一學生生的達標率是多少少?在這次測試中,學生跳跳繩次數(shù)的中位數(shù)數(shù)落在哪個小組內內?請說明理由。分析:在頻率分布直方方圖中,各小

9、長方方形的面積等于相相應各組的頻率,小小長方形的高與頻頻數(shù)成正比,各組組頻數(shù)之和等于樣樣本容量,頻率之之和等于1。解:(1)由于頻率分分布直方圖以面積積的形式反映了數(shù)數(shù)據(jù)落在各小組內內的頻率大小,因此第二小組的頻率為為:又因為頻率=,所以 (2)由圖可估計該學學校高一學生的達達標率約為(3)由已知可得各小小組的頻數(shù)依次為為6,12,51,45,27,9,所所以前三組的頻數(shù)數(shù)之和為69,前前四組的頻數(shù)之和和為114,所以以跳繩次數(shù)的中位位數(shù)落在第四小組組內。3、樣本平均數(shù): 。如有一組數(shù)據(jù):x1,x2,xn(x1x2xn),它們的算術平平均值為20,若若去掉其中的xn,余下數(shù)據(jù)的算算術平均值為1

10、8,則則xn關于n的表達式為 (答答:)。4、樣本方差:;樣本標準差:。如(1)甲、乙兩名射擊擊運動員參加某大大型運動會的預選選賽,他們分別射射擊了5次,成績績如下表(單位:環(huán))甲108999乙1010799如果甲、乙兩人中只有有1人入選,則入入選的應是 (答:甲);(2)已知實數(shù)的期望望值為,方差為,若,則一定有 A B C D與無法比較大小(答答:B);(3)某班40人隨機平均分分成兩組,兩組學學生一次考試的成成績情況如下表: 統(tǒng)統(tǒng)計量組別平均分方差第1組8016第2組9036 則全班的平均分為_,方方差為_(答:85,51)提醒:若的平均數(shù)為,方方差為,則的平均數(shù)為,方差差為。如已知數(shù)據(jù)

11、的平均數(shù),方方差,則數(shù)據(jù)的平均數(shù)數(shù)和標準差分別為為 A15,36 B22,6 C15,6 D22,36 (答:B)5.莖葉圖(1) 莖葉圖的畫法法: = 1 * GB3 將每個數(shù)據(jù)分為莖(高高位)與葉(低位位)兩部分, = 2 * GB3 將最大莖和最小小莖之間的數(shù)按大大小順序排成一列列, = 3 * GB3 將各數(shù)據(jù)的葉依依先后次序寫在其其莖的左(右)兩兩側.(2)莖葉圖的特征:()用莖葉圖表示數(shù)數(shù)據(jù)有兩個優(yōu)點:一是從統(tǒng)計圖上上沒有原始數(shù)據(jù)信信息的損失,所有有數(shù)據(jù)信息都可以以從莖葉圖中得到到;二是莖葉圖中中的數(shù)據(jù)可以隨時時記錄,隨時添加加,方便記錄與表表示。()莖葉圖只便于表表示兩位有效數(shù)字

12、字的數(shù)據(jù),而且莖莖葉圖只方便記錄錄兩組的數(shù)據(jù),兩兩個以上的數(shù)據(jù)雖雖然能夠記錄,但但是沒有表示兩個個記錄那么直觀,清清晰。6. 獨立性檢驗獨立性檢驗是檢定兩個個事件間是否獨立立的統(tǒng)計方法,是是卡方檢驗的一個個應用. 卡方檢驗是對樣本的頻頻數(shù)分布所來自的的總體分布是否服服從某種理論分布布或某種假設分布布所作的假設檢驗驗.即根據(jù)樣本的頻頻數(shù)分布來推斷總總體的分布,卡方獨立性檢驗驗的零假設是各事事件之間相互獨立立.卡方值永遠大大于零. 2的兩個臨界值值分別是3.841,與與6.635.3.841時,接接受假設即兩事件件無關.相關系數(shù)是測定變量之之間相關密切程度度和相關方向的代代表性指標。相關關系數(shù)用符

13、號“r ”表示,其特點點表現(xiàn)在:參與相相關分析的兩個變變量是對等的,不不分自變量和因變變量,改變兩變量量的地位并不影響響相關系數(shù)的數(shù)值值,因此相關系數(shù)數(shù)只有一個;相關關系數(shù)有正負號反反映相關系數(shù)的方方向,正號反映正正相關,負號反映映負相關; 回歸和相關都是研究兩兩個變量相互關系系的分析方法。相相關分析研究兩個個變量之間相關的的方向和相關的密密切程度。但是相相關分析不能指出出兩變量相互關系系的具體形式,也也無法從一個變量量的變化來推測另另一個變量的變化化關系。回歸方程程則是通過一定的的數(shù)學方程來反映映變量之間相互關關系的具體形式,以以便從一個已知量量來推測另一個未未知量。為估算預預測提供一個重要

14、要的方法。相關性檢驗的步驟是:(1)做統(tǒng)計假假設:x與Y不具具備線性相關關系系.(2)根據(jù)小小概率0.05與與查出r的一個臨臨界值.(3)根根據(jù)樣本相關系數(shù)數(shù)公式計算出r的的值.(4)作統(tǒng)統(tǒng)計推斷:如果表表明95%的把握握認為x與Y之間間具備線性相關關關系,如果接受假假設.提醒:A與B有關并不不意味著A的發(fā)生生必然導致B的發(fā)發(fā)生.7.回歸分析回歸分析是對具有相關關關系的兩個或兩兩個以上變量之間間數(shù)量變化的一般般關系進行測定,確確定一個相應的數(shù)數(shù)學表達式,以便便從一個已知量來來推測另一個未知知量,為估計預測測提供一個重要的的方法。在回歸分分析中,由X推算算Y與由Y推算X的的回歸方程是不同同的,不

15、可混淆: .與相關分析析相比,回歸分析析的特點是:兩個個變量是不對等的的,只能用自變量量來估計因變量,而而不允許由因變量量來推測自變量,必須區(qū)分自變量,一般說,事物的原因作自變量X.回歸分析和相關分析是是互相補充、密切切聯(lián)系的。相關分分析需要回歸分析析來表明現(xiàn)象數(shù)量量相關的具體形式式,而回歸分析則則應該建立在相關關分析的基礎上。依依靠相關分析表明明現(xiàn)象的數(shù)量變化化具有密切相關,進進行回歸分析求其其相關的具體形式式才有意義。如(1)在研究色盲與性性別的關系調查中中,調查了男性480人人,其中有38人人患色盲,調查的的520個女性中中6人患色盲,(1)根據(jù)以上的數(shù)據(jù)據(jù)建立一個22的列聯(lián)表;(2)若認為“性別與與患色盲有關系”,則出錯的概率率會是多少解:(1)患色盲不患色盲總計男38442480女6514520總計449561000 (2)假設H :“性性別與患色盲沒有有關系” 先算出K 的觀測值: 則有 即是H 成立的概率不超超過0.001, 若認為“性別與患色盲有有關系”,則出錯的概率率為0.001(2)一臺機器使用的的時間較長,但還還可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論