




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、板塊四.統(tǒng)計數(shù)據(jù)的數(shù)字特征一隨機(jī)抽樣1隨機(jī)抽樣:滿足每個個體被抽到的機(jī)會是均等的抽樣,共有三種經(jīng)常采用的隨機(jī)抽樣方法:簡單隨機(jī)抽樣:從元素個數(shù)為的總體中不放回地抽取容量為的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機(jī)抽樣抽出辦法:抽簽法:用紙片或小球分別標(biāo)號后抽簽的方法隨機(jī)數(shù)表法:隨機(jī)數(shù)表是使用計算器或計算機(jī)的應(yīng)用程序生成隨機(jī)數(shù)的功能生成的一張數(shù)表表中每一位置出現(xiàn)各個數(shù)字的可能性相同隨機(jī)數(shù)表法是對樣本進(jìn)行編號后,按照一定的規(guī)律從隨機(jī)數(shù)表中讀數(shù),并取出相應(yīng)的樣本的方法簡單隨機(jī)抽樣是最簡單、最基本的抽樣方法系統(tǒng)抽樣:將總體分成均衡的若干部分,然后按照預(yù)先制定
2、的規(guī)則,從每一部分抽取一個個體,得到所需要的樣本的抽樣方法抽出辦法:從元素個數(shù)為的總體中抽取容量為的樣本,如果總體容量能被樣本容量整除,設(shè),先對總體進(jìn)行編號,號碼從到,再從數(shù)字到中隨機(jī)抽取一個數(shù)作為起始數(shù),然后順次抽取第個數(shù),這樣就得到容量為的樣本如果總體容量不能被樣本容量整除,可隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣方法進(jìn)行抽樣系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣分層抽樣:當(dāng)總體有明顯差別的幾部分組成時,要反映總體情況,常采用分層抽樣,使總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進(jìn)行簡單隨機(jī)抽樣,這種抽樣方
3、法叫做分層抽樣分層抽樣的樣本具有較強(qiáng)的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,應(yīng)用廣泛2簡單隨機(jī)抽樣必須具備下列特點:簡單隨機(jī)抽樣要求被抽取的樣本的總體個數(shù)是有限的簡單隨機(jī)樣本數(shù)小于等于樣本總體的個數(shù)簡單隨機(jī)樣本是從總體中逐個抽取的簡單隨機(jī)抽樣是一種不放回的抽樣簡單隨機(jī)抽樣的每個個體入樣的可能性均為3系統(tǒng)抽樣時,當(dāng)總體個數(shù)恰好是樣本容量的整數(shù)倍時,取;若不是整數(shù)時,先從總體中隨機(jī)地剔除幾個個體,使得總體中剩余的個體數(shù)能被樣本容量整除因為每個個體被剔除的機(jī)會相等,因而整個抽樣過程中每個個體被抽取的機(jī)會仍然相等,為二頻率直方圖列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:計算極差:找出
4、數(shù)據(jù)的最大值與最小值,計算它們的差;決定組距與組數(shù):取組距,用決定組數(shù);決定分點:決定起點,進(jìn)行分組;列頻率分布直方圖:對落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,得到各小組的頻率繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖,知小長方形的面積組距×頻率頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義總體密度曲線:樣本容量不斷增大時,所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線總體密度曲線精確
5、地反映了一個總體在各個區(qū)域內(nèi)取值的規(guī)律三莖葉圖制作莖葉圖的步驟:將數(shù)據(jù)分為“莖”、“葉”兩部分;將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線;將各個數(shù)據(jù)的“葉”在分界線的一側(cè)對應(yīng)莖處同行列出四統(tǒng)計數(shù)據(jù)的數(shù)字特征用樣本平均數(shù)估計總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度;樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根一般地,設(shè)樣本的元素為樣本的平均數(shù)為,定義樣本方差為,樣本標(biāo)準(zhǔn)差簡化公式:五獨立性檢驗1兩個變量之間的關(guān)系;常見的有兩類:一類是確
6、定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系所要求的確定性,它們的關(guān)系是帶有一定隨機(jī)性的當(dāng)一個變量取值一定時,另一個變量的取值帶有一定隨機(jī)性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系2散點圖:將樣本中的個數(shù)據(jù)點描在平面直角坐標(biāo)系中,就得到了散點圖散點圖形象地反映了各個數(shù)據(jù)的密切程度,根據(jù)散點圖的分布趨勢可以直觀地判斷分析兩個變量的關(guān)系3如果當(dāng)一個變量的值變大時,另一個變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時,散點圖中的點在從左下角到右上角的區(qū)域反之,一個變量的值變大時,另一個變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān)此時,散點圖中的點在從左上角到右下角的區(qū)域散點圖可以判斷兩個變量之間有沒有相
7、關(guān)關(guān)系4統(tǒng)計假設(shè):如果事件與獨立,這時應(yīng)該有,用字母表示此式,即,稱之為統(tǒng)計假設(shè)5(讀作“卡方”)統(tǒng)計量:統(tǒng)計學(xué)中有一個非常有用的統(tǒng)計量,它的表達(dá)式為,用它的大小可以用來決定是否拒絕原來的統(tǒng)計假設(shè)如果的值較大,就拒絕,即認(rèn)為與是有關(guān)的統(tǒng)計量的兩個臨界值:、;當(dāng)時,有的把握說事件與有關(guān);當(dāng)時,有的把握說事件與有關(guān);當(dāng)時,認(rèn)為事件與是無關(guān)的獨立性檢驗的基本思想與反證法類似,由結(jié)論不成立時推出有利于結(jié)論成立的小概率事件發(fā)生,而小概率事件在一次試驗中通常是不會發(fā)生的,所以認(rèn)為結(jié)論在很大程度上是成立的1獨立性檢驗的步驟:統(tǒng)計假設(shè):;列出聯(lián)表;計算統(tǒng)計量;查對臨界值表,作出判斷2幾個臨界值:聯(lián)表的獨立性檢
8、驗:如果對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個情況,這樣排成一張的表,如下:狀態(tài)狀態(tài)合計狀態(tài)狀態(tài)如果有調(diào)查得來的四個數(shù)據(jù),并希望根據(jù)這樣的個數(shù)據(jù)來檢驗上述的兩種狀態(tài)與是否有關(guān),就稱之為聯(lián)表的獨立性檢驗六回歸分析1回歸分析:對于具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法叫做回歸分析,即回歸分析就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線2最小二乘法:記回歸直線方程為:,稱為變量對變量的回歸直線方程,其中叫做回歸系數(shù)是為了區(qū)分的實際值,當(dāng)取值時,變量的相應(yīng)觀察值為,而直線上對應(yīng)于的縱坐
9、標(biāo)是設(shè)的一組觀察值為,且回歸直線方程為,當(dāng)取值時,的相應(yīng)觀察值為,差刻畫了實際觀察值與回歸直線上相應(yīng)點的縱坐標(biāo)之間的偏離程度,稱這些值為離差我們希望這個離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點記,回歸直線就是所有直線中取最小值的那條這種使“離差平方和為最小”的方法,叫做最小二乘法用最小二乘法求回歸系數(shù)有如下的公式:,其中上方加“”,表示是由觀察值按最小二乘法求得的回歸系數(shù)3線性回歸模型:將用于估計值的線性函數(shù)作為確定性函數(shù);的實際值與估計值之間的誤差記為,稱之為隨機(jī)誤差;將稱為線性回歸模型產(chǎn)生隨機(jī)誤差的主要原因有:所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;忽略了某些因素的影
10、響,通常這些影響都比較??;由于測量工具等原因,存在觀測誤差4線性回歸系數(shù)的最佳估計值:利用最小二乘法可以得到的計算公式為,其中,由此得到的直線就稱為回歸直線,此直線方程即為線性回歸方程其中,分別為,的估計值,稱為回歸截距,稱為回歸系數(shù),稱為回歸值5相關(guān)系數(shù):6相關(guān)系數(shù)的性質(zhì):;越接近于1,的線性相關(guān)程度越強(qiáng);越接近于0,的線性相關(guān)程度越弱可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān)7轉(zhuǎn)化思想:根據(jù)專業(yè)知識或散點圖,對某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)化為線性回歸方程,從而確定未知參數(shù)8一些備案回歸(regression)一詞的來歷:“回歸”這個詞英國統(tǒng)計
11、學(xué)家Francils Galton提出來的1889年,他在研究祖先與后代的身高之間的關(guān)系時發(fā)現(xiàn),身材較高的父母,他們的孩子也較高,但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身高高Galton把這種后代的身高向中間值靠近的趨勢稱為“回歸現(xiàn)象”后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回歸分析回歸系數(shù)的推導(dǎo)過程:,把上式看成的二次函數(shù),的系數(shù),因此當(dāng)時取最小值同理,把的展開式按的降冪排列,看成的二次函數(shù),當(dāng)時取最小值解得:,其中,是樣本平均數(shù)9 對相關(guān)系數(shù)進(jìn)行相關(guān)性檢驗的步驟:提出統(tǒng)計假設(shè):變量不具有線
12、性相關(guān)關(guān)系;如果以的把握作出推斷,那么可以根據(jù)與(是樣本容量)在相關(guān)性檢驗的臨界值表中查出一個的臨界值(其中稱為檢驗水平);計算樣本相關(guān)系數(shù);作出統(tǒng)計推斷:若,則否定,表明有的把握認(rèn)為變量與之間具有線性相關(guān)關(guān)系;若,則沒有理由拒絕,即就目前數(shù)據(jù)而言,沒有充分理由認(rèn)為變量與之間具有線性相關(guān)關(guān)系說明:對相關(guān)系數(shù)進(jìn)行顯著性檢驗,一般取檢驗水平,即可靠程度為這里的指的是線性相關(guān)系數(shù),的絕對值很小,只是說明線性相關(guān)程度低,不一定不相關(guān),可能是非線性相關(guān)的某種關(guān)系這里的是對抽樣數(shù)據(jù)而言的有時即使,兩者也不一定是線性相關(guān)的故在統(tǒng)計分析時,不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實際情況進(jìn)行合理解釋典例分析題型一數(shù)字特征的計
13、算【例1】 (2010海淀二模)某校高中年級開設(shè)了豐富多彩的校本課程,甲、乙兩班各隨機(jī)抽取了5名學(xué)生的學(xué)分,用莖葉圖表示(如右圖),分別表示甲、乙兩班各自5名學(xué)生學(xué)分的標(biāo)準(zhǔn)差,則(填“”、“”或“”)【例2】 (2010崇文二模)甲、乙、丙三名射擊運動員在某次測試中各射擊20次,三人的測試成績?nèi)缦卤砑椎某煽?環(huán)數(shù)78910頻數(shù)5555乙的成績環(huán)數(shù)78910頻數(shù)6446丙的成績環(huán)數(shù)78910頻數(shù)4664分別表示甲、乙、丙三名運動員這次測試成績的平均數(shù),則的大小關(guān)系為 ;分別表示甲、乙、丙三名運動員這次測
14、試成績的標(biāo)準(zhǔn)差,則的大小關(guān)系為 【例3】 個正數(shù)的平方和是,方差是,那么平均數(shù)為( )ABC D【例4】 若個數(shù)的平均數(shù)是,個數(shù)的平均數(shù)是,則這個數(shù)的平均數(shù)是( )A B C D【例5】 已知一組數(shù)據(jù)的方差是,且,則這組數(shù)據(jù)的平均數(shù)_【例6】 求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差(精確到),并分析由這些結(jié)果可得出什么更一般的結(jié)論;【例7】 (2009上海18)在發(fā)生某公共衛(wèi)生事件期間,有專業(yè)機(jī)構(gòu)認(rèn)為該事件在一段時間內(nèi)沒有發(fā)生大規(guī)模群體感染的標(biāo)志為“連續(xù)天,每天新增疑似病例不超過人”根據(jù)過去天甲、乙、丙、丁四地新增疑似病例數(shù)據(jù),一定符合該標(biāo)志的是( )A甲地:總體均為,中位數(shù)為 B乙地:總體均值為,總體方差大于C丙地:中位數(shù)為,眾數(shù)為D丁地:總體均值為,總體方差為【例8】 (2009四川卷文)設(shè)矩形的長為,寬為,其比滿足,這種矩形給人以美感,稱為黃金矩形黃金矩形常應(yīng)用于工藝品設(shè)計中下面是某工藝品廠隨機(jī)抽取兩個批次的初加工矩形寬度與長度的比值樣本:甲批次:乙批次:根據(jù)上述兩個樣本來估計兩個批次的總體平均數(shù),與標(biāo)準(zhǔn)值比較,正確結(jié)論是A甲批次的總體平均數(shù)與標(biāo)準(zhǔn)值更接近B乙批次的總體平均數(shù)與標(biāo)準(zhǔn)值更接近C兩個批次總體平均數(shù)與標(biāo)準(zhǔn)值接近程度相同D兩個批次總體平均數(shù)與標(biāo)準(zhǔn)值接近程度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商品代理采購合同范本
- 河北省保定市2025屆高三下學(xué)期一模試題 地理 含解析
- 創(chuàng)新創(chuàng)業(yè)基礎(chǔ)教程 課件 模塊三 創(chuàng)業(yè)團(tuán)隊組建
- 不跪的中國人課件
- 西藏昌都地區(qū)昌都縣2025年數(shù)學(xué)三下期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 云南農(nóng)業(yè)職業(yè)技術(shù)學(xué)院《中國現(xiàn)代文學(xué)Ⅱ》2023-2024學(xué)年第一學(xué)期期末試卷
- 濟(jì)源職業(yè)技術(shù)學(xué)院《農(nóng)業(yè)機(jī)械與信息技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 長沙理工大學(xué)城南學(xué)院《復(fù)合材料力學(xué)與結(jié)構(gòu)設(shè)計基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 遼寧省大連市高新區(qū)2025年小升初數(shù)學(xué)綜合練習(xí)卷含解析
- 沈陽航空航天大學(xué)《鋼琴(3)》2023-2024學(xué)年第二學(xué)期期末試卷
- 課文《牧場之國》的教學(xué)反思
- 單叉固定式液壓升降臺設(shè)計
- 天藍(lán)色商務(wù)發(fā)展歷程時間軸PPT模板課件
- 外墻憎水巖棉保溫板施工方案doc
- 聯(lián)想集團(tuán)財務(wù)風(fēng)險分析及對策論文財務(wù)管理專業(yè)
- 阿丁尿床了(2)
- 工會會計報表完整版(內(nèi)有6張表)
- 雙堿法脫硫設(shè)計計算
- 增值稅銷售貨物或者提供應(yīng)稅勞務(wù)清單(標(biāo)準(zhǔn)模板)
- 醫(yī)用耗材分類目錄 (低值 ╱ 高值)
- competition-model
評論
0/150
提交評論