下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、高中統(tǒng)計與概率知識點(文科)(一)統(tǒng)計一、簡單隨機抽樣1 .總體和樣本在統(tǒng)計學(xué)中,把研究對象的全體叫做總體.把每個研究對象叫做個體.把總體中個體的總數(shù)叫做總體容量.為了研究總體 近的有關(guān)性質(zhì),一般從總體中隨機抽取一部分:/,叼,- , /研究,我們稱它為樣本.其中個體的個數(shù)稱為樣本容量.2 .簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取調(diào)查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等) ,樣本的每個單位完全獨立,彼此 間無一定的關(guān)聯(lián)性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少時,才采用這種方法。
2、3 .簡單隨機抽樣常用的方法:(1)抽簽法;隨機數(shù)表法;計算機模擬法;使用統(tǒng)計軟件直接抽取。在簡單隨機抽樣的樣本容量設(shè)計中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。4 .抽簽法:(1)給調(diào)查對象群體中的每一個對象編號;(2)準備抽簽的工具,實施抽簽(3)對樣本中的每一個個體進行測量或調(diào)查例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。5 .隨機數(shù)表法:例:利用隨機數(shù)表在所在的班級中抽取10位同學(xué)參加某項活動。二、系統(tǒng)抽樣1 .系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。K (抽樣
3、距離)=N (總體規(guī)模)/n (樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應(yīng)是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布。 可以在調(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布成某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更 為重要的是,如果有某種與調(diào)查指標相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系 統(tǒng)抽樣可以大大提高估計精度。三、分層抽樣1 .分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別
4、、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)?次中采用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:(1)先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。(2)先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法 抽取樣本。2 .分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,再抽取不同的子總體中的樣本分別代表該子 總體,所有的樣本進而代表總體。分層標準:(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標準。(2)以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出
5、總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3.分層的比例問題:(1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。(2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。四、用樣本的頻率分布估計總體分布1.頻率分布直方圖組距與分組:樣本容量越大,分組越多,當(dāng)樣本容量不超過100時,一般可分成 512組,組距力
6、求“取整” .直方圖中小長方形的面積表示相應(yīng)各組白頻率,小長方形的面積之和為1。頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖。2.莖葉圖:莖是指中間的一列數(shù),葉就是從莖的旁邊生長出來的數(shù),中間的數(shù)字表示得數(shù)的十位數(shù),旁邊的數(shù)字分 別表示兩個人得分的個位數(shù).一般將各個數(shù)據(jù)的葉按大小次序?qū)懺谇o的左右側(cè)。五、用樣本的數(shù)字特征估計總體的數(shù)字特征Xn一 一 Xi X21 .平均數(shù):X n2 .極差:一組數(shù)據(jù)中的最大值減去最小值的差,它反映了這組數(shù)據(jù)的偏離程度3 .方差:4 .標準差:s叱:出上旦亙?nèi)缟蟦n,標準差越小越穩(wěn)定5 .用樣本估計總體時,如果抽樣的方法比較合理,
7、那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標準差并不是總體的真正分布、均值和標準差,而只是一個估計,但 這種估計是合理的,特別是當(dāng)樣本量很大時,它們確實反映了總體的信息。6 . (1)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標準差不變(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標準差變?yōu)樵瓉淼?k倍(3) 一組數(shù)據(jù)中的最大值和最小值對標準差的影響,區(qū)間(7 3s, x 3s)的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理7.如何從頻率分布直方圖估計樣本的數(shù)字特征:中位數(shù):
8、在直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等。 平均數(shù):在直方圖中,平均數(shù)等于每個小矩形的面積乘以小矩形底邊中點的橫坐標之和。六、兩個變量的線性相關(guān)1、概念:(1)回歸直線方程:散點圖中的點從整體上看分布在一條直線附近,這條直線叫回歸直線(2)回歸系數(shù):直線方程y=kx+b,我們把直線方程記作:y=bx+a,其中,a,b叫做回歸系數(shù).b是直線的斜率,a是截距.2 .最小二乘法3 .直線回歸方程的應(yīng)用(1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系(2)利用回歸方程進行預(yù)測;把預(yù)報因子(即自變量x)代入回歸方程對預(yù)報量(即因變量Y)進行估計,即可得到個體
9、 Y值的容許區(qū)間。(3)利用回歸方程進行統(tǒng)計控制規(guī)定Y值的變化,通過控制 x的范圍來實現(xiàn)統(tǒng)計控制的目標。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。(二)概率隨機事件的概率及概率的意義1、基本概念:(1)必然事件:在條件 S下,一定會發(fā)生的事件,叫相對于條件S的必然事件;(2)不可能事件:在條件 S下,一定不會發(fā)生的事件,叫相對于條件S的不可能事件;(3)確定事件:必然事件和不可能事件統(tǒng)稱為相對于條件S的確定事件;(4)隨機事件:在條件 S下可能發(fā)生也可能不發(fā)生的事件,叫相對于條件S的隨機事件;(5)頻數(shù)與頻率:在相同的條件 S下重復(fù)n次
10、試驗,觀察某一事件 A是否出現(xiàn),稱n次nA試驗中事件A出現(xiàn)的次數(shù)nA為事件A出現(xiàn)的頻數(shù);稱事件 A出現(xiàn)的比例fn(A)= n為事彳A出現(xiàn)的概率:對于給定的隨機事件A,如果隨著試驗次數(shù)的增加,事件 A發(fā)生的頻率fn(A)穩(wěn)定在某個常數(shù)上,把這個常數(shù)記作P (A),稱為事件A的概率。(6)頻率與概率的區(qū)別與聯(lián)系:隨機事件的頻率,指此事件發(fā)生的次數(shù)nA與試驗總次數(shù)nAn的比值n ,它具有一定的穩(wěn)定性,總在某個常數(shù)附近擺動,且隨著試驗次數(shù)的不斷增多,這種擺動幅度越來越小。我們把這個常數(shù)叫做隨機事件的概率,概率從數(shù)量上反映了隨機事件發(fā)生的可能性的大小。頻率在大量重復(fù)試驗的前提下可以近似地作為這個事件的概
11、率。3.1.3概率的基本性質(zhì)1、基本概念:(1)事件的包含、并事件、交事件、相等事件(2)若An B為不可能事件,即 AnB=6,那么稱事件 A與事件B互斥;(3)若An B為不可能事件,AU B為必然事件,那么稱事件 A與事件B互為對立事件;(4)當(dāng)事件A與B互斥時,滿足加法公式:P(AU B)= P(A)+ P(B);若事件A與B為對立事件,則AU B為必然事件, 所以 P(A U B)= P(A)+ P(B)=1,于是有 P(A)=1P(B)2、概率的基本性質(zhì):1)必然事件概率為 1,不可能事件概率為 0,因此0WP(A)W1;2)當(dāng)事件A與B互斥時,滿足加法公式:P(AU B)= P(
12、A)+ P(B);3)若事件A與B為對立事件,則 AU B為必然事件,所以 P(AU B)= P(A)+ P(B)=1,于是有 P(A)=1 P(B);4)互斥事件與對立事件的區(qū)別與聯(lián)系,互斥事件是指事件 A與事件B在一次試驗中不會同時發(fā)生, 其具體包括三種不同的情形:(1)事件A發(fā)生且事件B不發(fā)生;(2)事件A不發(fā)生且事件 B發(fā)生;(3)事件A與事件B同 時不發(fā)生,而對立事件是指事件 A與事件B有且僅有一個發(fā)生,其包括兩種情形;(1)事件A發(fā)生B不發(fā)生;(2) 事件B發(fā)生事件A不發(fā)生,對立事件互斥事件的特殊情形。3.2.1 3.2.2古典概型及隨機數(shù)的產(chǎn)生1、(1)古典概型的使用條件:試驗結(jié)果的有限性和所有結(jié)果的等可能性。(2)古典概型的解題步驟;求出總的基本事件數(shù);A包含的基本事件數(shù)求出事件A所包含的基本事件數(shù),然后利用公式P (A)=總的基本事件個數(shù)3.3.1-3.3.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《新加坡專利局檢索》課件
- 2024校園安全學(xué)生演講稿(35篇)
- 《新房幫使用幫助》課件
- 第6單元 走向和平發(fā)展的世界(B卷·能力提升練)(解析版)
- 《孕期保健新理念》課件
- 2024年度天津市公共營養(yǎng)師之三級營養(yǎng)師題庫附答案(基礎(chǔ)題)
- 2024年度天津市公共營養(yǎng)師之二級營養(yǎng)師高分通關(guān)題型題庫附解析答案
- 年產(chǎn)1000噸茶油加工可行性研究報告申請備案立項
- 氣體分析儀生產(chǎn)項目可行性研究報告建議書
- 2021-2026年中國飲用水鉛污染治理市場供需現(xiàn)狀及投資戰(zhàn)略研究報告
- 航空概論學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 業(yè)務(wù)流程可視化改善
- 期末復(fù)(知識清單)2024-2025學(xué)年人教PEP版(2024)英語三年級上冊
- 45001-2020職業(yè)健康安全管理體系危險源識別與風(fēng)險評價及應(yīng)對措施表(各部門)
- 人教版六年級科學(xué)重點知識點
- 春節(jié):藝術(shù)的盛宴
- 煙草公司化肥采購項目-化肥投標文件(技術(shù)方案)
- 【良品鋪子成本控制中存在的問題及優(yōu)化建議探析(定量論文)11000字】
- 2023八年級語文上冊 第三單元 13 唐詩五首說課稿 新人教版
- 2024至2030年中國青年旅舍行業(yè)發(fā)展監(jiān)測及投資戰(zhàn)略研究報告
-
評論
0/150
提交評論