統(tǒng)計知識點及常見題型_第1頁
統(tǒng)計知識點及常見題型_第2頁
統(tǒng)計知識點及常見題型_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、統(tǒng)計知識點及常見題型1. 總體和樣本:在統(tǒng)計學中,把研究對象的全體叫做總體.把每個研究對象叫做個體.把總體中個體的總數叫做總體容量.為了研究總體T的有關性質,一般從總體中隨機抽取一部分:,心,,研究,我們稱它為樣本.其中個體的個數稱為樣本容量.2. 簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、戈咲、排隊等, 完全隨機地抽取調查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關聯性和排斥性。簡單隨機抽樣 是其它各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數目較少 時,才采用這種方法。3. 簡單隨機抽樣常用的方法:(1)抽簽法

2、;隨機數表法;計算機模擬法;使用統(tǒng)計軟件直接抽取。 在簡單隨機抽樣的樣本容量設計中,主要考慮:總體變異情況;允 許誤差范圍;概率保證程度。4 .抽簽法:(1)給調查對象群體中的每一個對象編號;(2)準備抽簽的工具,實施抽簽(3)對樣本中的每一個個體進行測量或調查例:請調查你所在的學校的學生做喜歡的體育活動情況。5.隨機數表法:例:利用隨機數表在所在的班級中抽取10位同學參加某項活動。1. 系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽 取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。K (抽樣距離)二N (總體規(guī)模)/n (樣本規(guī)模)前提條件

3、:總體中個體的排列對于研究的變量來說,應是隨機的,即不存在 某種與研究變量相關的規(guī)則分布。可以在調查允許的條件下,從不同的樣本幵始 抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種 循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2. 系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的 要求較低,實施也比較簡單。更為重要的是,如果有某種與調查指標相關的輔助 變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大 大提高估計精度。1. 分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或

4、層次中采用簡單隨機抽樣或系用抽樣的辦法抽取一 個子樣本,最后,將這些子樣本合起來構成總體的樣本。兩種方法:1. 先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2. 先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊 排列,最后用系統(tǒng)抽樣的方法抽取樣本。2. 分層抽樣是把異質性較強的總體分成一個個同質性較強的子總體,再抽取不同 的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。分層標準:(1) 以調查所要分析和研究的主要變量或相關的變量作為分層的標準。(2) 以保證各層內部同質性強、各層之間異質性強、突出總體內在結構的變 量作為分層變量。(3) 以那

5、些有明顯分層區(qū)分的變量作為分層變量。3. 分層的比例問題:(1) 按比例分層抽樣:根據各種類型或層次中的單位數目占總體單位數目的比 重來抽取子樣本的方法。(2) 不按比例分層抽樣:有的層次在總體中的比重太小, 其樣本量就會非常少, 此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。 如果要用樣本資料推斷總體時,則需要先對各層的數據資料進行加權處理,調整 樣本中各層的比例,使數據恢復到總體中各層實際的比例結構。1、 樣 本均值:X 厘丄2Xnn2、.樣本標準差:S礙J% X)2 % X)2 區(qū)k»n3. 用樣本估計總體時,如果抽樣的方法比較合理, 那么樣本可以反映

6、總體的信息, 但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的。雖然我 們用樣本數據得到的分布、均值和標準差并不是總體的真正的分布、均值和標準差,而只是一個估計,但這種估計是合理的,特別是當樣本量很大時,它們確實 反映了總體的信息。4. (1)如果把一組數據中的每一個數據都加上或減去同一個共同的常數,標準 差不變(2) 如果把一組數據中的每一個數據乘以一個共同的常數k,標準差變?yōu)樵瓉?的k倍(3) 組數據中的最大值和最小值對標準差的影響,區(qū)間(X 3s,x 3s)的應用; “去掉一個最高分,去掉一個最低分”中的科學道理1、 概念:(1)回歸直線方程(2)回歸系數2. 回歸直線方程

7、的應用(1) 描述兩變量之間的依存關系;利用直線回歸方程即可定量描述兩個變量間依存的數量關系(2) 利用回歸方程進行預測;把預報因子(即自變量x )代入回歸方程對預報量(即因變量 Y)進行估計,即可得到個體 Y值的容許區(qū)間。(3) 利用回歸方程進行統(tǒng)計控制規(guī)定 Y值的變化,通過控制x的范圍來實現統(tǒng)計控制的目標。如已經得到了空氣中 NO的濃度和汽車流量間的 回歸方程,即可通過控制汽車流量來控制空氣中NO的濃度。4應用直線回歸的注意事項(1)做回歸分析要有實際意義;( 2)回歸分析前 , 最好先作出散點圖;(3)回歸直線不要外延。題型一選擇合適的抽樣方法簡單隨機抽樣 ,也叫純隨機抽樣。 就是從總體

8、中不加任何分組、劃類、排隊 等,完全隨機地抽取調查單位系統(tǒng)抽樣 (等距抽樣或機械抽樣) :把總體的單位進行排序,再計算出抽樣距 離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡 單隨機抽樣的辦法抽取。分層抽樣 (類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、 年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采 用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這 些子樣本合起來構成總體的樣本。1. 現有以下兩項調查:某裝訂廠平均每小時大約裝訂圖書362冊,要求檢驗員 每小時抽取40冊圖書,檢查其裝訂質量狀況;某市有大型、中型與小型的商店共1500家,三者數量之比為

9、1 : 5 : 9.為了調查全市商店每日零售額情況,抽取 其中15家進行調查. 完成、這兩項調查宜采用的抽樣方法依次是()A. 簡單隨機抽樣法,分層抽樣法B. 分層抽樣法,簡單隨機抽樣法C.分層抽樣法,系統(tǒng)抽樣法D .系統(tǒng)抽樣法,分層抽樣法2. 某社區(qū)有 400個家庭,其中高等收入家庭 120 戶,中等收入家庭 180戶,低收入家庭 1 0 0戶.為了調查社會購買力的某項指標, 要從中抽取一個容量為 100的樣 本記作;某校高一年級有 12名女排球運動員,要從中選出 3人調查學習負擔情 況,記作;那么,完成上述 2項調查應采用的抽樣方法是()A.用隨機抽樣法,用系統(tǒng)抽樣法B.用分層抽樣法,用隨

10、機抽樣法C.用系統(tǒng)抽樣法,用分層抽樣法D. 用分層抽樣法,用系統(tǒng)抽樣法題型二: 系統(tǒng)抽樣剔除個體數計算 當系統(tǒng)抽樣中樣本總量除以樣本容量不是整數時,需要用簡單隨機抽樣法剔除部分個體,剔除個35體的數量=樣本總量一組距卅羊本容量。例.若總體中含有 1650 個個體,現在要采用系統(tǒng)抽樣,從中抽取一個容量為的樣本,分段時應從總體中隨機剔除 個個體,編號后應均分為 _段,每段有 個個體.5,35,47題型三:分層抽樣有關計算 樣本容量分層抽樣特點:各層抽樣比例 =總體抽樣比例=,每層抽取個體數量=該層個體總量 抽樣總體容量比例。經典例題:某校高中部有三個年級,其中高三有學生1000人,現采用分層抽樣法

11、抽取一個容量為185的樣本,已知在高一年級抽取了75人,高二年級抽取了 60人,則高中部共有多少學生?練習.某單位業(yè)務人員、管理人員、后勤服務人員人數之比依次為15 : 3: 2.為了了解該單位職員的某種情況,采用分層抽樣方法抽出一個容量為n的樣本,樣本中業(yè)務人員人數為30,則此樣本的容量 門為( )C. 40D . 80題型四:頻率分布直方圖畫法步驟作頻率分布直方圖分布的步驟求極差(即一組數據中最大值與最小值的差)決定組距與組數,一般樣本容量越大組數越多,經常分為512組,組距盡量取整。將數據分組,通過唱票計算各組的頻數列頻率分布表,根據各組頻數計算頻率,列出頻率分布表畫出頻率分布直方圖,橫

12、軸只畫最小值與最大值之間部分,縱軸表示頻率組距的值題型五:由頻率分布直方圖估計眾數、平均數、中位數(由頻率分布直方圖估計眾數:一般先計算各部分小矩形的面積,找到面積最大的矩形,取該矩形橫邊中點對應的數即為所求(由頻率分布直方圖估計平均數:一般利用平均數公式 X X.P, x2p2xnpn來計算,其中Xn表示第n個矩形橫邊中點對應的數,Pn表示第n個矩形的面積。(由頻率分布直方圖估計中位數:就是平分直方圖面積且垂直于橫軸的直線對應的數。前n個小矩形面積不足時,不足部分數值中位數=下一個矩形橫邊左端點+x組距該小矩形面積題型六:頻率分布表中未知量計算各組頻數之和二樣本容量,各組頻率之和 =1,各組

13、頻數我率二樣本容 數據落在某區(qū)間的概率 V區(qū)間包括的各組頻率之和經典例題:為了了解小學生的體能情況,抽取了某小學同年級部分學生進行跳繩測試,將所得的數據整理后畫出頻率分布直方圖(如下圖),已知圖中從左到右的 前三個小組的頻率分別是,.第一小組的頻數是5.(1)求第四小組的頻率和參加這次測試的學生人數;(2)在這次測試中,學生跳繩次數的中位數落在第幾小組內?(3)參加這次測試跳繩次數在100次以上為優(yōu)秀,試估計該校此年級跳繩成績優(yōu)秀率是多少?組試估計該年級學生平均跳繩次數,中位數、眾數練習一.2005年降雨量的概率如下表所示:次數(1)求年降雨量在100,200范圍內的概率;(2)求年降雨量在1

14、50,200或250,300范圍內 的概率; 求年降雨量不在150,300范圍內的概率;(4)求年降雨量在100,300范圍內的概率.年降雨量/mm概率0. 120. 250. 160. 14練習2某地區(qū)的年降水量在下列范圍內的概率如下表所示年降水量(單位::100,:150,:200,:250,mm150)200)250)300)概率則年降水量在150, 300 (mm范圍內的概率為()A. B . C .D練習3. (2014重慶文17)(本小題滿分13分.(I )小問4分,(II )小問4分,(III )小問5分)20名學生某次數學考試成績(單位:分)的頻率分布直方圖如圖所示: 洞穿高考

15、預測題六(I)求頻率分布直方圖中a的值;(II )分別求出成績落在50,60與60,70中的學生人數;(III )從成績在50,70的學生中任選2人,求此2人的成績都在60,70中的概率.題型七:用平均數和方差判斷產品質量、成績好壞、產量高低等平均數和方差(標準差)都是反映數據離散程度的工具。成績好壞、產量高低等指標首先看平均數越高越好,當平均數相近或相同時,可以用方差(標準差)來刻畫樣本的穩(wěn)定性。題型八:求線性相關的兩個變量的回歸直線方程,并作出適當預測第一步:作散點圖第二步:求回歸方程第三步:代值計算nn_xx nX y(Xj x)(yi y)求線性回歸方程系數公式:I?匕,? y bX.X2 nX2(xi x)2i 1i 1重要結論正相關則 b> 0,負相關則bv 0,當解釋變量增加一個單位時,預報變量相應增加(b>0)或減少(b v 0) | b丨個單位? y bx , (x, y)稱為樣本點的中心,此點一定在回歸直線上。用回歸直線方程計算出的 y值不是真實值,真實值在計算值的左右,可能大,可能小也可能相等。相關指數R2用來刻畫擬合效果,R2的值越大,擬合效果越好,反之則越差,一般選擇 氏值大的模型。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論