數(shù)理統(tǒng)計學(xué)的基本思想是用樣本估計總體_第1頁
數(shù)理統(tǒng)計學(xué)的基本思想是用樣本估計總體_第2頁
數(shù)理統(tǒng)計學(xué)的基本思想是用樣本估計總體_第3頁
數(shù)理統(tǒng)計學(xué)的基本思想是用樣本估計總體_第4頁
數(shù)理統(tǒng)計學(xué)的基本思想是用樣本估計總體_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 統(tǒng) 計數(shù)理統(tǒng)計學(xué)的基本思想是用樣本估計總體,它主要研究兩個基本問題:一是如何從總體中抽取樣本,二是如何通過對所抽取的樣本進(jìn)行計算和分析,從而對總體的相應(yīng)情況作出推斷。本章是在初中“統(tǒng)計和概率初步”的基礎(chǔ)上學(xué)習(xí)的,其內(nèi)容可看成是以上內(nèi)容的深入和擴(kuò)展,但總的來說,所介紹的仍屬于統(tǒng)計中一些極其初步的知識?;A(chǔ)知識隨機抽樣 用樣本估計總體 變量間的相關(guān)關(guān)系隨機抽樣從總體中抽取樣本的方法叫抽樣方法,統(tǒng)計中涉及的抽樣方法很多,如果按照抽取時總體中的每個個體被抽取的概率是否相等來進(jìn)行分類,可分為等概率抽樣和不等概率抽樣,等概率抽樣又可分為不放回抽樣和放回抽樣。在抽樣中,如果每次抽出個體后不再將它放回總體,

2、稱這樣的抽樣為不放回抽樣;如果每次抽出個體后再將它放回總體,稱這樣的抽樣為放回抽樣常見的抽樣方法主要有簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣三種,它們的共同特點是在抽樣過程中每個個體被抽取的概率相等,這體現(xiàn)了這些抽樣方法的客觀性和公平性。1簡單隨機抽樣若一個總體的個體數(shù)有限,如果通過逐個抽取的方法從中不放回地抽取一個樣本,且每次抽取時,各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。(1)根據(jù)簡單隨機抽樣的定義,可以看到它有以下特點:它要求被抽取樣本的個體數(shù)有限,以便于對其中各個個體被抽取的概率進(jìn)行分析。它是從總體中逐個地進(jìn)行抽取,這樣便于在抽樣實踐中進(jìn)行操作。它是一種不放回抽樣,因而具有較

3、廣泛的實用性,也便于相關(guān)的分析和計算。它是一種等概率抽樣,不論是每次從總體中抽取一個個體,還是在整個抽樣過程當(dāng)中,每個個體被抽取的概率相等,從而保證了這種抽樣方法的公平性。值得注意的是,進(jìn)行簡單隨機抽樣時,“每次抽到一個個體時任一個體被抽到的概率”與“在整個抽樣過程中某個體被抽到的概率”是不同的,關(guān)于這一點,我們可結(jié)合實例,利用初中學(xué)過的概率初步知識加以體會。(2)實施簡單隨機抽樣,主要有兩種方法:抽簽法(抓鬮法)和隨機數(shù)表法。抽簽法(抓鬮法)就是在總體中個體數(shù)不多時,將總體中的個個體編號,把號碼寫在號簽上,再將號簽放在一個容器中攪拌均勻后,每次從中抽取一個號簽,連續(xù)抽取次,就得到一個容量為的

4、樣本。隨機數(shù)表中的十個數(shù)字是用計算機生成的隨機數(shù),它們在每個位置上等概率地出現(xiàn)。用隨機數(shù)表進(jìn)行抽樣的步驟是:將總體中的個體編號;選定開始的數(shù)字;獲取樣本號碼。2系統(tǒng)抽樣當(dāng)總體中的個體數(shù)目較多時,可將總體分成均衡的幾個部分,然后按照事先定出的規(guī)則,從每一部分抽取一定數(shù)目的個體,得到所需要的樣本,這種抽樣叫做系統(tǒng)抽樣。(1)系統(tǒng)抽樣的操作步驟為: 將個體編號;分段;確定起始的個體號;抽取樣本。 (2)關(guān)于系統(tǒng)抽樣,我們指出以幾點:系統(tǒng)抽樣適用于總體中的個體數(shù)較多的情況,因為這時采用簡單隨機抽樣就顯得不很方便;將總體中的個體均分后的每一段進(jìn)行抽樣時,采用的是簡單隨機抽樣;與簡單隨機抽樣一樣,系統(tǒng)抽樣

5、也屬于等概率抽樣。特別提示當(dāng)總體中的個體數(shù)不能被樣本容量整除時,可先用簡單隨機抽樣從總體中剔除幾個個體,使剩下的個體數(shù)能被樣本容量整除,然后再按系統(tǒng)抽樣進(jìn)行,這時在整個抽樣過程中每個個體被抽取的概率仍然是相等的。3分層抽樣當(dāng)已知總體由差異明顯的幾部分組成時,為了使樣本更充分地反映總體的這種情況,常將總體分成幾部分,然后按照各部分所占的比進(jìn)行抽樣,這種抽樣方法叫做分層抽樣,其中所分成的各部分叫做層。(1)分層抽樣的步驟是:分層;按比例確定各層抽取對象;各層抽樣;綜合各層,組成樣本。(2) 分層抽樣的特點是:分層抽樣適用于總體由差異明顯的幾個部分組成的情況;在每一層進(jìn)行抽樣時,采用簡單隨機抽樣或系

6、統(tǒng)抽樣;分層抽樣也是等概率抽樣。特別提示簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣這三種抽樣方法的聯(lián)系與適用范圍見下表:類別共同點各自特點相互聯(lián)系適用范圍簡單隨機抽樣都是不放回抽樣,抽樣過程中,每個個體被抽到的機會(概率)相等從總體中逐個抽取總體中的個體數(shù)較少系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則,在各部分抽取在起始部分抽樣時,采用簡單隨機抽樣總體中的個體數(shù)較多分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時,采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成用樣本估計總體總體取值的概率分布規(guī)律通常稱為總體分布。為了考察一個總體的情況,在統(tǒng)計中通常是從總體中抽取一個樣本,用樣本的有關(guān)情況去估計總體

7、的相應(yīng)情況。這種估計大體分為兩類:1用樣本的頻率分布去估計總體分布樣本頻率是指樣本在某一范圍內(nèi)的個數(shù)(頻數(shù))與樣本總體的比值,樣本的頻率分布常用頻率分布表、頻率分布直方圖、頻率分布折線圖、總體密度曲線、莖葉圖等來表示。(1)頻率分布表、頻率分布直方圖:是指在用樣本估計總體時,通過各個小組數(shù)據(jù)在樣本容量中所占比例大小的角度來表示頻率分布的規(guī)律,它可以使我們看到整個樣本數(shù)據(jù)的頻率分布。其具體操作步驟是: 求極差,即求出一組數(shù)據(jù)中最大值與最小值的差; 決定組距與組數(shù),組數(shù)應(yīng)力求合適,一般分成10組左右; 將數(shù)據(jù)分組; 列頻率分布表,將上述分組、頻數(shù)累計、頻數(shù)、頻率列成表格; 畫頻率分布直方圖,圖中各

8、小長方形的面積等于相應(yīng)各組的頻率,這個圖形的面積的形式反映了數(shù)據(jù)落在各個小組的頻率的大小,且圖中各小矩形的面積的和等于1需要指出的是:在反映樣本的頻率分布方面,頻率分布表在數(shù)量表示上比較確切,而頻率分布直方圖及初中學(xué)過的頻率分布條形圖則比較直觀,兩者相互補充,使我們對數(shù)據(jù)的頻率分布情況了解得更加清楚 當(dāng)總體中的個體取不同數(shù)值很少時,其頻率分布表由所取樣本不同數(shù)值及其相應(yīng)的頻率來表示,其幾何表示就是相應(yīng)的條形圖;當(dāng)總體中的個體取不同數(shù)值較多甚至無限時,對其頻率分布的研究要用到初中學(xué)過的整理樣本數(shù)據(jù)的知識,將樣本數(shù)據(jù)恰當(dāng)?shù)胤纸M,用各組的頻率來描繪總體的分布,其幾何表示就是相應(yīng)的直方圖。頻率分布條形

9、圖和直方圖的不同之處在于:前者用其高度來表示取各個值的頻率,而后者是用圖形面積的大小來表示在各個區(qū)間內(nèi)取值的頻率。(2)頻率分布折線圖:順次連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖。(3)總體密度曲線:樣本容量越大,所分組數(shù)越多,各組的頻率就越接近于總體在相應(yīng)各組取值的概率設(shè)想樣本容量無限增大,分組的組距無限縮小,那么頻率分布直方圖和頻率分布折線圖就會無限接近于一條光滑曲線,這條曲線叫做總體密度曲線(5)莖葉圖:與前面提到的圖、表類似,莖葉圖也可以用來表示樣本數(shù)據(jù)的分布情況,“莖”是指中間的一列數(shù),“葉”就是從“莖”的旁邊生長出來的數(shù)。用莖葉圖表示有兩個突出的優(yōu)點,其一,

10、從統(tǒng)計圖上沒有信息的損失,所有的信息都可以從莖葉圖中得到;其二,莖葉圖可以隨時記錄與表示。但莖葉圖一般只能表示兩位的整數(shù)。2用樣本的數(shù)字特征估計總體的數(shù)字特征樣本的數(shù)字特征有平均數(shù)、眾數(shù)、中位數(shù)、標(biāo)準(zhǔn)差、方差等。平均數(shù)、中位數(shù)、眾數(shù)都是描述數(shù)據(jù)集中趨勢的重要特征數(shù),它們既有聯(lián)系又有區(qū)別,應(yīng)用時可根據(jù)具體情況進(jìn)行選擇。(1)平均數(shù):就是一組數(shù)據(jù)的平均值。(2)眾數(shù):就是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)據(jù)。(3)中位數(shù):就是一組數(shù)據(jù)按從小到大(或從大到小)的次序排列后,位于中間的那個數(shù)據(jù)(當(dāng)數(shù)據(jù)個數(shù)為奇數(shù)個),或者是位于中間的兩個數(shù)的平均數(shù)(當(dāng)數(shù)據(jù)個數(shù)為偶數(shù)個)。特別提示平均數(shù)雖然常可幫助我們了解一

11、組數(shù)據(jù)的平均水平,但有時因受到該組數(shù)據(jù)中特別大或特別小數(shù)據(jù)的影響,不容易把數(shù)據(jù)的集中趨勢與特征表示出來,所以有時我們用中位數(shù)或眾數(shù)來代替平均數(shù)比較合理。(4)總體方差與總體標(biāo)準(zhǔn)差是描述一個總體的波動大小的特征量,可以通過計算樣本方差與標(biāo)準(zhǔn)差對總體方差與標(biāo)準(zhǔn)差進(jìn)行估計。樣本方差公式是;樣本標(biāo)準(zhǔn)差公式是;其中,分別是樣本中個體的取值,是樣本的平均數(shù)。特別提示(1)由于方差和標(biāo)準(zhǔn)差的計算量一般較大,所以通常需要借助科學(xué)計算器;(2)方差和標(biāo)準(zhǔn)差的大小反映了總體或者樣本的波動程度,可以對諸如均衡性、穩(wěn)定性、差異性等作出描述;(3)在分別利用方差和標(biāo)準(zhǔn)差對不同總體和樣本進(jìn)行比較時,其效果是等價的。 變量

12、間的相關(guān)關(guān)系變量之間存在著兩類關(guān)系:一類是函數(shù)關(guān)系,這是一種確定的關(guān)系,另一類是相關(guān)關(guān)系,這是一種非確定關(guān)系,這兩類關(guān)系在一定條件下可以相互轉(zhuǎn)化。1變量間的相關(guān)關(guān)系當(dāng)自變量一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關(guān)系稱為相關(guān)關(guān)系。(1)相關(guān)關(guān)系是非隨機變量與隨機變量之間的關(guān)系,函數(shù)關(guān)系是兩個非隨機變量之間的關(guān)系,是一種因果關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系,所以相關(guān)關(guān)系與函數(shù)關(guān)系不同,其變量具有隨機性,因此相關(guān)關(guān)系是一種非確定性關(guān)系,既有因果關(guān)系,也有伴隨關(guān)系。(2)相關(guān)關(guān)系與函數(shù)關(guān)系的異同點是:相同點:均是指兩個變量的關(guān)系;不同點:函數(shù)關(guān)系是一種確定的關(guān)系,而相關(guān)關(guān)系是一種非確定關(guān)

13、系;函數(shù)關(guān)系是自變量與因變量之間的關(guān)系,這種關(guān)系是兩個非隨機變量的關(guān)系;而相關(guān)關(guān)系是非隨機變量與隨機變量的關(guān)系2兩個變量的線性相關(guān)(1)回歸分析:兩個變量的相關(guān)關(guān)系有正相關(guān)、負(fù)相關(guān),對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法叫做回歸分析。通俗地講,回歸分析是尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性。(2)一元線性回歸分析:如果因變量僅與一個自變量有關(guān),且因變量與自變量的關(guān)系是線性的,這樣的回歸分析叫一元線性回歸分析,它是回歸分析中最基本的一種類型。(3)散點圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖,散點圖形象地反映了各對數(shù)據(jù)的密切程度。(4)線性相關(guān)與回歸直線:如果散點圖中點的分

14、布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線。(5)回歸直線方程:設(shè)與是具有相關(guān)關(guān)系的兩個變量,且相應(yīng)于組觀測值的個點大致分布在一條直線附近,則由,,所得到的直線方程叫做回歸直線方程,是回歸方程的斜率,是截距,相應(yīng)的直線叫做回歸直線,而對這兩個變量所進(jìn)行的統(tǒng)計分析就是線性回歸分析。利用計算器或計算機的軟件,可以方便地求出回歸直線方程。(6)最小二乘法:在求回歸直線時,上述公式中選取的使得誤差的平方和最小,也就是使得樣本數(shù)據(jù)的點到它的距離的平方和最小,這一方法稱為最小二乘法。值得指出的是,討論變量是否線性相關(guān),應(yīng)先進(jìn)行相關(guān)性檢驗,在確認(rèn)線性相關(guān)后,再求

15、回歸直線。相關(guān)性檢驗的有關(guān)概念、方法和步驟,本章不作學(xué)習(xí)要求?;炯寄茈S機抽樣的基本技能 變用樣本估計總體的基本技能 變量間相關(guān)關(guān)系的基本技能現(xiàn)代社會是信息化的社會,人們常常需要收集數(shù)據(jù),根據(jù)所獲得的數(shù)據(jù)提取有價值的信息,作出合理的決策。統(tǒng)計是研究如何合理收集、整理、分析數(shù)據(jù)的學(xué)科,它可以為人們制定決策提供依據(jù)。隨機現(xiàn)象在日常生活中隨處可見,下一章即將學(xué)習(xí)的概率則是研究隨機現(xiàn)象規(guī)律的學(xué)科,它為人們認(rèn)識客觀世界提供了重要的思維模式和解決問題的方法,同時為統(tǒng)計學(xué)的發(fā)展提供了理論基礎(chǔ)。因此,統(tǒng)計與概率的基本技能已經(jīng)成為一個未來公民的必備常識。隨機抽樣的基本技能隨機抽樣是運用統(tǒng)計方法解決問題的第一步,

16、簡單隨機抽樣是隨機抽樣中最簡單的一種模型,它是分層抽樣、系統(tǒng)抽樣以及其它更復(fù)雜抽樣方法的基礎(chǔ),“隨機抽樣”與“簡單隨機抽樣”是兩個不同的概念。這一內(nèi)容的基本技能主要表現(xiàn)在對三種常用抽樣方法的理解、選擇并正確運用,體會統(tǒng)計的作用和基本思想,用統(tǒng)計的思想去分析、解決實際問題。1能從現(xiàn)實生活或其他學(xué)科中提出具有一定價值的統(tǒng)計問題。2結(jié)合具體的實際問題情境,理解隨機抽樣的必要性和重要性。3會對三種抽樣方法進(jìn)行比較和判斷。在參與解決統(tǒng)計問題的過程中,學(xué)會用簡單隨機抽樣方法(抽簽法、隨機數(shù)表法)從總體中抽取樣本;通過對實例的分析,了解分層抽樣和系統(tǒng)抽樣方法。4能通過試驗、查閱資料、設(shè)計調(diào)查問卷等方法收集數(shù)

17、據(jù)。用樣本估計總體的基本技能用樣本估計總體涉及兩方面的問題。一是如何用樣本的頻率分布去估計總體分布,二是如何用樣本的某種數(shù)字特征去估計總體的相應(yīng)特征數(shù)。這一內(nèi)容的基本技能主要表現(xiàn)在能結(jié)合具體問題對統(tǒng)計中的概念進(jìn)行描述性說明,學(xué)會從數(shù)據(jù)中提取信息,深入體會統(tǒng)計結(jié)果的隨機性,培養(yǎng)基本計算、抽象概括、綜合分析問題的能力,而不是簡單地把統(tǒng)計處理成數(shù)字運算和畫圖表。1通過實例體會分布的意義和作用。在表示樣本數(shù)據(jù)的過程中,能用多種方法繪制統(tǒng)計表和統(tǒng)計圖,學(xué)會列頻率分布表、畫頻率分布直方圖、頻率分布折線圖、莖葉圖,體會它們各自的特點。2通過實例理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用。會利用計算器計算平均數(shù)、標(biāo)準(zhǔn)差、

18、方差,會判斷眾數(shù)、中位數(shù)。3能根據(jù)實際問題的需求合理地選取樣本。從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋。4在解決統(tǒng)計問題的過程中,進(jìn)一步體會用樣本估計總體的思想。會用樣本的頻率分布估計總體分布,會用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征;體會樣本頻率分布和數(shù)字特征的隨機性。5會用隨機抽樣的基本方法和樣本估計總體的思想,解決一些簡單的實際問題。能通過對數(shù)據(jù)的分析為合理的決策提供一些依據(jù),認(rèn)識統(tǒng)計的作用。6體會統(tǒng)計思維與確定性思維的差異。通過解決實際問題,較為系統(tǒng)地經(jīng)歷數(shù)據(jù)收集與處理的全過程,形成對數(shù)據(jù)處理過程進(jìn)行初步評價的意識。變量間相關(guān)關(guān)系的基本技能兩個變量間的關(guān)系,除了函數(shù)關(guān)系這種確定性關(guān)系以外,還大量存在因變量的取值帶有一定隨機性的相關(guān)關(guān)系,一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論