統(tǒng)計學筆記.doc_第1頁
統(tǒng)計學筆記.doc_第2頁
統(tǒng)計學筆記.doc_第3頁
統(tǒng)計學筆記.doc_第4頁
統(tǒng)計學筆記.doc_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

精品文檔第一章 總 論第一節(jié) 統(tǒng)計學概述一、什么是統(tǒng)計學1、統(tǒng)計學的定義: 統(tǒng)計學是一門關(guān)于數(shù)據(jù)的科學,是一門關(guān)于數(shù)據(jù)的收集、整理、分析、解釋和推斷的科學。2、統(tǒng)計的三種含義:統(tǒng)計工作對現(xiàn)象的數(shù)量進行搜集、整理和分析的活動過程統(tǒng)計資料通過統(tǒng)計實踐活動取得的說明對象某種數(shù)量特征的數(shù)據(jù)統(tǒng)計學是關(guān)于數(shù)據(jù)的一門科學三者之間的關(guān)系:統(tǒng)計工作與統(tǒng)計資料是工作與工作成果關(guān)系,三者之間是實踐與理論關(guān)系3、統(tǒng)計學的研究對象: 一切自然與社會現(xiàn)象總體的數(shù)量特征及其相互關(guān)系特點:數(shù)量性、總體性、變異性4、統(tǒng)計學的研究方法大量觀察法、統(tǒng)計指標法、統(tǒng)計推斷法二、統(tǒng)計學的產(chǎn)生與發(fā)展1、古典統(tǒng)計學(17世紀中18世紀中):記述學派和政治算術(shù)學派2、近代統(tǒng)計學(18世紀末19世紀末):數(shù)量統(tǒng)計學派和社會統(tǒng)計學派3、現(xiàn)代統(tǒng)計學(20世紀至今)三、統(tǒng)計學的分類1、理論統(tǒng)計學:研究的內(nèi)容是統(tǒng)計的一般理論和方法v 描述統(tǒng)計學 用圖形、表格和數(shù)值方法來匯總數(shù)據(jù)的統(tǒng)計學。v 推斷統(tǒng)計學 用樣本數(shù)據(jù)對總體的某些特征進行估計和假設(shè)檢驗的統(tǒng)計學。2、應(yīng)用統(tǒng)計學:研究的內(nèi)容是運用于某一特定領(lǐng)域的統(tǒng)計問題第二節(jié) 統(tǒng)計學的基本概念一、統(tǒng)計總體與總體單位1、統(tǒng)計總體:由客觀存在的、在同一性質(zhì)基礎(chǔ)上結(jié)合起來的許多個別單位所形成的集合。具有大量性、同質(zhì)性和變異性等特點2、總體單位:指構(gòu)成總體的個體即每一個單位??傮w由總體單位構(gòu)成,要認識總體必須從總體單位開始,總體是統(tǒng)計認識的對象。總體或總體單位的區(qū)分不是固定的:同一個研究對象,在一種情況下是總體,在另一種情況下可能成了總體單位。3、統(tǒng)計總體的種類(1)有限總體:指所包含的單位數(shù)目有限的總體無限總體:指所包含的單位數(shù)目無限的總體(2)大總體小總體:指大總體的各組成部分(3)可加總體:指總體單位可以合計的總體不可加總體:指總體單位不能合計的總體二、標志與變量1、標志:指總體單位所具有的屬性和特征,標志的具體表現(xiàn)稱為標志值。(1)品質(zhì)標志:是表明事物“質(zhì)” 的特性的標志數(shù)量標志:是表明事物“量” 的特性的標志其中,可變的數(shù)量標志又被叫作變量統(tǒng)計研究是從登記標志開始,并通過對標志的綜合來反映總體的數(shù)量特征,因此標志是統(tǒng)計研究的起點。(2)總體單位標志分為不變標志(標志表現(xiàn)無差異)和變異標志(標志表現(xiàn)有差異)2、變量的種類確定性變量:指受確定性因素影響的變量隨機變量:指受隨機因素影響的變量連續(xù)型變量:在一個區(qū)間內(nèi)可以連續(xù)不斷取值的變量離散型變量:其一切可能取值都以整數(shù)形式出現(xiàn),并可以一一列舉的變量三、指標與指標體系1、統(tǒng)計指標:反映社會經(jīng)濟現(xiàn)象總體數(shù)量特征的概念及其具體數(shù)值構(gòu)成要素:時間限制、空間限制、指標名稱、具體數(shù)值、計量單位性質(zhì):數(shù)量性、具體性、綜合性2、標志與指標的聯(lián)系與區(qū)別:聯(lián)系:(1)標志是總體指標的來源和基礎(chǔ),指標則是標志的綜合。(2)數(shù)量標志與指標之間存在著變換關(guān)系。區(qū)別:(1)標志是說明總體單位特征的,指標則是說明統(tǒng)計總體數(shù)量特征的。(2)有的標志用數(shù)值表示,有的標志用文字表示,而指標都是用數(shù)值表示的。3、統(tǒng)計指標的分類()按表現(xiàn)形式分:總量指標、相對指標、平均指標()按內(nèi)容特征分:數(shù)量指標、質(zhì)量指標v 數(shù)量指標: 反映的是所研究總體的規(guī)模和水平,其大小取決于總體單位數(shù)目的多少及其標志水平的高低。v 質(zhì)量指標: 反映的是與總體單位數(shù)相對應(yīng)的標志的平均水平或其它數(shù)量對比關(guān)系。()按計量單位分:實物指標、價值指標、勞動指標()按時間特征分:時期指標、時點指標、統(tǒng)計指標體系:具有某種內(nèi)在聯(lián)系的一系列統(tǒng)計指標所構(gòu)成的整體作用:全面、綜合地對客觀事物進行描述、分析。、樣本:由總體的部分單位組成的集合第二章統(tǒng)計數(shù)據(jù)的收集2.1 統(tǒng)計測量尺度一、統(tǒng)計測量尺度的概念與種類分類、標識、統(tǒng)計測量:運用某種方法使自然或社會經(jīng)濟現(xiàn)象量化。測量結(jié)果:形成變量或指標2、統(tǒng)計測量尺度的種類()定類尺度按現(xiàn)象性質(zhì)差異進行的辨別與區(qū)分。測量結(jié)果形成定類變量或定類指標。定類變量或指標確切的值是以文字表述的,可以用數(shù)值標識,但僅起標簽作用。定類變量或指標的各類別間是平等的,沒有高低、大小、優(yōu)劣之分。()定類尺度對現(xiàn)象順序差異進行的辨別與區(qū)分。測量結(jié)果形成定序變量或定序指標。定序變量或指標確切的值是以文字表述的,也可以用數(shù)值標識,也僅起標簽作用。定序變量或指標各類別間有高低優(yōu)劣之分,不能隨意排列,但差異無法準確計量。()定距尺度按現(xiàn)象絕對數(shù)量差異進行的辨別與區(qū)分。測量結(jié)果形成定距變量或定距指標。定距變量或指標的值以數(shù)字表述,有計量單位,可以進行加減運算。定距變量或指標各類別間自然有大小之分,但沒有絕對的零點,不能進行乘除運算。()定比尺度對現(xiàn)象絕對差異與相對差異進行的辨別與區(qū)分。測量結(jié)果形成定比變量或定比指標。定比變量或指標確切的值也以數(shù)字表述,有計量單位 ,可以進行加減運算。定比變量或指標有絕對意義上的零點,既可以加減運算,也可以乘除運算。3、數(shù)據(jù)度量尺度(1)定類尺度:無等級次序排列 例如:男-女從事工作的行業(yè)(2)定序尺度: 可作等級次序排列 例如:公司職位產(chǎn)品滿意度(3)定距尺度: 沒有真正的零點 例如,溫度(4)定比尺度:存在真正的零點倍數(shù)有意義例,身高、體重4、數(shù)據(jù)度量與信息含量()度量尺度的信息含量由弱到強排列:定類尺度定序尺度定距尺度定比尺度() 定類尺度和定序尺度用于屬性數(shù)據(jù):信息量低() 定距尺度和定比尺度用于數(shù)值數(shù)據(jù):信息量高二、統(tǒng)計測量尺度的作用第一,決定數(shù)據(jù)的整理、顯示方法第二,決定數(shù)據(jù)的分析方法第三,決定計算機的處理方法注意:在自然或社會經(jīng)濟領(lǐng)域里,單純的定距變量是很少的,絕大多數(shù)定距變量同時也是定比變量。定距測量與定比測量的區(qū)別只在理論上有意義,在實際工作中常將二者歸為一類。三、測量層次與測量尺度的正確應(yīng)用、對測量尺度層次的判斷較低層次的測量尺度較高層次的測量尺度小 信息數(shù)量 大少 計算方法 多低 測量精度 高 定類尺度、定序尺度、定距尺度、定比尺度的層次:由高至低2、測量尺度的正確應(yīng)用對于不同的現(xiàn)象,要注意準確性;對數(shù)量差異的度量,要注意層次2.2 原始數(shù)據(jù)的收集方法一、統(tǒng)計調(diào)查概述1、統(tǒng)計調(diào)查:收集原始數(shù)據(jù)資料 的統(tǒng)計活動過程要求:準確、及時、全面、系統(tǒng)統(tǒng)計調(diào)查是整個統(tǒng)計認識活動的基礎(chǔ),決定著統(tǒng)計認識過程及其結(jié)果的成敗 2、統(tǒng)計調(diào)查的種類按調(diào)查單位的范圍大小分為非全面調(diào)查、全面調(diào)查按調(diào)查時間是否連續(xù)分為連續(xù)性調(diào)查、一次性調(diào)查按調(diào)查的組織方式不同分為統(tǒng)計報表、專門調(diào)查(普查、重點調(diào)查、典型調(diào)查、抽樣調(diào)查)3、統(tǒng)計調(diào)查的組織方式()統(tǒng)計報表:指按照國家統(tǒng)一規(guī)定的各項要求,自下而上地定期向國家和主管部門報送基本統(tǒng)計資料的一種報告制度優(yōu)點:能保證統(tǒng)計資料的全面性和連續(xù)性;能保證統(tǒng)計資料的統(tǒng)一性和及時性;能滿足各級部門對統(tǒng)計資料的需要局限:統(tǒng)計報表過多會增加基層負擔;有可能由于虛報瞞報而影響統(tǒng)計資料質(zhì)量()普查:指國家為詳盡了解某項重要的國情國力而專門組織的一次性全面調(diào)查作用:可以為抽樣調(diào)查提供抽樣框;可以收集統(tǒng)計報表所不能提供的反映重大國情國力的基本統(tǒng)計信息局限:由于需要大量的人力、物力和財力,不宜經(jīng)常進行()重點調(diào)查:為了解總體基本情況,在調(diào)查對象中只選擇一部分重點單位 進行調(diào)查的一種非全面調(diào)查組織方式作用:能以較少的投入和較快的速度取得總體基本情況及變動趨勢的資料局限:只適用于客觀存在著重點單位的情況()典型調(diào)查:在對調(diào)查對象有一定了解的基礎(chǔ)上,有意識地選擇少數(shù)典型單位 進行調(diào)查的一種非全面調(diào)查組織方式作用:一定條件下能估計總體指標數(shù)值;可以補充全面調(diào)查的不足;可以用來研究新生事物局限:不能確定推斷的把握程度,無法計算和控制推斷誤差()抽樣調(diào)查:按照隨機原則 從調(diào)查對象中抽取一部分樣本單位進行調(diào)查,再用樣本資料推斷把握總體的數(shù)量特征的一種非全面調(diào)查組織方式特點:按隨機原則抽取樣本單位;目的是推斷總體的數(shù)量特征;抽樣誤差可以事先計算并控制優(yōu)點:能用較少的人力、物力和時間達到全面調(diào)查的目的;調(diào)查資料的準確性較高、受人為干擾的可能性較小、統(tǒng)計調(diào)查的主要技術(shù)方法觀察記錄法、報告法、訪問調(diào)查法二、統(tǒng)計調(diào)查方案、統(tǒng)計調(diào)查方案:用來指導(dǎo)整個調(diào)查工作的綱領(lǐng)性文件,是統(tǒng)計設(shè)計在統(tǒng)計調(diào)查階段的具體化、基本內(nèi)容:調(diào)查目的;調(diào)查對象與調(diào)查單位;調(diào)查項目與調(diào)查表;調(diào)查時間;制定調(diào)查工作的組織實施計劃。三、問卷設(shè)計、問卷調(diào)查:主要指非政府性統(tǒng)計機構(gòu)或個人所從事的對人的主觀意見的調(diào)查工作,也稱作民意調(diào)查或民意測驗調(diào)查問卷的基本格式:表頭(說明詞:解釋調(diào)查意義、表達感激之情等);表體(主題問句:被調(diào)查者基本情況、調(diào)查項目);表腳(作業(yè)記錄:時間、操作者等)2、調(diào)查對象:被調(diào)查現(xiàn)象的物質(zhì)承擔者指,是總體在調(diào)查階段的具體化調(diào)查單位:指構(gòu)成調(diào)查對象的每一個總體單位3、調(diào)查問卷的問題類型:封閉式問題、開放式問題4、問卷調(diào)查的基本要求主題明確、提問科學、邏輯性強、容量適度2.3 次級資料的收集一、次級資料指已經(jīng)被收集、加工整理成型的數(shù)據(jù)信息二、次級資料的主要收集渠道:查閱公開出版物;向政府統(tǒng)計機構(gòu)咨詢;向其他機構(gòu)咨詢;網(wǎng)上查詢。2.4 統(tǒng)計調(diào)查誤差一、調(diào)查誤差指收集來的數(shù)據(jù)資料與真實情況間的差異二、調(diào)查誤差的種類、登記誤差:由于人的主觀故意或失誤而產(chǎn)生的誤差,理論上它可以用某種方法加以消除、代表性誤差(隨機誤差):由部分單位數(shù)值來推斷總體數(shù)值所產(chǎn)生的誤差,它不可以消除,但可以加以控制第三章 統(tǒng)計數(shù)據(jù)的整理與顯示3.1 統(tǒng)計整理與統(tǒng)計分組一、統(tǒng)計整理的意義和步驟、統(tǒng)計整理:將統(tǒng)計調(diào)查得到的原始資料進行科學的分組和匯總形成綜合統(tǒng)計資料的工作過程、統(tǒng)計整理的內(nèi)容統(tǒng)計數(shù)據(jù)的處理: 統(tǒng)計資料的分組、匯總及制表統(tǒng)計數(shù)據(jù)的管理: 數(shù)據(jù)的傳輸、貯存、更新及輸出、統(tǒng)計整理的步驟制定統(tǒng)計整理方案、對原始資料進行審核、數(shù)據(jù)處理、制作統(tǒng)計表和統(tǒng)計圖二、統(tǒng)計整理的基本方法(一)統(tǒng)計分組:將總體中所有單位按一定的標志分為性質(zhì)不同但又有聯(lián)系的若干部分的過程、統(tǒng)計分組的作用q 劃分社會經(jīng)濟現(xiàn)象的類型q 反映社會經(jīng)濟現(xiàn)象的內(nèi)部結(jié)構(gòu)和比例關(guān)系q 揭示社會經(jīng)濟現(xiàn)象之間的相互依存關(guān)系、統(tǒng)計分組的程序選擇分組標志、確定分組體系、總體單位歸類、統(tǒng)計分組的原則科學性、完備性、互斥性(二)分組體系:指同時使用兩個以上標志分組時,分組標志的組合形式。平行分組體系、交叉分組體系3.2 分布數(shù)列的編制一、分布數(shù)列的定義及種類、分布數(shù)列:將總體各單位按某個標志分成若干組,列出各組的總體單位數(shù)或各組在總體中所占的比重而形成的數(shù)列構(gòu)成要素:分組標志的具體表現(xiàn)、各組的次數(shù)或頻率分類:變量數(shù)列品質(zhì)數(shù)列異距數(shù)列等距數(shù)列組距數(shù)列單值數(shù)列二、變量數(shù)列的編制、單值數(shù)列:指每個組值只用一個具體的變量值表現(xiàn)的數(shù)列編制條件:變量是離散變量;變量的不同取值個數(shù)較少、組距數(shù)列:指每個組的變量值用一個區(qū)間來表現(xiàn)的變量數(shù)列編制條件:變量是連續(xù)變量;或:總體單位數(shù)較多,變量不同取值個數(shù)也較多的離散變量。分類:等距數(shù)列、異距數(shù)列、相關(guān)概念組限:指每組兩端表示各組界限的變量值,各組的最小值為下限,最大值為上限組距:每組變量值變動區(qū)間的長度,為上下限之差組中值:每組變量取值范圍的中點數(shù)值 組中值=開口式組距數(shù)列組中值的計算: 、編制等距數(shù)列步驟()求變異全距()確定組距及組數(shù): R組距(d) 組數(shù)(m) 確定組距的原則:q 要能區(qū)分各組的性質(zhì)差異q 要能反映總體資料的分布特征q 為方便計算,盡可能為5或10的整數(shù)倍 計算組數(shù)(組數(shù)不宜過多,也不宜太少) (當 的結(jié)果為整數(shù)時)(當 的結(jié)果為小數(shù)時)(3)確定組限q 對于離散變量,相鄰組組限可以間斷,也可重疊;q 對于連續(xù)變量,相鄰組組限必須重疊;q 符合“上組限不計入”原則;q 首末兩組可使用“以下”及“以上”的開口組。() 計算次數(shù)三、累計次數(shù)與累計頻率1、頻率:各組單位數(shù)占總體單位總數(shù)的比重2、累計次數(shù)(頻率) 向上累計:從變量值高的組開始,將各組次數(shù)(頻率)逐次向變量值低的組累計 向下累計:從變量值低的組開始,將各組次數(shù)(頻率)逐次向變量值高的組累計3.3 統(tǒng)計圖表一、統(tǒng)計圖 以點、線條、面積等方法描述、顯示統(tǒng)計數(shù)據(jù)的形式組成:坐標系、圖形、圖例二、統(tǒng)計表 以縱橫交叉的線條所形成的表格來表現(xiàn)統(tǒng)計資料的形式1、 常用結(jié)構(gòu):總標題、主詞欄、賓詞欄、數(shù)據(jù)欄2、 統(tǒng)計表的編制規(guī)則選擇合適的總標題;主詞欄與賓詞欄要各歸其位,相互對應(yīng);表的上、下端用粗線或雙線封口,左右兩端一般不封口;可在各列的文字標題下面設(shè)置編號加以標識;數(shù)據(jù)欄不能有空白。第四章 變量數(shù)列分析4.1 集中趨勢的測定一、集中趨勢的涵義 指總體中各單位的次數(shù)分布從兩邊向中間集中的趨勢,用平均指標來反映。測定集中趨勢的意義:q 可以反映現(xiàn)象總體的客觀規(guī)定性;q 可以對比同類現(xiàn)象在不同的時間、地點和條件下的一般水平;q 可以分析現(xiàn)象之間的依存關(guān)系。二、平均指標的種類及計算方法(一)算術(shù)平均數(shù)1、簡單算術(shù)平均數(shù):適用于總體資料未經(jīng)分組整理、尚為原始資料的情況 2、加權(quán)算術(shù)平均數(shù):適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況 (說明若資料為組距數(shù)列,則應(yīng)取各組的組中值作為該組的代表值用于計算)(1)權(quán)數(shù):指變量數(shù)列中各組標志值出現(xiàn)的次數(shù),是變量值的承擔者,反映了各組的標志值對平均數(shù)的影響程度 表現(xiàn)為次數(shù)、頻數(shù)、單位數(shù);即公式 中的 絕對權(quán)數(shù):表現(xiàn)為次數(shù)、頻數(shù)、單位數(shù) 相對權(quán)數(shù):表現(xiàn)為頻率、比重算術(shù)平均數(shù)的計算取決于變量值和權(quán)數(shù)的共同作用:變量值決定平均數(shù)的范圍;權(quán)數(shù)則決定平均數(shù)的位置3、 算術(shù)平均數(shù)的數(shù)學性質(zhì)變量值與其算術(shù)平均數(shù)的離差之和衡等于零;變量值與其算術(shù)平均數(shù)的離差平方和為最小,(二)調(diào)和平均數(shù) 是總體各單位標志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又叫倒數(shù)平均數(shù)1、簡單調(diào)和平均數(shù):適用于總體資料未經(jīng)分組整理、尚為原始資料的情況 2、加權(quán)調(diào)和平均數(shù):適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況3、調(diào)和平均數(shù)的應(yīng)用:當已知各組變量值和標志總量時,作為算術(shù)平均數(shù)的變形使用。(三)幾何平均數(shù) 是N項變量值連乘積的開N次方根1、應(yīng)用:用于計算現(xiàn)象的平均比率或平均速度2、應(yīng)用的前提條件q 各個比率或速度的連乘積等于總比率或總速度;q 相乘的各個比率或速度不為零或負值。3、簡單幾何平均數(shù):適用于總體資料未經(jīng)分組整理尚為原始資料的情況 4、加權(quán)幾何平均數(shù):適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況 同一資料, (四)中位數(shù) 將總體各單位標志值按大小順序排列后,指處于數(shù)列中間位置的標志值。不受極端數(shù)值的影響,在總體標志值差異很大時,具有較強的代表性。1、未分組數(shù)據(jù):首先排序,再按數(shù)據(jù)n為奇數(shù)和偶數(shù)進行計算中位數(shù)2、單值數(shù)據(jù):首先排序,然后根據(jù)中位數(shù)的位次對照累積計數(shù)確定中位數(shù)所在組,該組的標志值即為中位數(shù)3、組距數(shù)據(jù)(五)眾數(shù) 指總體中出現(xiàn)次數(shù)最多的變量值,它不受極端數(shù)值的影響,用來說明總體中大多數(shù)單位所達到的一般水平。1、 單值數(shù)據(jù)2、 組距數(shù)據(jù)(六)數(shù)據(jù)分布 表明數(shù)據(jù)是如何分布的 偏態(tài)與 對稱左偏: 均值中位數(shù)對稱(零偏度) :均值 = 中位數(shù)(七)百分位數(shù) 第p個百分位數(shù)是這樣的數(shù)值:至少有p%個數(shù)值跟它一樣大或比它小;至少有(100p)%個數(shù)值跟它一樣大或比它大。 四分位數(shù):通常將數(shù)據(jù)分成四個部分是合乎需要的,每一部分大約包括1/4或25%的數(shù)據(jù),分位點稱為四分位數(shù)。4.2 離中趨勢的測定一、離中趨勢的涵義 指總體中各單位標志值背離分布中心的規(guī)模或程度,用標志變異指標來反映。1、變異指標值越大,平均指標的代表性越??;反之,平均指標的代表性越大2、測定離中趨勢的意義q 用來衡量和比較平均數(shù)代表性的大??;q 用來反映社會經(jīng)濟活動過程的均衡性和節(jié)奏性;q 用來測定變量數(shù)列次數(shù)分布較正態(tài)分布的偏離程度。 二、標志變異指標的種類及計算(一)全距 指所研究的數(shù)據(jù)中,最大值與最小值之差1、 計算公式2、全距的特點q 優(yōu)點:計算方法簡單、易懂;q 缺點:易受極端數(shù)值的影響,不能全面反映所有標志值差異大小及分布狀況,準確程度差(二)平均差:是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差絕對值的算術(shù)平均數(shù)1、簡單平均差:適用于未分組資料2、加權(quán)平均差:適用于分組資料3、平均差的特點q 優(yōu)點:不易受極端數(shù)值的影響,能綜合反映全部單位標志值的實際差異程度;q 缺點:用絕對值的形式消除各標志值與算術(shù)平均數(shù)離差的正負值問題,不便于作數(shù)學處理和參與統(tǒng)計分析運算。(三)標準差:是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù)的開平方根;標準差的平方又叫作方差 1、簡單標準差:適用于未分組資料2、加權(quán)標準差:適用于分組資料3、標準差的特點q 不易受極端數(shù)值的影響,能綜合反映全部單位標志值的實際差異程度;q 用平方的方法消除各標志值與算術(shù)平均數(shù)離差的正負值問題,可方便地用于數(shù)學處理和統(tǒng)計分析運算.(四)變異系數(shù)1、平均差系數(shù) 標準差系數(shù) 2、應(yīng)用 用來對比不同水平的同類現(xiàn)象; 標準差系數(shù)小的總體,其平均數(shù)的代表性大;反之,亦然。三、是非標志的標準差及方差1、是非標志:指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現(xiàn)形式的標志,又叫交替標志分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計2、成數(shù):指是非標志總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重具有某種標志表現(xiàn)的單位數(shù)所占的成數(shù):不具有某種標志表現(xiàn)的單位數(shù)所占的成數(shù):3、是非標志總體的指標 均值:;標準差:;方差:;標準差系數(shù):第五章 抽樣推斷5.1 抽樣方案的設(shè)計一、抽樣估計的意義和一般步驟(一)抽樣估計的定義 按照隨機原則 從調(diào)查對象中抽取一部分單位進行調(diào)查,并以調(diào)查結(jié)果對總體數(shù)量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法。(二)抽樣估計的特點q 按隨機原則抽取樣本單位q 目的是推斷總體的數(shù)量特征q 抽樣推斷的結(jié)果具有一定的可靠程度,抽樣誤差可以事先計算并控制(三)抽樣估計的應(yīng)用q 不可能進行全面調(diào)查時q 不必要進行全面調(diào)查時q 來不及進行全面調(diào)查時q 對全面調(diào)查資料進行補充修正時(四)抽樣估計的步驟 設(shè)計抽樣方案、抽取樣本單位、收集樣本數(shù)據(jù)、計算樣本統(tǒng)計量、推斷總體參數(shù)(五)抽樣估計的基本概念1、樣本容量:從總體中抽出的部分單位的集合(n)2、樣本個數(shù):從一個總體中可能抽取多少個樣本 3、總體參數(shù):指被估計的總體指標(1)總體平均數(shù)(總體均值) (2)總體單位標志值的標準差 (3)總體單位標志值的方差 (4)總體成數(shù) (5)總體是非標志的標準差 (6)總體是非標志的方差 4、樣本指標:指根據(jù)樣本單位的標志值計算的用以估計和推斷相應(yīng)總體指標的綜合指標,又被稱為估計量或統(tǒng)計量。 (1)樣本平均數(shù)(樣本均值) (2)樣本單位標志值的標準差 (3)樣本單位標志值的方差 (4)樣本成數(shù) (5)樣本單位是非標志的標準差(6)樣本單位是非標志的方差二、抽樣方案設(shè)計的基本準則 隨機原則、抽樣誤差最小、費用最少三、抽樣方案設(shè)計的主要內(nèi)容(一)編制抽樣框 抽樣框:指包括全部抽樣單位的名單框架,僅對有限總體而言 主要形式:名單抽樣框、區(qū)域抽樣框、時間表抽樣框(二)確定抽樣方法 1、重復(fù)抽樣 抽出個體登記特征放回總體繼續(xù)抽取 2、不重復(fù)抽樣 抽出個體登記特征繼續(xù)抽取 (三)確定抽樣組織方式 1、簡單隨機抽樣 對總體單位逐一編號,然后按隨機原則則直接從總體中抽出若干單位構(gòu)成樣本。 應(yīng)用:僅適用于規(guī)模不大、內(nèi)部各單位標志值差異較小的總體 2、類型抽樣 將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本。 3、等距抽樣 將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位。 4、整群抽樣 將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本。 確定抽樣組織方式需考慮:調(diào)查對象的性質(zhì)特點;對調(diào)查對象的了解程度(抽樣框的特點);抽樣誤差的大?。蝗肆?、財力和物力等條件的限制 (四)確定樣本容量 1、n30,為大樣本;n 30,為小樣本 2、確定適當樣本容量的意義:若n過大,調(diào)查工作量增大,體現(xiàn)不出抽樣調(diào)查的優(yōu)越性;若n 過小,抽樣誤差會增大,抽樣推斷就會失去價值。 3、樣本的可能數(shù)目:在考慮順序的抽樣條件下,從總體N中隨機抽取n個樣本單位共有多少種可能的抽選結(jié)果 (1)重復(fù)抽樣的可能樣本數(shù)目 (2)不重復(fù)抽樣的可能樣本數(shù)目5.2 抽樣分布一、 抽樣分布 樣本統(tǒng)計量所有可能值的概率分布(一) 平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即: 從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的。(二) 比率的抽樣分布全部可能樣本比率的均值等于總體比率,即: 從非正態(tài)總體中抽取的樣本比率,當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標準差為總體標準差的。二、 抽樣估計量的優(yōu)良標準 設(shè)為待估計的總體參數(shù),為樣本統(tǒng)計量,則的優(yōu)良標準為: 1、無偏性:指樣本指標的均值應(yīng)等于被估計的總體指標 若,則稱為的無偏性估計量 2、有效性:作為優(yōu)良的估計量,除了滿足無偏性的要求外,其方差應(yīng)比較小 若,則稱為比更有效的估計量 3、一致性:指隨著樣本單位數(shù)n的增大,樣本估計量將在概率意義下越來越接近于總體真實值 若對于任意,有 4、抽樣估計量的優(yōu)良標準 為的無偏、有效、一致估計量 為的無偏、有效、一致估計量 為的無偏、有效、一致估計量三、 抽樣誤差的概念 指樣本估計量與總體參數(shù)之間數(shù)量上的差異,僅指由于按照隨機原則抽取樣本而產(chǎn)生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差說明:對于任何一個樣本,其抽樣誤差都不可能測量出來;抽樣誤差的大小可以依據(jù)概率分布理論加以說明。四、 抽樣平均誤差 指每一個可能樣本的估計值與總體指標值之間離差的平均數(shù),即樣本估計量的標準差 式中:為樣本平均數(shù)的抽樣平均誤差;M為可能的樣本數(shù)目;為第i個可能樣本的平均數(shù);為總體平均數(shù)1、 樣本平均數(shù)的抽樣平均誤差重復(fù)抽樣:不重復(fù)抽樣: 2、 樣本成數(shù)的抽樣平均誤差重復(fù)抽樣:不重復(fù)抽樣:3、 關(guān)于總體方差的估計方法用過去同類問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗數(shù)據(jù)代替;用樣本標準差s代替總體標準差,用代替。4、 影響抽樣誤差的因素總體各單位的差異程度;樣本單位數(shù)的多少;抽樣方法;抽樣組織方式五、 抽樣極限誤差指在一定的概率保證程度下,抽樣誤差不允許超過的某一給定范圍,也稱作允許誤差。5.3 參數(shù)估計一、點估計指直接以樣本指標來估計總體指標優(yōu)點:簡單,具體明確缺點:無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況二、區(qū)間估計(一)區(qū)間估計的定義和原理 指根據(jù)樣本指標和抽樣極限誤差以一定的可靠程度推斷總體指標的可能范圍;其中,被推斷的總體指標的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計的可靠程度也稱為置信度。(二)總體平均數(shù)的區(qū)間估計1、表達式 ,其中2、步驟(1)計算樣本平均數(shù)(2)搜集總體方差的經(jīng)驗數(shù)據(jù),或計算樣本標準差,即 (3)計算抽樣平均誤差 重復(fù)抽樣時: 不重復(fù)抽樣時:(4)計算抽樣極限誤差 (5)確定總體平均數(shù)的置信區(qū)間(三)總體成數(shù)的區(qū)間估計 1、表達式 ,其中 2、步驟(1)計算樣本成數(shù)(2)搜集總體方差的經(jīng)驗數(shù)據(jù)(3)計算抽樣平均誤差 重復(fù)抽樣: 不重復(fù)抽樣:(4)計算抽樣極限誤差 (5)確定總體成數(shù)的置信區(qū)間 三、樣本數(shù)目的確定 確定樣本容量的意義 考慮調(diào)查誤差和調(diào)查費用兩方面,確定樣本容量 推斷總體平均數(shù)所需的樣本容量1、 重復(fù)抽樣 2、不重復(fù)抽樣 推斷總體成數(shù)所需的樣本容量1、 重復(fù)抽樣2、 不重復(fù)抽樣 必要樣本容量的影響因素q 總體方差的大小;q 允許誤差范圍的大小;q 概率保證程度;q 抽樣方法;q 抽樣的組織方式。第六章 假設(shè)檢驗6.1 假設(shè)檢驗的一般問題一、假設(shè)檢驗的概念概念 事先對總體參數(shù)或分布形式作出某種假設(shè) 然后利用樣本信息來判斷原假設(shè)是否成立類型 參數(shù)假設(shè)檢驗 非參數(shù)假設(shè)檢驗特點 采用邏輯上的反證法 依據(jù)統(tǒng)計上的小概率原理二、假設(shè)檢驗的步驟(一)提出原假設(shè)和備擇假設(shè)1、什么是原假設(shè)?v 研究者想收集證據(jù)予以反對的假設(shè)v 有等號 =, 或 v 表示為 H02、什么是備擇假設(shè)?v 研究者想收集證據(jù)予以支持的假設(shè)v 有不等號: , v 表示為 H1(二)確定適當?shù)臋z驗統(tǒng)計量1、用于假設(shè)檢驗問題的統(tǒng)計量2、選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知(三)規(guī)定顯著性水平a1、是一個概率值2、原假設(shè)為真時,拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域3、表示為 av 常用的 a值有0.01, 0.05, 0.104、由研究者事先確定(四)計算檢驗統(tǒng)計量的值,作出統(tǒng)計決策1. 計算檢驗的統(tǒng)計量2. 根據(jù)給定的顯著性水平a,查表得出相應(yīng)的臨界值Za或Z/2a3. 將檢驗統(tǒng)計量的值與a 水平的臨界值進行比較4. 得出接受或拒絕原假設(shè)的結(jié)論三、假設(shè)檢驗中的兩類錯誤1、第一類錯誤(棄真錯誤) 原假設(shè)為真時拒絕原假設(shè) 會產(chǎn)生一系列后果 第一類錯誤的概率為av 被稱為顯著性水平2、第二類錯誤(取偽錯誤) 原假設(shè)為假時接受原假設(shè) 第二類錯誤的概率為 b(Beta) H0 檢驗決策實際情況H0為真H0為假接受H0正確第二類錯誤(b)拒絕H0第一類錯誤(a)正確 3、a 錯誤和 b 錯誤的關(guān)系 a和b的關(guān)系就像翹翹板,a小b就大, a大b就小四、雙側(cè)檢驗和單側(cè)檢驗(一)雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式)(課本P152)(二)雙側(cè)檢驗(原假設(shè)與備擇假設(shè)的確定)1. 雙側(cè)檢驗屬于決策中的假設(shè)檢驗。也就是說,不論是拒絕H0還是接受H0,我們都必需采取相應(yīng)的行動措施2. 例如,某種零件的尺寸,要求其平均長度為10厘米,大于或小于10厘米均屬于不合格3. 建立的原假設(shè)與備擇假設(shè)應(yīng)為v H0: m = 10 H1: m 10(三)雙側(cè)檢驗(顯著性水平與拒絕域 ) (課本P155)(四)單側(cè)檢驗(原假設(shè)與備擇假設(shè)的確定)v 檢驗研究中的假設(shè)1. 將所研究的假設(shè)作為備擇假設(shè)H12. 將認為研究結(jié)果是無效的說法或理論作為原假設(shè)H0。或者說,把希望(想要)證明的假設(shè)作為備擇假設(shè)3. 先確立備擇假設(shè)H1v 檢驗?zāi)稠椔暶鞯挠行?. 將所作出的說明(聲明)作為原假設(shè)2. 對該說明的質(zhì)疑作為備擇假設(shè)3. 先確立原假設(shè)H0 除非我們有證據(jù)表明“聲明”無效,否則就應(yīng)認為該“聲明”是有效的(五)單側(cè)檢驗(顯著性水平與拒絕域 ) (課本P155)6.2 一個正態(tài)總體的參數(shù)檢驗檢驗的步驟v 陳述原假設(shè) H0v 陳述備擇假設(shè) H1v 選擇顯著性水平 av 選擇檢驗統(tǒng)計量v 選擇nv 給出臨界值v 搜集數(shù)據(jù)v 計算檢驗統(tǒng)計量v 進行統(tǒng)計決策v 表述決策結(jié)果一、大樣本的均值檢驗二、小樣本的均值檢驗三、總體比率的假設(shè)檢驗方差分析一、方差分析的基本問題1、檢驗多個總體均值是否相等通過對各觀察數(shù)據(jù)誤差來源的分析來判斷多個總體均值是否相等2、變量 一個定類尺度的自變量v 2個或多個 (k 個) 處理水平或分類 一個定距或比例尺度的因變量二、方差分析的基本思想和原理(一)基本概念1、因素或因子:所要檢驗的對象稱為因子2、水平:因素的具體表現(xiàn)稱為水平3、觀察值:在每個因素水平下得到的樣本值4、試驗5、總體:因素的每一個水平可以看作是一個總體6、樣本數(shù)據(jù)(二)兩類誤差1. 隨機誤差 在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異 不同超市銷售量的差異可以看成是隨機因素的影響,或者說是由于抽樣的隨機性所造成的,稱為隨機誤差 2. 系統(tǒng)誤差 在因素的不同水平(不同總體)下,各觀察值之間的差異 這種差異可能是由于抽樣的隨機性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差(三)兩類方差組內(nèi)方差 因素的同一水平(同一個總體)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論