西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第1頁(yè)
西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第2頁(yè)
西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第3頁(yè)
西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第4頁(yè)
西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)問(wèn)答題整理行管蓋小靜第一章 導(dǎo)論1. 什么是統(tǒng)計(jì)學(xué)?怎樣理解統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)數(shù)據(jù)的關(guān)系?1) 統(tǒng)計(jì)學(xué)是指收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。2) 關(guān)系:它是一門關(guān)于數(shù)據(jù)的科學(xué),它提供的是一套關(guān)于數(shù)據(jù)收集、處理、分析、解釋并得出結(jié)論的方法,它研究的是來(lái)自各個(gè)領(lǐng)域的數(shù)據(jù)。而其中數(shù)據(jù)收集就是取得統(tǒng)計(jì)數(shù)據(jù),處理是將數(shù)據(jù)用圖表等形式展示出來(lái),分析是通過(guò)統(tǒng)計(jì)方法研究數(shù)據(jù)、并從數(shù)據(jù)中取得有用信息以幫助決策。3) 數(shù)據(jù)分析的方法有描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。描述統(tǒng)計(jì)是指研究數(shù)據(jù)收集、處理和描述的分支,推斷是指研究如何用樣本數(shù)據(jù)來(lái)推斷總體特征的分支。2. 統(tǒng)計(jì)數(shù)據(jù)可以分為哪幾類?不同類型的數(shù)據(jù)各有什么

2、特點(diǎn)?不同的數(shù)據(jù)要采用不同的統(tǒng)計(jì)方法來(lái)處理和分析1) 按計(jì)量尺度分:分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),由分類尺度計(jì)量形成;順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù),由順序尺度計(jì)量形成。分類和順序數(shù)據(jù)說(shuō)明的是事物的品質(zhì)特征,常用文字來(lái)表述,其結(jié)果表現(xiàn)為類別,故也可稱定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)。數(shù)值型數(shù)據(jù):按數(shù)字尺度測(cè)量的觀測(cè)值。其說(shuō)明的是現(xiàn)象的數(shù)量特征,通常用數(shù)值表述,也可稱定量或數(shù)量數(shù)據(jù)。2) 按收集方法分: 觀測(cè)數(shù)據(jù):通過(guò)調(diào)查或觀測(cè)收集到得數(shù)據(jù)。在沒(méi)有對(duì)事物人為控制的條件下得到,一般有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)都是;實(shí)驗(yàn)數(shù)據(jù):在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的。一般為自然科學(xué)領(lǐng)域收集到得數(shù)據(jù)。3)

3、 按被描述的現(xiàn)象與時(shí)間的關(guān)系分:截面數(shù)據(jù):在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)。它所描述的是現(xiàn)象在某一時(shí)刻的變化情況,通常是在不同空間上獲得的數(shù)據(jù);時(shí)間序列數(shù)據(jù):在不同時(shí)間上收集到的數(shù)據(jù)。它是按著時(shí)間順序收集到的,用于描述現(xiàn)象隨時(shí)間變化的情況。3. 舉例說(shuō)明總體、樣本、參數(shù)、統(tǒng)計(jì)量和變量的概念。總體:包含所研究的全部個(gè)體(數(shù)據(jù))的集合。樣本:從總體中抽取的一部分元素的集合。樣本容量:構(gòu)成樣本的元素?cái)?shù)目,又稱樣本量。參數(shù):用來(lái)描述總體特征的概括性數(shù)字度量。統(tǒng)計(jì)量:用來(lái)描述樣本特征的概括性數(shù)字度量。變量:說(shuō)明事物某種特征的概念。特點(diǎn)是從一次觀察到下一次觀察會(huì)呈現(xiàn)差別或變化。4. 舉例說(shuō)明什么是有限

4、總體和無(wú)限總體??傮w根據(jù)包含的數(shù)目是否可數(shù)而劃分的:1) 有限總體:總體的范圍能夠明確確定,元素的數(shù)目有限可數(shù),在每次抽取樣本時(shí)是不獨(dú)立的。2) 無(wú)限總體:總體所包含元素是無(wú)限不可數(shù)的。其每次抽取樣本是獨(dú)立的,即本次抽取不影響下一次的抽樣結(jié)果。在推斷統(tǒng)計(jì)中通常是針對(duì)無(wú)限總體的,因而通常把總體看作隨機(jī)變量。5. 變量可以分為哪幾類?1) 分類變量:說(shuō)明事物類別的一個(gè)名稱。其取值即分類數(shù)據(jù)。2) 順序變量:說(shuō)明事物有序類別的一個(gè)名稱。其取值即順序數(shù)據(jù)。3) 數(shù)值型變量:說(shuō)明事物數(shù)字特征的一個(gè)名稱。其取值即數(shù)值型數(shù)據(jù)。根據(jù)其取值不同可以分為連續(xù)和離散變量。連續(xù)變量是指可以在一個(gè)或多個(gè)區(qū)間中取任意值的

5、變量,其取值連續(xù)不斷,不可一一列舉;離散變量是指只能取可數(shù)值的變量,其取值只能取有限個(gè)值,且取值都以整數(shù)位斷開,可一一列舉。在社會(huì)和經(jīng)濟(jì)問(wèn)題的研究中離散變量很多時(shí)也可以當(dāng)作連續(xù)變量處理。此外,還可以將變量劃分為隨機(jī)和非隨機(jī)變量,經(jīng)驗(yàn)變量和理論變量等。經(jīng)驗(yàn)變量是在周圍環(huán)境中可以觀察到的事物,理論變量是統(tǒng)計(jì)學(xué)家用數(shù)學(xué)方法構(gòu)造出來(lái)的變量。6. 統(tǒng)計(jì)學(xué)應(yīng)用的領(lǐng)域有什么。統(tǒng)計(jì)學(xué)可以應(yīng)用于所有有數(shù)據(jù)的領(lǐng)域,如政府部門、學(xué)術(shù)研究領(lǐng)域、日常生活、公司企業(yè)的生產(chǎn)經(jīng)營(yíng)管理等。如在工商管理中有:企業(yè)發(fā)展戰(zhàn)略、產(chǎn)品質(zhì)量管理、市場(chǎng)研究、財(cái)務(wù)分析、經(jīng)濟(jì)預(yù)測(cè)和HR等。統(tǒng)計(jì)有助于數(shù)據(jù)分,數(shù)據(jù)分析的真正目的是找到規(guī)律、獲得啟發(fā)

6、,而不是尋找支持,真正的分析事先是沒(méi)有結(jié)論的,通過(guò)數(shù)據(jù)的分析才能得出結(jié)論。當(dāng)然,統(tǒng)計(jì)也不是萬(wàn)能的。第二章 數(shù)據(jù)收集1. 簡(jiǎn)述普查和抽樣調(diào)查的特點(diǎn)。它們都是實(shí)際中常用的統(tǒng)計(jì)調(diào)查方式。此外還有統(tǒng)計(jì)報(bào)表:按照國(guó)家有關(guān)法律規(guī)定,自上而下的提供基本數(shù)據(jù)。1) 抽樣調(diào)查:從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來(lái)推斷總體特征的數(shù)據(jù)收集方法。它具有四大特點(diǎn):經(jīng)濟(jì)性(人、財(cái)、物、時(shí)、費(fèi)較低)、時(shí)效性強(qiáng)、適應(yīng)面廣、準(zhǔn)確性高。2) 普查:為特定目的而專門組織的全面調(diào)查。它適合于特定目的特定對(duì)象的一種調(diào)查方式,主要用于收集某一時(shí)間點(diǎn)上的社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量,目的是掌握特定社會(huì)經(jīng)濟(jì)現(xiàn)象的基本全貌,

7、為國(guó)家制定政策措施提供依據(jù)。我國(guó)進(jìn)行的主要有人口(末尾0)、工業(yè)、農(nóng)業(yè)(6)、經(jīng)濟(jì)普查(3和8)。普查需要耗費(fèi)大量的人力、物力、財(cái)力和時(shí)間,通常隔較長(zhǎng)時(shí)間進(jìn)行一次,具有周期性。2. 統(tǒng)計(jì)數(shù)據(jù)的具體收集方法有哪些。數(shù)據(jù)來(lái)源間接來(lái)源直接來(lái)源出版物、網(wǎng)絡(luò)調(diào)查實(shí)驗(yàn)抽樣調(diào)查普查數(shù)據(jù)收集方法詢問(wèn)調(diào)查觀察實(shí)驗(yàn)訪問(wèn)調(diào)查郵寄調(diào)查電話調(diào)查電腦輔助座談會(huì)個(gè)別深訪觀察實(shí)驗(yàn)工業(yè)普查農(nóng)業(yè)普查經(jīng)濟(jì)普查概率抽樣非概率抽樣隨機(jī)抽樣分層抽樣機(jī)械抽樣整群抽樣3. 簡(jiǎn)述調(diào)查方案的4個(gè)基本結(jié)構(gòu)。1) 調(diào)查目的:調(diào)查要達(dá)到的具體目標(biāo)回答“為什么調(diào)查?”調(diào)查之前必須明確2) 調(diào)查對(duì)象和調(diào)查單位:調(diào)查對(duì)象:調(diào)查研究的總體或調(diào)查范圍;調(diào)查單位

8、:需要對(duì)之進(jìn)行調(diào)查的單位??梢允钦{(diào)查對(duì)象的全部單位(全面調(diào)查),也可以是調(diào)查對(duì)象中的一部分單位(非全面調(diào)查);回答“向誰(shuí)調(diào)查?3) 調(diào)查項(xiàng)目和調(diào)查表:即調(diào)查的具體內(nèi)容;通常表現(xiàn)為表格或問(wèn)卷;回答“調(diào)查什么?”。4) 其它問(wèn)題:明確調(diào)查所采用的方法;確定調(diào)查資料的所屬時(shí)間和調(diào)查工作的期限;調(diào)查的組織與實(shí)施細(xì)則。4. 什么是問(wèn)卷?它由哪幾部分組成?問(wèn)卷是用來(lái)收集調(diào)查數(shù)據(jù)的一種工具,調(diào)查者根據(jù)調(diào)查目的和要求所設(shè)計(jì)的,由一系列問(wèn)題、備選答案、說(shuō)明以及碼表組成的一種調(diào)查形式。不同的調(diào)查問(wèn)卷在具體結(jié)構(gòu)、題型、措詞、版式等設(shè)計(jì)上會(huì)有所不同,但在結(jié)構(gòu)上一般都由開頭部分(問(wèn)候語(yǔ)、填寫說(shuō)明、問(wèn)卷編號(hào))、甄別部分、

9、(篩選調(diào)查者)主體部分(核心)和背景部分(放在最后)四方面組成 。5. 設(shè)計(jì)問(wèn)卷的提問(wèn)項(xiàng)目應(yīng)該注意哪些問(wèn)題。1) 提問(wèn)的內(nèi)容盡可能短 2) 用詞要確切、通俗可按6W準(zhǔn)則加以推敲。Who、Where、When、Why、What、How。3) 一項(xiàng)提問(wèn)只包含一項(xiàng)內(nèi)容 4) 避免誘導(dǎo)性提問(wèn) 5) 避免否定形式的提問(wèn) 6) 避免敏感性問(wèn)題 6. 封閉型問(wèn)題答案的設(shè)計(jì)有哪些主要方法。封閉性問(wèn)題主要是選擇回答型,主要包括五種方法:1) 兩項(xiàng)選擇法:Y/N2) 多項(xiàng)選擇法:?jiǎn)雾?xiàng)、多項(xiàng)以及限制項(xiàng)選擇三種。3) 順序選擇法:對(duì)選項(xiàng)按重要程度進(jìn)行排列。4) 評(píng)定尺度法:即非常好、一般好、不好等。5) 雙向列聯(lián)法。

10、7. 問(wèn)卷中問(wèn)題順序的設(shè)計(jì)應(yīng)該注意哪些問(wèn)題。1) 問(wèn)題的安排應(yīng)具有邏輯性。2) 問(wèn)題的順序應(yīng)先易后難。3) 能引起被調(diào)查者興趣的問(wèn)題放在前面。4) 開放性問(wèn)題放在后面。5) 版面格式的設(shè)計(jì)。包括:?jiǎn)柧淼慕Y(jié)構(gòu)安排要合理,問(wèn)卷的主體部分要突出、醒目;不要編排過(guò)密,各問(wèn)題之間要留出一定的空間;外表及內(nèi)容的印刷要美觀8. 數(shù)據(jù)誤差的產(chǎn)生及消除。1) 抽樣誤差:由于抽樣的隨機(jī)性所帶來(lái)的誤差,所有樣本可能的結(jié)果與總體真值之間的平均性差異,無(wú)法消除但可以事先計(jì)算和控制。 產(chǎn)生原因:未遵循隨機(jī)原則;樣本結(jié)構(gòu)與總體結(jié)構(gòu)有差異;樣本量不足等2) 非抽樣誤差:相對(duì)抽樣誤差而言,是除抽樣誤差之外的,由于其他原因造成的

11、樣本觀察結(jié)果與總體真值之間的差異,存在于所有的調(diào)查之中。(概率抽樣、非概率抽樣、全面性調(diào)查)理論上可以消除。 產(chǎn)生有:抽樣框誤差、回答誤差和無(wú)回答誤差(被調(diào)查者)、調(diào)查員誤差、測(cè)量誤差。3) 誤差的控制: 抽樣誤差可計(jì)算和控制。 非抽樣誤差的控制:調(diào)查員的挑選;調(diào)查員的培訓(xùn);督導(dǎo)員的調(diào)查專業(yè)水平;調(diào)查過(guò)程控制(調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評(píng)估;現(xiàn)場(chǎng)調(diào)查人員進(jìn)行獎(jiǎng)懲的制度)。9、以及數(shù)據(jù)質(zhì)量的要求?1. 精度:最低的抽樣誤差或隨機(jī)誤差2. 準(zhǔn)確性:最小的非抽樣誤差或偏差3. 關(guān)聯(lián)性:滿足用戶決策、管理和研究的需要4. 及時(shí)性:在最短的時(shí)間里取得并公布數(shù)據(jù)5. 一致性:保持時(shí)間序列的可比性6. 最低成本:以

12、最經(jīng)濟(jì)的方式取得數(shù)據(jù)第三章 數(shù)據(jù)的圖表展示1. 數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容?1) 數(shù)據(jù)審核:檢查數(shù)據(jù)中的錯(cuò)誤2) 數(shù)據(jù)篩選:找出符合條件的數(shù)據(jù)3) 數(shù)據(jù)排序:升序和降序;尋找數(shù)據(jù)的基本特征。排序后的稱為順序統(tǒng)計(jì)量。4) 數(shù)據(jù)透視表:按需要匯總。自己附加:一、數(shù)據(jù)審核的具體方法是?1. 原始數(shù)據(jù):1) 完整性審核n 應(yīng)調(diào)查的單位或個(gè)體是否有遺漏n 所有的調(diào)查項(xiàng)目或變量是否填寫齊全2)準(zhǔn)確性審核n 數(shù)據(jù)是否真實(shí)反映實(shí)際情況,內(nèi)容是否符合實(shí)際n 數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等2. 二手?jǐn)?shù)據(jù):1) 適用性審核n 弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料n 確定數(shù)據(jù)是否符合自己分析研究的需要2) 時(shí)

13、效性審核n 盡可能使用最新的數(shù)據(jù)3)確認(rèn)是否有必要做進(jìn)一步的加工整理二數(shù)據(jù)篩選的內(nèi)容是什么?1. 當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選。2. 數(shù)據(jù)篩選的內(nèi)容 將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除 將符合某種特定條件的數(shù)據(jù)篩選出來(lái),而不符合特定條件的數(shù)據(jù)予以剔除三、數(shù)據(jù)排序的方法?1. 分類數(shù)據(jù)的排序 字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序 漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分2. 數(shù)值型數(shù)據(jù)的排序n 遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,xn,遞增排序后可表示為:x(1)x(

14、2)x(2)x(n)三、數(shù)據(jù)排序的目的?1. 按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索2. 排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)3. 在某些場(chǎng)合,排序本身就是分析的目的之一4. 排序可借助于計(jì)算機(jī)完成。2. 數(shù)據(jù)整理與圖示的基本問(wèn)題是什么?(附件)1) 要弄清所面對(duì)的數(shù)據(jù)類型,不同類型的數(shù)據(jù),采取不同的處理方式和方法:n 對(duì)分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理。n 對(duì)數(shù)值型數(shù)據(jù)則主要是作分組整理2)適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)。3. 分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法

15、各有哪些?A. 都是品質(zhì)型數(shù)據(jù),可計(jì)算的統(tǒng)計(jì)量有:(后兩個(gè)僅為順序數(shù)據(jù)的)1) 頻數(shù):落在各類別中的數(shù)據(jù)個(gè)數(shù)2) 比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3) 百分比:將對(duì)比的基數(shù)作為100而計(jì)算的比值4) 比率:不同類別數(shù)值的比值5) 累積頻數(shù):各類別頻數(shù)的逐級(jí)累加。向上向下兩種。6) 累積頻率:各類別頻率(百分比)的逐級(jí)累加B圖示方法有:(后兩個(gè)僅為順序數(shù)據(jù)的)1) 條形圖。寬度相同的條形的高度或長(zhǎng)短來(lái)表示各類別數(shù)據(jù)的圖形,單式條形圖、復(fù)式條形圖等形式。主要用于反映分類數(shù)據(jù)的頻數(shù)分布,繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖。2) 帕累托圖。按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排

16、序后繪制的柱形圖 3) 對(duì)比條形圖。用以對(duì)比分類變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢(shì)。4) 餅圖。也是圓形圖,是用圓形及圓內(nèi)扇形的角度來(lái)表示數(shù)值大小的圖形,主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問(wèn)題。5) 累計(jì)頻率或頻數(shù)分布圖6) 環(huán)形圖。類似餅圖,中間有一個(gè)“洞”,可用于顯示多個(gè)樣本或總體的各個(gè)部分所占比例,有利于比較。用于結(jié)構(gòu)比較研究, 用于展示分類和順序數(shù)據(jù)。4. 數(shù)值型數(shù)據(jù)的分組方法有哪些?簡(jiǎn)述組距分組的步驟。數(shù)據(jù)分組是指根據(jù)數(shù)據(jù)研究需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同組別。包括:1) 單變量值分組:一個(gè)變量值作為一組,適合于離散變量和變量值較少的情

17、況。2) 組距分組:將變量值的一個(gè)區(qū)間作為一組,適合于連續(xù)變量和變量值較多的情況,需要遵循“不重不漏”的原則,可采用等距分組,也可采用不等距分組。組距分組的步驟:1. 確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),組數(shù)一般為5K 15,可以按 Sturges 提出的經(jīng)驗(yàn)公式確定組數(shù)K- 。2. 確定組距:一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即組距( 最大值 - 最小值) 組數(shù) 3. 統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表 。遵循補(bǔ)充不漏可使用:上下組限重疊時(shí),上組限不在內(nèi);上下組限斷開;使用開口組。5. 直方圖與條形圖有何區(qū)別。1)

18、 條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的。2) 直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義。3) 直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列。4) 條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)。6. 繪制線圖應(yīng)該注意哪些問(wèn)題?它是用來(lái)表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形,注意三點(diǎn):1) 時(shí)間一般繪在橫軸,數(shù)據(jù)繪在縱軸2) 圖形的長(zhǎng)寬比例大致為10 : 7。3) 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷7.

19、 餅圖和環(huán)形圖有什么不同?與餅圖類似,但又有區(qū)別:1) 餅圖只能顯示一個(gè)總體各部分所占的比例2) 環(huán)形圖則可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,每一個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)。8. 莖葉圖和直方圖相比有什么優(yōu)點(diǎn)?他們的應(yīng)用場(chǎng)合分別是什么?1) 莖葉圖是用于顯示未分組的原始數(shù)據(jù)的分布,由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的,以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉,樹葉上只保留最后一位數(shù)字。對(duì)于n(20 n 300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過(guò) L = 10 lg n 2) 直方圖是用矩形長(zhǎng)和高即面積來(lái)表示頻數(shù)分布的圖形。3) 莖葉圖類似于橫置的直方圖,但又有區(qū)別: 直方圖可觀察

20、一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值。 莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息。 直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。9. 鑒別圖表優(yōu)劣的準(zhǔn)則有哪些。好的圖表應(yīng)包括以下基本特征:(附加)1) 顯示數(shù)據(jù)2) 讓讀者把注意力集中在圖表的內(nèi)容上,而不是制作圖表的程序上3) 避免歪曲4) 強(qiáng)調(diào)數(shù)據(jù)之間的比較5) 服務(wù)于一個(gè)明確的目的6) 有對(duì)圖表的統(tǒng)計(jì)描述和文字說(shuō)明好的圖表的鑒別準(zhǔn)則是:1) 精心設(shè)計(jì)、有助于洞察問(wèn)題的實(shí)質(zhì)2) 使復(fù)雜的觀點(diǎn)得到簡(jiǎn)明、確切、高效的闡述3) 能在最短的時(shí)間內(nèi)以最少的筆墨給讀者提供最大量的信息4) 是多維的5) 表述數(shù)據(jù)的

21、真實(shí)情況10. 統(tǒng)計(jì)表由那幾個(gè)部分組成?五個(gè)部分:表頭、行標(biāo)題(類別名稱)、列標(biāo)題(變量名稱)、數(shù)字資料、表外附加(數(shù)據(jù)來(lái)源、變量的注釋何必要說(shuō)明等)11. 制作統(tǒng)計(jì)表應(yīng)該注意哪些問(wèn)題?1) 合理安排統(tǒng)計(jì)表的結(jié)構(gòu)2) 總標(biāo)題內(nèi)容應(yīng)滿足3W 要求3) 數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)變量后或單列出一列標(biāo)明4) 表中的上下兩條橫線一般用粗線,其他線用細(xì)線5) 通常情況下,統(tǒng)計(jì)表的左右兩邊不封口6) 表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一7) 對(duì)于沒(méi)有數(shù)字的表格單元,一般用“”表示8) 必要時(shí)可在表的下方加上注釋小結(jié)表:數(shù)據(jù)類型品質(zhì)數(shù)據(jù)數(shù)值

22、型數(shù)據(jù)匯總表原始數(shù)據(jù)分組數(shù)據(jù)時(shí)序數(shù)據(jù)多元數(shù)據(jù)條形圖餅圖莖葉圖箱線圖直方圖折線圖線圖散點(diǎn)圖氣泡圖雷達(dá)圖環(huán)形圖第四章 數(shù)據(jù)的概括性度量1. 一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測(cè)度?1) 集中趨勢(shì)(位置):一組數(shù)據(jù)向其中心值靠攏的傾向和程度,測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值。且不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值,低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù):分類數(shù)據(jù)-眾數(shù);順序數(shù)據(jù)-中位數(shù)和分位數(shù);數(shù)值型數(shù)據(jù)-平均數(shù)。2) 離散趨勢(shì)(分散程度):數(shù)據(jù)分布的另一個(gè)重要特征,映各變量值遠(yuǎn)離其中心值的程度,從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表

23、程度。不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值: 分類數(shù)據(jù)-異眾比率; 順序數(shù)據(jù)-四分位差;數(shù)值型數(shù)據(jù)-方差、標(biāo)準(zhǔn)差,此外還有極差和平均差,標(biāo)準(zhǔn)分?jǐn)?shù)(判斷一值在一組數(shù)據(jù)中的相對(duì)位置)和離散系數(shù)(測(cè)度不同組別數(shù)據(jù)的相對(duì)離散程度)3) 偏態(tài)和峰態(tài)(形狀):數(shù)據(jù)分布偏斜程度的測(cè)度和扁平程度的測(cè)度。2. 怎樣理解均值在統(tǒng)計(jì)學(xué)中的地位?1) 均值是集中趨勢(shì)的最常用測(cè)度值,主要適用于數(shù)值型數(shù)據(jù),有簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)之分,此外還有幾何平均數(shù)。2) 它是進(jìn)行統(tǒng)計(jì)分析和統(tǒng)計(jì)推斷的基礎(chǔ)。從統(tǒng)計(jì)思想上看,它是一組數(shù)據(jù)的重心所在,是數(shù)據(jù)誤差相互抵消后的必然性結(jié)果。 具有使各變量值與平均數(shù)離差平方和最小的數(shù)學(xué)性質(zhì)。3)

24、 但其易受極端值的影響。3. 簡(jiǎn)述四分位數(shù)的計(jì)算方法。是指排序后處于25%和75%位置上的值,不受極端值的影響,主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù)。1) 定義計(jì)算: 2) 較準(zhǔn)確計(jì)算: 3) 中位數(shù)法: 4) Excel計(jì)算: 4. 對(duì)于比率數(shù)據(jù)的平均為什么采用幾何平均?是指n 個(gè)變量值乘積的 n 次方根。適用于對(duì)比率數(shù)據(jù)的平均,主要用于計(jì)算平均增長(zhǎng)率,因?yàn)樗莆盏淖兞恐当旧砭褪潜嚷实男问?,如果各比率?shù)值相差不大還可以用算術(shù)平均,相差大只能用幾何平均。用Gm表示。5. 簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)以及應(yīng)用場(chǎng)合。1) 眾數(shù)n 不受極端值影響n 具有不惟一性n 數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)

25、應(yīng)用,主要用于數(shù)量較多的分類數(shù)據(jù)。2) 中位數(shù)n 不受極端值影響n 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用,主要適于順序數(shù)據(jù)。3) 平均數(shù)n 易受極端值影響n 數(shù)學(xué)性質(zhì)優(yōu)良n 數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用,主要適于數(shù)值型數(shù)據(jù)。6. 簡(jiǎn)述異眾比率、四分位差、方差或標(biāo)準(zhǔn)差的適用場(chǎng)合?1) 異眾比率:非眾數(shù)組的頻數(shù)占總頻數(shù)的比例,用以衡量眾數(shù)的代表性。主要適于分類數(shù)據(jù)。2) 四分位差:稱為內(nèi)距或四分間距,是上四分位數(shù)與下四分位數(shù)之差,即Qd = QU QL。反映了中間50%數(shù)據(jù)的離散程度,不受極端值的影響,用于衡量中位數(shù)的代表性,適于順序型數(shù)據(jù)。3) 方差或標(biāo)準(zhǔn)差:數(shù)據(jù)離散程度的最常用測(cè)度值,反映了各變量值

26、與均值的平均差異。主要適于數(shù)值型數(shù)據(jù)。7. 標(biāo)準(zhǔn)分?jǐn)?shù)有哪些用途?標(biāo)準(zhǔn)分?jǐn)?shù)也稱標(biāo)準(zhǔn)化值,是用公式 對(duì)不同量綱的變量進(jìn)行標(biāo)準(zhǔn)化處理,用以測(cè)度每個(gè)值在一組數(shù)據(jù)中的相對(duì)位置,也可用于判斷一組數(shù)據(jù)是否有離群點(diǎn),8. 為什么要計(jì)算離散系數(shù)?離散系數(shù)也稱為變異系數(shù)、標(biāo)準(zhǔn)差系數(shù),是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是相對(duì)離散程度的測(cè)度。其公式是 它用于對(duì)不同組別數(shù)據(jù)離散程度的比較,消除了數(shù)據(jù)水平高低和計(jì)量單位的影響,離散系數(shù)大的離散程度也就大。9. 測(cè)度數(shù)據(jù)分布形狀的統(tǒng)計(jì)量有哪些?1) 偏態(tài)系數(shù):對(duì)數(shù)據(jù)分布不對(duì)稱性的度量值。其公式為:分組數(shù)據(jù): 未分組數(shù)據(jù): 判斷:偏態(tài)系數(shù)=0為對(duì)稱分布;偏態(tài)系數(shù) 0為右偏

27、分布或正偏; 偏態(tài)系數(shù)0為尖峰分布;峰態(tài)系數(shù)0為扁平分布。數(shù)據(jù)分布特征集中趨勢(shì)離散程度分布形狀中位數(shù)平均數(shù)異眾比率四分位差極差偏態(tài)系數(shù)平均差方差或標(biāo)準(zhǔn)差峰態(tài)系數(shù)眾數(shù)離散系數(shù)第五章 概率與概率分布1. 含義解釋:試驗(yàn)與事件、樣本空間1) 試驗(yàn):對(duì)一個(gè)或多個(gè)實(shí)驗(yàn)對(duì)象進(jìn)行一次觀察或測(cè)量的過(guò)程。2) 事件:試驗(yàn)的每一個(gè)可能結(jié)果(任何樣本點(diǎn)集合)。其中隨機(jī)事件是每次試驗(yàn)可能出現(xiàn)也可能不出現(xiàn)的事件3) 樣本空間:一個(gè)試驗(yàn)中所有結(jié)果的集合,用W表示4) 樣本點(diǎn):樣本空間中每一個(gè)特定的試驗(yàn)結(jié)果,用符號(hào)w表示2. 簡(jiǎn)述概率與頻率的關(guān)系。1) 事件A的概率是一個(gè)介于0和1之間的一個(gè)值,用以度量試驗(yàn)完成時(shí)事件A發(fā)生

28、的可能性大小, 記為P(A)。2) 當(dāng)試驗(yàn)的次數(shù)很多時(shí),概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來(lái)逼近n 在相同條件下,重復(fù)進(jìn)行n次試驗(yàn),事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫為 3. 什么是互斥事件,其加法規(guī)則是什么?在試驗(yàn)中,兩個(gè)事件有一個(gè)發(fā)生時(shí),另一個(gè)就不能發(fā)生,則稱事件A與事件B是互斥事件(沒(méi)有公共樣本點(diǎn)。若兩個(gè)事件A與B互斥,則事件A發(fā)生或事件B發(fā)生的概率等于這兩個(gè)事件各自的概率之和,即 P(AB) =P(A)+P(B)4. 概率的基本性質(zhì)。1) 非負(fù)性n 對(duì)任意事件A,有 P 02) 規(guī)范性n 一個(gè)事件的概率是一個(gè)介于0與1之間的值,即對(duì)于任意事件 A,有0 P

29、 13) 必然事件的概率為1;不可能事件的概率為0。即P (W )=1; P(F )=04) 可加性n 若A與B互斥,則P(AB) =P(A)+P(B)n 推廣到多個(gè)兩兩互斥事件A1,A2,An,有 P( A1A2 An) = P(A1)+P(A2)+P(An)5. 什么是條件概率。在事件B已經(jīng)發(fā)生的條件下事件A發(fā)生的概率,稱為已知事件B時(shí)事件A的條件概率,記為P(A|B)= 6. 兩個(gè)事件獨(dú)立意味著什么?1) 若P(A|B)=P(A)或P(B|A)=P(B) ,則稱事件A與B事件獨(dú)立,或稱獨(dú)立事件 2) 若兩個(gè)事件相互獨(dú)立,則這兩個(gè)事件同時(shí)發(fā)生的概率等于它們各自發(fā)生的概率之積,即 P(AB)

30、= P(A) P(B);若事件A1,A2,An相互獨(dú)立,則P(A1, A2, , An)= P(A1) P(A2) P(An) 。7. 什么是隨機(jī)變量,它的類型是什么?隨機(jī)變量是一次試驗(yàn)的結(jié)果的數(shù)值性描述(事先未知)一般用 X,Y,Z 來(lái)表示。根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量:1) 離散型:只能取有限個(gè)或可數(shù)個(gè)值得隨機(jī)變量,這些值可以逐個(gè)列舉,且以確定的概率取這些不同的值。2) 連續(xù)型:可以取一個(gè)或多個(gè)區(qū)間中任何值的隨機(jī)變量。不可以一一列舉8. 什么是離散隨機(jī)變量的概率分布?列出離散型隨機(jī)變量X的所有可能取值和隨機(jī)變量取這些值的確定概率,以表格的形式表現(xiàn)出來(lái)。則P(X =x

31、i)=pi稱為離散型隨機(jī)變量的概率函數(shù)。且pi0 ;pi=19. 兩點(diǎn)分布與二項(xiàng)分布有何不同?一個(gè)離散型隨機(jī)變量X只取0和1兩個(gè)可能的值稱為兩點(diǎn)分布,重復(fù)進(jìn)行 n 次試驗(yàn),出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布,記為XB(n,p),其概率密度函數(shù)分別為: 兩點(diǎn)分布用于伯努利試驗(yàn),而二項(xiàng)分布用于n次伯努利試驗(yàn),前者是后者基礎(chǔ)。10. 簡(jiǎn)述N重伯努利試驗(yàn)的條件。(與二項(xiàng)分布有關(guān))將伯努利試驗(yàn)重復(fù)進(jìn)行n次:1) 一次試驗(yàn)只有兩個(gè)可能結(jié)果,即“成功”和“失敗”2) 一次試驗(yàn)“成功”的概率為p ,失敗的概率為q =1- p,且概率p對(duì)每次試驗(yàn)都是相同的 。3) 試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行n次 。

32、4) 在n次試驗(yàn)中,“成功”的次數(shù)對(duì)應(yīng)一個(gè)離散型隨機(jī)變量X 11. 超幾何分布的適用場(chǎng)合是什么?適用于采用不重復(fù)抽樣,各次試驗(yàn)并不獨(dú)立,成功的概率也互不相等,總體元素的數(shù)目N很小,或樣本容量n相對(duì)于N來(lái)說(shuō)較大時(shí),樣本中“成功”的次數(shù)則服從超幾何概率分布。概率分布函數(shù)為:12. 簡(jiǎn)述概率密度函數(shù)和分布函數(shù)的含義。1) 密度函數(shù):設(shè)X為一連續(xù)型隨機(jī)變量,x 為某一區(qū)間或多個(gè)區(qū)間的任意數(shù)值,X的概率密度函數(shù)記為f(x)。連續(xù)型隨機(jī)變量的給定區(qū)間取值的概率對(duì)應(yīng)的是f(x)曲線或直線在該區(qū)間圍成的面積。它在某一點(diǎn)的概率值為0,密度函數(shù)曲線下的面積等于1。密度函數(shù) f(x)表示X 的所有取值 x 及其頻數(shù)

33、f(x)2) 分布函數(shù):對(duì)于隨機(jī)變量x,設(shè)其為任意實(shí)數(shù),則函數(shù)F(x)=P(Xx)稱為隨機(jī)變量的分布函數(shù)。分布函數(shù)在X處的取值,即X的取值落在區(qū)間(,x)上的概率。分布函數(shù)是曲線下小于 x 的面積.13. 判斷數(shù)據(jù)正態(tài)性的方法有哪些?1) 對(duì)數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖。若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似2) 求出樣本數(shù)據(jù)的四分位差Qd和標(biāo)準(zhǔn)差s,然后計(jì)算比值Qd/s 。若數(shù)據(jù)近似服從正態(tài)分布,則有Qd/s1.3則為正態(tài)分布。3) 繪制正態(tài)概率圖。若由(xi,zi)形成的點(diǎn)緊密圍繞在一條直線周圍即是。14. 簡(jiǎn)述標(biāo)準(zhǔn)正態(tài)概率圖的繪制步驟。第1步:將樣本觀察值從

34、小到大排列:第2步:求出樣本觀察值的標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zi 。標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)滿足: 第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為標(biāo)準(zhǔn)正態(tài)概率圖。15. 在什么條件下用正態(tài)分布近似計(jì)算二項(xiàng)分布的概率效果比較好?對(duì)于小樣本,p=0.5時(shí)則近似,此時(shí)u=np是對(duì)稱中心。此外當(dāng)n 很大時(shí),大到使np、n(1p)5時(shí)即可近似服從正態(tài)分布Nnp , np(1-p)16. 均勻分布和指數(shù)分布描述的現(xiàn)象各有什么特點(diǎn)均勻分布:隨機(jī)變量在某一特定區(qū)間內(nèi)取值,其在區(qū)間內(nèi)取任何一個(gè)值的概率相等,因?yàn)樗锌赡苋≈档姆秶鷥?nèi)分布是均勻的。指數(shù)分布:描述等待某一特定事件發(fā)生所需事件的一種連續(xù)性概率分布。17. 正態(tài)分布函數(shù)的

35、性質(zhì)是什么。1) 圖形是關(guān)于x=m對(duì)稱的鐘形曲線,且峰值在x=m 處2) 均值m和標(biāo)準(zhǔn)差s一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族” 3) 均值m可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體水平位置;4) 標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。s越大,正態(tài)曲線扁平;s越小,正態(tài)曲線越陡峭5) 當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交6) 正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1 第六章 抽樣與抽樣分布1. 概率抽樣:根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位,也稱隨機(jī)抽樣

36、特點(diǎn)n 按一定的概率以隨機(jī)原則抽取樣本,抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中n 每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的 n 當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率2. 簡(jiǎn)單隨機(jī)抽樣:從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本,使得總體中每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中 。抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣。參數(shù)估計(jì)和假設(shè)檢驗(yàn)所依據(jù)的主要是簡(jiǎn)單隨機(jī)樣本特點(diǎn):n 簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本n 用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性:n 當(dāng)N很大時(shí),不易構(gòu)造抽樣框n 抽出的單位很分散,給實(shí)施調(diào)查增加了困難n 沒(méi)有利用

37、其他輔助信息以提高估計(jì)的效率3.分層抽樣:將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。優(yōu)點(diǎn):n 保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度n 組織實(shí)施調(diào)查方便n 既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)4.系統(tǒng)抽樣:將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位。如先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位。優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難5、整群抽樣:將總體中若干個(gè)單位合并

38、為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查。特點(diǎn):n 抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量n 調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施n 缺點(diǎn)是估計(jì)的精度較差6、多階段抽樣:先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查。群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣n 具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用n 需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開n 在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法 1. 解釋總體

39、分布、樣本分布和抽樣分布的含義1) 總體分布:素的觀察值所形成的相對(duì)頻數(shù)分布。分布通常是未知的,以假定它服從某種分布 。2) 樣本分布:從總體中抽取容量為n的樣本,這n個(gè)樣本觀測(cè)值形成的相對(duì)頻數(shù)分布,也稱經(jīng)驗(yàn)分布 。樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布 3) 抽樣分布:是樣本統(tǒng)計(jì)量的概率分布,是一種理論分布,即重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布 。隨機(jī)變量是樣本統(tǒng)計(jì)量;結(jié)果來(lái)自容量相同的所有可能樣本;提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 2. 解釋中心極限定理。從均值為m ,方差為s 的一個(gè)任意總體中

40、抽取容量為n的隨機(jī)樣本,當(dāng)n充分大時(shí)(n30),樣本均值的抽樣分布近似服從均值為,方差為2/n的正態(tài)分布。3. 重復(fù)抽樣和不重復(fù)抽樣相比,抽樣均值分布的標(biāo)準(zhǔn)差有何不同?1) 重復(fù)抽樣條件下,(同時(shí)包括不重復(fù)抽樣中的大樣本:在對(duì)無(wú)限總體進(jìn)行不重復(fù)抽樣, 以及有限總體N很大,n/N很小時(shí),則修正系數(shù)(Nn/N-1)趨于1,都可以按重復(fù)抽樣條件下處理。)方差為: 2) 在不重復(fù)抽樣條件下,抽樣均值方差則需要修正系數(shù),方差為: 4. 樣本均值分布與總體分布的關(guān)系是什么?1) 原總體為正態(tài)分布時(shí),無(wú)論樣本容量大小,樣本均值抽樣分布均服從正態(tài)分布。2) 原總體為非正態(tài)分布時(shí),有兩種情況:n 樣本容量n30

41、時(shí),其不服從正態(tài)分布。n 樣本容量n30時(shí),使用中心極限定理:從均值為m ,方差為s 的一個(gè)任意總體中抽取容量為n的隨機(jī)樣本,當(dāng)n充分大時(shí)(n30),樣本均值的抽樣分布近似服從均值為,方差為2/n的正態(tài)分布。5. 樣本方差與兩個(gè)樣本方差的比各自服從什么分布?且其圖形各有什么特點(diǎn)?1) 樣本方差服從X2分布其特征有四:n 分布的變量值始終為正 n 分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱 n 期望為E(c2)=n,方差為D(c2)=2n(n為自由度) n 可加性:若U和V為兩個(gè)獨(dú)立的服從c2分布的隨機(jī)變量,Uc2(n1),Vc2(n2),則U+V這

42、一隨機(jī)變量服從自由度為n1+n2的c2分布 2) 兩個(gè)樣本方差的比服從F分布:其特征為:圖形右偏。第七章 參數(shù)估計(jì)1. 解釋估計(jì)量和估計(jì)值估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱。如樣本均值,樣本比例、樣本方差等。參數(shù)用q 表示,估計(jì)量用q 表示估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來(lái)的統(tǒng)計(jì)量的具體值。2. 簡(jiǎn)述估計(jì)量好壞的評(píng)價(jià)標(biāo)準(zhǔn)1) 無(wú)偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)2) 有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效 3) 一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。3. 解釋置信水平的含義將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)

43、真值的次數(shù)所占的比例稱為置信水平 ,表示為 (1 - a )。a 為是總體參數(shù)未在區(qū)間內(nèi)的比例。也叫置信系數(shù)。4. 怎樣理解置信區(qū)間1) 由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間2) 統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間 3) 用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值a) 我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)b) 總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯(cuò)誤的5. 解釋95%的置信區(qū)間N個(gè)隨機(jī)區(qū)間中,有95%個(gè)區(qū)間

44、可能包含真值.6. 估計(jì)誤差或邊際誤差的式子 含義是什么。它是估計(jì)總體均值時(shí)的邊際誤差,也稱為估計(jì)誤差或者估計(jì)范圍。其中a是預(yù)先所確定的概率值,也稱為風(fēng)險(xiǎn)值,它是總體均值不包含在置信區(qū)間的概率,Za/2是標(biāo)準(zhǔn)正態(tài)分布上側(cè)面積為a/2時(shí)的Z值。7. 均值的置信區(qū)間估計(jì)與新觀測(cè)值的預(yù)測(cè)區(qū)間估計(jì)有什么不同。1) 研究一個(gè)總體時(shí),總體均值的置信區(qū)間估計(jì)關(guān)心的是總體均值,而與它不同的是有時(shí)關(guān)心的是預(yù)測(cè)隨機(jī)變量未來(lái)的觀察值,并希望求出各某個(gè)未來(lái)觀察值的取值范圍,這個(gè)范圍就是對(duì)某個(gè)未來(lái)觀察值的預(yù)測(cè)區(qū)間估計(jì)。2) 未來(lái)觀測(cè)值Xn+1的預(yù)測(cè)區(qū)間總是比均值的置信區(qū)間要長(zhǎng)。因?yàn)閄n+1的預(yù)測(cè)誤差比u的估計(jì)誤差要大。

45、n 直觀的看,預(yù)測(cè)誤差是兩個(gè)隨機(jī)變量的差( ),而用于置信區(qū)間的估計(jì)誤差是一個(gè)隨機(jī)變量和常數(shù)的差( ),隨著n的增大,估計(jì)誤差越來(lái)越接近0,置信區(qū)間的長(zhǎng)度也就趨于0,變?yōu)閡的真實(shí)值,而未來(lái)觀測(cè)值的預(yù)測(cè)誤差總是存在,其區(qū)間長(zhǎng)度接近于 3) 總體均值的置信區(qū)間估計(jì)對(duì)正態(tài)性的假設(shè)不是很敏感,而未來(lái)觀測(cè)值的預(yù)測(cè)區(qū)間則對(duì)正態(tài)性假設(shè)很敏感,因?yàn)樗c從整態(tài)總體中隨機(jī)抽取的單個(gè)觀測(cè)值有關(guān)。8. 解釋獨(dú)立樣本和匹配樣本的含義。1) 獨(dú)立樣本:是指兩個(gè)樣本是從總體中獨(dú)立地抽取的,即一個(gè)樣本中的元素與另一個(gè)樣本中的元素相互獨(dú)立。2) 匹配樣本:使用獨(dú)立樣本來(lái)估計(jì)兩個(gè)總體均值之差存在潛在的弊端,可能因?yàn)椴还降臉颖局?/p>

46、定掩蓋樣本的真正差異。因?yàn)闉榱私鉀Q這一問(wèn)題,采用匹配樣本,即一個(gè)樣本中的數(shù)據(jù)與另一樣本中的數(shù)據(jù)相對(duì)應(yīng)。9. 在對(duì)兩個(gè)總體均值之差的小樣本估計(jì)中,對(duì)兩個(gè)總體和樣本都有哪些假定? 兩個(gè)總體都服從正態(tài)分布 兩個(gè)獨(dú)立的小樣本(n130和n230) 此外還有分別的假定,如總體方差相等、樣本容量相等等,計(jì)算方法也不一樣。10. 簡(jiǎn)述樣本容量與置信水平、總體方差、邊際誤差的關(guān)系。在估計(jì)時(shí),總希望提高估計(jì)的可靠程度或者說(shuō)是置信水平,就應(yīng)擴(kuò)大置信區(qū)間,但過(guò)于寬的置信區(qū)間在實(shí)際中是沒(méi)有意義的,如果要縮小置信區(qū)間又不降低置信程度,就要增大樣本容量,但樣本容量的增加也存在諸多限制,如增加調(diào)查費(fèi)用和工作量等,通常它們之

47、間存在一定的關(guān)系:公式為 則說(shuō)明樣本容量與a) 與總體方差成正比。b) 與邊際誤差的平方成反比。c) 與可靠性系數(shù)成正比。11. 參數(shù)估計(jì)中結(jié)果的四舍五入法則。(附加)1) 當(dāng)用原始數(shù)據(jù)構(gòu)建置信區(qū)間時(shí),置信區(qū)間的計(jì)算結(jié)果應(yīng)保留的小數(shù)點(diǎn)位數(shù)要比原始數(shù)據(jù)中使用的小數(shù)點(diǎn)多一位,如原始數(shù)據(jù)有一位小數(shù),置信區(qū)間的結(jié)果應(yīng)保留兩位小數(shù)。2) 當(dāng)不知道原始數(shù)據(jù),只使用匯總統(tǒng)計(jì)量(n,s)時(shí),置信區(qū)間的計(jì)算結(jié)果應(yīng)保留的小數(shù)點(diǎn)位數(shù)應(yīng)與樣本方差或標(biāo)準(zhǔn)差使用的小數(shù)點(diǎn)位數(shù)相同 。第八章 假設(shè)檢驗(yàn)(18個(gè) )統(tǒng)計(jì)方法包括描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)(推斷統(tǒng)計(jì)又包括參數(shù)估計(jì)和假設(shè)檢驗(yàn))1. 解釋原假設(shè)和備擇假設(shè)1) 通常將研究者想收

48、集證據(jù)予以支持的假設(shè)稱為備擇假設(shè),或研究假設(shè),用H1或者Ha表示。2) 研究者想收集證據(jù)予以反對(duì)的假設(shè),稱為原假設(shè),或者零假設(shè)。表示為 H02. 什么是標(biāo)準(zhǔn)化檢驗(yàn)統(tǒng)計(jì)量?為什么要對(duì)統(tǒng)計(jì)量進(jìn)行標(biāo)準(zhǔn)化?檢驗(yàn)統(tǒng)計(jì)量是根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量。對(duì)于總體均值和總體比例的檢驗(yàn),標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量可以表示為: 原因:n 因?yàn)闄z驗(yàn)統(tǒng)計(jì)量實(shí)際上是總體參數(shù)的點(diǎn)估計(jì)量,但是點(diǎn)估計(jì)量并不能直接作為檢驗(yàn)的統(tǒng)計(jì)量,只有將其標(biāo)準(zhǔn)化后才能用于度量它與原假設(shè)的參數(shù)真值之間的差異程度。n 點(diǎn)估計(jì)量標(biāo)準(zhǔn)化的依據(jù)是:原假設(shè)為真和點(diǎn)估計(jì)量的抽樣分布。n 實(shí)際上假設(shè)檢驗(yàn)中用的都是標(biāo)準(zhǔn)化

49、檢驗(yàn)統(tǒng)計(jì)量,它反映了點(diǎn)估計(jì)量與總體參數(shù)相比相差多少個(gè)標(biāo)準(zhǔn)差。3. 怎樣理解顯著性水平?它是一個(gè)概率值,原假設(shè)為真時(shí),拒絕原假設(shè)的概率,抽樣分布的拒絕域表示為 a ,由研究者事先確定。1. 我們可以在事先確定用于拒絕原假設(shè)H0的證據(jù)必須強(qiáng)到何種程度。這等于說(shuō)我們要求多小的P值。而這個(gè)P值就叫顯著性水平,用a表示n 顯著性水平表示總體中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。n 假如我們選擇a=0.05,樣本數(shù)據(jù)能拒絕原假設(shè)的證據(jù)要強(qiáng)到:當(dāng)H0正確時(shí),這種樣本結(jié)果發(fā)生的頻率不超過(guò)5%;如果我們選擇a=0.01,就是要求拒絕H0的證據(jù)要更強(qiáng),這種樣本結(jié)果發(fā)生的頻率只有1%。2. 如果P值小于或等于a ,我們稱該組數(shù)據(jù)不利于原假設(shè)的證據(jù)有a的顯著性水平4. 怎樣理解統(tǒng)計(jì)顯著性與實(shí)際顯著性?統(tǒng)計(jì)上顯著不一定有實(shí)際意義:1. 當(dāng)原假設(shè)被拒絕時(shí),我們稱樣本結(jié)果在統(tǒng)計(jì)上是顯著的,當(dāng)不拒絕原假設(shè)時(shí),我們稱樣本結(jié)果在統(tǒng)計(jì)上是不顯著的。n P值越小,表明結(jié)果越顯著。但檢驗(yàn)結(jié)果究竟是“顯著的”、“中度顯著的”還是“高

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論