數(shù)量方法概念_第1頁(yè)
數(shù)量方法概念_第2頁(yè)
數(shù)量方法概念_第3頁(yè)
數(shù)量方法概念_第4頁(yè)
數(shù)量方法概念_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章:數(shù)據(jù)的整理和描述名詞解釋1:分類型數(shù)據(jù):即屬性數(shù)據(jù),它所描述的是事物的品質(zhì)特征。從統(tǒng)計(jì)的計(jì)量水準(zhǔn)來(lái)說(shuō)是一種較原始和低級(jí)的計(jì)量,稱列名水準(zhǔn)。這類數(shù)據(jù)只能計(jì)算各類的頻數(shù)和比例,不能進(jìn)行其他數(shù)學(xué)運(yùn)算,如人口按性別、民族等分類,這種分類沒(méi)有嚴(yán)格的先后順序。廣義的分類數(shù)據(jù),也包括順序的計(jì)量水準(zhǔn),如學(xué)生的成績(jī)劃分為優(yōu)良中及格和不及格,它們之間有一定的順序關(guān)系,可以比較,但也不能進(jìn)行其他數(shù)學(xué)運(yùn)算。2:數(shù)量型數(shù)據(jù):這類數(shù)據(jù)是用來(lái)說(shuō)明事物的數(shù)量特征,從統(tǒng)計(jì)的計(jì)量水準(zhǔn)來(lái)說(shuō)包括定距水準(zhǔn)和定比水準(zhǔn)。如:人的年齡,企業(yè)職工人數(shù),產(chǎn)品產(chǎn)量,國(guó)家的國(guó)民生產(chǎn)總值等用數(shù)值的形式表示,這類數(shù)據(jù)除了計(jì)算頻數(shù)和比例外,還可進(jìn)行計(jì)算平均數(shù)和方差。3:截面數(shù)據(jù):是指用來(lái)描述事物在同一時(shí)點(diǎn)社會(huì)經(jīng)濟(jì)各種不同指標(biāo)的數(shù)據(jù)。如在同一時(shí)期的人口數(shù)、國(guó)內(nèi)生產(chǎn)總值、運(yùn)輸量、財(cái)政收入等數(shù)據(jù),可觀察同一時(shí)期各指標(biāo)間的相互關(guān)系。它還包括同一時(shí)期相同指標(biāo)在不同部門的分布,又稱橫向數(shù)據(jù),它可研究客觀現(xiàn)象之間的相互聯(lián)系。4:時(shí)間序列數(shù)據(jù):將數(shù)據(jù)按時(shí)間的先后順序排列后形成的數(shù)據(jù)序列,又稱縱向數(shù)據(jù)。時(shí)間序列數(shù)據(jù)可以反映事物在一定時(shí)間范圍內(nèi)的變化情況,研究事物動(dòng)態(tài)變化的規(guī)律性并進(jìn)行預(yù)測(cè)等。5:頻數(shù)分布:即次數(shù)分布,是按數(shù)據(jù)的某種特征進(jìn)行分組后再計(jì)算出各類數(shù)據(jù)在各組出現(xiàn)的次數(shù)加以整理,這種次數(shù)也稱頻數(shù),整理后形成的表稱頻數(shù)分布表。把頻數(shù)與全體數(shù)據(jù)個(gè)數(shù)之比,稱頻率,這樣的表就為頻率分布表。6:組距:在數(shù)量型數(shù)列中按單變量分組有時(shí)組數(shù)過(guò)多,不便于觀察數(shù)據(jù)分布特征和規(guī)律,需要將數(shù)據(jù)的大小適當(dāng)歸并,在每組中規(guī)定的最大值與最小值之差就稱為組距。各組的組距均相等時(shí)稱等距數(shù)列,不完全相等時(shí)稱不等距數(shù)列。7:組界:又稱組限,指組距的變量數(shù)列的分組中,各組變動(dòng)范圍兩端的數(shù)值,最小限度的值稱下限,最大限度的值稱上限,上限與下限之差即為組距。8:組中值:組距的變量數(shù)列中每組上限與下限的平均值,其公式為:組中值=(上限+下限)/29:頻率分布表:頻數(shù)分布表的另一種表現(xiàn)形式,它把每組中變量出現(xiàn)的頻數(shù)轉(zhuǎn)換為相對(duì)次數(shù),即得每組次數(shù)除以總次數(shù),稱各組的頻率,各組的頻率相加為1。10:直方圖:頻數(shù)分配表的直觀圖示形式。它適用于組距數(shù)列,圖形用一平面的直角坐標(biāo),橫軸表示變量值,各組的組距大小與橫軸上的長(zhǎng)度成正比。縱軸表示頻數(shù)或頻率,用高度來(lái)表示頻數(shù)多少,與橫軸的各組組距連接垂直直線。11:條形圖和柱形圖:一種用來(lái)對(duì)各項(xiàng)信息進(jìn)行比較的圖示方式。在平面上用相同寬度但不同長(zhǎng)度的條形來(lái)表示數(shù)值的大小,其條形可橫可豎。當(dāng)條形豎立時(shí),也稱柱形圖。條形圖可用來(lái)比較不同國(guó)家、地區(qū)、行業(yè)以及公司單位之間同一指標(biāo)的差異,也可以比較同一單位在不同時(shí)間指標(biāo)值的差異。如果把兩個(gè)或兩個(gè)以上指標(biāo)的條形圖合成一組條形圖,稱復(fù)式條形圖,如果把一個(gè)條件的全部長(zhǎng)度分割成幾個(gè)小段,每個(gè)小段長(zhǎng)度代表總體的一個(gè)組成部分,稱結(jié)構(gòu)條形圖。12:餅形圖:又稱圓形結(jié)構(gòu)圖,一般用來(lái)描述和顯示總體中各種類型占全體的比例。通常以圓面積表示研究對(duì)象的總量,把圓形分成若干扇形部分,每個(gè)扇形部分代表一種組成部門,該組成部分的大小與扇形的面積大小成正比,從而表示總量的構(gòu)成狀況,形象地顯示總量的結(jié)構(gòu)。13:折線圖:有兩種折線圖,一是在研究動(dòng)態(tài)趨勢(shì)時(shí),以橫坐標(biāo)表示時(shí)間,縱坐標(biāo)表示現(xiàn)象的數(shù)值,將所形成的點(diǎn)逐點(diǎn)相連,就形成動(dòng)態(tài)折現(xiàn)圖,可以反映動(dòng)態(tài)的變化趨勢(shì),另一是在直方圖的基礎(chǔ)上,將頂端中間的點(diǎn),其臨近兩點(diǎn)用直線加以連接,就形成頻數(shù)分配的折線圖,把折線兩端延伸與橫軸相連,則折線圖下所覆蓋的面積相當(dāng)于直方圖的面積,在頻率分布時(shí)其面積表示1,可反映變量的分布狀況。14:曲線圖:是折線圖的修勻,折線圖在各點(diǎn)連接時(shí)會(huì)產(chǎn)生突變,而客觀事物的發(fā)展往往是逐漸變化的,通過(guò)修勻后的曲線圖則彌補(bǔ)了這一不足,反映了逐漸變化的過(guò)程,反映時(shí)間數(shù)列的曲線圖又稱動(dòng)態(tài)曲線圖或歷史曲線圖,反映變量數(shù)列的曲線圖又稱頻率曲線圖。15:散點(diǎn)圖:又稱散布圖,通常用來(lái)描述兩個(gè)變量之間的關(guān)系,當(dāng)一個(gè)單元具有兩個(gè)標(biāo)志值時(shí),在坐標(biāo)軸上分別用橫坐標(biāo)和縱坐標(biāo)表示,在它們?nèi)≈档慕徊纥c(diǎn)上作點(diǎn),這些點(diǎn)所形成的圖形,就稱散點(diǎn)圖。它可以觀察兩個(gè)指標(biāo)之間是否存在關(guān)系,若有關(guān)系又是何種形狀的關(guān)系,在相關(guān)與回歸分析中具有重要作用。16:莖葉圖:形象地把每個(gè)數(shù)據(jù)分為莖和葉兩部分,把數(shù)字的主干部分加以歸類作為莖,然后在分類時(shí)把其余部分作為葉,列在相應(yīng)的莖上,其優(yōu)點(diǎn)是可以把統(tǒng)計(jì)的分組和頻數(shù)分配的劃記工作一次完成,即保持了直方圖的直觀形象,又保留了原有數(shù)據(jù)的原始信息,從中可得到平均數(shù),中位數(shù)和眾數(shù)等特征值。17:平均數(shù):又稱均值,其中最常用的是算術(shù)平均數(shù),是指一組數(shù)據(jù)之和除以數(shù)據(jù)的個(gè)數(shù),它代表了一組數(shù)據(jù)的一般水平,因?yàn)樗前迅叩蛿?shù)據(jù)相互抵消的結(jié)果,它也是數(shù)據(jù)集的重心位置,正好是一平衡點(diǎn),反映了數(shù)據(jù)位置或集中趨勢(shì)。18:中位數(shù):將一組數(shù)據(jù)按照由小到大依次排序后處于中間位置上的變量值,也就是說(shuō)中位數(shù)將整個(gè)數(shù)據(jù)一分為二,正好有一半的數(shù)據(jù)比中位數(shù)小,另一半的數(shù)據(jù)比中位數(shù)大,如果數(shù)據(jù)集為偶數(shù),則應(yīng)是中間兩個(gè)數(shù)值的平均數(shù),如果是頻數(shù)分配表,中位數(shù)往往位于某一組距之內(nèi),需要用插入的方法計(jì)算。19:眾數(shù):指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)變量值,眾數(shù)的優(yōu)點(diǎn)在于反映了數(shù)據(jù)中最常見(jiàn)的數(shù)值,它不僅適用于數(shù)量型數(shù)據(jù),也適用于分類型數(shù)據(jù)。其缺點(diǎn)是有些數(shù)據(jù)集可能沒(méi)有眾數(shù),也可能有幾個(gè)眾數(shù)。20:方差:是一組數(shù)據(jù)的每一個(gè)觀察值與其平均數(shù)離差平方的平均數(shù)。方差是反映一組數(shù)據(jù)離散程度的重要指標(biāo),當(dāng)與平均數(shù)一起應(yīng)用時(shí)可以說(shuō)明平均數(shù)代表該數(shù)據(jù)集的代表性,方差越小,平均數(shù)的代表性越強(qiáng)。21:標(biāo)準(zhǔn)差:方差的平方根,即。=。2,也是反映數(shù)據(jù)離散程度的指標(biāo),由于方差是變量與平均數(shù)離差平方的平均數(shù),因而方差的量綱與原來(lái)數(shù)據(jù)的量綱不一致,標(biāo)準(zhǔn)差將其開(kāi)平方根,就恢復(fù)了原來(lái)數(shù)據(jù)的量綱。22:極差:又稱全距,極差日=最大值max—最小值min,顯然它也是度量一組數(shù)據(jù)的離散或集中程度的,極差越小表示數(shù)據(jù)的集中程度越高,極差越大表示數(shù)據(jù)越分散。它的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)便,缺點(diǎn)是易受極端值的影響而不夠穩(wěn)定,且沒(méi)有充分利用所有數(shù)據(jù)的信息。23:變異系數(shù):又稱離散系數(shù),O 是指一組數(shù)據(jù)的標(biāo)準(zhǔn)差與平礙數(shù)之5比,用u表示,它反映數(shù)據(jù)的相對(duì)離散程度,便于在不同均值的兩組數(shù)據(jù)中以及對(duì)于具有不同屬性的兩組數(shù)據(jù)中比較離散程度。24:四分位點(diǎn):將一組數(shù)據(jù)由小到大順序排列,用Q1Q2Q3三點(diǎn)將整個(gè)數(shù)據(jù)的個(gè)數(shù)進(jìn)行四等分,它們分別位于:25%、50%、75%的位置,這三個(gè)點(diǎn)就稱為四分位點(diǎn),這三個(gè)店的數(shù)值稱為四分位數(shù)。25:四分位差:基于四分位點(diǎn)計(jì)算的數(shù)據(jù)值之差,又分為四分位極差和四分位半距。四分位極差是指第3個(gè)四分位數(shù)Q3與第1個(gè)四分位數(shù)之差,即Q3-Q1,它表明除去兩端各25%的數(shù)據(jù)后的極差;四分位半距是將四分位極差除以2.兩者都是度量數(shù)據(jù)離散程度的指標(biāo),與全距相比,它排除了少數(shù)極端數(shù)值的影響。思考題1、 簡(jiǎn)述平均數(shù)的作用:在大量的數(shù)據(jù)觀察中,平均數(shù)抵消了些偶然變動(dòng)的影響,從而呈現(xiàn)了數(shù)據(jù)的一般水平,在頻數(shù)分布中平均數(shù)體現(xiàn)了大量數(shù)據(jù)的集中趨勢(shì),其他數(shù)據(jù)圍繞平均數(shù)上下波動(dòng),在統(tǒng)計(jì)推斷中也離不開(kāi)平均數(shù)。2、 簡(jiǎn)述中位數(shù)的作用?中位數(shù)也是一種集中趨勢(shì)的計(jì)量,但它是一個(gè)位置的中間值。當(dāng)數(shù)據(jù)中有極端數(shù)字時(shí),平均數(shù)易受極端值影響,而中位數(shù)則不受影響,故在統(tǒng)計(jì)中稱有比較穩(wěn)健的性質(zhì)。3、 簡(jiǎn)述眾數(shù)的作用?一個(gè)表明位置的集中趨勢(shì),它表明數(shù)據(jù)出現(xiàn)次數(shù)最多的那個(gè)值,有特定的作用,如電視機(jī)有各種不同的型號(hào),需要了解哪種型號(hào)是銷售最多的,這就是眾數(shù)的型號(hào),他不能由平均數(shù)或中位數(shù)代替。另外它不僅可用于數(shù)量型變量,也可用于屬性變量。4、 簡(jiǎn)述一組數(shù)據(jù)中,平均數(shù)、中位數(shù)和眾數(shù)間的關(guān)系?當(dāng)一組數(shù)據(jù)呈中間大兩頭小的對(duì)稱分布時(shí),平均數(shù)、中位數(shù)和眾數(shù)是一致的。但如果呈現(xiàn)偏態(tài)時(shí)這三者就不一致了,當(dāng)分布為右偏時(shí),則平均數(shù)受極端值的影響較大,中位數(shù)在中間而眾數(shù)最小。當(dāng)分布為左偏時(shí),則平均數(shù)最小,眾數(shù)最大,而中位數(shù)仍在中間。5、 簡(jiǎn)述標(biāo)準(zhǔn)差與變異系數(shù)的關(guān)系?標(biāo)準(zhǔn)差與變異系數(shù)都是測(cè)定一組數(shù)據(jù)的離散程度,有相同的作用,但標(biāo)準(zhǔn)差是測(cè)定絕對(duì)的離差大小,具有量綱,它的計(jì)量單位與測(cè)量數(shù)據(jù)的單位是一致的,變異系數(shù)則是測(cè)量相對(duì)的變異程度,因而沒(méi)有量綱,在不同場(chǎng)合有不同作用。6、 簡(jiǎn)述極差與四分位極差關(guān)系?極差與四分位極差都是計(jì)量一組數(shù)據(jù)離散程度的,極差比較直觀且容易計(jì)算,在質(zhì)量管理中測(cè)量產(chǎn)品變動(dòng)情況時(shí)常用到極差。但極差是最大值減去最小值,易受極端值的影響。而四分位極差是兩端各去掉1/4單位后,計(jì)算其差值,因此它消除了兩段極值的影響,但在計(jì)算時(shí)要先算出Q1和Q3。:填空題:1:若是一個(gè)正偏的頻數(shù)分布,指峰在左邊,右邊有較長(zhǎng)的尾巴,算術(shù)平均數(shù)集中趨勢(shì)的計(jì)量值最大。(平均數(shù)〉中位數(shù)〉眾數(shù))2:有一組數(shù)據(jù):0,0,0,-30,-20,20,50.其平均數(shù)為2?-86,中位數(shù)為0,眾數(shù)為03:甲、乙兩地相距200公里,某人駕車從甲地到乙地平均車速每小時(shí)50公里,又從乙地回甲地,平均每小時(shí)40公里,則來(lái)回全程的車速每小時(shí)為44.44(全程400公里,共花9小時(shí),400/9)公里。4:-條公路在建造的招標(biāo)中共有5個(gè)投標(biāo),其投標(biāo)金額分別為100,112,108,98,102,這些投標(biāo)的極差為112-98=14,標(biāo)準(zhǔn)差為5.22,變異系數(shù)為0.05.5:某籃球隊(duì)上場(chǎng)的5名球員有4名在190公分至200公分間,其中有1人身高為2.4米,要說(shuō)明該隊(duì)隊(duì)員身高的一般水平,用平均數(shù)或中位數(shù)這一集中趨勢(shì)比較適合,理由是:可以充分利用每個(gè)人身高的信息,反映全隊(duì)的平均高度?;蚩梢圆皇軅€(gè)別高個(gè)了的影響而反映般水平。第2章隨機(jī)事件及其概率名詞解釋1、 隨機(jī)試驗(yàn):廣義地講,凡是一個(gè)行動(dòng)或過(guò)程會(huì)導(dǎo)致一系列可能結(jié)果之一,但具體發(fā)生哪一個(gè)結(jié)果則是不確定的,這種行動(dòng)或過(guò)程統(tǒng)稱為隨機(jī)試驗(yàn)。如在一批產(chǎn)品中隨機(jī)地抽取一個(gè),觀察是正品還是次品等。隨機(jī)試驗(yàn)有以下3個(gè)特點(diǎn):(1)可以在相同的條件下重復(fù)地進(jìn)行(2)試驗(yàn)的結(jié)果不止一個(gè),且是可知的(3)每次試驗(yàn)總是出現(xiàn)結(jié)果中的一個(gè),但試驗(yàn)結(jié)束前不能確定哪一個(gè)結(jié)果。這里注意兩點(diǎn),一這里所指的“試驗(yàn)”不局限于科學(xué)實(shí)驗(yàn)或工程方面為了探索某種規(guī)律或生產(chǎn)某種新產(chǎn)品的試驗(yàn),而是一種更廣的概念。二是在實(shí)踐中,尤其在社會(huì)經(jīng)濟(jì)及商務(wù)管理中不可能在完全相同的條件下重復(fù)進(jìn)行,因而是相對(duì)的。2、 隨機(jī)事件:隨機(jī)試驗(yàn)的每一個(gè)可能的結(jié)果稱為隨機(jī)事件,又稱不確定事件,簡(jiǎn)稱事件。事件可分為基本事件和復(fù)合事件,如事件不可能分解,即一個(gè)事件中只包括一個(gè)基本結(jié)果,就稱為基本事件,若事件中包括一個(gè)以上結(jié)果,就稱為復(fù)合事件。事件中有兩種特殊情況,在一定條件下每次試驗(yàn)一定會(huì)出現(xiàn)的事件稱必然事件,在一定條件下每次試驗(yàn)一定不會(huì)出現(xiàn)的事件稱不可能事件。3、 樣本空間:隨機(jī)試驗(yàn)的所有可能結(jié)果所組成的全體,稱樣本空間,它應(yīng)該無(wú)一遺漏的包括所有基本結(jié)果。4、 事件的包含:如果事件A的每一個(gè)樣本點(diǎn)都包括在事件B中,或事件A的發(fā)生必然導(dǎo)致事件B發(fā)生,則稱事件A包含于事件B,或稱事件B包含事件A,記作A{B或B}A。5、 事件的并:又稱事件的和,即表示事件A和事件B至少有一個(gè)事件發(fā)生的事件,記為AUB或A+B.類似地,n個(gè)事件A1,A2,…,An的并記為A1+A2+?+An,它表示n個(gè)事件中至少有一個(gè)發(fā)生的事件。6、 事件的交:又稱事件的積,事件A與事件B同時(shí)發(fā)生的事件稱為事件A與事件B的交,它是由既屬于A也屬于B的所有公共樣本點(diǎn)所組成的集合,記AnB或AB。類似地,n個(gè)事件A1,A2,…,An的交記為A1,A2,?An,表示n個(gè)事件同時(shí)發(fā)生的事件。7、 事件的差:事件A發(fā)生而事件B不發(fā)生,這一事件稱為事件A與事件B之差,它是屬于事件A而不屬于事件B的那些樣本點(diǎn)構(gòu)成的集合,記作A-B或AB(這一橫在B的上面)8、 互斥事件:時(shí)間A與事件B沒(méi)有共同的樣本點(diǎn),即兩事件不可能同時(shí)發(fā)生,稱事件A與事件B為互斥事件,又稱A和B互不相容,否則這兩個(gè)事件是相容的。9、 對(duì)立事件:又稱互補(bǔ)事件或逆事件,一個(gè)事件B若與事件A互斥,且它與事件A的并是整個(gè)樣本空間,則稱B是事件A的對(duì)立事件。10、 事件的運(yùn)算規(guī)則:進(jìn)行事件的運(yùn)算時(shí),經(jīng)常要用到一些規(guī)則:設(shè)ABC為三事件,則有:(1)交換律:AUB=BUA,AnB=BnA;(2)結(jié)合律:AU(BUC)=(AUB)UC,An(Bnc)=(AnB)nc;(3)分配律:AU(BnC)=(AUB)n(AUC),An(BUC)=(AnB)U(AnC)(4)德摩根律:又稱對(duì)偶原則。11、 頻數(shù)與頻率:在相同的條件下進(jìn)行N次獨(dú)立的試驗(yàn),事件A發(fā)生了Na次,則Na稱為事件A發(fā)生的頻數(shù),比值Na/N稱為事件A發(fā)生的頻率。12、 概率:是對(duì)于不確定事件出現(xiàn)可能性大小的一種度量。由于概率應(yīng)用的發(fā)展,統(tǒng)計(jì)學(xué)家對(duì)概率有不同的解釋,有古典的定義,統(tǒng)計(jì)的定義以及公理化定義等。13、 概率的古典定義:如果某一隨機(jī)試驗(yàn)的結(jié)果有限,且各個(gè)結(jié)果出現(xiàn)的可能性相等,則某一事件A發(fā)生的概率為該事件所包含的基本事件數(shù)Na與樣本空間所包含的基本事件數(shù)N的比值,記為P(A)=Na/N.14、 概率的統(tǒng)計(jì)定義:在相同的條件下進(jìn)行N次試驗(yàn),事件A發(fā)生的頻率Na/N,隨著試驗(yàn)次數(shù)的增大,將圍繞某一常數(shù)P上下擺動(dòng),則擺動(dòng)的幅度逐漸減小而趨于穩(wěn)定,這個(gè)頻率的穩(wěn)定值P稱為事件A出現(xiàn)的概率。15、 概率的公理化定義:由下列幾條公里組成:(1)對(duì)于任何一個(gè)事件A,有0二P(A)二1;(2)對(duì)于必然事件Q,有P(Q)=1,不可能事件:p(^)=0(3)對(duì)于兩兩互斥事件A1,A2,…,有P(A1+A2+…)=P(A1)+P(A2)+…16、 概率的加法規(guī)則:對(duì)于任意兩個(gè)隨機(jī)事件,它們之和的概率為兩個(gè)事件分別概率之和減去兩個(gè)事件之交的概率。P(AUB)=P(A)+P(B)-P(AnB),當(dāng)兩個(gè)事件為互斥時(shí),P(AnB)=0,可簡(jiǎn)化為P(AUB)=P(A)+P(B).17、 條件概率:是指在另一事件已發(fā)生的條件下某一事件發(fā)生的概率。如當(dāng)B已發(fā)生的條件下,A發(fā)生的概率就稱為B發(fā)生條件下A事件的條件概率,記:P(A|B).18、 事件的獨(dú)立性:兩個(gè)事件中不論哪一個(gè)事件發(fā)生與否并不影響另一事件發(fā)生的概率,則稱兩個(gè)事件相互獨(dú)立,這時(shí)它們的條件概率等于無(wú)條件概率。如A和B為二獨(dú)立事件,則有P(B|A)=P(B),P(A|B)=P(A),且有P(AnB)=P(A)-P(B)19、 概率的乘法規(guī)則:兩個(gè)事件之積的概率等于其中一個(gè)事件的概率與另一個(gè)事件在前一事件發(fā)生下條件概率的乘積。如p(AnB)=P(A)?P(B|A)或P(AnB)=P(B)?P(A|B)。當(dāng)兩事件相互獨(dú)立時(shí),則兩個(gè)事件之積的概率等于兩事件分別概率的乘積。思考題1、 隨機(jī)試驗(yàn)的特點(diǎn)是什么?1、試驗(yàn)可在相同條件下重復(fù)進(jìn)行;2、試驗(yàn)的所有可能結(jié)果是明確可知的,并且不止一個(gè);3、每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。2、 事件的獨(dú)立性與事件互斥之間有什么聯(lián)系和區(qū)別?互斥事件定是相互依賴,因而是不獨(dú)立的。然而相互依賴的事件則不定是互斥的。以氣象為例,用事件A表示下雨,事件B表示無(wú)雨,事件C表示刮風(fēng),顯然事件A與B是互斥的,因而也是不獨(dú)立的。事件A與C雖然不互斥,但通常也是不獨(dú)立而有依賴關(guān)系。反過(guò)來(lái)不互斥事件,,可能是獨(dú)立的,,也可能是不獨(dú)立的。關(guān)于不互斥事件相互獨(dú)立的例子,可用有放回抽樣來(lái)說(shuō),A表第一次抽到是正品,B表第二次抽到也是正品。這兩事件并不互斥,但卻是獨(dú)立的。3、 在現(xiàn)實(shí)世界的許多問(wèn)題中用古典概率有什么局限性?由于古典概率要求試驗(yàn)結(jié)果是有限的,且要求每一基本事件出現(xiàn)的可能性是相等的,而現(xiàn)實(shí)世界中許多隨機(jī)現(xiàn)象并不一定能滿足這一條件,因而在使用上就受到局限。4、 概率的統(tǒng)計(jì)定義有什么局限性?由于概率的統(tǒng)計(jì)定義要求在相同條件下的大量重復(fù)試驗(yàn),而在現(xiàn)實(shí)生活中不可能在相同條件下做大量試驗(yàn),有些根本不能做重復(fù)試驗(yàn)。5、組成樣本空間的條件是什么?組成樣本空間的條件是無(wú)一遺漏地包括所有的可能結(jié)果。6、 若做鄭一枚硬幣和鄭枚賽子的試驗(yàn),現(xiàn)定義下列兩事件:事件A代表硬幣正面向上,塞子出現(xiàn)偶數(shù),事件B代表硬幣反面向上,塞子出現(xiàn)奇數(shù)。那么事件A和事件B的和是否組成樣本空間?事件A與B的并沒(méi)用包括所有的可能結(jié)果,如還有硬幣正面向上,塞子出現(xiàn)奇數(shù);硬幣反面向上,塞子出現(xiàn)偶數(shù),因此不能組成樣本空間。7、 若產(chǎn)品檢驗(yàn)分為合格與不合格兩種結(jié)果,有放回地檢驗(yàn)三件產(chǎn)品,共有多少樣本點(diǎn)?其樣本空間是什么?由于每個(gè)產(chǎn)品有兩種可能,3個(gè)產(chǎn)品共有2的三次方等于8種可能結(jié)果,組成樣本空間的樣本點(diǎn)為O、冬冬冬冬木冬4°{合、口、口,口、口、不,口、不、合,合、不、不,不、合、合,不、合、不,不、不、合,不、不、不}以上按照觀察的順序排列,其中合表示合格品,不表示不合格品。8、 有甲乙丙三個(gè)投標(biāo)人,看來(lái)甲中標(biāo)的概率將兩倍于乙,而乙的中標(biāo)概率又兩倍于丙。甲、乙、丙各自中標(biāo)的概率是多少?應(yīng)用了什么概率定義?答:由于三個(gè)投標(biāo)人中總有一人中標(biāo),組成樣本空間,已知P(甲)=2P(乙),P(乙)=2P(丙);根據(jù)樣本空間的定義有P(甲)+P(乙)+P(丙)=1,將已知條件代入出4P(丙)+2P(丙)+P(丙)=1,7P(丙)=1,P(丙)=1/7,P(乙)=2/7,P(甲)=4/7。以上是應(yīng)用了主觀概率的定義,因?yàn)橐陨现袠?biāo)既不是等可能的,又無(wú)法進(jìn)行大量試驗(yàn),因此既不是古典概率定義,也不是統(tǒng)計(jì)概率定義。9、 樣本空間與隨機(jī)事件的表示方法是什么?表示的方法有列舉法和描述法兩種。以連續(xù)拋一枚均勻硬幣兩次,觀察什么面朝上為例,該樣本空間用列舉法表示為Q=(正正,正反,反正,反反)。用描述法表示為Q={兩次都出現(xiàn)正面,第一次出現(xiàn)正面、第二次出現(xiàn)反面,第一次出現(xiàn)反面、第二次出現(xiàn)正面,兩次都出現(xiàn)反面}。10、條件概率P(A|B)和無(wú)條件概率P(A)誰(shuí)大?答是不確定的。填空題1、 鄭一枚硬幣,連續(xù)鄭三次,其樣本空間共有8(2的三次方=8)個(gè)基本事件組成,用列舉法來(lái)表示樣本空間,Q=(正正正,正正反,正反正,正反反,反正正,反正反,反反正,反反反)。若每次出現(xiàn)正面的概率為0.6,則出現(xiàn)兩次正面的一次反面概率為0.432。(0.6的平方*0.4=0.144,總概率=0.144*3=0.432)2、 如果事件A的概率為P(A)=1/2,事件B的概率為P(B)=1/2,則通常情況下P(AAB)的概率為:小量的可能取值,另一方面列出各種取值的概率,這種表示方式較直觀清楚,但只能適用于取值較少的離散型概率分布。4、 概率密度函數(shù):用數(shù)學(xué)函數(shù)的形式來(lái)表示概率分布,這種方式一般適用于連續(xù)的隨機(jī)變量,且較簡(jiǎn)潔,同一類型的隨機(jī)變量的分布,只要用不同的參數(shù)就可以表示不同的分布。5、 分布函數(shù):是按照隨機(jī)變量的取值由小到大順序排列,并以累積的方式來(lái)表示概率分布,常用F(x)表示隨機(jī)變量在小于等于x值時(shí)的累積概率,即F(x)=P(X*)。6、 隨機(jī)變量的數(shù)學(xué)期望:是隨機(jī)變量分布的一個(gè)重要特征,它是指隨機(jī)變量的每一個(gè)可能值乘以相應(yīng)的概率之和。數(shù)學(xué)期望就是隨機(jī)變量以其概率作為權(quán)數(shù)的加權(quán)算術(shù)平均數(shù),反映了隨機(jī)變量的重心位置。7、 隨機(jī)變量的方差:是指隨機(jī)變量每個(gè)可能值與數(shù)學(xué)期望離差平方之?dāng)?shù)學(xué)期望。設(shè)隨機(jī)變量為X,其方差定義為D(X)=E[X-E(x)平方]或D(X)=E(x平方)-(E(x))的平方,也是隨機(jī)變量的一個(gè)重要特征,用來(lái)反映隨機(jī)變量的離散程度。8、 貝努利試驗(yàn)概型:是具有以下特征的隨機(jī)試驗(yàn):(1)每次試驗(yàn)只有兩種可能結(jié)果,可稱為''成功”和“失敗”,通常用1和0表示;(2)每一次試驗(yàn)出現(xiàn)成功的概率P相同,失敗的概率q也相同,且有p+q=1;(3)每一次試驗(yàn)相互獨(dú)立。9、 二項(xiàng)分布:一種常見(jiàn)的離散型隨機(jī)變量的概率分布。它是建立在貝努利試驗(yàn)的基礎(chǔ)上。二項(xiàng)分布具有兩個(gè)參數(shù)n和p,記為X?B(n,p)它的數(shù)學(xué)期望和方差分別為E(X)=np,D(x)=npq。10、 泊松分布:一種常見(jiàn)的離散型隨機(jī)變量的概率分布,它適用于單位時(shí)間內(nèi)隨機(jī)事件發(fā)生的次數(shù)。當(dāng)二項(xiàng)分布P的值很小,np<5時(shí),X的分布也近似泊松分布。泊松分布的概率函數(shù)P(X=x)=。。。泊松分布的參數(shù)為A,其數(shù)學(xué)期望和方差都是&。11、 正態(tài)分布:一種最常用的連續(xù)型分布,這一分布的特點(diǎn)是變量集中在平均數(shù)左右,形成中間高向兩端伸展的鐘形。若u=0,方差=1時(shí),稱標(biāo)準(zhǔn)的正態(tài)分布。12、 均勻分布:一種連續(xù)型的隨機(jī)變量的分布,若隨機(jī)變量X在區(qū)間[a,b]間任意一點(diǎn)的概率密度相等,則稱X服從[a,b]上的均勻分布,可記作X?U(a,b),其密度為:U(x,a,b)={1/(b-a)a=x=b,{0其他。該分布的數(shù)學(xué)期望為E(X)=(a+b)/2,方差為D(X)=(b-a)的平方除以12。13、 指數(shù)分布:指數(shù)分布的數(shù)學(xué)期望和方差分別為E(X)=1/X,D(X)=1/A的平方。14、 協(xié)方差:反映二元隨機(jī)變量分布中兩個(gè)變量之間關(guān)系的一個(gè)特征值,設(shè)X、Y為兩個(gè)隨機(jī)變量,則協(xié)方差定義為Cov(X,Y)=E([X-E(X)])[Y-E(Y)]).顯然,當(dāng)X、Y為同方向變動(dòng)時(shí),協(xié)方差為正,往相反方向變動(dòng)時(shí),協(xié)方差為負(fù)。15、 決策樹(shù):是在不確定條件下進(jìn)行決策時(shí),形象地利用樹(shù)分支的結(jié)構(gòu)圖形進(jìn)行決策的一種方法。一般是從左向右展開(kāi),用一方框代表決策點(diǎn),然后根據(jù)方案的多少向右邊分出幾根樹(shù)枝,每根樹(shù)枝的末端有一圓點(diǎn)稱作結(jié)點(diǎn),根據(jù)決策面臨的狀態(tài)又分成若干樹(shù)枝,將決策方案與每一種狀態(tài)相結(jié)合,就會(huì)得到各種不同的收益或損失,通常稱作報(bào)償,寫(xiě)在樹(shù)枝的右端,然后再自右向左根據(jù)決策準(zhǔn)則進(jìn)行決策,選擇最優(yōu)方案。這種決策方法簡(jiǎn)單、直觀、而且可應(yīng)用于多階段決策。16、 極大極小決策原則:不確定情況下決策原則之一,這一原則的基本想法是在選擇方案時(shí)要從最壞處著想,即將各種方案的最壞結(jié)果一極小收益一進(jìn)行比較,從中選擇一個(gè)收益最大的方案。17、 最小期望機(jī)會(huì)損失原則:機(jī)會(huì)損失是指由于沒(méi)有選擇正確的方案而帶來(lái)的損失。在采用這一原則時(shí),首先要計(jì)算出各種情況下實(shí)行的方案與最優(yōu)方案之間的差額,即機(jī)會(huì)損失。然后根據(jù)各種狀態(tài)的概率算出各方案的期望機(jī)會(huì)損失。最小期望機(jī)會(huì)損失原則就是選擇期望損失最小的方案。18、 最大期望收益原則:采用不同方案時(shí)對(duì)于不同的狀態(tài)會(huì)得到不同的收益,可以根據(jù)不同狀態(tài)的概率,計(jì)算出期望收益。最大的期望收益原則就是選擇期望收益最大的方案。最大期望收益原則與最小期望機(jī)會(huì)損失兩種決策原則是一致的。19、 敏感性分析:是指某一決策方案確定以后,決策中的自然狀態(tài)變動(dòng)對(duì)最優(yōu)方案的變動(dòng)是否敏感。如果自然狀態(tài)有較小的變動(dòng)就會(huì)影響方案的選擇,就稱該方案比較敏感。有時(shí)需分析自然狀態(tài)的概率變動(dòng)到什么程度需要改變最優(yōu)方案,這種分析稱敏感性分析。一:數(shù)學(xué)期望:1:定義: y,以概率為權(quán)數(shù)的加權(quán)平均!r;Ju性質(zhì):Ec=c(常數(shù)期望是本身),E(ax)=aEx(常數(shù)因子提出來(lái)),E(ax+b)=aEx+b(一項(xiàng)一項(xiàng)分開(kāi)算)二:方差:1:定義:D性質(zhì)^河丁或等于1/2。 若某一事件出現(xiàn)的概率為1/6,當(dāng)試驗(yàn)6次時(shí),該事件出現(xiàn)的次數(shù)將是:1次或大于1次或小于次。 有三種投資,每種投資成功的概率為1/3,若三種投資相互獨(dú)立,三種投資中至少有一種成功的概率是多少?計(jì)算:1-P(A)?P(B)?P(C)=1-2/3的三次方即8/27=1-8/27=19/27 凡是一個(gè)行動(dòng)或過(guò)程會(huì)導(dǎo)致一系列可能的結(jié)果之一,但具體發(fā)生哪一個(gè)結(jié)果是不確定的,這種行動(dòng)或過(guò)程在統(tǒng)計(jì)學(xué)中統(tǒng)稱為隨機(jī)試驗(yàn)。丁或等于1/2。 若某一事件出現(xiàn)的概率為1/6,當(dāng)試驗(yàn)6次時(shí),該事件出現(xiàn)的次數(shù)將是:1次或大于1次或小于次。 有三種投資,每種投資成功的概率為1/3,若三種投資相互獨(dú)立,三種投資中至少有一種成功的概率是多少?計(jì)算:1-P(A)?P(B)?P(C)=1-2/3的三次方即8/27=1-8/27=19/27 凡是一個(gè)行動(dòng)或過(guò)程會(huì)導(dǎo)致一系列可能的結(jié)果之一,但具體發(fā)生哪一個(gè)結(jié)果是不確定的,這種行動(dòng)或過(guò)程在統(tǒng)計(jì)學(xué)中統(tǒng)稱為隨機(jī)試驗(yàn)。 設(shè)A和B為同一樣本空間的兩個(gè)事件,若P(ACB)=P(A)?P(B)時(shí)稱作A、B兩事件獨(dú)立,P(AUB)=P(A)+P(B)成立的前提是A、B兩事件互斥。 檢驗(yàn)3件產(chǎn)品,產(chǎn)品分為合格與不合格兩種,“三件產(chǎn)品都不合格”這一事件的對(duì)立事件是:至少有件合格。 10個(gè)燈泡中5個(gè)是好的,5個(gè)是壞的,混合在一起,若隨機(jī)有放回抽取2個(gè)燈泡,這2個(gè)燈泡都是好的概率為*,若第1個(gè)和第2個(gè)燈泡都是好的,再抽第3個(gè)燈泡仍舊是好的概率為1/2;若重新抽取3個(gè)燈泡,這3個(gè)全是好的概率為1/8;若一開(kāi)始采用無(wú)放回抽樣,抽中3個(gè)全是好的概率為*2。 一家公司中有30%是女性,其中有6%是已婚婦女,隨機(jī)抽選1人發(fā)現(xiàn)為女性,該女性是已婚的概率為0-2。 共有ABCDEF六個(gè)字母,任何兩個(gè)字母可組成一條信息,如AB、BC等,可以重復(fù)如AA,BB,且不同排列也表示不同信息,如AB與BA表示不同信息,這樣六個(gè)字母可表達(dá)6的平方等于36條信息。第3章隨機(jī)變量及其分布(-)名詞解釋1、 隨機(jī)變量:把一隨機(jī)試驗(yàn)的所有可能結(jié)果用數(shù)量來(lái)描述時(shí),與一定事件相對(duì)應(yīng)的數(shù)值稱為隨機(jī)變量。隨機(jī)變量可分為離散的隨機(jī)變量和連續(xù)的隨機(jī)變量?jī)深?。若一個(gè)隨機(jī)變量的所有可能取值為有限個(gè)或無(wú)限可數(shù)即可以逐個(gè)加以列舉的,則稱離散型隨機(jī)變量,如果一個(gè)隨機(jī)變量的取值不能一一列舉,而是用某一區(qū)間來(lái)表示,則稱為連續(xù)型隨機(jī)變量。2、 概率分布:是對(duì)隨機(jī)變量總體規(guī)律性的描述,綜合反映隨機(jī)變量在取某一值時(shí)的概率。它有多種表示形式,如分布律,概率密度函數(shù),分布函數(shù),分布的圖形。3、 分布律:是概率分布的一種表示形式,常適用于離散型的隨機(jī)變量,即用列表形式,一方面列出隨機(jī)變3:公式:Dx=E(x2)-(Ex)2(方差=平方的期望一期望的平方);三:常用隨機(jī)變量:1:0-1分布:①隨機(jī)變量X只能取0,1這兩個(gè)值;②X?B(1,p);③Ex=p,Dx=p(1-p)2:二項(xiàng)分布:①分布律:P(X=k)=Ckpk(1-pg,k=0,12....n;^X?B(n;p)③Ex=np④Dx=np(1-p)⑤適用:隨機(jī)試驗(yàn)具有兩個(gè)可能的結(jié)果A或者A,且P(A)=p,P(A)=1—p,將次貝努里試驗(yàn)重復(fù)n次。3:泊松分布:1:分布律:兀e項(xiàng) ,P(X賣X尋kP)燈E0,=2.;4:Dx=A;5:適用:指定時(shí)間內(nèi)某事件發(fā)生的次數(shù)。四:連續(xù)型隨機(jī)變量:設(shè)X是一個(gè)連續(xù)型隨機(jī)變量:1:X的均值,記做^,就是X的數(shù)學(xué)期望,即n=EX;2:X的方差,記做DX或C2,是(X-h)2的數(shù)學(xué)期望,即:DX=E[(X一日)2]=E(X2)一日23:X的標(biāo)準(zhǔn)差,記做。,是X的方差。2的算術(shù)平方根,即a=■a2;(二)思考題1平均數(shù)和方差的概念與隨機(jī)變量中的數(shù)學(xué)期望和方差的聯(lián)系和區(qū)別?描述統(tǒng)計(jì)中的平均數(shù)和方差具有相似的性質(zhì)和作用,即都是反映集中趨勢(shì)和離散程度的指標(biāo)。但描述統(tǒng)計(jì)是對(duì)某一組觀察到的具體數(shù)據(jù)而言的,而隨機(jī)變量的數(shù)學(xué)期望和方差是對(duì)某一抽象的分布而言的,它代表了該類數(shù)據(jù)的總體現(xiàn)象,并不是已觀察到得數(shù)據(jù),而是假設(shè)潛在可能發(fā)生的數(shù)據(jù)。2簡(jiǎn)述數(shù)學(xué)期望的一些常用性質(zhì)?如果X為隨機(jī)變量,a和b為常數(shù),則E(aX+b)=aE(X)+b;若X和Y為兩個(gè)隨機(jī)變量,則有E(X+Y)=E(X)+E(Y);若X和Y相互獨(dú)立,則有E(XY)=E(X).E(Y)3簡(jiǎn)述隨機(jī)變量方差的一些常用性質(zhì)?常數(shù)的方差為0;設(shè)X為隨機(jī)變量,a,b為常數(shù),則有D(aX+b)=a的平方D(X);若X,Y分別為兩個(gè)隨機(jī)變量a,b為常數(shù),則有D(aX±bY)=a的平方D(X)+b的平方D(Y)±2abCov(XY),若X和Y相互獨(dú)立,則公式最后一項(xiàng)為零。4簡(jiǎn)述二項(xiàng)分布的性質(zhì)?二項(xiàng)分布的圖形由參數(shù)n和p確定,當(dāng)p=0.5時(shí),二項(xiàng)分布是以均值np為中心的對(duì)稱分布,但當(dāng)p不等于0.5時(shí),該分布就不是對(duì)稱的了。但是隨著試驗(yàn)次數(shù)n的增加,又逐漸趨向?qū)ΨQ。當(dāng)次數(shù)無(wú)限增加時(shí)其極限分布時(shí)正態(tài)分布。因此當(dāng)n很大時(shí),通??捎谜龖B(tài)分布來(lái)近似計(jì)算。二項(xiàng)分布的數(shù)學(xué)期望為np,方差為np(1-p)5簡(jiǎn)述泊松分布的性質(zhì)?泊松分布時(shí)一個(gè)離散的分布,它只有一個(gè)參數(shù)P,其P可以是任意的正數(shù),當(dāng)P很小時(shí),泊松分布時(shí)一個(gè)偏態(tài)的分布,并隨著P的增大而趨向?qū)ΨQ。隨機(jī)變量X從0開(kāi)始,其概率逐漸增加,在到P以后概率下降。當(dāng)P是整數(shù)時(shí),則X取P和P—1的概率最大。泊松分布的數(shù)學(xué)期望和方差都是&。6簡(jiǎn)述正態(tài)分布的性質(zhì)?正態(tài)分布時(shí)一個(gè)對(duì)稱的鐘形分布,為一連續(xù)的光滑曲線,在均值P(標(biāo)準(zhǔn)正態(tài)分布為0)時(shí)有極大值,在左右一個(gè)標(biāo)準(zhǔn)差。(標(biāo)準(zhǔn)正態(tài)分布為1)處為曲線的拐點(diǎn),在橫軸X軸的兩端無(wú)限延伸呈鐘形,由于很多客觀現(xiàn)象中由許多細(xì)小的隨機(jī)因素綜合作用的結(jié)果往往形成近似的正態(tài)分布,使得正態(tài)分布應(yīng)用十分廣泛。如對(duì)于正態(tài)分布的變量約99.7%的變量位于平均值左右三個(gè)標(biāo)準(zhǔn)差的范圍內(nèi),在質(zhì)量控制中通常稱為控制質(zhì)量的3。準(zhǔn)則。(三)填空題1、 數(shù)學(xué)期望和方差是隨機(jī)變量概率分布中的重要特征,數(shù)學(xué)期望反映分布的位置(集中趨勢(shì)),而方差反映分布的離散程度、二項(xiàng)分布的數(shù)學(xué)期望為np,方差為np(1-p)P,泊松分布的數(shù)學(xué)期望為為,方差為f平方;正態(tài)分布的數(shù)學(xué)期望為u,方差為a2。均勻分布的數(shù)學(xué)期望為(a+b)/2,方差為(b-a)的平方除以12.2、 某一零件的直徑規(guī)定為10厘米,但生產(chǎn)的結(jié)果有的超過(guò)10厘米,有的不足10厘米。在正常生產(chǎn)的情況下,其誤差的分布通常服從正態(tài)分布。3、 某工廠生產(chǎn)的零件出廠時(shí)每200個(gè)裝一盒,這種零件分為合格與不合格兩類,合格率約為99%,設(shè)每9盒中的不合格數(shù)為X,則X通常服從 。4、 設(shè)X為離散型隨機(jī)變量,當(dāng)X為xi時(shí)的概率為p(xi),則X的數(shù)學(xué)期望E(X)定義為:£xiP(xi),X的方差D(X)定義為:£[xiE(X)]的平方?P(xi)5、 若隨機(jī)變量Z服從標(biāo)準(zhǔn)正態(tài)分布,則Z<1.645的概率為95%,Z>-1.285的概率為90%。6、 隨機(jī)變量的取值總是實(shí)數(shù)。7、 隨機(jī)變量劃分為離散型隨機(jī)變量和連續(xù)性隨機(jī)變量。(在表達(dá)方式上,離散隨即變量可一一列舉,采用分布律的方式表示,而連續(xù)隨機(jī)變量則不能,在計(jì)算隨機(jī)變量的概率時(shí),離散隨機(jī)變量可以計(jì)算出某一具體值的概率為零,需要計(jì)算某一區(qū)間的概率;在計(jì)算數(shù)學(xué)期望和方差等特征值時(shí),離散的隨機(jī)變量可用求和的形式,而連續(xù)的隨機(jī)變量則要用積分的形式,計(jì)算概率時(shí)也是如此。8隨機(jī)變量的方差是指隨機(jī)變量的每一個(gè)可能值與數(shù)學(xué)期望離差平方的數(shù)學(xué)期望。第四章:抽樣方法與抽樣分布(一)名詞解釋1抽樣推斷:從研究對(duì)象的全部單位中抽取一部分單元進(jìn)行觀察研究取得數(shù)據(jù),并從這些數(shù)據(jù)中獲得信息,以此來(lái)推斷全體。用統(tǒng)計(jì)學(xué)的術(shù)語(yǔ)就是根據(jù)樣本來(lái)推斷全體。2總體:是指研究對(duì)象的全體,它是具有某種共同性質(zhì)的許多個(gè)體的集合,這些個(gè)體稱為總體單元或元素。個(gè)體可以是指某種實(shí)體,如居名戶,工廠,人等,也可以是指某一實(shí)體或現(xiàn)象的觀察值,如居名戶的收入,工廠的年產(chǎn)值,人的年齡等??傮w是一個(gè)隨機(jī)變量。3樣本:是按照某種抽樣規(guī)則從總體中抽選處一部分總體單元加以觀察研究并用來(lái)推斷總體的那部分單元的集合。樣本中包括總體單元數(shù)目稱樣本量或樣本容量。4隨機(jī)抽樣:又稱概率抽樣,在抽取樣本的過(guò)程中排除主觀上有意識(shí)的選擇樣本單元加以觀察研究用來(lái)推斷總體的那部分單元的集合。樣本中包括的總體單元數(shù)目稱作樣本量或樣本容量。5簡(jiǎn)單隨機(jī)抽樣:又稱純隨機(jī)抽樣,是指總體有N個(gè)單元,從中抽取n個(gè)單元作樣本,使得所有可能的樣本都有同樣的機(jī)會(huì)被抽中的抽樣方法。在抽樣的實(shí)施過(guò)程中往往是逐個(gè)抽取的。根據(jù)在下一次抽取之前是否把前次抽取的總體單元放回總體,分為有放回抽樣和無(wú)放回抽樣。在有放回的情況下,同一總體單元有可能被重復(fù)抽中,故又稱重復(fù)抽樣,無(wú)放回抽樣又稱不重復(fù)抽樣。在通常情況下簡(jiǎn)單隨機(jī)抽樣是指不重復(fù)抽樣.6系統(tǒng)抽樣:又稱等距抽樣或機(jī)械抽樣,這種抽樣方法是將總體單元在抽樣之前按某種順序排列,并按照設(shè)計(jì)的規(guī)則確定一個(gè)隨機(jī)起點(diǎn),然后每隔一定的間隔逐個(gè)抽取樣本單元的抽選方法。7分層抽樣:又稱分類抽樣或類型抽樣,是在抽樣之前將總體劃分為互不交叉重疊的若干層,每個(gè)總體單元被劃在某一層內(nèi),然后在各層中獨(dú)立抽取一定數(shù)量的單元作樣本的抽樣方法。如果樣本占總體單元的比例在各層中相等,稱作等比例分層抽樣,如果不等則稱不等比例抽樣。8整群抽樣:是在抽樣之前把總體的單元按自然形成的或人為地分成群作為抽樣單位,在包括全部總體單元的群中隨機(jī)的抽取若干群作為樣本的抽樣方法。例如在抽取住戶時(shí),抽取若干個(gè)街道或居委會(huì),在抽選學(xué)生時(shí)抽取若干個(gè)學(xué)校。9抽樣框:用來(lái)代表總體從中抽選樣本的框架。為了實(shí)施抽樣通常要把總體單元?jiǎng)澐殖沙闃訂卧?,抽樣單元可以是組成總體的基本單位一元素,也可以是把若干元素組合在一起的群,把抽樣單位編制成名冊(cè),清單或地圖,這種名冊(cè),清單或地圖就稱作抽樣框。一個(gè)好的抽樣框應(yīng)包括全部總體單元,既不重復(fù)又無(wú)遺漏,并具備抽樣所需的有關(guān)信息。10非抽樣誤差:是抽樣調(diào)查的估計(jì)推斷中除了抽樣誤差以外其他所有誤差的總稱。它的來(lái)源很多,如有的來(lái)自于調(diào)查員的疏忽,記錄出錯(cuò);有的來(lái)自于被調(diào)查者對(duì)一些敏感性問(wèn)題的故意虛報(bào)瞞報(bào);也有的是回憶性錯(cuò)誤或所問(wèn)的問(wèn)題含義不清而引起錯(cuò)誤的理解;還有無(wú)回答或抽樣框引起的偏差等。11無(wú)回答:是指抽樣調(diào)查中的樣本,由于各種原因未能獲得調(diào)查數(shù)據(jù),通常是發(fā)生在調(diào)查對(duì)象是人單位總體,包括有意或無(wú)意的無(wú)回答,例如對(duì)一些敏感的問(wèn)題不愿回答等。愿意回答的人與不愿的人在一些指標(biāo)的數(shù)值上往往是有差別的,如果根據(jù)樣本中回答的數(shù)據(jù)來(lái)推斷總體,往往會(huì)產(chǎn)生偏差。14總體分布:是指研究對(duì)象這一總體中各個(gè)單元標(biāo)志值所形成的分布??傮w分布的一些特征如數(shù)學(xué)期望(即總體平均數(shù))等往往是抽樣推斷中待估的參數(shù)。15樣本分布:又稱子樣分布或經(jīng)驗(yàn)分布,指從總體中抽取容量為n的樣本,這些樣本單元標(biāo)志值所形成的分布。當(dāng)樣本量比較大時(shí),樣本是總體的一個(gè)雛形,可以用樣本的均值來(lái)估計(jì)總體的均值,用樣本的方差來(lái)估計(jì)總體方差。16抽樣分布:是指樣本估計(jì)量的分布。樣本估計(jì)量是樣本的函數(shù),在統(tǒng)計(jì)學(xué)中稱作統(tǒng)計(jì)量,因此抽樣分布也是指統(tǒng)計(jì)量的分布。17中心極限定理:是統(tǒng)計(jì)學(xué)中闡明在什么條件下隨機(jī)變量趨近于正態(tài)分布的一類定理。18概率抽樣:又稱隨機(jī)抽樣,是建立在概率論和統(tǒng)計(jì)學(xué)基礎(chǔ)上的一種科學(xué)的抽樣方法,這種抽樣的樣本抽取是完全隨機(jī)的,即樣本中的個(gè)體排除人們意識(shí)的選取,而是憑機(jī)遇抽選出來(lái)的,它要求每個(gè)總體單元被抽中概率時(shí)已知的,從而每個(gè)可能的樣本被抽出的機(jī)遇大小也是可以用概率計(jì)算和表示的。這種抽樣特點(diǎn)是可以用一定的概率來(lái)控制抽樣誤差的范圍。19判斷抽樣:是一種非概率抽樣方法,和概率抽樣不同,其樣本的抽取或是憑人們的主觀判斷從總體中選出少數(shù)有代表性的單元,或完全由人們?nèi)我馓暨x,每個(gè)樣本被選中的機(jī)遇無(wú)法計(jì)算,更不能用概率表示。這種方法準(zhǔn)確的情況取決于主觀判斷能力,優(yōu)點(diǎn)是方法簡(jiǎn)便。費(fèi)用節(jié)約,但缺點(diǎn)是不可避免的帶來(lái)主觀認(rèn)識(shí)上的偏差,而且這種誤差或偏差是無(wú)法客觀度量的。(二)思考題1系統(tǒng)抽樣的特點(diǎn)是什么?首先,系統(tǒng)抽樣方法簡(jiǎn)便易行,容易掌握,當(dāng)對(duì)總體單元按一定順序排列后,只要確定了抽樣的起點(diǎn)和間隔,樣本單元也就隨之而定。其次,從組織管理來(lái)看,在多階段抽樣中,便于上一級(jí)對(duì)下一級(jí)的監(jiān)督檢查,是否按隨機(jī)原則抽選樣本;第三,從抽樣效率來(lái)看,系統(tǒng)抽樣的樣本單元在總體中的分布比較均勻,因此其抽樣誤差常常小于簡(jiǎn)單隨機(jī)抽樣,如果利用已知信息將總體單元按有關(guān)標(biāo)志排列時(shí),則可以明顯提高估計(jì)精度。2分層抽樣的作用是什么?1、通過(guò)分層可以獲得各層作為子總體的估計(jì)值;2、在組織抽樣時(shí),可以按地區(qū)或行政系統(tǒng)分層,使抽樣的組織和實(shí)施比較方便;3、若按照標(biāo)志值的大小分層,因此分層抽樣要求有分層的抽樣框及各層的總體單位數(shù)目。3整群抽樣的優(yōu)缺點(diǎn)是什么??jī)?yōu)點(diǎn):群內(nèi)各單元比較集中,對(duì)樣本調(diào)查比較方便節(jié)約費(fèi)用;整群抽樣時(shí)不需要他有總體單元的詳細(xì)名單抽樣框,只要求有群的名單抽樣框,而這比較容易得到;如果群的內(nèi)部差異比較大,群之間的差異比較小時(shí),整群抽樣的效率還是比較高的。但是在通常的情況下,群內(nèi)各單元往往有同性質(zhì),即群內(nèi)各單元的差異比較小,而群與群之間的差異比較大,這樣整群抽樣誤差要大于簡(jiǎn)單隨機(jī)抽樣,這是整群抽樣的局限性。4簡(jiǎn)述抽樣框?qū)Τ闃诱{(diào)查的影響?抽樣框是用來(lái)代表總體并從中抽選樣本的框架,因此用樣本進(jìn)行推斷的總體也與抽樣框所代表的總體相一致。如果抽樣框與所研究的目標(biāo)總體之間不一致,就會(huì)產(chǎn)生估計(jì)的偏差。嚴(yán)重的偏差會(huì)導(dǎo)致數(shù)據(jù)失真,甚至得出錯(cuò)誤的結(jié)論,故抽樣框的好壞對(duì)于抽樣調(diào)查至關(guān)重要。5簡(jiǎn)述無(wú)回答對(duì)抽樣的影響及處理無(wú)回答的方法?1、無(wú)回答會(huì)減少有效地樣本數(shù)量,從而會(huì)使抽樣誤差較原設(shè)計(jì)誤差增大2、無(wú)回答往往是有原因的,如被調(diào)查者的問(wèn)題比較敏感不愿意回答或者其他原因不回答,回答者和不回答者之間對(duì)調(diào)查的態(tài)度不同,常常會(huì)影響到研究的標(biāo)志值有差異,因此只根據(jù)回答者的結(jié)果來(lái)推斷總體就會(huì)產(chǎn)生偏差,其偏差的大小取決于兩類回答者的差異程度和無(wú)回答在總樣本中的比例。6處理好無(wú)回答的問(wèn)題?1、應(yīng)搞好調(diào)查問(wèn)卷的設(shè)計(jì)和加強(qiáng)調(diào)查員的培訓(xùn),使得盡量減少無(wú)回答2、可采用多次訪問(wèn)的方法,把無(wú)回答的情況降到最低3、對(duì)無(wú)回答的人作進(jìn)一步抽樣,以獲取無(wú)回答的信息,加以綜合估計(jì)4、用適當(dāng)?shù)姆椒ㄌ鎿Q無(wú)回答的樣本單元等。7簡(jiǎn)述中心極限定理在抽樣中的作用?中心極限定理是在大樣本條件下對(duì)總體特征值進(jìn)行區(qū)間估計(jì)的工具。在抽樣中統(tǒng)計(jì)量的分布與總體分布之間有一定的關(guān)系,如總體分布為正態(tài)分布,其樣本均值的分布不論樣本容量大小均服從正態(tài)分布,但如果總體分布未知時(shí),小樣本統(tǒng)計(jì)量的分布通常也不好確定。通過(guò)中心極限定理可知,隨著樣本容量的增加,不論總體的分布如何,樣本均值的分布會(huì)趨向正態(tài)分布,這就對(duì)總體均值的估計(jì)提供了理論基礎(chǔ)。8簡(jiǎn)述X的平方分布的性質(zhì)和特點(diǎn)?服從X的平方分布的隨機(jī)變量始終為正;分布形狀通常為一正偏分布,但隨著自由度的增加而趨于對(duì)稱,自由度為n的x的平方分布其數(shù)學(xué)期望為E(X的平方)=n,方差為D(X的平方)=2n,X的平方分布具有可加性,若U和V獨(dú)立,則U和V也是服從X的平方分布的隨機(jī)變量,即U~X平方(n1),V~X的平方(n2),且U和V獨(dú)立,則U+V也是服從X的平方分布的隨機(jī)變量,其自由度為n1+n2.(三)填空題1概率抽樣在抽選樣本單元時(shí)必須是使總體中的每一個(gè)單元(有已知的概率被抽中)2若采用有放回的等概率抽樣,如果樣本容量增加4倍,則樣本均值抽樣分布的標(biāo)準(zhǔn)誤差將(為原來(lái)的二分之一)3某大學(xué)在學(xué)生中進(jìn)行一項(xiàng)民意測(cè)驗(yàn),假設(shè)抽取樣本的方法是根據(jù)學(xué)校學(xué)生處的花名冊(cè),按一定的間隔抽取一人,這種抽樣方法稱作(系統(tǒng)抽樣);若根據(jù)全校的所有班級(jí)中抽選若干班級(jí),對(duì)抽中班級(jí)的學(xué)生進(jìn)行全部調(diào)查,這種抽樣方法稱作(整群抽樣);若不同的系的學(xué)生的態(tài)度有所差別,在各系中分別抽取一部分學(xué)生進(jìn)行調(diào)查,這種抽樣方法稱作(分層抽樣)3自由度為n的2分布變量的均值為-^。4如果抽選10個(gè)人作樣本的抽選方法是從160公分及以下的人中隨機(jī)抽選2人,在180公分及以上的人中隨機(jī)抽選2人,在165~175公分的人中隨機(jī)抽選6人,這種抽選方法稱作(分層抽樣)5調(diào)查某市中學(xué)生中近視眼人數(shù)比例時(shí),采用隨機(jī)抽取幾所中學(xué)作為樣本,對(duì)抽中學(xué)校所有學(xué)生進(jìn)行調(diào)查,這時(shí)每一所中學(xué)時(shí)一個(gè)(抽樣單位)6在一項(xiàng)化妝品調(diào)查中,采用的方法是將樣本按總?cè)丝诘哪信詣e和城鄉(xiāng)比例進(jìn)行分配。然后要求在各類人員中有目的地選擇經(jīng)常使用該化妝品的消費(fèi)者進(jìn)行調(diào)查,這種方法稱作(配額抽樣)7在估計(jì)某一總體均值時(shí),隨機(jī)抽取n個(gè)單元作樣本,用樣本均值作估量,在構(gòu)造置信區(qū)間時(shí),發(fā)現(xiàn)置信區(qū)間太寬,其主要原因是(樣本容量太小了)8區(qū)間估計(jì)時(shí),置信區(qū)間的大小表示估計(jì)的(精確性),置信概率的大小表示(可靠性)9估計(jì)量的抽樣標(biāo)準(zhǔn)誤大小反映了估計(jì)的(精確性)10估計(jì)量的均方誤反映了估計(jì)的(準(zhǔn)確性)11當(dāng)抽樣方式與樣本容量不變的條件下,置信區(qū)間愈大則(可靠性愈小)12估計(jì)量的有效性是指(估計(jì)量的抽樣方差比較大)13在參數(shù)估計(jì)中利用t分布構(gòu)造置信區(qū)間的條件是(總體分布為正態(tài)分布,方差未知)14在樣本容量和抽樣方式不變的情況下要求提高置信度時(shí)(會(huì)增大置信區(qū)間)第五章參數(shù)估計(jì)(一)名詞解釋1參數(shù):狹義的參數(shù)是指決定某一理論分布的函數(shù)中一個(gè)或若干個(gè)數(shù)值,它決定了隨機(jī)變量的分布狀況,如正態(tài)分布有兩個(gè)參數(shù)U和。,它決定了正態(tài)分布的中心位置及離散情況等。廣義的參數(shù)是指反映總體特征的數(shù)值,如總體的均值,總體的總值,總體的比例及總體的方差等。2估計(jì)量:是根據(jù)樣本來(lái)估計(jì)總體參數(shù)的一個(gè)規(guī)則,它通常表示為樣本數(shù)值的一個(gè)函數(shù)即統(tǒng)計(jì)量。它不包含總體的任何未知的參數(shù)。由于它是隨著樣本數(shù)值的變動(dòng)而變動(dòng),因此估計(jì)量是一個(gè)隨機(jī)變量3估計(jì)值:是估計(jì)量在某一次抽樣中的具體取值。如在估計(jì)總體均值這一參數(shù)時(shí),通常使用樣本均值作為估計(jì)量,但某一具體抽樣結(jié)果所得到的樣本均值就是估計(jì)值4點(diǎn)估計(jì):是參數(shù)估計(jì)的一種類型或方法,它是指從抽到的具體樣本數(shù)據(jù)計(jì)算出單個(gè)估計(jì)值作為待估總體參數(shù)的估計(jì)值。例如某企業(yè)要估計(jì)某批產(chǎn)品的次品率,從中抽取了100件產(chǎn)品,發(fā)現(xiàn)9個(gè)是次品,用樣本的次品9%作為總體的次品率,這就是點(diǎn)估計(jì)。5.區(qū)間估計(jì):是參數(shù)估計(jì)的另一種類型和方法,它是在點(diǎn)估計(jì)的基礎(chǔ)上給出一個(gè)估計(jì)的范圍,推斷總體參數(shù)有多大的概率被涵蓋在這一范圍之內(nèi)。因此區(qū)間估計(jì)時(shí)包含總體參數(shù)的一個(gè)值域,在估計(jì)的結(jié)論中指出上下限和結(jié)論的可靠性。置信區(qū)間:指區(qū)間估計(jì)時(shí)給出的估計(jì)范圍。置信區(qū)間總是與一定的概率相聯(lián)系的,這一概率通常稱作置信水平,而與置信水平相聯(lián)系的數(shù)值范圍稱作置信區(qū)間,數(shù)值的兩端稱作置信限,按照大小分為置信上限與置信下限置信系數(shù):又稱置信水平,通常是在區(qū)間估計(jì)時(shí)人為確定的,習(xí)慣上用1-a來(lái)表示。置信系數(shù)的確定通常根據(jù)研究事物的客觀要求而定。(二) 思考題參數(shù)估計(jì)的實(shí)際意義是什么?在現(xiàn)實(shí)生活中通過(guò)數(shù)量方法研究問(wèn)題,首先要搜集數(shù)據(jù)。如要估計(jì)全國(guó)的糧食產(chǎn)量,了解某一地區(qū)的居民收入、某一批產(chǎn)品的質(zhì)量等。實(shí)際上就是要取得廣義的參數(shù)。而這些參數(shù)若進(jìn)行全面調(diào)查,要費(fèi)很大的人物力,這就借助抽樣,通過(guò)樣本對(duì)這些參數(shù)估計(jì)。此外對(duì)有些客觀現(xiàn)象間的關(guān)系,需建立數(shù)學(xué)模型,如回歸模型、計(jì)量經(jīng)濟(jì)模型、模型中的參數(shù)也需要進(jìn)行估計(jì)。簡(jiǎn)述點(diǎn)估計(jì)的優(yōu)點(diǎn)及其局限性。點(diǎn)估計(jì)是以樣本得到得值作為總體參數(shù)的估計(jì)值。這一估計(jì)方式比較簡(jiǎn)單直觀,在樣本足夠大的情況下,該估計(jì)值通常在總體參數(shù)附近相差不會(huì)太大。但是點(diǎn)估計(jì)是用隨機(jī)變量中的某一個(gè)值來(lái)作出估計(jì),雖然會(huì)有抽樣誤差存在,而在點(diǎn)估計(jì)中未能給出誤差大小及置信的概率,這是這種估計(jì)方式的局限性。簡(jiǎn)述置信區(qū)間與置信系數(shù)間的關(guān)系。用區(qū)間估計(jì)來(lái)估計(jì)總體參數(shù)時(shí)是用一估計(jì)的范圍來(lái)涵蓋總體參數(shù)稱置信區(qū)間,它與置信系數(shù)是聯(lián)在一起的。人們總希望估計(jì)的范圍能小一些,這可對(duì)參數(shù)估計(jì)更精確,可在抽樣分布固定的條件下,估計(jì)的范圍愈小意味著估計(jì)值落入這范圍的概率愈小,從而置信系數(shù)就隨之降低。比如從±2個(gè)標(biāo)準(zhǔn)差范圍縮小到±1個(gè)標(biāo)準(zhǔn)差的范圍,其置信系數(shù)就從95%下降到68%,這也是人們?cè)诠烙?jì)時(shí)所不愿意的。反之,如果要增加置信系數(shù),就會(huì)增大置信區(qū)間,降低估計(jì)精度,顯然很大的置信區(qū)間也是沒(méi)有意義的。要解決這問(wèn)題,就要求助于增加樣本容量,改變抽樣分布,使抽樣分布的標(biāo)準(zhǔn)差縮小。簡(jiǎn)述置信區(qū)間與樣本量間的關(guān)系。要縮小置信區(qū)間而又不降低置信度,就必須增加樣本量,這是由于樣本量與置信區(qū)間之間存在著反比的關(guān)系,即在相同的條件下樣本量的增加可以使抽樣分布的標(biāo)準(zhǔn)誤差縮小,但它們之間并不是線性關(guān)系。(三) :填空題:1:區(qū)間估計(jì)時(shí),置信區(qū)間的大小表示估計(jì)的精確性,置信概率的大小表示可靠性,若置信度為1-a時(shí),a表示可能犯錯(cuò)誤的概率或風(fēng)險(xiǎn)。第六章假設(shè)檢驗(yàn)(一)名詞解釋1參數(shù)假設(shè)檢驗(yàn):對(duì)總體的未知參數(shù)先作出某種假設(shè),通常稱作原假設(shè)。與此相對(duì)應(yīng)的另一個(gè)假設(shè)稱作備擇假設(shè)或?qū)α⒓僭O(shè)。將樣本試驗(yàn)所有的可能結(jié)果均包括在這兩個(gè)假設(shè)之內(nèi),然后抽取樣本,根據(jù)樣本的結(jié)果來(lái)判斷接受哪一個(gè)假設(shè)。這種推斷方法稱作參數(shù)的假設(shè)檢驗(yàn)。2檢驗(yàn)的統(tǒng)計(jì)量:是假設(shè)檢驗(yàn)中建立在樣本數(shù)據(jù)基礎(chǔ)上的一個(gè)函數(shù),用來(lái)判斷是否接受原假設(shè)。采用什么統(tǒng)計(jì)量要根據(jù)研究的參數(shù),及其估計(jì)量的分布等因素來(lái)確定。常用

的有z統(tǒng)計(jì)量、t統(tǒng)計(jì)量、X2分布統(tǒng)計(jì)量、F統(tǒng)計(jì)量等。3接受域和拒絕域:判斷是否接受原假設(shè)時(shí)要把抽樣所有可能結(jié)果組成的樣本空間分成兩部分,當(dāng)原假設(shè)為真時(shí),統(tǒng)計(jì)量在允許范圍內(nèi)變動(dòng)的區(qū)域稱作接受域,也就是說(shuō),當(dāng)統(tǒng)計(jì)量的值落入這一區(qū)域,就應(yīng)接受原假設(shè)。當(dāng)統(tǒng)計(jì)量的值超出這一區(qū)域,原假設(shè)為真時(shí),只有很小的概率會(huì)出現(xiàn)這種情況,因此將拒絕原假設(shè)的區(qū)域稱作拒絕域。4顯著性水平:原假設(shè)為真時(shí),決策規(guī)則判定為假的概率,通常用a來(lái)表示。因?yàn)樵跈z驗(yàn)中由于樣本的隨機(jī)性與要求檢驗(yàn)的總體參數(shù)總是有差別的。這種差別只有達(dá)到了一定的界限才能判段有顯著差別。這種界限以一定的小概率作為準(zhǔn)則,這一小概率水平就稱作顯著水平,通常是根據(jù)研究的需要來(lái)確定的。5雙側(cè)檢驗(yàn):是拒絕域位于兩側(cè)的假設(shè)檢驗(yàn)。其假設(shè)的形式為Ho:uo;H1:u1Nuo。當(dāng)統(tǒng)計(jì)量過(guò)大或過(guò)小時(shí),都將判斷拒絕原假設(shè)。6單側(cè)檢驗(yàn):是拒絕域位于一側(cè)的假設(shè)檢驗(yàn)。其假設(shè)的形式為:Ho:u1Muo;H1<uo;或Ho:u1二uo;H1:u1>uo。前者拒絕域在左側(cè),稱作左側(cè)檢驗(yàn),后者拒絕域在右側(cè),稱作右側(cè)檢驗(yàn)。這是由于在實(shí)際問(wèn)題中有些現(xiàn)象愈低愈好,只有大于某一標(biāo)準(zhǔn)時(shí)才拒絕,如次品率等;有些現(xiàn)象則愈大愈好,只有小于某以標(biāo)準(zhǔn)時(shí)才拒絕,如燈管的使用壽命等。7第一類錯(cuò)誤:又稱a錯(cuò)誤或棄真錯(cuò)誤。當(dāng)原假設(shè)Ho為真時(shí)而拒絕Ho的錯(cuò)誤,因此它也是接受備擇假設(shè)時(shí)可能犯的錯(cuò)誤,當(dāng)顯著性水平規(guī)定為a時(shí),接受H1時(shí)犯錯(cuò)誤的概率即為a。8第二類錯(cuò)誤:又稱B錯(cuò)誤或取偽錯(cuò)誤。當(dāng)原假設(shè)Ho為假時(shí)而接受Ho的錯(cuò)誤,因此它是接受原假設(shè)時(shí)可能犯的錯(cuò)誤,通常用B表示,故稱B錯(cuò)誤。9非參數(shù)假設(shè)檢驗(yàn):通常是指不依賴于總體分布的檢驗(yàn),其變量的計(jì)量水準(zhǔn)比較低,如等級(jí)的,順心的或?qū)傩缘挠?jì)量水準(zhǔn)。它還包括參數(shù)以外的總體分布特征的檢驗(yàn),如隨機(jī)變量是否服從某種規(guī)律的檢驗(yàn)等。10擬合優(yōu)度檢驗(yàn):對(duì)一組數(shù)據(jù)是否服從某種規(guī)律的一種非參數(shù)檢驗(yàn)。擬合優(yōu)度檢驗(yàn)有多種方法,本書(shū)介紹了X2檢驗(yàn)的方法。11獨(dú)立性檢驗(yàn):是對(duì)于某一個(gè)雙變量分布中兩個(gè)變量之間是相依還是獨(dú)立的檢驗(yàn)。這種檢驗(yàn)通常是將所有觀察值按兩個(gè)變量進(jìn)行分類形成雙向分類表,稱作列聯(lián)表,然后進(jìn)行檢驗(yàn),故又稱列聯(lián)表檢驗(yàn),統(tǒng)計(jì)量為X2。12秩和檢驗(yàn):又稱等級(jí)求和檢驗(yàn)。因?yàn)閰?shù)中的均值檢驗(yàn)在小樣本時(shí)必須要求總體變量服從正態(tài)分布,當(dāng)數(shù)據(jù)不符合正態(tài)分布時(shí),可以把數(shù)據(jù)按大小轉(zhuǎn)換成等級(jí),然后檢驗(yàn),這一類檢驗(yàn)統(tǒng)稱為非參數(shù)的秩和檢驗(yàn)。這類檢驗(yàn)中有曼.惠尼檢驗(yàn)、威爾科克森檢驗(yàn)等13等級(jí)相關(guān)系數(shù):是測(cè)定兩組等級(jí)變量之間的相關(guān)系數(shù)。最常用的有斯皮爾曼等級(jí)相關(guān)系數(shù)。設(shè)樣本量為n,兩組變量的等級(jí)之差為d1(i=1,2,3?..n),則斯皮爾曼等級(jí)相關(guān)系數(shù)r=1-(6*Edi的平方/n(n的平方-1))(二)思考題1怎樣理解假設(shè)檢驗(yàn)中的小概率原理?答:小概率原理是指發(fā)生概率很小的隨機(jī)事件在一次試驗(yàn)中幾乎是不可能發(fā)生的,如果一旦發(fā)生就要懷疑原來(lái)的事件是否為小概率事件。在假設(shè)檢驗(yàn)中,把拒絕域的發(fā)生作為一個(gè)小概率,一旦樣本統(tǒng)計(jì)量落入拒絕域,就要否定原來(lái)的假設(shè),從而接受備擇假設(shè)。2假設(shè)檢驗(yàn)有哪些步驟?答:(1)根據(jù)研究問(wèn)題的需要建立原假設(shè)Ho和備擇假設(shè)H1,(2)找出檢驗(yàn)的統(tǒng)計(jì)量及其分布(3)規(guī)定顯著水平,也即確定當(dāng)Ho為真而拒絕的概率(4)確定決策的規(guī)則,即規(guī)定檢驗(yàn)統(tǒng)計(jì)量的臨界值(5)根據(jù)觀察所得到的數(shù)據(jù)進(jìn)行計(jì)算,并作出決策。3如何決定采用雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn)?答:若研究的問(wèn)題要求檢驗(yàn)是否相等,凡是過(guò)大過(guò)小均需加以拒絕時(shí)應(yīng)采用雙側(cè)檢驗(yàn)。如果某種零件的規(guī)格不能太大也不能太小就要采用單側(cè)檢驗(yàn)。若研究的問(wèn)題只對(duì)某一側(cè)有要求,如次品率不能過(guò)高,導(dǎo)線的拉力強(qiáng)度不能過(guò)低等現(xiàn)象時(shí),應(yīng)采用單側(cè)檢驗(yàn)。(三)填空題,z,1:正態(tài)總體均值的假設(shè)檢驗(yàn),Ho:u=uo,H1:uNuo,若總體方差已知,樣本量為n,則其檢驗(yàn)的統(tǒng)計(jì)量為=其公式為?x—uo,若顯著性水平為a,接受域?yàn)椋▅z|M切2)2:正態(tài)分布總體均值的假設(shè)檢驗(yàn),Ho:u=uo,H1:u<uo,這種檢驗(yàn)稱作左側(cè)檢驗(yàn),若顯著性水平為a,大樣本,其拒絕域?yàn)閆<-Za3:正態(tài)總體均值的假設(shè)檢驗(yàn),Ho:u二uo,H1:U>Uo,顯著想水平為a,這種檢驗(yàn)稱作右側(cè)檢驗(yàn),若總體方差已知,n為小樣本,則檢驗(yàn)統(tǒng)計(jì)量為z,其公式為:心,z,z>Za L/.■n03:在假設(shè)檢驗(yàn)中,隨著顯著性水平"的增大,拒絕H(的可能性將會(huì)增大。4:當(dāng)原假設(shè)Ho為真而被拒絕的錯(cuò)誤稱作第類錯(cuò)誤(a錯(cuò)誤),原假設(shè)Ho為假而被接收的錯(cuò)誤稱作第二類錯(cuò)誤。5:假設(shè)檢驗(yàn)中若其他條件不變,顯著性水平a的取值越小,接受Ho的可能性越大,原假設(shè)為真而被拒絕的概率越小。6:進(jìn)行兩個(gè)總體均值之差的檢驗(yàn),當(dāng)兩個(gè)總體均為正態(tài)分布,方差未知,分別用小樣本N1,n2時(shí),t統(tǒng)計(jì)量的自由度為(n1+n22)。7:進(jìn)行X2的獨(dú)立性檢驗(yàn)2采用r行c列的列聯(lián)表,檢驗(yàn)時(shí)X2的自由度?為(r1)(c1)o8:曼.惠尼U檢驗(yàn)是一種非參數(shù)統(tǒng)計(jì)方法,它適用于順序計(jì)量水準(zhǔn)的數(shù)據(jù),當(dāng)統(tǒng)計(jì)量U>Ua時(shí)應(yīng)接受原假設(shè)。9:威爾科克森帶符號(hào)的秩檢驗(yàn)是在符號(hào)檢驗(yàn)基礎(chǔ)上發(fā)展起來(lái)的,它用來(lái)檢驗(yàn)兩個(gè)成對(duì)的非正態(tài)總體的均值是否相同,當(dāng)統(tǒng)計(jì)量T<Ta時(shí)就拒絕原假設(shè)。第七章相關(guān)與回歸分析(一)名詞解釋1相關(guān)關(guān)系:是指現(xiàn)象之間存在的不確定的數(shù)量關(guān)系。線性相關(guān)與非線性相關(guān):若變量間的關(guān)系近似地表現(xiàn)為一條直線,則稱線性相關(guān);如果變量之間關(guān)系近似地表現(xiàn)為一條曲線,則稱為非線性相關(guān)或曲線相關(guān)。2正相關(guān)與負(fù)相關(guān):在線性相關(guān)中,若兩個(gè)變量的變動(dòng)方向相同,一個(gè)變量的數(shù)值增大(或減少),另一個(gè)變量也隨之增大(或減少),稱為正相關(guān);若兩個(gè)變量的變動(dòng)方向相反,一個(gè)變量數(shù)值增大,另一個(gè)變量的數(shù)值隨之減少,或一個(gè)變量的數(shù)值減少,另一個(gè)變量的隨之增大,則稱為負(fù)相關(guān)。3相關(guān)系數(shù):它是測(cè)量變量之間關(guān)系密切程度的一個(gè)量;對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù);若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù);若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù)。4回歸平方和:它是回歸值與因變量的均值的離差平方和,即,它反映了y的總變差中由于x與y之間的線性關(guān)系引起的y的變化部分,是可以由回歸直線來(lái)解釋的變差部分,因而也稱為可解釋的變差平方和。5剩余平方和:它是各實(shí)際觀察值與回歸值的殘差平方和,即,它是除了x對(duì)y的線性影響之外的其他因素對(duì)y變差的作用,是不能由回歸直線來(lái)解釋的,因而也可稱為不可解釋的變差平方和。6判定系數(shù):回歸平方和(SSR)占總變差平方和(SST)的比例定義為判定系數(shù),它測(cè)量了回歸直線對(duì)各觀測(cè)數(shù)據(jù)的擬定程度。7估計(jì)標(biāo)準(zhǔn)誤差:它是實(shí)際觀測(cè)值與回歸估計(jì)值之間的平均離差,它測(cè)量了各實(shí)際觀測(cè)點(diǎn)在直線周圍的散步狀況。(二)填空題在線性先關(guān)中,如果兩個(gè)變量的變動(dòng)方向相同則稱為正相關(guān);如果兩個(gè)變量的變動(dòng)方向相反則稱為負(fù)^相^關(guān)用于描述變量之間關(guān)系形態(tài)的圖形稱為散點(diǎn)圖;用于度量變量之間的關(guān)系密切程度的量稱為相關(guān)系數(shù)相關(guān)系數(shù)r的取值范圍是【1,1】;判定系數(shù)的取值范圍是【0,1】若變量x與y之間為完全正相關(guān),則相關(guān)系數(shù)r=1;若變量x與y之間為完全負(fù)相關(guān),則相關(guān)系數(shù)r=—;若x與y之間不存在線性相關(guān)系數(shù),則r=-0檢驗(yàn)回歸系數(shù)的顯著性時(shí),檢驗(yàn)的統(tǒng)計(jì)量r=b/Sb(b在右下角)在線性回歸分析中,只涉及一個(gè)自變量的回歸稱為元線性回歸;涉及多個(gè)自變量的回歸稱為多元線性回歸因變量的觀察值yi與其平均值y上加一杠的總變差由兩部分組成,其中回歸值與均值y上加杠的離差平方和稱為回歸平方和;觀察值yi與回歸值的離差平方和稱為剩余平方和回歸平方和(SSR)占總變量平方和(SST)的比列稱為判定系數(shù),它測(cè)量了回歸直線對(duì)各觀測(cè)數(shù)據(jù)的擬定程度9回歸方程的假設(shè)檢驗(yàn)通常包括兩方面的內(nèi)容:一是線性相關(guān)檢驗(yàn),二是回歸系數(shù)檢驗(yàn)對(duì)回歸方程線性關(guān)系的顯著性檢驗(yàn)通常采用七檢驗(yàn);對(duì)回歸系數(shù)的顯著性檢驗(yàn)通常采用十檢驗(yàn)對(duì)于兩個(gè)變量x和y,若已二x=1239,Ey=879,Exy=11430,Ex的平方=17322,n=100,則一元線性回歸方程的回歸系數(shù)b=0.2736第八章時(shí)間數(shù)列分析(一)名詞解釋1時(shí)間數(shù)列:同一現(xiàn)象在不同時(shí)間上的觀察值排列而成的數(shù)列稱為時(shí)間數(shù)列.2序時(shí)平均數(shù):是現(xiàn)象在不同時(shí)間上的觀察值的平均數(shù),又稱為平均發(fā)展水平。3增長(zhǎng)量:是時(shí)間數(shù)列中不同時(shí)期的發(fā)展水平之差,同于描述現(xiàn)象在觀察期內(nèi)增長(zhǎng)的絕對(duì)數(shù)量。4逐期增長(zhǎng)量與累積增長(zhǎng)量:逐期增長(zhǎng)量是報(bào)告期水平與前一時(shí)期

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論