




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、a,1,概率論與數(shù)理統(tǒng)計(jì)輔導(dǎo),王曉謙 ,a,2,引言 數(shù)學(xué)是刻畫(huà)自然規(guī)律和社會(huì)規(guī)律的科學(xué)語(yǔ)言和有效工具。在自然科學(xué)、技術(shù)科學(xué)、經(jīng)濟(jì)科學(xué)、社會(huì)科學(xué)的應(yīng)用不斷深入。與計(jì)算機(jī)的結(jié)合,使以前只有理論而無(wú)法計(jì)算的內(nèi)容找到了廣闊的應(yīng)用領(lǐng)域。 概率和統(tǒng)計(jì)具有不同于其他數(shù)學(xué)分支的思維方式。我們?cè)诮虒W(xué)實(shí)踐中既要體會(huì)概率和統(tǒng)計(jì)思想與其他數(shù)學(xué)思想的不同,但也必須注意到它們與其他數(shù)學(xué)分支之間的密切關(guān)系。要培養(yǎng)利用概率、統(tǒng)計(jì)的思想思考、處理問(wèn)題的能力,a,3,第一部分 概率 第一節(jié) 隨機(jī)事件及其概率 A. 隨機(jī)現(xiàn)象與隨機(jī)事件,概率論就是研究隨機(jī)現(xiàn)象的數(shù)學(xué)分支,a,4,研究隨機(jī)現(xiàn)象的第一步:定義事件 在給定條件下,可能發(fā)
2、生這樣的結(jié)果,也可能發(fā)生那樣的結(jié)果,這就是隨機(jī)現(xiàn)象。 特點(diǎn):一個(gè)隨機(jī)現(xiàn)象,我們知道所有可能的結(jié)果有哪些,但是在條件沒(méi)有實(shí)現(xiàn)之前,無(wú)法判斷會(huì)出現(xiàn)哪個(gè)結(jié)果。 隨機(jī)事件:我們把在給定條件實(shí)現(xiàn)之后,可以判斷是否發(fā)生的結(jié)果叫做隨機(jī)事件,用大些英文字母表示,a,5,例如,研究某個(gè)射擊運(yùn)動(dòng)員的射擊水平。 在正常條件下,他射出一發(fā)子彈,落點(diǎn)會(huì)是隨機(jī)的,都有哪些隨機(jī)事件呢?無(wú)窮多個(gè)隨機(jī)事件:A:十環(huán) B:九環(huán),E:沒(méi)有脫靶,F(xiàn):脫靶,等等等等,這些都是可能發(fā)生的結(jié)果,都是隨機(jī)事件。 只要實(shí)現(xiàn)一次條件,即在正常條件下,他射出一發(fā)子彈,哪個(gè)事件發(fā)生,哪個(gè)沒(méi)有發(fā)生,一目了然,a,6,兩個(gè)特例: 不可能事件:用字母表示
3、。 例如上面例子里,“既沒(méi)有脫靶,也沒(méi)有上靶”這個(gè)事件就是不可能事件。 必然事件:用字母表示。 例如上面例子里,“脫靶或沒(méi)有脫靶”就是一個(gè)必然事件,a,7,a,8,B. 事件的概率 事件的概率就是刻劃該事件在一次試驗(yàn)中發(fā)生的可能性大小的數(shù)量指標(biāo)。設(shè)A是一個(gè)事件,用P(A)表示這個(gè)事件的概率。 概率的第一個(gè)基本性質(zhì):對(duì)于任意事件A,這是一種要求,a,9,例:七個(gè)有變異的豌豆特征(P89) 子的形狀,子的顏色,豆莢的形狀,豆莢外衣的顏色,未成熟豆莢的顏色,花的位置,豆梗的長(zhǎng)度 孟德?tīng)柊丫G色豌豆與黃色豌豆雜交,結(jié)果下一代都是黃色豌豆。 對(duì)其他六個(gè)特征做試驗(yàn),也有類(lèi)似的結(jié)果。 我們把這一代叫做雜交第一
4、子代,簡(jiǎn)稱(chēng)為子一代。問(wèn)題是,用它們作為種子,下一代會(huì)怎樣呢?這是中學(xué)教師孟德?tīng)柕膯?wèn)題,這個(gè)問(wèn)題的解決讓他名崔青史。(18221884,a,10,孟德?tīng)柊央s交黃色豌豆作為第一子代F1,培育出第二子代F2。在第二子代中豌豆會(huì)是什么顏色的呢?他提出了一種遺傳學(xué)理論,用這個(gè)理論來(lái)預(yù)測(cè)第二子代的顏色。他的預(yù)言是: 75%的黃色豌豆 25%綠色豌豆 即兩者比例為3:1,a,11,用G代表綠色基因,Y代表黃色基因,則第一子代F1可表示為YG。 這樣的豌豆自由雜交,在第二子代F2中會(huì)出現(xiàn)四種情況:YY,YG,GY,GG。每種情況出現(xiàn)的機(jī)會(huì)均等。其中 黃色:YY,YG,GY; 綠色:GG 所以黃色豌豆與綠色豌豆
5、數(shù)量的比例應(yīng)該是3:1。】 課本上89頁(yè)表7-1-1的數(shù)據(jù)就是試驗(yàn)觀測(cè)結(jié)果。這里用的是頻率估計(jì)概率的思想,a,12,我們不知道當(dāng)初老孟是先有的數(shù)據(jù)還是先做的理論分析。不過(guò)大多數(shù)人相信是 1、先做的試驗(yàn), 2、然后利用觀測(cè)到的現(xiàn)象(概率統(tǒng)計(jì)思想)提 出大膽的理論, 3、利用提出的理論對(duì)觀測(cè)結(jié)果作出解釋?zhuān)?4、再利用理論作預(yù)測(cè), 5、然后通過(guò)試驗(yàn)驗(yàn)證理論預(yù)測(cè)的可靠性。 這是科學(xué)研究的一種基本方法,a,13,為了估計(jì)事件A發(fā)生的概率,我們?cè)谙嗤瑮l件下進(jìn)行重復(fù)試驗(yàn),記錄試驗(yàn)次數(shù)n和事件A發(fā)生的次數(shù)m,然后用事件A在這n次試驗(yàn)中發(fā)生的頻率作為事件A發(fā)生的概率的估計(jì)值,求概率之基本方法試驗(yàn)法。有誤差,a,
6、14,概率的第二個(gè)基本性質(zhì),這不是公式,是一種規(guī)范化要求,a,15,第二節(jié) 古典概型 試驗(yàn)或觀測(cè)只有有限多種可能的基本結(jié)果,這些結(jié)果具有以下特點(diǎn): (1)、這些可能結(jié)果有限多個(gè); (2)、每次試驗(yàn),這些結(jié)果中必有一個(gè)會(huì)發(fā)生,而且 只有一個(gè)會(huì)發(fā)生; (3)、每個(gè)結(jié)果的發(fā)生是等可能的。 滿(mǎn)足前兩條的結(jié)果叫基本事件。假設(shè)共有n個(gè)基本事件。如果還滿(mǎn)足第三條的話,這樣的隨機(jī)現(xiàn)象的概率計(jì)算模型就叫做古典概型,a,16,古典概型里,每個(gè)基本事件的概率都是,如果事件A的發(fā)生等價(jià)于m個(gè)基本事件之一發(fā)生,那么事件A發(fā)生的概率就是,a,17,第三節(jié) 幾何概型 試驗(yàn)或觀測(cè)有無(wú)限多種可能的基本結(jié)果,這些結(jié)果具有以下特點(diǎn)
7、: (1)、這些可能結(jié)果有無(wú)限多個(gè); (2)、每次試驗(yàn),這些結(jié)果中必有一個(gè)會(huì)發(fā)生,而且 只有一個(gè)會(huì)發(fā)生; (3)、每個(gè)結(jié)果的發(fā)生是等可能的。 這樣的隨機(jī)現(xiàn)象的概率計(jì)算模型就叫做幾何概型,a,18,方程有實(shí)根的概率是多少,例一、方程,中的系數(shù),分別在,區(qū)間隨機(jī)取值,那么這個(gè),解:我們把,放到一起考慮,那么任取,中的,兩個(gè)值作為,矩形區(qū)域 S 中任取一個(gè)點(diǎn),把橫坐標(biāo)作為,可以看作是在平面直角坐標(biāo)系中,縱坐,坐標(biāo)作為,a,19,方程有實(shí)根等價(jià)于,這等價(jià)于要求點(diǎn)必須取在區(qū)域A中。所以,a,20,例二、怎樣求一個(gè)不規(guī)則圖形的面積? 做正方形S,隨機(jī)向圖中投點(diǎn),計(jì)算落在A中的點(diǎn)的頻率,A的面積的近似值就是
8、該頻率與S的面積的乘積,a,21,例三 貝特朗奇論 在圓內(nèi)任取一弦,問(wèn)其長(zhǎng)度超過(guò)內(nèi)接等邊三角形 邊長(zhǎng)的概率是多少? 貝特朗給出了三中求解方法,設(shè)該圓半徑為,則內(nèi)接等邊三角形邊長(zhǎng)為,記弦的長(zhǎng)度為,a,22,1)、由于弦長(zhǎng)只跟它與圓心的距離有關(guān),而與方向無(wú)關(guān),因而可假定弦垂直于某直徑EF。如圖所示,當(dāng)且僅當(dāng)弦AB與圓形的 距離小于,時(shí),有,所以所求概率為,a,23,2)、弦長(zhǎng)由其中點(diǎn)唯一確定。當(dāng)且僅當(dāng)弦的中點(diǎn)落到 半徑為,的同心圓內(nèi)時(shí),弦長(zhǎng),所以,如圖所示,所求概率為,a,24,3)、因?yàn)槿魏蜗叶冀粓A于兩點(diǎn),并且具有對(duì)稱(chēng)性, 所以不妨固定弦的一端A于圓周上,另一端在圓周上任 意取。如圖,考慮等邊三
9、角形ADE,如B落在角A所對(duì) 應(yīng)的弧,上,則弦長(zhǎng),所以所求概率為,a,25,第四節(jié) 互斥事件與概率 兩個(gè)事件互斥 一組事件是互斥的 設(shè)是A,B是兩個(gè)互斥事件,我們用 A+B表示一個(gè)新 的事件,即 “A,B中至少有一件發(fā)生” 這個(gè)事件,a,26,是一組互斥事件,那么,中至少有一個(gè)發(fā)生這個(gè)事件,表示,概率的第三個(gè)基本性質(zhì)要求,a,27,例如,表示某射擊運(yùn)動(dòng)員打中k環(huán)這個(gè)事件,k=1, 2,10. 那么它們是10個(gè)互斥事件。如果知道每個(gè) 事件的概率,我們就可以算出許多其它事件的概率。 例如打到8環(huán)以?xún)?nèi)這樣的事件的概率,例如,a,28,對(duì)立事件:如果兩個(gè)事件互斥,而且每次試驗(yàn)或觀測(cè)兩個(gè)事件中必有一個(gè)發(fā)
10、生,那么這兩個(gè)事件就叫做一對(duì)對(duì)立事件。如果用A表示其中的一個(gè)事件,另一個(gè)就用,來(lái)表示。顯然,所以,或等價(jià)地,a,29,例、求500人中至少有一人生日在今天的概率。 解法一、用A表示“500人中至少有一人生日在今天”, 用,表示“500人中恰有k人生日在今天”, k=0,1,500,互斥,而且,所以,則不難發(fā)現(xiàn)這501個(gè)事件,a,30,由于,所以,a,31,解法二、顯然,表示,所以,500人中沒(méi)有一人在今天過(guò)生日,我們可以求出,a,32,比較這兩個(gè)結(jié)果你可以發(fā)現(xiàn)一個(gè)公式,即,事實(shí)上,a,33,第五節(jié) 獨(dú)立性概念 積事件:設(shè)A,B是兩個(gè)隨機(jī)事件,稱(chēng) “事件A與B同時(shí)發(fā)生” 這個(gè)事件為事件A與事件B
11、的積事件,記作AB。類(lèi)似地,用,表示一個(gè)新事件,該事件的發(fā)生等價(jià)于,這n個(gè)事件同時(shí)發(fā)生,a,34,例如,表示第k次投擲硬幣出現(xiàn)正面,k=1,2,就表示“連續(xù)投擲硬幣n次都出現(xiàn)正面”這個(gè)隨機(jī)事件,那么,a,35,定義:稱(chēng)事件A,B相互獨(dú)立,如果,一般地,稱(chēng)一組事件相互獨(dú)立,如果其中任意有限個(gè)同時(shí)發(fā)生的概率等于它們每一個(gè)發(fā)生的概率的乘積。 所以,如果知道事件相互獨(dú)立,那么事件同時(shí)發(fā)生的概率就等于每一個(gè)發(fā)生的概率的積,a,36,例、求500人中至少有一人生日在今天的概率,表示,不難理解,也是相互獨(dú)立的一組事件,而且,方法三、用,第k個(gè)人在今天過(guò)生日,k=1,2,500,則我們一般認(rèn)為這500個(gè)事件相
12、互獨(dú)立。顯然,a,37,所以,a,38,連續(xù)投擲一枚硬幣n次,計(jì)算其中恰好出現(xiàn) k次正面的概率,這個(gè)問(wèn)題有如下三點(diǎn)要注意: (1).每次試驗(yàn)(或觀測(cè))只有兩種可能的結(jié)果,其 一記為 A,另一個(gè)就是,2).每次試驗(yàn)(或觀測(cè))結(jié)果不受其它試驗(yàn)(或觀 測(cè))結(jié)果的影響。即各次試驗(yàn)或觀測(cè)相互獨(dú)立,3).每次A發(fā)生的概率都相同,記為,a,39,這個(gè)問(wèn)題的答案就是二項(xiàng)概率公式,這種隨機(jī)試驗(yàn)或觀測(cè)我們叫做獨(dú)立試驗(yàn)序列。在研究獨(dú)立試驗(yàn)序列時(shí),一個(gè)基本問(wèn)題就是,n次試驗(yàn)中事件A恰好發(fā)生k次的概率是多少,a,40,特別地,所以,每個(gè)人是否在今天過(guò)生日相互獨(dú)立。所以500人中恰有k人在今天過(guò)生日的概率為,方法四、每個(gè)
13、人在今天過(guò)生日的概率都是,例、求500人中至少有一人生日在今天的概率,a,41,某車(chē)間有十臺(tái)機(jī)床,彼此獨(dú)立工作。據(jù)統(tǒng)計(jì)每臺(tái)機(jī)床每小時(shí)有12分鐘在工作,工作時(shí)需8千瓦的電力。供電部門(mén)供多少電給該車(chē)間合適呢,該車(chē)間恰好有k臺(tái)機(jī)床在同時(shí)工作的概率為,解:用A表示一臺(tái)機(jī)床在工作,則,a,42,我們把恰好有0,1,2,10臺(tái)機(jī)床在同時(shí)工作的概率都計(jì)算出來(lái),列在下表里,從表中數(shù)據(jù)可以看出,所以,供給,千瓦電力就可以保證有0.9936的,概率不會(huì)誤事。完全沒(méi)有必要供給80千瓦的電力,a,43,第五節(jié) 隨機(jī)變量簡(jiǎn)介 隨機(jī)變量是這樣的一種“函數(shù)”,它把隨機(jī)試驗(yàn)的每一個(gè)基本結(jié)果對(duì)應(yīng)成一個(gè)實(shí)數(shù)。 例如,擲一枚硬幣有
14、兩個(gè)基本結(jié)果,正面和反面。我們?nèi)是這樣的一種對(duì)應(yīng)法則: 如果擲出正面,取X=1,如果擲出反面,取X=-1. 則X就是一個(gè)隨機(jī)變量,取-1和1兩個(gè)值,到底取哪個(gè) 在實(shí)驗(yàn)沒(méi)有結(jié)束之前不能確定,即取值是隨機(jī)的,所有可能取值的概率總和必為1,a,44,我們關(guān)心的是隨機(jī)變量的取某個(gè)值或取值落在某個(gè)范圍里的概率。怎樣計(jì)算,依不同情況而定。 隨機(jī)變量有兩種類(lèi)型,一種是它的所有可能的取值可以一一列舉出來(lái)。例如上面提到的。這樣的隨機(jī)變量叫做離散型隨機(jī)變量。對(duì)于這樣的隨機(jī)變量,我們要搞清楚它可能取的每一個(gè)值,而且要求出取每一個(gè)值的概率。 例如,投擲一個(gè)硬幣100次,用X表示其中出現(xiàn)的正面次數(shù),則所有可能的取值是
15、0,1,2,100,且,所有可能取值的概率總和必為1,a,45,對(duì)于隨機(jī)變量,我們常常會(huì)求它的取值的平均值,還要考慮它的取值的分散程度,那么這個(gè)運(yùn)動(dòng)員的水平該怎樣評(píng)價(jià)呢?我們計(jì)算一下他打一槍平均來(lái)說(shuō)可能的環(huán)數(shù),這個(gè)數(shù)叫隨機(jī)變量X的數(shù)學(xué)期望,例如,X表示一個(gè)射擊運(yùn)動(dòng)員命中的環(huán)數(shù),則它是一個(gè)隨機(jī)變量。假設(shè)我們已經(jīng)知道X取每一個(gè)值的概率,如下表所示,a,46,相對(duì)于數(shù)學(xué)期望,隨機(jī)變量的取值有時(shí)偏大,有時(shí)偏小,那么平均偏差該怎樣計(jì)算呢?先把這些偏差做平方,然后再平均??紤]到每一個(gè)偏差出現(xiàn)的可能性實(shí)際上就是原先的取值對(duì)應(yīng)的概率,所以也要用求數(shù)學(xué)期望那樣的方法來(lái)求偏差平方的平均值。例如,上面的X,由上表可
16、見(jiàn),偏差平方的平均值為,這個(gè)數(shù)叫隨機(jī)變量X的方差,a,47,隨機(jī)變量的數(shù)學(xué)期望反映了它取值的平均大小,是一個(gè)平均值; 隨機(jī)變量的方差反映了它相對(duì)于平均值而言的分散程度。方差越小,取值的分散程度越小。如果方差為0,那這個(gè)隨機(jī)變量就幾乎是一個(gè)常數(shù),a,48,例: 據(jù)氣象預(yù)報(bào),某地區(qū)下月有小洪水的概率為0.25,有大洪水的概率為0.01。設(shè)工地上有一臺(tái)大型設(shè)備,為保護(hù)設(shè)備,有以下三種方案: 1、運(yùn)走設(shè)備,需花費(fèi)3800元; 2、建一保護(hù)墻,需花費(fèi)2000元。但無(wú)法抵御大洪水,大洪水來(lái)臨的話,設(shè)備受損,損失60000元; 3、不采取任何措施,祈禱不發(fā)生洪水。大洪水來(lái)臨損失60000元,小洪水來(lái)臨損失1
17、0000元。 試比較哪種方案好,a,49,解:分別用X,Y,Z表示三種方案下可能帶來(lái)的費(fèi)用,則都是隨機(jī)變量。我們把各個(gè)隨機(jī)變量的分布列在下表里,則 E(X)=3800 E(Y)=2600 E(Z)=3100 平均來(lái)說(shuō),方案二比較好,a,50,第二部分 統(tǒng)計(jì) 統(tǒng)計(jì)在我們國(guó)家有兩種意義: 社會(huì)統(tǒng)計(jì) 數(shù)理統(tǒng)計(jì) 我們要討論的是數(shù)理統(tǒng)計(jì),a,51,引言 你要研究什么? 研究對(duì)象總體 由全體成員構(gòu)成。 例如 1、某地區(qū)高中學(xué)生的身高發(fā)育情況 2、袁隆平新水稻品種的畝產(chǎn)量 3、某班學(xué)生的數(shù)學(xué)學(xué)習(xí)成績(jī) 4、某個(gè)學(xué)生的數(shù)學(xué)學(xué)習(xí)成績(jī) 5、姚明的技術(shù)水平(投籃,三分球,命中 率, 籃板等) 6、學(xué)習(xí)成績(jī)與性別的關(guān)系
18、 7、紅樓夢(mèng)前80回與后40回的用字、用詞的 差異,a,52,為什么要學(xué)習(xí)統(tǒng)計(jì)? 1、當(dāng)我們要對(duì)總體進(jìn)行研究時(shí),由于種種原因,不 可把每個(gè)個(gè)體的特征都記錄研究; 2、不可能收集到所有數(shù)據(jù); 3、可能收集到所有數(shù)據(jù),但是要花費(fèi)大量的財(cái)力物 力; 4、即使收集到了所有的數(shù)據(jù)資料,面對(duì)大量的雜亂 無(wú)章的數(shù)據(jù),不用科學(xué)的方法處理,我們也無(wú)法 得到想要得到的信息,a,53,統(tǒng)計(jì)正是處理上面遇到的窘境的理想手段: 1、怎樣收集數(shù)據(jù)資料; 2、怎樣對(duì)收集到的數(shù)據(jù)資料進(jìn)行科學(xué)的分析處理; 3、合理解釋處理結(jié)果,a,54,樣本 從總體中抽取一部分個(gè)體出來(lái),測(cè)量其相應(yīng)的數(shù)量指標(biāo)和特征并記錄。這一部分個(gè)體放到一起就
19、叫做一個(gè)樣本。 一般來(lái)說(shuō),我們總是把測(cè)得的數(shù)據(jù)全體叫做樣本。 樣本中所考慮的個(gè)體的數(shù)目叫樣本容量,a,55,例如:1、隨機(jī)抽查某地區(qū)100名高中二年級(jí)學(xué)生測(cè)量身高得到的200個(gè)數(shù)據(jù); 2、將水稻新品種種植在其他條件相同的10塊試驗(yàn)田里,收割后測(cè)得的10個(gè)畝產(chǎn)量數(shù)據(jù),a,56,第一節(jié) 抽樣方法 A、簡(jiǎn)單隨機(jī)抽樣法 從有N個(gè)個(gè)體的總體中不重復(fù)地取出n個(gè)個(gè)體,nN,每個(gè)個(gè)體都有相同的機(jī)會(huì)被抽到。 抽簽法: 編號(hào)、制簽、攪勻、隨機(jī)抽簽k次 隨機(jī)數(shù)表:省掉制簽、攪勻、隨機(jī)抽簽過(guò)程,a,57,隨機(jī)數(shù)表是一個(gè)重要工具。 它是一張由數(shù)字0到9構(gòu)成的數(shù)表,可能三個(gè)三個(gè)地由三位數(shù)構(gòu)成。也可能由四位數(shù)構(gòu)成 。 我們
20、可以用某種編程語(yǔ)言產(chǎn)生隨機(jī)數(shù)表。 用Excel就可以方便地產(chǎn)生隨機(jī)數(shù)表,a,58,1、在單元格C1里輸入 =RAND() 產(chǎn)生一個(gè)0到1之間的隨機(jī)數(shù),拖拽C1的填充柄就可以產(chǎn)生不同的隨機(jī)數(shù)。65536行,可產(chǎn)生大量隨機(jī)數(shù)。(0,1之間隨機(jī)數(shù)) 2、輸入 =INT(100*RAND()產(chǎn)生0到99之間的整隨機(jī)數(shù)。 (兩位隨機(jī)數(shù)) 3、隨機(jī)數(shù)發(fā)生器 選擇 工具數(shù)據(jù)分析隨機(jī)數(shù)發(fā)生器 (隨機(jī)數(shù)) 4、 計(jì)算器可能會(huì)有不同的方法,要參考有關(guān)說(shuō)明書(shū),a,59,B、系統(tǒng)抽樣 分成相同的n組,每組隨機(jī)抽取一個(gè)。 C、分層抽樣 總體由差異明顯的幾個(gè)部分組成,各部分稱(chēng)為層。根據(jù)比例在各層進(jìn)行抽樣,a,60,第二節(jié)
21、 總體分布的估計(jì) 統(tǒng)計(jì)的任務(wù): 在統(tǒng)計(jì)里我們感興趣的是:如果從總體中任取一個(gè)個(gè)體,這個(gè)個(gè)體的某個(gè)或幾個(gè)數(shù)量指標(biāo)會(huì)有什么特征?我們不知道其指標(biāo)會(huì)是多少。統(tǒng)計(jì)的任務(wù)就是希望搞清楚,任取一個(gè)個(gè)體,其指標(biāo)會(huì)遵循什么規(guī)律。 當(dāng)然不會(huì)是一個(gè)確定性的規(guī)律,而是一個(gè)“統(tǒng)計(jì)規(guī)律”,就是一個(gè)具有概率意義的規(guī)律。例如某地某段時(shí)間里高溫出現(xiàn)概率;某校高一年級(jí)男生的身高在某個(gè)范圍里的概率,a,61,從總體中任取一個(gè)個(gè)體,其指標(biāo)不知道會(huì)是多少,就把它作為一個(gè)隨機(jī)變量對(duì)待。 對(duì)總體的研究,就是要達(dá)到搞清楚這個(gè)隨機(jī)變量的分布的目的。這就是統(tǒng)計(jì)的基本目的。 在概率論里,我們研究各種分布。在統(tǒng)計(jì)里,我們要利用樣本數(shù)據(jù)確定表示總體
22、指標(biāo)的那個(gè)隨機(jī)變量到底應(yīng)該是什么分布。如果分布完全是已知的,那統(tǒng)計(jì)就沒(méi)有任何意義了,a,62,參數(shù)問(wèn)題:對(duì)總體指標(biāo)的數(shù)字特征,比如數(shù)學(xué)期望,方差,中為數(shù)等的估算、刻畫(huà)。 非參數(shù)問(wèn)題 多個(gè)隨機(jī)變量之間的關(guān)系問(wèn)題,a,63,所以,要知道我們會(huì)遇到的問(wèn)題: 刻劃總體分布 刻劃總體數(shù)字特征 刻劃各種關(guān)系 在所有的問(wèn)題中,歸根結(jié)底是估計(jì)概率的問(wèn)題,而估計(jì)概率最基本的方法,就是利用頻率。要計(jì)算頻率,就要抽樣做實(shí)驗(yàn)獲取數(shù)據(jù),a,64,由于我們是從樣本出發(fā)做出的結(jié)論,結(jié)論勢(shì)必會(huì)有出錯(cuò)的可能。 數(shù)理統(tǒng)計(jì)的結(jié)論不同于其他的結(jié)論,其精華就在于: 在給出結(jié)論的同時(shí),還會(huì)告訴你, 這個(gè)結(jié)論出錯(cuò)的概率有多大,a,65,總
23、體分布的估計(jì)方法 頻率分布表 全距 組距 頻數(shù) 頻率 頻率/組距 頻率分布直方圖與折線圖 頻率直方圖,a,66,a,67,第三節(jié) 總體特征數(shù)的估計(jì) 總體分布的特征數(shù)有各種各樣,我們?cè)诟怕收摾锝兴鼈冏鲾?shù)字特征。例如數(shù)學(xué)期望,方差,中位數(shù),眾數(shù),等等。 在統(tǒng)計(jì)里這些往往都是不知道的。統(tǒng)計(jì)的任務(wù)之一就是利用樣本數(shù)據(jù)來(lái)估計(jì)這些數(shù)字特征。在這里就是要向?qū)W生介紹其中最基本的幾種估計(jì)量,a,68,A、平均數(shù)的估計(jì) 平均數(shù)指總體X平均數(shù),即數(shù)學(xué)期望E(X),一般用希臘字母表示。怎樣用樣本值來(lái)估計(jì)這個(gè)數(shù)呢? 設(shè)我們得到的樣本為,那么我們就用,來(lái)做為的估計(jì)值,有時(shí)記為,這個(gè)公式叫做樣本均值或樣本平均數(shù),a,69,
24、在統(tǒng)計(jì)研究中我們正是要討論這種公式的意義和價(jià)值,而不會(huì)對(duì)具體的計(jì)算結(jié)果說(shuō)它的優(yōu)劣。 為什么?因?yàn)樵俸玫墓揭矔?huì)有計(jì)算出糟糕結(jié)果的時(shí)候。例如抽樣的時(shí)候碰巧樣本取的不好,這是有可能的,a,70,樣本均值的最大優(yōu)點(diǎn)有兩個(gè),無(wú)偏性和最小方差性,a,71,總體X的方差是,描述了總體取值相對(duì)于其平均值的離散程度。我們要估計(jì)方差,就要先算出的估計(jì)來(lái),然后看看樣本值相對(duì)于這個(gè)估計(jì)值的離散程度有多大。所以就用,作為總體方差的估計(jì)值。這就是樣本方差。對(duì)其開(kāi)方,就得到樣本標(biāo)準(zhǔn)差,a,72,例如,要對(duì)一種新的水稻品種和一種老的品種做比較,看看新品種到底好不好,怎樣比? 我們需要進(jìn)行抽樣,得到樣本: 對(duì)每個(gè)品種種植試驗(yàn)
25、,例如,新品種種m塊試驗(yàn)田,得到m個(gè)畝產(chǎn)數(shù)據(jù),老品種種n塊試驗(yàn)田,得到n個(gè)畝產(chǎn)數(shù)據(jù)。我們就有了兩個(gè)樣本。 分別計(jì)算相應(yīng)的樣本均值和樣本方差。樣本均值越大越好,樣本方差則越小越好,a,73,MODE鍵 +3鍵:進(jìn)入統(tǒng)計(jì)模式 SHIFT鍵+KAC鍵:開(kāi)始輸入數(shù)據(jù) 每輸入一個(gè)數(shù)據(jù)按一次 DATA鍵 輸完后,KOUT鍵+n鍵,顯示數(shù)據(jù)個(gè)數(shù) SHIFT+1鍵:顯示樣本均值 SHIFT+2鍵:顯示樣本標(biāo)準(zhǔn)差,再按平方鍵可得樣本方差。 KOUT+2鍵可計(jì)算樣本值的總和,a,74,叫回歸方程,第四節(jié) 線性回歸方程 有兩個(gè)量 x 和 y,x 的變化會(huì)導(dǎo)致 y 發(fā)生變化。但 是,并不是每一個(gè)x值唯一地對(duì)應(yīng)一個(gè)y值
26、,即使已知x的取值,也無(wú)法完全確定y的取值,它有隨機(jī)性。y與x之間不是我們以前學(xué)過(guò)的函數(shù)關(guān)系,這種關(guān)系我們叫相關(guān)關(guān)系。對(duì)于具有相關(guān)關(guān)系的 y 和 x ,我們?cè)鯓永脭?shù)學(xué)知識(shí)比較準(zhǔn)確地刻畫(huà)它們之間的關(guān)系呢?我們希望能夠搞清楚,如果不考慮隨機(jī)因素,y與x之間的確定性關(guān)系是什么,a,75,叫回歸方程,這就是傳說(shuō)中的回歸模型。相應(yīng)的函數(shù)叫回歸函數(shù),而把,設(shè)這個(gè)確定性關(guān)系可以用函數(shù)f(x)表示。那么y與x之間的相關(guān)關(guān)系應(yīng)該用下式來(lái)刻畫(huà),a,76,回歸分析的基本理論任務(wù)有三個(gè): 1、確定到底有沒(méi)有這種回歸關(guān)系? 2、如果有,回歸函數(shù)是什么樣子的? 3、誤差項(xiàng)作為隨機(jī)變量服從什么分布?至少應(yīng)該估 計(jì)出它的數(shù)
27、學(xué)期望和方差。 至于它的應(yīng)用,非常廣泛,a,77,為了解決以上問(wèn)題,必須有樣本!作n次觀測(cè),每次觀測(cè)一個(gè)x值和它相應(yīng)的y值,依次記為,這就是樣本。在這一章我們假設(shè)已經(jīng)得到了樣本,下面解決相應(yīng)的問(wèn)題。樣本一般用一張表列出,a,78,的形式。這樣的回歸分析叫線性回歸分析,相應(yīng)的關(guān)系叫線性回歸關(guān)系,我們要先考慮選擇一個(gè)適當(dāng)?shù)暮瘮?shù),然后看看這個(gè)函數(shù)是不是合適。在中學(xué)課本里,我們選擇線性函數(shù),就是取,a,79,如果y與x之間完全沒(méi)有任何線性依賴(lài)關(guān)系,那么給定x對(duì)計(jì)算y沒(méi)有任何意義。這時(shí)b自然應(yīng)該是0。所以在線性回歸里如果b幾乎是0,那么線性回歸就沒(méi)有什么意義了,我們也正是通過(guò)數(shù)據(jù)計(jì)算這兩個(gè)系數(shù)的,而且也
28、是通過(guò)判斷 b與 0的接近程度來(lái)判斷 y 與 x 之間有沒(méi)有線性回歸關(guān)系的,a,80,散點(diǎn)圖,a,81,回歸系數(shù)的計(jì)算 選用怎樣的直線最好呢?假如我們選定了一條直線是,那么如果不考慮隨機(jī)因素,把x帶入這個(gè)方程計(jì)算出來(lái)的,應(yīng)該與觀測(cè)到的y值越接近越好。如果把樣本里的所有x的取值依次帶入,就可以計(jì)算得到相應(yīng)的,好的直線應(yīng)該使得這里計(jì)算出來(lái)的值與相應(yīng)的觀測(cè)值,相差不大,a,82,把所有的誤差的平方累積起來(lái)就是,我們要取這樣的,使得,達(dá)到最小,最小二乘思想,a,83,a,84,a,85,a,86,a,87,其中,a,88,不難看出,為使,達(dá)到最小,只要取,就可以了。而且這時(shí),達(dá)到最小值,a,89,我們得到的回歸直線為,帶入到此方程,即可得到一個(gè)相應(yīng)的,此值可以看作是,的計(jì)算值,把樣本中的,a,90,我們把,叫做殘差平方和?;貧w直線就是使殘差平方和達(dá)到最小的那條直線,a,91,越小,說(shuō)明直線回歸越好。這就部分地解決了我們判斷線性回歸好不好的問(wèn)題,這里還得到一個(gè)副產(chǎn)品,從而,所以,a,92,相關(guān)系數(shù),a,93,可見(jiàn),r|越接近于1,直線回歸越好,如果|r|接近于1,F(xiàn)值就會(huì)比較大。但是如果沒(méi)有線性相關(guān)關(guān)系,F(xiàn)值較大的可能性很小。所以據(jù)此判斷有線性相關(guān)關(guān)系,事實(shí)上,如果
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)村租大棚種菜合同范本
- 合伙買(mǎi)鋪面合同范本
- 任職勞動(dòng)合同范本
- 可研編制合同范本
- 北京股權(quán)質(zhì)押合同范本
- 農(nóng)田雇傭合同范本
- 廚房灶具采購(gòu)合同范本
- 二手電瓶車(chē)收購(gòu)合同范本
- 北京朝陽(yáng)租房合同范本
- 農(nóng)村客運(yùn)公司合同范本
- 借哪吒精神燃開(kāi)學(xué)斗志 開(kāi)學(xué)主題班會(huì)課件
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- GB/T 18747.1-2002厭氧膠粘劑扭矩強(qiáng)度的測(cè)定(螺紋緊固件)
- 船舶電氣設(shè)備及系統(tǒng)船舶照明系統(tǒng)管理-課件
- 蘇教版六年級(jí)英語(yǔ)下冊(cè)單詞表(默寫(xiě)不用提)
- 單層廠房鋼結(jié)構(gòu)設(shè)計(jì)T83
- 5S點(diǎn)檢表1(日檢查表)
- 醫(yī)院感染管理組織架構(gòu)圖
- 帶你看認(rèn)養(yǎng)一頭牛品牌調(diào)研
- 雙鴨山玄武巖纖維及其制品生產(chǎn)基地項(xiàng)目(一期)環(huán)評(píng)報(bào)告表
- 冠心病病人的護(hù)理ppt(完整版)課件
評(píng)論
0/150
提交評(píng)論