正態(tài)分布和線性回歸_第1頁
正態(tài)分布和線性回歸_第2頁
正態(tài)分布和線性回歸_第3頁
正態(tài)分布和線性回歸_第4頁
正態(tài)分布和線性回歸_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、專題:正態(tài)分布和線性回歸一、 基礎知識回顧1.正態(tài)分布:若總體密度曲線就是或近似地是函數(shù)的圖象其中:是圓周率;e是自然對數(shù)的底;x是隨機變量的取值,為正態(tài)分布的平均值;是正態(tài)分布的標準差這個總體是無限容量的抽樣總體,其分布叫做正態(tài)分布正態(tài)分布由參數(shù),唯一確定,記作,E()=,D()=.2.函數(shù)f(x)圖象被稱為正態(tài)曲線(1)從形態(tài)上看,正態(tài)分布是一條單峰、對稱呈鐘形的曲線,其對稱軸為x=,并在x=時取最大值。(2)從x=點開始,曲線向正負兩個方向遞減延伸,不斷逼近x軸,但永不與x軸相交,因此說曲線在正負兩個方向都是以x軸為漸近線的,(3)當?shù)闹狄欢〞r, 越大,曲線越“矮胖”,總體分布越分散;越

2、小,曲線越“高”總體分布越集中3. 把即=0,=1稱為標準正態(tài)分布,這樣的正態(tài)總體稱為標準正態(tài)總體,其密度函數(shù)為,x(-,+),相應的曲線稱為標準正態(tài)曲線.利用標準正態(tài)分布表可求得標準正態(tài)總體在某一區(qū)間內取值的概率. (1)對于標準正態(tài)總體,是總體取值小于的概率,即:,其中,其值可以通過“標準正態(tài)分布表”查得,也就是圖中陰影部分的面積,它表示總體取值小于的概率(2)標準正態(tài)曲線關于y軸對稱。因為當時,;而當時,根據正態(tài)曲線的性質可得:,并且可以求得在任一區(qū)間內取值的概率:,顯然(0)=0.5.5.對于任一正態(tài)總體,都可以通過使之標準化,那么,P()=P(<)=,求得其在某一區(qū)間內取值的概

3、率.例如: N(1,4),那么,設=,則,有P(<3)=P(<1)=0.8413.6. (1)=0.8413、(2)=0.9772、(3)=0.9987 二、例題1.下面給出三個正態(tài)總體的函數(shù)表示式,請找出其均值和標準差(1),(-x+ (2),(-x+(3),(-x+2.正態(tài)總體的函數(shù)表示式是,(-x+)(1)求f(x)的最大值;(2)利用指數(shù)函數(shù)性質說明其單調區(qū)間,以及曲線的對稱軸3.利用標準正態(tài)分布表(1)=0.8413、(2)=0.9772、(3)=0.9987)求標準正態(tài)總體在下面區(qū)間取值的概率(1)(0,1);(2)(1,3);(3)(-1,2).利用標準正態(tài)分布表(1

4、)=0.8413、(1.84)=0.9671),求正態(tài)總體在下面區(qū)間取值的概率(1)在N(1,4)下,求F(3)(2)在下,求P(-1.84<X<+1.84)*.對于正態(tài)總體取值的概率:()(-,+):()(-2,+2):()(-3,+3):取值的概率分別為68.3%、95.4%、99.7%。因此我們時常只在區(qū)間(-3,+3)內研究正態(tài)總體分布情況,而忽略其中很小的一部分,這一部分情況發(fā)生為小概率事件。6.下列關于正態(tài)曲線性質的敘述正確的是(1)曲線關于直線x=對稱,這個曲線只在x軸上方;(2)曲線關于直線x=對稱,這個曲線只有當x(-3,3)時才在x軸上方;(3)曲線關于y軸對稱

5、,因為曲線對應的正態(tài)密度函數(shù)是一個偶函數(shù);(4)曲線在x=時處于最高點,由這一點向左右兩邊延伸時,曲線逐漸降低;(5)曲線的對稱軸由確定,曲線的形狀由確定;(6)越大,曲線越“矮胖”,總體分布越分散;越小,曲線越“高”總體分布越集中()(A)只有()()()() (B) 只有(2)()() (C) 只有(3)()()() (D) 只有()()()7.把一個正態(tài)曲線a沿著橫軸方向向右移動2個單位,得到一個新的曲線b,下列說法不正確的是 (A)曲線b仍然是正態(tài)曲線 (B)曲線a和曲線b的最高點的縱坐標相等(C)以曲線a為概率密度曲線的總體的方差比以曲線b為概率密度曲線的總體的方差大2(D)以曲線a

6、為概率密度曲線的總體的期望比以曲線b為概率密度曲線的總體的期望小28.在正態(tài)總體(0,)中,數(shù)值落在(-,-1)(1,+)里的概率為(A)0.097 (B).046 (C)0.03 (D)0.0039.設隨機變量N(2,4),則D()等于 (A)1 (B)2 (C)0.5 (D)410.設隨機變量(,),且P(C)=P(C),則C等于 ( ) (A)0 (B) (C)- (D)11.正態(tài)總體的概率密度函數(shù)為,則總體的平均數(shù)和標準差分別是 (A)0和8 (B)0和4 (C)0和2 (D)0和 12.填空題(1)若隨機變量N(1,0.25),則2的概率密度函數(shù)為 .(2)期望為2,方差為的正態(tài)分布

7、的密度函數(shù)是 .(3)已知正態(tài)總體落在區(qū)間(0.2,+)的概率是0.5,則相應的正態(tài)曲線f(x)在x= 時,達到最高點.(4)已知N(0,1),P(1.96)=(1.96)=0.9750,則(-1.96)= .(5)某種零件的尺寸服從正態(tài)分布N(0,4),則不屬于區(qū)間(-4,4)這個尺寸范圍的零件約占總數(shù)的 .(6)某次抽樣調查結果表明,考生的成績(百分制)近似服從正態(tài)分布,平均成績?yōu)?2分,96分以上的考生占考生總數(shù)的2.3%,則考生成績在60至84分之間的概率為 . (1)=0.8413、(2)=0.977、(3)=0.9987參考答案:1(1)0,1(2)1,2(3)-1,0.5;2.(

8、1)x=-1時,(2)對稱軸為x=-1.3.(1)0.3413(2)0.1574(3)0.81854. (1)F(3)=0.8413(2) P(-1.84<X<+1.84)=0.9342;6.A;7.C;8.D;9.A;10.B;11.C;12.(1);(2) ;(3)0.2;(4)0.025;(5)4.56%;(6)=12;P=0.6826.F(96)=, F(84)- F(60)= 正態(tài)分布和線性回歸高考要求 1.了解正態(tài)分布的意義及主要性質 2.了解線性回歸的方法和簡單應用知識點歸納 1正態(tài)分布密度函數(shù):,(0,-x)其中是圓周率;e是自然對數(shù)的底;x是隨機變量的取值;為正態(tài)

9、分布的均值;是正態(tài)分布的標準差.正態(tài)分布一般記為 2正態(tài)分布)是由均值和標準差唯一決定的分布例1、下面給出三個正態(tài)總體的函數(shù)表示式,請找出其均值和標準差(1),(-x+ (2),(-x+解: (1)0,1 (2)1,2 3正態(tài)曲線的性質:正態(tài)分布由參數(shù)、唯一確定,如果隨機變量N(,2),根據定義有:=E,=D。正態(tài)曲線具有以下性質:(1)曲線在x軸的上方,與x軸不相交。(2)曲線關于直線x =對稱。(3)曲線在x =時位于最高點。(4)當x <時,曲線上升;當x >時,曲線下降。并且當曲線向左、右兩邊無限延伸時,以x軸為漸近線,向它無限靠近。(5)當一定時,曲線的形狀由確定。越大,

10、曲線越“矮胖”,表示總體越分散;越小,曲線越“瘦高”,表示總體的分布越集中。五條性質中前三條較易掌握,后兩條較難理解,因此應運用數(shù)形結合的原則,采用對比教學 4標準正態(tài)曲線:當=0、=l時,正態(tài)總體稱為標準正態(tài)總體,其相應的函數(shù)表示式是,(-x+)其相應的曲線稱為標準正態(tài)曲線 標準正態(tài)總體N(0,1)在正態(tài)總體的研究中占有重要的地位 任何正態(tài)分布的概率問題均可轉化成標準正態(tài)分布的概率問題 5.標準正態(tài)總體的概率問題: 對于標準正態(tài)總體N(0,1),是總體取值小于的概率,即 ,其中,圖中陰影部分的面積表示為概率 只要有標準正態(tài)分布表即可查表解決.從圖中不難發(fā)現(xiàn):當時,;而當時,(0)=0.5 例

11、2 設,且總體密度曲線的函數(shù)表達式為:,xR。(1)求,;(2)求的值。分析:根據表示正態(tài)曲線函數(shù)的結構特征,對照已知函數(shù)求出和。利用一般正態(tài)總體與標準正態(tài)總體N(0,1)概率間的關系,將一般正態(tài)總體劃歸為標準正態(tài)總體來解決。解:(1)由于,根據一般正態(tài)分布的函數(shù)表達形式,可知=1,故XN(1,2)。(2) 。點評:在解決數(shù)學問題的過程中,將未知的,不熟悉的問題轉化為已知的、熟悉的、已解決了的問題,是我們常用的手段與思考問題的出發(fā)點。通過本例我們還可以看出一般正態(tài)分布與標準正態(tài)分布間的內在關聯(lián)。9相關關系:當自變量一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關系稱為相關關系 相關關系與

12、函數(shù)關系的異同點如下:相同點:均是指兩個變量的關系 不同點:函數(shù)關系是一種確定的關系;而相關關系是一種非確定關系;函數(shù)關系是自變量與因變量之間的關系,這種關系是兩個非隨機變量的關系;而相關關系是非隨機變量與隨機變量的關系10回歸分析一元線性回歸分析: 對具有相關關系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析 通俗地講,回歸分析是尋找相關關系中非確定性關系的某種確定性 對于線性回歸分析,我們要注意以下幾個方面:(1)回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法。兩個變量具有相關關系是回歸分析的前提。(2)散點圖是定義在具有相關系的兩個變量基礎上的,對于性質不明確的兩組數(shù)據,可先作散點圖,在

13、圖上看它們有無關系,關系的密切程度,然后再進行相關回歸分析。(3)求回歸直線方程,首先應注意到,只有在散點圖大至呈線性時,求出的回歸直線方程才有實際意義,否則,求出的回歸直線方程毫無意義。11散點圖:表示具有相關關系的兩個變量的一組數(shù)據的圖形叫做散點圖.散點圖形象地反映了各對數(shù)據的密切程度 粗略地看,散點分布具有一定的規(guī)律 12. 回歸直線設所求的直線方程為,其中a、b是待定系數(shù),,相應的直線叫做回歸直線,對兩個變量所進行的上述統(tǒng)計分析叫做回歸分析 13.相關系數(shù):相關系數(shù)是因果統(tǒng)計學家皮爾遜提出的,對于變量y與x的一組觀測值,把= 叫做變量y與x之間的樣本相關系數(shù),簡稱相關系數(shù),用它來衡量兩個變量之間的線性相關程度. 14.相關系數(shù)的性質: 1,且越接近1,相關程度越大;且越接近0,相關程度越小.一般的,當 0.75 時,就可以判斷其具有很強的相關性,這時求線性回歸方程才有意義。例3 假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統(tǒng)計資料:x23456y2.23.85.56.57.0若由資料可知y對x呈線性相關關系。試求:(1)線性回歸方程;(2)估計使用年限為10年時,維修費用是多少?分析:本題為了降低難度,告訴了y與x間呈線性相關關系,目的是訓練公式的使用。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論