




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第一章計數(shù)原理1.1 分類加法計數(shù)與分步乘法計數(shù) 分類加法計數(shù)原理:完成一件事有兩類不同方案,在第 1類方案中有m種不同 的方法,在第2類方案中有n種不同的方法,那么完成這件事共有 N=m+n種不 同的方法。分類要做到“不重不漏”。分步乘法計數(shù)原理:完成一件事需要兩個步驟。做第 1步有m種不同的方法, 做第2步有n種不同的方法,那么完成這件事共有N=mxn種不同的方法。分步 要做到“步驟完整”。n元集合A=a, a2? , an的不同子集有2n個。1.2 排列與組合1.2.1 排列一般地,從n個不同元素中取出m(m&n)個元素,按照一定的順序排成一列, 叫做從n個不同元素中取出 m個元
2、素的一個 排歹!J (arrangement)。從n個不同元素中取出m(m&n)個元素的所有不同排列的個數(shù)叫做從 n個不同元 素中取出m個元素的排列數(shù),用符號Amm表示。排列數(shù)公式:n!Am = = n(n - 1)( n - 2) ? (n - m + 1)(n - m)!n個元素的全排列數(shù)An = n!規(guī)定:0!=11.2.2 組合一般地,從n個不同元素中取出m(m&n)個元素合成一組,叫做從n個不同元素中取出 m個元素的一個組合(combination)。從n個不同元素中取出m(m&n)個元素的所有不同組合的個數(shù),叫做從n個不同 元素中取出m個元素的組合數(shù),用符號
3、Cm或(m)表示。組合數(shù)公式:m = rm m, An Cn - AmmAmn!n(n - 1)( n - 2) ? (n - m + 1)Cn -Am =m! (n - m)!m!規(guī)定:?= ?組合數(shù)的性質(zhì):cm = cn-m("構(gòu)建組合意義”一一“殊途同歸”)c+i = cm + cm-1(楊輝三角)kC = nCk-1kv nm-k - nm v nkCn 入 Cn-kCn 人 Cm1.3二項式定理1.3.1 二項式定理(binomial theorem)(a + b)n =C0an+Cnan-1b + ? +Cnan-kbk+ ? +Cnbn(n玳*)其中各項的系數(shù) Ck (
4、kC0, 1, 2, ? , n)叫做二項式系數(shù)(binomial coefficient);式中的Ckan-k bk叫做二項展開式的通項,用Tk+1表示通項展開式的第k+1項:Tk+1 = Ckan-k bk*注意二項展開式某一項的系數(shù)與這一項的二項式系數(shù)是兩個不同的概念。1.3.2 “楊輝三角”與二項式系數(shù)的性質(zhì)*表現(xiàn)形式的變化有時能幫助我們發(fā)現(xiàn)某些規(guī)律!對稱性工+1,公(2)當n是偶數(shù)時,共有奇數(shù)項,中間的一項 C2取得最大值;n-1n+1當n是奇數(shù)時,共有偶數(shù)項,中間的兩項 鏟,彳同時取得最大值。(3)各二項式系數(shù)的和為2n = C0 + Cn + C2 + ? + Cn + ? +
5、Cn(4)二項式展開式中,奇數(shù)項二項式系數(shù)之和等于偶數(shù)項二項式系數(shù)之和:C0 + C2+C4 + ? = Cn + C3+C5+?(5) 一般地,cr+cr+i+c+2+ ? +cn-i=c+1(n > ?)第二章隨機變量及其分布2.1 離散型隨機變量及其分布2.1.1 離散型隨機變量隨著試驗結(jié)果變化而變化的變量稱為 隨機變量(random variable)。隨機變量和函數(shù)都是一種映射,隨機變量把隨機試驗的結(jié)果映為實數(shù),函數(shù)把實數(shù)映為實數(shù)。試驗結(jié)果的范圍相當于函數(shù)的定義域,隨機變量的取值范圍相當于函數(shù)的值域。所有取值可以一一列出的隨機變量,稱為離散型隨機變量(discrete rand
6、omvariable)。概率分布列(probability distribution series),簡稱為分布列(distribution series)。XX1X2?Xi?XnPp1p2?pi?pn也可用等式表示:P(X = Xi) = pi , i = 1 , 2, ? , n根據(jù)概率的性質(zhì),離散型隨機變量的分布列具有如下性質(zhì):(1) pi>0, i=1, 2, ? , n; 41 pi = 1隨機變量X的均值(mean)或數(shù)學期望(mathematical expectation): E(X) = X1p1 + X2p2 + ? + Xi pi + ? Xn pn它反映了離散型隨
7、機變量取值的平均水平。隨機變量X的方差(variance)刻畫了隨機變量X與其均值E(X)l勺平均偏離程度nD(X) = E(Xi - E(X)2pii=1其算術(shù)平方根vD(X)為隨機變量X的標準差(standard deviation)E(aX+ b) = aE(X) + bD(aX+ b) = a2D(X)若隨機變量 X的分布具有下表的形式,則稱 X服從兩點分布(two-point distribution),并稱p=P(X=1訥成功卞K率。(兩點分布又稱0-1分布。由于只有兩 個可能結(jié)果的隨機試驗叫伯努利試驗,所以兩點分布又叫伯努利分布)X01P1-pp若X服從兩點分布,則E(X) =
8、p, D(X) = p(1 - p)般地,在含有M件次品的N件產(chǎn)品中,任取n件,其中恰有X件次品,則k nk?= k) = MN-M,k=0, 1, 2, ? , m CNX01?mP000n-0CM CN-M010n-1CM CN-M?0n-m CM CN-MCNCNCn其中 m=minM , n,且 n&N, MKN , n, M, NCN*如果隨機變量X的分布列具有上表的形式,則稱隨機變量X服從超幾何分布(hypergeometric distribution)。2.2 二項分布及其應用2.2.1 條件概率般地,設A, B為兩個事件,且P(A)>0,稱P(B|A)=P(AB
9、)P(A)為在事件A發(fā)生的條件下,事件 B發(fā)生的條件概率(conditional probability) 如果B和C是兩個互斥事件,則P(B UC|A) = P(B|A) + P(C|A)2.2.2 事件的相互獨立性設A, B為兩個事件,若P(AB) = P(A)P(B)則稱事件A與事件B相互獨立(mutually independent)??梢宰C明,如果事件A與B相互獨立,那么A與? ?%B,?f ?也都相互獨立2.2.3 獨立重復試驗與二項分布一般地,在相同條件下重復做的n次試驗稱為n次獨立重復試驗(independent and repeated trials)。P(AlA2? An)
10、 = P(Ai)P(A2)? P(An)其中Ai (i=1 , 2, ? , n)是第i次試驗的結(jié)果。一般地,在n次獨立重復試驗中,用 X表示事件A發(fā)生的次數(shù),設每次試驗中 事件A發(fā)生的概率為p,則P(X= k) = Ckpk(1 - p)n-k , k= 0, 1 , 2, ? , n此時稱隨機變量 X服從二項分布(binomial distribution),記作XB(n , p),并稱p 為成功概率。若XB(n , p),則nnn-1E(X) = E kCk pk qn-k = E npCn-1 pk-1 qn-1-(k-1)= np E Cn-1 pkqn-1-kk=0k=1k=0=n
11、p(p + q)n-1 = npD(X) = np(1 - p)*隨機變量的均值是常數(shù),而樣本的平均值是隨著樣本的不同而變化的,因此樣 本的平均值是隨機變量。隨機變量的方差是常數(shù),而樣本的方差是隨著樣本的不同而變化的, 因此樣本的 方差是隨機變量。2.4正態(tài)分布一般地,如果對于任何實數(shù)a, b (a<b),隨機變量X滿足1(x-心)2鼠 b(x)= -e 21,x s ( - s, +8)v2 兀(T bP(a< ?< ?= /。僅)dxa '則稱隨機變量X服從正態(tài)分布(normal distribution)。正態(tài)分布完全由參數(shù) 仙和o-確定,記作N(必a2) o如
12、果隨機變量X服從正態(tài)分布,則記為XN(5 3).6 Xx)的圖像稱為正態(tài)分布密度曲線,簡稱正態(tài)曲線。(參數(shù)小是反映隨機變量取值的平均水平的特征數(shù),可用樣本的均值去估計;(7 是衡量隨機變量總體波動大小的特征數(shù),可用樣本的標準差去估計。) 標準正態(tài)分布:XN(0 , 1)經(jīng)驗表明,一個隨機變量如果是眾多的、互不相干的、不分主次的偶然因素作 用結(jié)果之和,它就服從或近似服從正態(tài)分布。正態(tài)曲線的特點:(1)曲線位于x軸上方,與x軸不相交;(2)曲線是單峰的,它關于直線x=p對稱;(3)曲線在x=仙處達到峰值 T;o/2 兀(4)曲線與x軸之間的面積為1。*«越小,曲線越“高瘦”,表示總體分布
13、越集中;越大,曲線越“矮胖”, 表示總體分布越分散;若XN口,a2),則對于任何實數(shù)a>0 ,11 +aP(上 a< ?<?在??= / 弧,Jx) dxi -a該面積隨著(T的減少而變大。這說明 b越小,X落在區(qū)間(p- a, p+a的概率越大,即X集中在以周圍概率越大。特別有P( H- o< ?< ?+ o) = 0.6826P( p- 2(r< ?< ?+ 2 & = 0.9544P( p- 3 X ?< ?+ 3 o) = 0.9974 在實際應用中,通常認為服從于正態(tài)分布 N(j o2)的隨機變量X只取 (曠3 Z ?0?+ 3
14、 &之間的值,并簡稱之為???則。第三章統(tǒng)計案例3.1回歸分析的基本思想回歸分析(regression analysis)是對具有相關關系的兩個變量進行統(tǒng)計分析的一種 常用方法。對于一組具有線性相關關系的數(shù)據(jù)(Xi, yi), (X2, y2), ? , (Xn, yn)? _ 卑1 (X i -X?)(y i-y?) _ 型i xiyi-nx?郊=1 (X i -X?)21=1 X2-nX?2?= ?- b?_11 一其中? = 1浮1 Xi, ?= 1淳1 yi, ()?, ?)稱為樣本點的中心,回歸直線過樣本 nn點的中心?;貧w方程:? = ?X + ?線性回歸模型:y = bX
15、 + a + e2,E(e) = 0, D(e)= /其中a和b為模型的未知參數(shù),e是y與bX+a之間的誤差。通常e為隨機變 量,稱為 隨機誤差(random error)。與函數(shù)關系不同,在回歸模型中,y的值由x和隨機因素e共同確定,即x 只能解釋部分y的變化,因此我們把x稱為解釋變量,把y稱為預報變量。隨機誤差e的方差懈越小,用bx+a預報真實值y的精度越高。隨機誤差是引起 預報值如真實值y之間存在誤差的原因之一,其大小取決于隨機誤差的方差。另一方面,?和?為斜率和截距的估計值,它們與真實值 a和b之間也存在誤差,這種誤差是引起預報值?與真實值y之間存在誤差的另一個原因。由于隨機誤差e =
16、 y- (bx + a),所以e=y- ?是6的估計量。對于樣本點(xi, yi),僅2, 丫2), ? , (xn, yn)它們的隨機誤差為ei = yi - bxi - a, i = 1, 2, ? , n其估計值為?i = yi - y? = yi - ?xi - ?, i = 1, 2, ? , n?i稱為相應于點(xi, yi)的殘差(residual)??梢酝ㄟ^殘差發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù),判斷所建立模型的擬合效果。以樣本編號為橫坐標,殘差為縱坐標,可作出 殘差圖。檢查殘差較大的樣本點,確認采集該樣本點過程中是否有人為錯誤,如有,應予 以糾正,再重新利用線性回歸模型擬合數(shù)據(jù);如沒有
17、,則需尋找其它原因。另外,對于已經(jīng)獲取的樣本數(shù)據(jù),R2_ 1 玨i M - ?2=- "i(yy)2中的理i(yi- ?)2為確定的數(shù)。因此R2越大,意味著殘差平方和 年i(yi- %)2越 小,即模型擬合效果越好;R2越小,殘差平方和越大,即模型擬合效果越差。R2表示解釋變量對于預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越 好。一般地,建立回歸模型的基本步驟:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量;畫出解釋變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等)(3)有經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關系,則選用線性回歸 方
18、程)(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù);(5)得出結(jié)果后分析殘差圖是否有異常(如個別數(shù)據(jù)對應殘差過大,殘差呈現(xiàn)不隨 機的規(guī)律性等)。若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。回歸模型的適用范圍:(1)回歸方程只適用于我們所研究的樣本的總體;(2)我們所建立的回歸方程一般都有時間性;(3)樣本取值的范圍會影響回歸方程的適用范圍;不能期望回歸方程得到的預報值就是預報變量的精確值。一般地,比較兩個函數(shù)模型的擬合程度的步驟如下:(1)分別建立對應于兩個模型的回歸方程 yi = f(x, ?)與?2 = g(x,階,其中?和?分別是參數(shù)a和b的估計值(2)分別計算兩個模型的R2
19、值若R2 > R2,則模型1比模型2擬合效果更好;若R2 <后,則模型2比模型 1擬合效果更好。3.2獨立性檢驗的基本思想不同的“值”表示不同類別的變量叫做 分類變量。列出兩個分類變量的頻數(shù)表稱 為列聯(lián)表(contingency table)。常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征。利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為 獨立性檢驗(test of independence) o反證法原理與獨立性檢驗原理的比較反證法原理在假設H0下,如果推出一個矛盾,就證明了 H0不成立獨立性檢驗原理在假設H0下, 斷Ho不成立,如果出現(xiàn)一個與H0相矛盾的小概率事件,就推 且該推斷
20、犯錯誤的概率不超過這個小概率一般地,假設有兩個分類變量 X和Y,它們的取值分別為xi, X2和y1,y2,其 樣本頻數(shù)列聯(lián)表(稱為2X2列聯(lián)表)為:y1y2總計xiaba+bx2cdc+d總計a+cb+da+b+c+d假設H0: X與Y沒有關系,即X與Y獨立 則有 P(XY尸P(X)P(Y)根據(jù)頻率近似于概率,故有aa + ba+ cyxa+b+c+d a+b+c+d a+b+c+d化簡得ad =bc因此,|ad - bc|越小,兩者關系越弱;|ad - bc|越大,兩者關系越強; 基于以上分析,構(gòu)造隨機變量K2n(ad-bc) 2(a+b )(c+d )(a+c)(b+d)'其中n
21、= a + b + c + d為樣本容量K2的值越小則關系越小,K2的值越大則關系越大。(實際應用中通常要求a, b, c, d都不小于5)計算K2的觀測值k并與K2作比較。統(tǒng)計學研究發(fā)現(xiàn),在Ho成立的情況下,P(K2 >6.635) = 0.01即在Ho成立的情況下,K2的觀測值超過6.635的概率非常小,近似為0.01,是 一個小概率事件。若觀測值k大于6.635,則有理由判定 力不成立,即“ X與Y有關系”。但這種判斷會犯錯誤,犯錯誤的概率不會超過 0.01.*(這里概率計算的前提是H0成立,即H。:兩個分類變量沒有關系)若要推斷的論述為Hi: “X與Y有關系”??梢酝ㄟ^頻率直觀地判斷兩個條件概率P(Y=yX=X1)和P(Y=yX=X2)是否相等。如果判斷它們相等,就意味著X和Y沒有關系;否則就認為它們有關系。由上表可知,在X=xi的情況下,Y=yi的頻率為一 a+b,c,一 ,、一,、,在X=)e的情況下,Y=y的頻率為。因此,如果通過直接計算或等圖條形圖發(fā)c+d a c現(xiàn)和相差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 吊裝工程合同范例
- 吊船租賃合同范本
- 包工頭內(nèi)部合同范本
- 合伙開車行合同范本
- 商鋪門面租借合同范本
- 農(nóng)村土布收購合同范本
- 衛(wèi)浴安裝承攬合同范本
- 名氣大承攬合同范本
- 代理加工合同范本
- 加油站職業(yè)經(jīng)理人合同范本
- 江蘇省環(huán)保集團有限公司招聘筆試題庫2024
- 商場物料制作合同協(xié)議書
- 醫(yī)院論文發(fā)表前誠信承諾及備案表
- 2024年廣州市中考語文試卷真題(含官方答案)
- ISO14644國際標準(中文版)
- 食品安全管理制度打印版【7】
- 2024社工(初)《社會工作實務》考試題庫附答案
- 標桿地產(chǎn)五星級酒店精裝修標準
- (高清版)JTGT 5532-2023 公路橋梁支座和伸縮裝置養(yǎng)護與更換技術(shù)規(guī)范
- 2024年江蘇農(nóng)林職業(yè)技術(shù)學院單招職業(yè)適應性測試題庫1套
- 廣東省廣州市越秀區(qū)2022-2023學年六年級下學期期末數(shù)學試卷
評論
0/150
提交評論