



免費預(yù)覽已結(jié)束,剩余1頁可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
推薦一本概率統(tǒng)計的寫的比較好的書現(xiàn)在看來在中國,中文的教科書可不是越厚越好,似乎已經(jīng)成了一種和國外相反的趨勢,厚的書以盈利為目的,薄的書才可能是教書育人的。大學的那本概率統(tǒng)計書似乎就是這樣的一個很好的例子,忘了是哪個地方出的,反正好像很多大學都用的,很厚,封面有點淺藍色。Anyway,不爽的就讓它過去吧,雖然我花了很長時間在那本書上也沒搞清楚它在講什么?,F(xiàn)在隆重推出概率統(tǒng)計,同濟大學工程數(shù)學教研室編,由同濟大學出版社出版,封面上還寫有函授自學教材。我手上的(圖書館借的)是99年的第一版,才14塊,絕對的劃算,書也不厚不薄,正好包含了它應(yīng)該有的內(nèi)容。這本書最出彩的是他第五章開始的數(shù)理統(tǒng)計的講解,和很多其它書不同,這本書抓住了統(tǒng)計的精要統(tǒng)計是用于實踐的。內(nèi)容處處與實踐相結(jié)合,顯示出了數(shù)學是實踐的強大工具。下面是我摘要的個人感覺講的比較好的地方(也是我以前看垃圾書一直搞不懂的地方,不過我考試確能很好的通過,這也是我搞不懂的地方,中國教育這個垃圾)。1,什么是數(shù)理統(tǒng)計數(shù)理統(tǒng)計方法實際上就是數(shù)據(jù)處理的方法,與其它數(shù)學科目不同,它注重的是對實際工程中獲得的不理想的數(shù)據(jù)的處理,使其盡量理想化。比方說你想知道世界上是漂亮女人多還是丑的多,那么我們可以做這么一個實驗。隨便找一天上街,然后把看到的所有年輕女人進行你心目中的評分,然后計下來,下面是我做的這么一個實驗數(shù)據(jù)(比較衰,這天沒看到幾個漂亮的),1表示完美,0表示極丑,0.5為中等。0.90.50.40.40.80.50.60.30.50.50.40.60.70.4對這組數(shù)據(jù)最簡單的處理就是取其平均值,不過在此之前,先看看數(shù)據(jù)的特性。數(shù)據(jù)值頻數(shù)0.000.100.200.310.440.540.620.710.810.911.00要注意,頻數(shù)和頻率在概率論里是兩個不同的概念,頻數(shù)是指其數(shù)據(jù)在實際實驗中出現(xiàn)過的次數(shù),而頻率是理論或者實際試驗后處理過的數(shù)據(jù)(工程中用頻數(shù)除以數(shù)據(jù)的總數(shù)作為頻率或者講概率的一個估計)。有興趣的讀者可以用word把上面的數(shù)據(jù)作個條形圖看看數(shù)據(jù)的分布,很有趣的。O.K.現(xiàn)在我們看看我們的數(shù)據(jù)可以帶給我們什么樣的結(jié)果呢,對數(shù)據(jù)做和然后求平均,*(0.9+0.8+0.7+0.6*2+0.5*4+0.4*4+0.3)=0.536Well,結(jié)果似乎還是令人滿意的,說明對我來說這個世界的年輕女人長得還是可以的,不致于我要出家當和尚(我要求是不是很低?。?。好了,上面就是我們所做的統(tǒng)計的最初之旅,有點簡單但是很實用。不過細心的讀者可能會發(fā)現(xiàn),實際上我的這個結(jié)論是極其不可靠的,因為首先我只是對幾個女人進行評價,從而得出了一個對整個世界女人的評價,即使這個方法是合理的,也頂多能判斷中國或者上海女人符合這個判斷。還有我采用的評價公式是否是合理的,為什么只取平均,而不是其它的值。很顯然統(tǒng)計這門學科就是要研究如何采集數(shù)據(jù),以及分析數(shù)據(jù),以及數(shù)據(jù)能對對象的什么特性進行評價的一門學科。2,總體和樣本的概念說實話,在看到這本書之前(本科學這門課到研究生第二年,靠,考研顯然也是垃圾,我照搬公式就搞定了),我對這個概念一直是搞不清(我覺得不能怪我,責任都在我的大學體制和那本垃圾教科書)。但是這是要看懂后面概念所最基本的,這里我作個詳細介紹,當然你也可以看我上面推薦的那本書。在數(shù)理統(tǒng)計中,我們把研究對象的全體稱作總體,而其中的每個成員看作個體。在上面的那個例子中,全世界的年輕女人就是總體,單個女人就是個體。一般來講,捕獲全體是不現(xiàn)時的,就像我不可能看過全世界的所有女人,所以個體就變得十分重要。好的個體能很好的包含總體的屬性,不過一般來講,個體總能包含總體的屬性,只是多和少罷了。在實際的工程中,我們常常只是把自己感興趣的指標X視為總體,如上面例子,對總體的進一步抽象就是全世界年輕女子的樣貌作為總體。在實際應(yīng)用中,常常可以看到別人使用了積分的一些表達式,這是因為從統(tǒng)計的角度來說,人們更喜歡使用密度這個概念,這樣如果計算對象隨某一變量實時變化那么我們就可以用積分來計算這個對象了。這里我們把這個密度函數(shù)稱作分布函數(shù),一般對于總體X,叫做X的分布函數(shù),當X是連續(xù)型的隨機變量時,叫做總體密度函數(shù),如果是離散的,就叫概率函數(shù)。在實際工程中,總體的分布函數(shù)總是未知的(知道了就不要用統(tǒng)計了),但可能其分布類型為已知,而只是其中參數(shù)未知,那么通過樣本分析得到這些參數(shù)的統(tǒng)計推斷就構(gòu)成了參數(shù)統(tǒng)計的內(nèi)容,如果連分布類型都不知的化,那么就是非參數(shù)統(tǒng)計了,顯然后者更復(fù)雜一點。一般的,如果總體包含的個體個數(shù)很多時,我們常常將其認為是無限總體來進行近似,比如上面那個例子中,全世界的年輕女人太多,就可以認為是無限總體了。我們這里只討論無限總體,有限總體可以從中類比,因為有限比較簡單。為了對總體進行分析,所要做的第一步就是從總體中抽出一些個體,這一過程稱作抽樣。在上面的例子中,那些數(shù)據(jù)就是從抽樣樣本的數(shù)字表示。一般把這些數(shù)字表現(xiàn)或者叫做樣本觀測值記為x1,x2,x3.xn,其中n叫做樣本大小或者樣本容量。顯然在抽樣前我們無法知道這些觀測的具體值,所以站在抽樣前的立場來看,它們也是隨機的變量,把他們表示為X1,X2,X3,.Xn,我們把(X1,X2,X3,.Xn)稱作樣本或子樣,抽樣后的具體值叫做樣本觀測值。自然而然,我們就會想到如何抽樣才能最好的體現(xiàn)總體的屬性,這屬于抽樣論的內(nèi)容,有興趣的讀者可以參考相關(guān)書籍。一般的,我們使用隨機抽樣就能很好的體現(xiàn)總體了,所以在實踐中人們常常使用簡單的隨機抽樣,我們這里也以這個作為前提。隨機抽樣的結(jié)果叫做簡單隨機樣本,它應(yīng)該具有下面兩個屬性:(1) 代表性:每個Xi與總體X有相同的分布。(2) 獨立性:X1.Xn相互獨立。后面就把簡單隨機樣本通稱為樣本。實際上上面的兩個屬性看似簡單,但實際上很多情況下都不滿足它的條件。以通信信號來作個例子,如果一個信號發(fā)生器的輸出是與時間相關(guān)的,那么顯然不滿足第一個條件,我們無法做這樣一個等效:對一個機器在一段時間的采樣n次同時對n臺機器在同一時刻采樣,但是如果信號輸出與時間無關(guān)(更一般的說與任何可變參數(shù)無關(guān)),就能夠滿足第一條,比如高斯白噪聲。第二個屬性有時也很難滿足,比如某種具有對實驗對象具有破壞性的實驗,每采樣一次,就把采樣結(jié)果從實驗對象中剔除,這樣顯然各次的樣本之間就不獨立了。3,統(tǒng)計量我們有了樣本實際上什么也干不了,更重要的是對樣本建立一個(X1,X2,X3,.Xn)函數(shù),然后用樣本觀測值來進行統(tǒng)計推斷。例如要測一個美女的體重,為了滿足她對數(shù)字的精確性,我們對她一共量了n次,于是就有了樣本(X1,X2,X3,.Xn),顯然體重是我們這里的統(tǒng)計量,為此我們對樣本建立一個與體重有關(guān)的函數(shù),在實際測量工作做完后,我們將觀測值帶入這個樣本函數(shù)中,得到這個具體的數(shù)字,這樣我們就為美女提供了她精確的體重了。這里給出統(tǒng)計量的精確定義:如果樣本(X1,X2,X3,.Xn)的函數(shù)Foo(X1,X2,X3,.Xn)不包含總體分布中的任何未知參數(shù),那么這個函數(shù)就是統(tǒng)計量。說白了,就是如果把觀測值帶入函數(shù)后得到一個實際數(shù)字的函數(shù)就是統(tǒng)計量。常用的統(tǒng)計量有樣本均值,樣本方差,樣本標準差,樣本k階原點矩,樣本k階中心矩。一般我們通過這些統(tǒng)計量來近似總體分布中的一些未知參數(shù)(參數(shù)統(tǒng)計),4,統(tǒng)計量的分布上面的統(tǒng)計量實際上也是有分布的,具體的分布情況視其總體分布而定,具體可以查看我推薦的這本書。不過一般的有正態(tài)分布和波努力分布(通過大數(shù)和中心極限定理得到)。這里的這部分就很好的體現(xiàn)出了如果知道了總體的分布,再通過對觀測數(shù)據(jù)的分析就能知道某些事情的概率了(通過書上的例子可以體會)。5,參數(shù)點估計如果已經(jīng)知道了總體的分布類型,但是不知道其中的參數(shù),那么如何通過樣本作出對參數(shù)的估計,就構(gòu)成了參數(shù)估計(參數(shù)統(tǒng)計)。一般有兩種方法,點估計和區(qū)間估計。點估計就好比是估計某個美女的年齡是23歲,而區(qū)間估計就是估計這個美女的年齡大約在2025歲左右。從理論上來講,點估計就是構(gòu)造一個統(tǒng)計量,而區(qū)間估計則是構(gòu)造兩個統(tǒng)計量從而形成一個區(qū)間。當然,對于某一個未知參數(shù)可以有多個估計方法。下面先講點估計。如果是總體的一個未知參數(shù),那么與相關(guān)的統(tǒng)計量 (X1,X2,X3,.Xn)就稱為的點估計。理論上任何一個統(tǒng)計量都是的點估計,但是這個統(tǒng)計量在實際工程上要被人接收就要有一定的物理理由。點估計法一般又分為兩種,矩估計和最大似然估計。矩估計就是講統(tǒng)計量表示成矩的形式,然后講觀測值帶入,得到未知參數(shù)的估計值。最大似然估計基于下面這樣一個假設(shè),如果P(B|A1) P(B|A2),這時如果得到B,那么我們認為B是在A1條件下得到的比在A2下得到的概率大,所以我們判定實驗結(jié)果是A1,顯然最大似然原理的思想源自經(jīng)驗。更一般的,定義似然函數(shù)L()=f(xi;)其中xi為觀測值,顯然根據(jù)最大似然原則,的一個合理估計是能使得L()最大的那個值。再看前面的那個假設(shè),得到B,要對情況A作出估計,顯然我們會選擇那個能使得B出現(xiàn)機會最大的那個A,于是我們選擇了A1。5,估計量的評選標準前面已經(jīng)提到,同一參數(shù)可以有多種估計方法,上面只是給出了最普遍的兩種點估計方法。但是哪個優(yōu)哪個劣,就需要有一套標準。(1) 無篇性如果對某一參數(shù)進行多次實驗估計,我們就能得到估計值的一組數(shù),當然由于樣本是隨機的,那么它也是隨機的,很自然的,我們就會希望這一組數(shù)與真正的被估計參量的平均誤差為0,即,E (X1,X2,X3,.Xn)- =0= E (X1,X2,X3,.Xn)這個就叫無偏估計。雖然一次估計不能保證誤差為0,但是多次使用后確能保證平均誤差為0,這樣的化就能取多次估計的平均數(shù)了。(2) 有效性仿照均值和方差的概念,有了上述無偏性的定義,自然就會想到,應(yīng)該還要定義一個估計和實際數(shù)之間的偏離程度。有效性就自然的成了比較各個估計方法的D (X1,X2,X3,.Xn)的大小了,當然越小越有效。不過要注意,要比較D,因為是個變量,那么比較的結(jié)果可能會隨不同而有所變化,比如D(1)=22 +,D(2)=2 +2時,就無法比較了,因為當=1,D(1)= D(2);而當=1,D(1)= D(2)。(3) 相和性它表示隨機的變量序列 (X1,X2,X3,.Xn)與的充分接近程度,定義方式有很多,依概率收斂就是其中之一。6,置信區(qū)間從上面的方法來看,點估計方便簡單,并且常用的最大似然法具有無偏性,一致性等,但是可以發(fā)現(xiàn),這些估計并沒有提供一個精度,比如估計值與被估計對象的真實值到底有多少誤差,顯然點估計不提供這個屬性,為了解決這一問題,人們使用了置信區(qū)間的方法,也就是判斷某一估計值成立的可能性有多大。這里要提一下,我們一般把1-稱作置信水平,通常這個值越接近1,那么所得的區(qū)間也就越大,而這個值越小,則區(qū)間長度也就越短。就好比我們估計某個美女的年齡是(0,150),盡管我們可以得到100%的置信水平,但是這個毫無意義,所以實際工程中根據(jù)情況一般取0.90或0.95或者0.99等。在實際問題中,有時只要估計未知參數(shù)的下限或者上限,那么可以將置信區(qū)間的上限取為+或者下限為-。這樣我們可以建立單側(cè)置信區(qū)間的概念。下面將雙側(cè)置信區(qū)間的具體求法概括:第一步:求的一個點估計,通常用極大似然法。第二步:以(X1Xn)為基礎(chǔ),建立一個隨機變量:J=J(X1Xn; ),其中J只能包含一個未知參數(shù)。第三步:定出常數(shù)a,b,使得Pa=J=1- ,通常取a為/2,b為1-/2 。第四步:等價變形,使得P_(X1Xn)= =-(X1Xn)= Pa=J=1- 。單側(cè)區(qū)間的求法區(qū)別在第三步開始,a或者b為已知,其它都一樣。7,顯著性檢驗在實際工程中,往往可能會需要對某些事進行假設(shè),比如改進后的技術(shù)優(yōu)于之前的技術(shù)。一般把H0:A=B(A優(yōu)于B),稱為原假設(shè),而H1:AB,稱為備擇假設(shè)。實際這兩種選哪個都是一樣的,一般取H0,因為方便計算。很顯然采用上面的方法,有時會犯取錯誤值的錯,這是無法避免的,畢竟我們這里討論的是概率和統(tǒng)計,概率本身就代表了非100發(fā)生的事。這個錯誤可以分為下面兩類:I:當實際上H0成立,但做統(tǒng)計時確作出了拒絕H0的決定。II:當實際上H0不成立,但做統(tǒng)計時確作出了接收H0的決定。自然而然的,我們會希望這兩類錯誤都盡量的小,但目前的技術(shù)表明,如果確保第一類錯誤出現(xiàn)的可能性小的化,那么第二類錯誤的出現(xiàn)率就會上升,反之亦然。如何舍魚而取熊掌就要根據(jù)實際情況了。下面我舉兩個實際的例子來說明如何取舍。愛因斯坦的廣義相對論中指出了宇宙中重力波的存在,但是到目前為止,由于重力波即使存在,其值也難以測得,一直未被世人證明。那么物理工作者如果利用儀器來測量時就需要做對數(shù)據(jù)的假設(shè)檢驗。顯然,由于重力波一直未被驗證到,那么我們情愿接收即使是真的接收到了重力波而作出拒絕的決定,這樣可以保證如果證明了存在,那么這個證明的成功可能性比較大。這樣科學教會將出現(xiàn)第二類錯誤的可能性減小,而放寬對第一類錯誤的限制。而在醫(yī)院看病,醫(yī)生為了保證病人的生命安全,在觀察到某一現(xiàn)象時他們更傾向于作出有病的結(jié)論,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年輔警招聘考試綜合提升試卷含答案詳解(黃金題型)
- 2022年2月錦州市直遴選面試真題附解析
- 2025年行政執(zhí)法基礎(chǔ)知識綜合練習題及參考答案詳解一套
- 2025年皖北煤電集團總醫(yī)院招聘24人筆試備考題庫及答案詳解(奪冠系列)
- 安全形勢交流發(fā)言材料
- 麗江云南麗江市交通運輸綜合行政執(zhí)法支隊執(zhí)法輔助人員招聘6人筆試歷年參考題庫含答案詳解(培優(yōu)b卷)
- 5s基礎(chǔ)知識考試試題及答案
- 醫(yī)美皮膚美容IPL激光治療知情同意書
- 2025經(jīng)紀人代理合同范本
- Cycloepoxydon-生命科學試劑-MCE
- 2023年山東省濟南市中考道德與法治真題(原卷版)
- 2024-2025學年中職語文基礎(chǔ)知識-字詞解析
- HG∕T 4686-2014 液氨泄漏的處理處置方法
- 租賃國企用地合同范本
- 2024年江蘇省南京玄武區(qū)八下英語期末考試試題含答案
- 2024內(nèi)蒙古森工集團第二批工作人員招聘【重點基礎(chǔ)提升】模擬試題(共500題)附帶答案詳解
- 城市更新暨老舊小區(qū)改造二期項目-初步設(shè)計說明書
- 黑龍江省高校畢業(yè)生“三支一扶”計劃招募筆試真題2021
- 職業(yè)道德與法治 第13課《學會依法維權(quán)》第二框課件《崇尚程序正義》
- 專業(yè)技術(shù)人員年度考核情況登記表
- 兒童眩暈的診斷與治療課件
評論
0/150
提交評論