




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨機變量分布函數(shù)本文從隨機變量分布函數(shù)最基本的的定義和性質(zhì)談起,探討了二元聯(lián)合分布函數(shù)的兩種估計方法,并介紹了概率密度函數(shù)的一個應(yīng)用瑞利概率密度分布函數(shù)在電信用戶預測中的運用。綜合了課內(nèi)所學與查閱課外資料文獻所得,更深入透徹地理解了隨機變量分布函數(shù)和概率密度分布函數(shù),并通過實際生活中的應(yīng)用感知到了它們的重要性。Part.1定義及性質(zhì)對于離散型隨機變量可以用分布律全面地描述它。但對于非離散型隨機變量,由于其取值不能一一列出,因而就不能像離散型隨機變量那樣可以用分布律來描述它。另外,我們通常遇到的非離散型隨機變量取任一指定的實數(shù)的概率都等于零,而且,在實際問題中我們并不單一地關(guān)注隨機變量取某一值的
2、概率,相反,我們更多的是關(guān)注隨機變量落在某個區(qū)間內(nèi)的概率,即P(x1 X x2 ) 。但注意到,所以我們只需要知道和就可以了,這就是引入了分布函數(shù)的概念。分布函數(shù)的引入可以對離散型的和非離散型的隨機變量給出一種統(tǒng)一的描述方法,進行統(tǒng)一的研究。一.隨機變量分布函數(shù)的定義定義1. 設(shè)X是一個隨機變量,是任意實數(shù),稱函數(shù): 為X的分布函數(shù)。分布函數(shù)是個普通函數(shù),它是實數(shù)的函數(shù),有時也可用記號F X (x)來表示X的分布函數(shù)。正是通過分布函數(shù),我們才能將數(shù)學分析的方法引入來研究隨機變量。如果將X看作數(shù)軸上隨機點的坐標,則分布函數(shù)F X (x)的值就表示X落在區(qū)間上的概率。對任意的實數(shù),有:從分布函數(shù)的
3、定義可見,任一隨機變量(離散的或連續(xù)的)都有一個分布函數(shù),有了分布函數(shù)就可據(jù)此算得與隨機變量X有關(guān)事件的概率。下面先介紹分布函數(shù)的三個基本性質(zhì)。二.隨機變量分布函數(shù)的性質(zhì)性質(zhì)1 (單調(diào)性)F(x)是定義在整個實數(shù)軸(,+)上的的單調(diào)非減的函數(shù)。即對任意的x1 x 2,, 有:F(x1) F(x2)性質(zhì)2 (有界性)對任意的,有0F(x)1,且:證明: 因為0F(x)1 ,且由F(x)單調(diào)性可知,對任意整數(shù)m,n ,有:又由概率的可列可加性得:由此可得:性質(zhì)3 (右連續(xù)性)F(x)是的右連續(xù)函數(shù)。即對任意的x0,有:證明:因為F (x)是單調(diào)有界非減函數(shù),所以其任一點x0的右極限(Fx0+0)必
4、存在。為證明右連續(xù),只要對單調(diào)下降的數(shù)列當時證明成立即可。 因為 :所以得:性質(zhì)1至性質(zhì)3是分布函數(shù)必須具有的性質(zhì)。反過來還可以證明:任一滿足這三個性質(zhì)的函數(shù),一定可以成為某個隨機變量的。因此,滿足這三個性質(zhì)的函數(shù)通常都稱為分布函數(shù)。有了隨機變量X的分布函數(shù),那么有關(guān)X的各鐘事件的概率都能方便地用分布函數(shù)來表示。例如,對任意的實數(shù)a,b,有:特別,當F(x)在a與b點連續(xù)時,有:例1設(shè)有一反正切函數(shù)它在整個數(shù)軸上是連續(xù)、單調(diào)嚴格遞增的函數(shù),且:所以此函數(shù)滿足分布函數(shù)的三條基本性質(zhì),故F(x)是隨機變量X的一個分布函數(shù)。稱這個分布函數(shù)為柯西分布函數(shù)。若隨機變量X服從柯西分布,則:三. 離散型隨機
5、變量的分布函數(shù)定義2。若離散型隨機變量X的分布律為: , k=1,2則其分布函數(shù)為:這里和式是對于所有滿足xkx的求和。分布函數(shù)F(x)在x= x k( k=1,2)處有跳躍,其跳躍值為。其圖形是個階梯形圖形: 圖1. 離散型隨機變量的分布函數(shù)在離散型隨機變量中要特別注意端點的計算,這也是離散型隨機變量與連續(xù)型隨機變量的一個區(qū)別之處。值得一提的是:離散型隨機變量的分布函數(shù)一般為階梯跳躍函數(shù),且在每個間斷點處僅右連續(xù)。但也有分布函數(shù)不是階梯函數(shù)的離散型隨機變量。例如,記(0,1)區(qū)間中的全體有理數(shù)為且x1,x2,且, 則X為離散型隨機變量,而此時的X分布函數(shù)非階梯形。Part.2 二元聯(lián)合分布函
6、數(shù)的兩種估計方法一、 copula函數(shù)估計方法又Sklar定理知如果邊緣分布是連續(xù)的,則存在唯一的copula函數(shù)來描述這兩個隨機變量的相關(guān)結(jié)構(gòu)。但現(xiàn)實應(yīng)用中,我們遇到的邊緣分布函數(shù)經(jīng)常是不連續(xù)的,如經(jīng)驗分布函數(shù),此時兩個隨機變量的copula函數(shù)就不唯一了。同時,相同的邊緣分布函數(shù),不同的copula函數(shù)構(gòu)造的聯(lián)合分布函數(shù)也是不同的。從上文知,選擇合適的copula函數(shù)對減小估計的誤差是很重要的。下面將分三步說明如何利用copula函數(shù)來構(gòu)造二維隨機變量的聯(lián)合分布函數(shù)。(1) 采用非參數(shù)核密度估計去估計兩隨機變量X和Y的邊緣分布函數(shù),先估計其分布函數(shù),如下所示:其中Xi是與X獨立同分布的樣本
7、,Yi是與Y獨立同分布的樣本。顯然,X和Y的邊緣分布函數(shù)很易求得,有如下形式:(2) 用二元核密度估計方法估計二維隨機變量的聯(lián)合分布函數(shù),先估計F(x,y)的密度函數(shù),有:同理,Xi,Yi是分別于X,Y獨立同分布的樣本。則F(x,y)的估計量有:(3) 四種備選的copula函數(shù)分別作為X和Y的結(jié)構(gòu)函數(shù),與X,Y的邊緣分布函數(shù)估計量構(gòu)造聯(lián)合分布函數(shù)的四種估計。計算出四種估計量在密度集中點上與二元核密度估計的聯(lián)合分布誤差,取絕對誤差均值最小者作為兩隨機變量相應(yīng)的copula函數(shù),若絕對誤差的均值相同,則取方差最小者。二、 乘積公式估計方法由乘積公式F(x, y) = F(x).F(y| x)可知
8、,若想估計出聯(lián)合分布函數(shù),必然要估計出一變量的邊緣分布函數(shù)及一變量在另一變量下的條件分布函數(shù)。鑒于此,分三步來處理該問題。(1) 先估計變量X的邊緣分布函數(shù),與copula函數(shù)估計方法中X完全相似。(2) 條件分布函數(shù)沒有公式可用,因,故條件分布函數(shù)可以用Xi上的的回歸來估計。一個簡單的非參數(shù)估計量就是局部線性光滑估計量:其中:(3) 利用乘積公式將兩者結(jié)合,即可得到二維隨機變量的聯(lián)合分布函數(shù)的估計量:以上兩種估計方法中,都涉及了核k(.)及帶寬的選擇,本文中的核k(.)都選用經(jīng)常用到的高斯和。由于作者知識水平有限,故在此不作更詳細的介紹。Part.3瑞利概率密度分布函數(shù)在電信用戶預測中的運用
9、瑞利概率密度分布函數(shù)的表達式如下取0x可作出瑞利概率密度分布函數(shù)的曲線如圖所示分析圖可以看到 瑞利概率密度分布函數(shù)和人均收入有極其相似的地方。這種相似性表現(xiàn)在:人群中收入中等程度的人占總?cè)藬?shù)的大部分, 而低收入人群和高收入人群占總?cè)藬?shù)的比例為少數(shù)。以圖為例收入為5000元的人數(shù)比例大約為1.21875x10-4,即為0.0121875%而收入為10000元的人參數(shù)作為門限值也利于進一步的分析工作。數(shù)比例略低于0.00563%。 對瑞利概率密度分布函數(shù)進行積分(0x)結(jié)果為1,表示瑞利概率密度分布函數(shù)若用于表示人群的收入情況,則函數(shù)囊括所有收入的人群。由于人群收入服從瑞利概率密度分布函數(shù),因此從
10、人均收入出發(fā),可以利用瑞利概率密分布函數(shù)來預測潛在用戶的數(shù)量。其基本原理是:通信交流是人們的基本需求當人們的收入達到一定水,有能力支付通信費用時,這些人就成為電信運營商的潛在用戶,通過宣傳、廣告等手段就可能將這些潛在用戶群發(fā)展成為實際用戶。 現(xiàn)在的問題是如何確定人群進入通信網(wǎng)絡(luò)的(門檻)即收入在多少以上的人才擁有能力支付通信費用成為潛在的用戶群。收入可以是月收入或年收入,為了與統(tǒng)計資料保持一致,通常情況下取年收入。市場調(diào)查結(jié)果發(fā)現(xiàn),家庭消費支出中通信費用占5%15%被認為是可以接受的。從通信運營商的角度出發(fā),各運營商也有一個可以接受的最低每用戶平均收入(ARPU)值,只有所有用戶的平均通信消費
11、支出高于期待的最低ARPU值,投入的資金才能在規(guī)定的時間內(nèi)收回,否則將使資金積壓投資回報率低下??梢园哑谕哪闍RPU值作為門限值。假設(shè)年ARPU值為a對瑞利函數(shù)進行積分:表達式中a為門限值,定義為家庭年平均消費性支出。則對瑞利函數(shù)進行積分的意義可以解釋為:在家庭年平均消費性支出為的情況下,有能力每年支付a元以上作為通信費用的人占總?cè)藬?shù)的比例,該比例也即是潛在用戶的比例,或稱之為“滲透率”。分析目前的各種通信業(yè)務(wù),除業(yè)務(wù)內(nèi)容的區(qū)別外,對用戶來講,另外一個重要的區(qū)別在于通信費用的區(qū)別。不同類型的業(yè)務(wù)其一次性投入和每月的支出是不一樣的。通過設(shè)定不同的門限值就可以實現(xiàn)對不同類型業(yè)務(wù)潛在用戶比例的預測。因此,瑞利概率密度分布函數(shù)可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 借款投資合作合同范本
- 公司廠房抵押合同范本
- ktv經(jīng)營合同范本
- 與商戶合同范本
- 親戚之間租車合同范本
- 勞動合同范本 日語
- 2024年重慶市榮昌區(qū)人民醫(yī)院招聘筆試真題
- 中國監(jiān)理合同范本
- 中山餐飲合同范本
- 2024年河源市紫金縣藍塘鎮(zhèn)招聘考試真題
- 合肥市城市大腦·數(shù)字底座白皮書2020
- 杭州灣跨海大橋項目案例ppt課件
- (完整版)光榮榜25張模板
- 機電預留預埋工程施工組織設(shè)計方案
- 工業(yè)催化劑作用原理—金屬氧化物催化劑
- 2022年三八婦女節(jié)婦女權(quán)益保障法律知識競賽題庫及答案(共290題)
- 優(yōu)秀教材推薦意見(真實的專家意見)
- Of studies原文譯文及賞析
- 安全閥基本知識講義
- QTD01鋼質(zhì)焊接氣瓶檢驗工藝指導書
- 辛棄疾生平簡介(課堂PPT)
評論
0/150
提交評論