概率統(tǒng)計中的隨機現(xiàn)象與數(shù)學理論_第1頁
概率統(tǒng)計中的隨機現(xiàn)象與數(shù)學理論_第2頁
概率統(tǒng)計中的隨機現(xiàn)象與數(shù)學理論_第3頁
概率統(tǒng)計中的隨機現(xiàn)象與數(shù)學理論_第4頁
概率統(tǒng)計中的隨機現(xiàn)象與數(shù)學理論_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

概率統(tǒng)計中的隨機現(xiàn)象與數(shù)學理論

1概率的發(fā)展過程概率統(tǒng)計是研究隨機現(xiàn)象數(shù)量規(guī)律的數(shù)學學科,包括隨機現(xiàn)象的數(shù)學理論,以及如何有效收集、分類和分析相關(guān)數(shù)據(jù),從而對驗證問題作出結(jié)論和預測。隨著計算機技術(shù)等高技術(shù)的迅速發(fā)展,各種高性能數(shù)據(jù)的收集設備和手段不斷更新,使人們可以針對許多復雜事物和現(xiàn)象直接獲得形式多樣的海量復雜數(shù)據(jù)。這也使得“數(shù)據(jù)驅(qū)動”式的科學研究成為時代的潮流,即直接利用海量復雜數(shù)據(jù),研究傳統(tǒng)方法和手段失效的復雜事物和現(xiàn)象,發(fā)現(xiàn)隱藏其中的復雜結(jié)構(gòu)和科學規(guī)律。值得指出的是,一方面這些形式多樣的海量復雜數(shù)據(jù)之間存在著很高的相依性和聚集性,使其整體呈現(xiàn)出與隨機性數(shù)據(jù)類似的性質(zhì);另一方面,由于各種未知的不可控因素對復雜事物和現(xiàn)象以及相關(guān)的數(shù)據(jù)收集設備的影響,使得絕大多數(shù)的海量復雜數(shù)據(jù)本身就是隨機性數(shù)據(jù)。因此,對海量復雜數(shù)據(jù)進行“數(shù)據(jù)驅(qū)動”式科學研究,離不開概率統(tǒng)計的理論與方法。概率統(tǒng)計中的概率論主要研究和發(fā)展關(guān)于隨機現(xiàn)象的數(shù)學理論,其主要目的是揭示蘊藏在隨機現(xiàn)象中的結(jié)構(gòu)和規(guī)律,同時也為統(tǒng)計理論與方法提供理論基礎(chǔ)。與大部分數(shù)學分支的起源不同,概率論起源于對賭博問題的研究。概率論的創(chuàng)始人分別是16世紀末的意大利數(shù)學家卡丹諾(G.Cardano)和17世紀的法國數(shù)學家帕斯卡(B.Pascal)、費馬(P.Fermat)以及瑞士數(shù)學家雅各-伯努利(J.Bernoulli)。人們逐漸發(fā)現(xiàn),許多領(lǐng)域都存在與賭博中出現(xiàn)的輸贏現(xiàn)象相似的重要隨機現(xiàn)象,概率論也就被應用到更多領(lǐng)域中,從而極大擴展了其應用范圍。19世紀末,波爾茨曼(L.Boltzmann)和吉布斯(J.W.Gibbs)建立的統(tǒng)計力學,運用大量隨機運動的粒子解釋了氣體的性質(zhì),成為用概率論解釋自然現(xiàn)象的一個巨大成功。20世紀初,受統(tǒng)計力學研究的刺激,人們開始研究隨時間變化的隨機現(xiàn)象,形成了有廣泛應用的隨機過程理論。1900年龐加萊的學生巴夏里埃(L.Bachelier)首先研究了“投機理論”,并建立了布朗運動的模型,其后愛因斯坦以及控制論創(chuàng)始人維納(N.Wiener)分別建立了布朗運動的物理模型與數(shù)學模型。1906年俄羅斯數(shù)學家馬爾可夫(A.Markov)提出了馬爾可夫鏈的概念。1933年蘇聯(lián)數(shù)學家柯爾莫哥洛夫為概率論奠定了嚴密的數(shù)學基礎(chǔ),給出了概率空間的公理化定義。這是概率論發(fā)展史上的一個重要里程碑,為概率論的迅速發(fā)展鋪平了道路。柯爾莫格羅夫也因包括這一工作在內(nèi)的一系列杰出貢獻于1980年獲得沃爾夫數(shù)學獎。1939年法國數(shù)學家溫勒(J.Ville)提出了鞅的概念。1942年日本數(shù)家伊藤清開創(chuàng)了隨機分析。概率論不僅在后來的發(fā)展中越來顯示出它在眾多領(lǐng)域的應用性和實用性,而且對很多基本應用問題的研究也推動了概率論的迅速發(fā)展。例如,2006年菲爾茲獎得主奧克恩科夫(A.Okounkov)的獲獎工作解決了與弦物理學有關(guān)的一個重要數(shù)學問題。在此過程中,他建立了概率論、表示論和代數(shù)幾何之間的橋梁。該工作不僅揭示了概率論與數(shù)學中多個表面上不相關(guān)分支之間的深刻聯(lián)系,而且也為弦物理學中一些重要問題的解決提供了新的思想。同年另一個菲爾茲獎得主陶哲軒(T.Tao)的獲獎工作解決了一個長期懸而未決的著名數(shù)論難題。在此過程中,他利用了概率論的思想和動力系統(tǒng)的多重遍歷理論。同時,他的工作也刺激了概率論學者進一步研究馬爾可夫過程的多重遍歷理論。利用動力系統(tǒng)理論和偏微分方程理論,維拉尼(C.Villani)解決了流體力學中的朗道阻尼和非平衡統(tǒng)計力學中波爾茲曼方程的長時間行為這兩個難題,并因此獲2010年菲爾茲獎。他的研究大量借鑒了概率論中泛函不等式和最優(yōu)輸運理論的思想和方法。概率論和社會經(jīng)濟相互促進發(fā)展的經(jīng)典范例之一,就是資產(chǎn)定價與風險度量理論的建立與廣泛應用。資產(chǎn)定價與風險度量問題是經(jīng)濟金融領(lǐng)域長期以來受到普遍關(guān)注的重大問題,1971年以前的近百年一直未得到很好的解決。1972年布萊克(F.Black)和斯科爾斯(M.Scholes)利用隨機微分方程來描述資產(chǎn)價格的變動,并基于此給出了資產(chǎn)定價與風險度量的內(nèi)在形成機制,提出了著名的Black-Schole公式,創(chuàng)造性地解決了資產(chǎn)定價和風險度量問題,極大地促進了現(xiàn)代金融業(yè)的發(fā)展壯大。斯科爾斯因此獲得了1997年的諾貝爾經(jīng)濟學獎。同時,由于資產(chǎn)定價與風險度量理論使用伊藤清建立的隨機積分理論,伊藤清被稱為“華爾街最有名的日本人”,他因此獲得了1987年的沃爾夫數(shù)學獎及2006年國際數(shù)學家大會新設的高斯獎。另外,資產(chǎn)定價與風險度量理論的深入研究也推動了概率論的進一步發(fā)展。例如,山東大學彭實戈院士因發(fā)展了用于刻畫動態(tài)風險度量的非線性數(shù)學期望及相應的隨機分析理論,應邀在2010年國際數(shù)學家大會做大會報告,成為首位獲此殊榮的國內(nèi)數(shù)學家。概率論和工程技術(shù)等領(lǐng)域也相互促進發(fā)展,例如自動化領(lǐng)域著名的卡爾曼濾波器設計的理論基礎(chǔ)之一就是隨機過程理論,而濾波理論也推動了馬爾可夫過程理論中布萊克威爾(A.Blackwell)猜測和庫尼塔(H.Kunita)問題的提出與研究。信息技術(shù)領(lǐng)域的復雜網(wǎng)絡理論與概率論極為密切?;ヂ?lián)網(wǎng)、無線通訊網(wǎng)以及物聯(lián)網(wǎng)甚至包括基因調(diào)控網(wǎng)和蛋白質(zhì)相互作用網(wǎng)等大規(guī)模網(wǎng)絡及其上的信息與物質(zhì)流動,都是不斷發(fā)生變化的且在整體上呈現(xiàn)出于與隨機變動類似的行為。因此,建立相應的隨機過程模型并利用概率方法進行分析,并基于此開展復雜網(wǎng)絡工程的設計成為研究網(wǎng)絡最好的模式。從上述事實可以看出,概率論進一步與數(shù)學其他分支、自然科學、工程技術(shù)以及社會經(jīng)濟等領(lǐng)域相互促進發(fā)展仍是其主要發(fā)展趨勢。特別是,隨著這些領(lǐng)域“數(shù)據(jù)驅(qū)動”式的科學研究成為時代的潮流,將越來越需要概率論為這類研究提供理論基礎(chǔ),其研究重點集中在與海量復雜數(shù)據(jù)處理與分析有關(guān)的概率問題上。概率統(tǒng)計中的統(tǒng)計學主要研究和發(fā)展有效地收集、整理和分析相關(guān)數(shù)據(jù)的理論與方法,并對所考察問題做出推斷或預測,其理論基礎(chǔ)是概率論。它的主要目的是提取和挖掘隱藏于數(shù)據(jù)背后的結(jié)構(gòu)和科學規(guī)律,并對相關(guān)的過去或未來進行推斷。因此,統(tǒng)計學需要關(guān)注推斷方法和所得結(jié)論與實際的吻合程度。近代統(tǒng)計學的產(chǎn)生和發(fā)展與生物學研究密切相關(guān)。英國遺傳學家高爾頓(F.Galton)受達爾文進化論的影響,從1860年開始首先研究甜豆的遺傳,他發(fā)現(xiàn),甜豆子代直徑的平均會趨向于全部甜豆直徑的平均。這不僅很好地解釋了經(jīng)歷繁衍甜豆的總體不發(fā)生變化的原因,而且也成了線性回歸方法研究的起源。他在1884年的倫敦世博會上建立了測量站,測量了數(shù)千人的人體數(shù)據(jù),并于1886年發(fā)表的文章中給出了一張相當于正態(tài)相關(guān)曲面的表,用來比較父母雙方平均身高與子女身高的關(guān)系。在他的促使下,迪克遜(H.Dickson)對這些數(shù)據(jù)開展了最早的相關(guān)性研究。高爾頓因此被公認為生物計量學的奠基人。接著,卡爾·皮爾遜(K.Pearson)以討論正態(tài)曲線和相關(guān)性為起點,定義了標準差、直方圖、眾數(shù)和相關(guān)系數(shù)等統(tǒng)計學的基本概念。他還提出了卡方檢驗的方法,用來檢驗觀測數(shù)據(jù)與正態(tài)曲線吻合的程度。20世紀20年代,卡爾·皮爾遜的兒子埃貢·皮爾遜(EgonPearson)和紐曼(J.Neyman)合作,利用概率論建立了一般假設檢驗的數(shù)學理論,使得人們可以利用觀測數(shù)據(jù)來判斷它們是否服從某種科學規(guī)律。這極大地改變了統(tǒng)計學的面貌,使統(tǒng)計學完成了從描述統(tǒng)計到統(tǒng)計推斷的革命性轉(zhuǎn)變。從歷史上看,統(tǒng)計學中很多的開創(chuàng)性工作都是從研究非常具體的實際問題開始的。例如,英國統(tǒng)計學家戈塞特(W.Gosset)開創(chuàng)的小樣本統(tǒng)計理論,就始于他對釀酒中使用的麥子質(zhì)量的研究。另外,費歇爾開創(chuàng)性地提出的試驗設計之隨機化原則,就始于他對農(nóng)業(yè)試驗的研究。試驗設計隨機化原則后來的應用具有十分重要的影響。到了現(xiàn)代,隨著人們研究的事物和現(xiàn)象越來越復雜,要求也越來越精細,描述數(shù)據(jù)內(nèi)在規(guī)律的概率統(tǒng)計模型也越來越復雜。事實上,參數(shù)估計已發(fā)展為半?yún)?shù)與非參數(shù)估計,模型已由線性擴展到非線性,數(shù)據(jù)也由獨立改變?yōu)橄嘁?。這方面一個很好的例子就是,資產(chǎn)定價與風險度量中Black-Schole公式里刻畫價格風險因子的識別問題。然而,解決這一問題就需要對價格變動過程中積累的大量的條件異方差的與相依的復雜數(shù)據(jù)之間的相互關(guān)系進行識別與分析。由于處理這個問題需要的統(tǒng)計學理論與方法超出了當時統(tǒng)計學的范圍,致使10年間未有進展。直到1982年恩格爾(R.Engle)創(chuàng)造性地提出了統(tǒng)計學中時間序列分析的新模型——ARCH模型,才成功地解決了資產(chǎn)定價與風險度量中風險因子的識別與估計問題,他因此獲2003年諾貝爾經(jīng)濟學獎。另外,近些年來一個值得注意的事實是,自然科學、社會經(jīng)濟和工程技術(shù)領(lǐng)域獲得的數(shù)據(jù)在規(guī)模和類型上都發(fā)生了巨大變化,統(tǒng)計學面臨著與以往完全不同的新問題。例如,歐洲核子研究中心(CERN)的大型強子對撞機(LHC)平均每天產(chǎn)生數(shù)據(jù)約4萬億個字節(jié)。同時,美國國家生物技術(shù)和信息中心(NCBI)的基因庫早已收錄了1億多條記錄,1千多億個堿基。由于人們?nèi)狈@類海量復雜數(shù)據(jù)背后復雜現(xiàn)象的理解而不具備提出合理科學假設的能力,所以,在面對這類海量復雜數(shù)據(jù)時,人們無法事先假設隱藏其中的科學規(guī)律。這就需要人們開展“數(shù)據(jù)驅(qū)動”式研究,即從這類海量復雜數(shù)據(jù)中直接發(fā)現(xiàn)新的結(jié)構(gòu)和科學規(guī)律,而不是先對隱藏在這類海量復雜數(shù)據(jù)中的結(jié)構(gòu)和科學規(guī)律提出合理假設,然后再利用這類數(shù)據(jù)進行假設檢驗。這種情況未曾有過,其對統(tǒng)計學的已有理論與方法提出了嚴峻的挑戰(zhàn)。2研究方向和方向在中國科學期刊內(nèi)自從柯爾莫哥洛夫為概率論奠定了嚴密數(shù)學基礎(chǔ)后,不但其理論迅速發(fā)展,而且研究方向也快速增加。一些方向繼續(xù)為統(tǒng)計學提供所需的理論基礎(chǔ),另一些則大量使用數(shù)學其他分支的思想方法,側(cè)重于直接研究許多領(lǐng)域中可轉(zhuǎn)化為隨機結(jié)構(gòu)的問題,形成了現(xiàn)代概率論豐富多彩的研究局面。2.2隨機環(huán)境模型的研究自從1906年馬爾可夫提出馬爾可夫鏈的概念起,歷經(jīng)柯爾莫哥洛夫、萊維等一大批概率學者的努力,到60年代已形成比較完備的馬爾可夫過程理論體系。馬爾可夫過程的特征是它的“無后效性”,即已知現(xiàn)在的狀態(tài)則未來與歷史無關(guān)。所有具有短記憶特征的變化過程都可用馬爾可夫過程來描述。因此,它是隨機過程中研究最多的與應用最廣的過程類之一。馬爾可夫過程理論主要的研究方法是,利用其生成元或轉(zhuǎn)移概率來研究它們的概率性質(zhì)。由于馬爾可夫過程理論的研究內(nèi)容極其豐富,這里僅著重介紹幾個方面。馬爾可夫過程遍歷性研究,目前重點集中在具有重要實際背景而且研究難度較大的不可逆馬爾可夫過程上,特別是對一些不可逆典型過程的譜空隙進行研究和估計。例如,某些不可逆排隊論模型的遍歷性問題,特別是M/PH/1,PH/M/1等模型在位相無限時的一般遍歷性、指數(shù)遍歷性和強遍歷性;多物種模型的過程存在性、唯一性和相應的遍歷理論等。馬爾可夫過程的衰減性與泛函不等式研究,其包括兩方面:(1)借鑒其遍歷性研究的豐富成果,建立衰減性的一套比較完整的理論,這也包括一些相應的泛函不等式;(2)研究具有非線性和非對稱性的隨機偏微分方程的泛函不等式、運費不等式和最優(yōu)傳輸不等式;某些條件下生滅過程或一般Q過程的泛函不等式、修正LogSoblev不等式和相應的顯式判別準則;以及粒子之間相互排斥的連續(xù)型氣體模型的泛函不等式,比如修正的LogSoblev不等式和協(xié)方差估計等。粒子系統(tǒng)與測度值過程及其遍歷性研究,包括:(1)利用擬正則狄氏型理論構(gòu)造一般Polish空間上的粒子系統(tǒng),并構(gòu)造合理的測度值過程使其關(guān)于相對熵指數(shù)收斂到Poisson-Dirichlet分布;研究隨機流產(chǎn)生的超過程以及包括相關(guān)的Konno-Shiga方程在內(nèi)的一類隨機偏微分方程解的軌道唯一性;(2)研究stepping-stone模型的遍歷行為,包括其泛函不等式和可逆性;研究有選擇的FV超過程的遍歷性和有移民分支過程的遍歷性和可逆性,以及選擇和重組模型與非平衡動力模型的極限行為;研究測度值過程和分支過程的大偏差等極限性質(zhì);利用Stein方法和耦合方法等,研究測度值過程和分支過程的極限和收斂性的上界估計。隨機環(huán)境模型的研究,目前有兩個方面:(1)研究具有隨機移民的超布朗運動在Quenched概率下的中心極限定理和大偏差等性質(zhì),以及大偏差理論在通訊、排隊論中的應用;(2)研究隨機環(huán)境中隨機游動的一些挑戰(zhàn)性的基本問題,例如,在二維情形以及環(huán)境平穩(wěn)、遍歷、一致橢圓、混合時隨機游動沿某方向運動的0-1率。目前,關(guān)于隨機環(huán)境中的隨機游動的研究在概率界是很活躍的。馬爾可夫骨架過程研究,其是馬爾可夫過程的一種重要推廣,仍借鑒馬爾可夫過程的思想與方法。它的研究分兩個方面:(1)包括了排隊論中各種排隊過程模型在內(nèi)的大量混雜隨機模型的馬爾可夫骨架過程的研究。這類馬爾可夫骨架過程由我國中南大學的侯振挺教授和合作者于1997年引入,目前的研究集中于該理論在金融保險和排隊理論中的應用。(2)大規(guī)模網(wǎng)絡上Web馬爾可夫骨架過程的理論及其應用的研究。Web馬爾可夫骨架過程是馬志明院士和合作者于2009年從萬維網(wǎng)搜索引擎設計的研究中提煉出來的一類新的重要隨機過程,囊括了離散時間馬氏鏈、Q-過程、更新過程等經(jīng)典隨機過程以及一類新的重要隨機過程——鏡面半馬氏過程。它概括了萬維網(wǎng)中信息的輸入、傳輸和使用的基本特征,可用來描述互聯(lián)網(wǎng)上用戶的瀏覽過程,計算機病毒在互聯(lián)網(wǎng)中的傳播過程,以及計算機黑客對計算機網(wǎng)站進攻的演化過程等。除此之外,這類過程也可以用來描述寬帶無線移動通信網(wǎng)絡、傳感器網(wǎng)絡、物聯(lián)網(wǎng)和生物分子網(wǎng)絡等大規(guī)模網(wǎng)絡中信息的輸入、傳輸和使用過程,以及這些網(wǎng)絡上故障的傳播與擴散過程等。目前的研究相對集中在豐富和發(fā)展大規(guī)模網(wǎng)絡上Web馬爾可夫骨架過程的理論與方法,解決若干大規(guī)模網(wǎng)絡上搜索引擎設計、熱點信息挖掘以及故障的傳播與擴散現(xiàn)象等問題。上述的兩類馬爾可夫骨架過程互不包含,既有重疊又有區(qū)別。2.3基于動態(tài)期望理論基礎(chǔ)的隨機分析非線性數(shù)學期望的理論研究可追溯到上世紀50年代。1954年,法國數(shù)學家邵蓋(G.Choquet)提出了容度概念,并利用容度定義了一種現(xiàn)在被稱為Choquet-積分的非線性積分,它定義的期望就是一種非線性數(shù)學期望。這一理論目前在金融和經(jīng)濟學中得到廣泛應用。70年代以來,這一理論被推廣為非可加測度和非線性數(shù)學期望理論。特別是近10多年,非可加測度和非線性積分理論的研究取得了一系列成果。1997年,山東大學彭實戈院士給出了定義非線性數(shù)學期望的新思路,即通過倒向隨機微分方程引入了非線性數(shù)學期望——G-期望與相應的條件G-期望的概念,在一定范圍內(nèi)建立了動態(tài)非線性數(shù)學期望理論的基礎(chǔ)。近些年發(fā)現(xiàn),G-期望是研究遞歸效用理論與金融風險度量的有力工具。G-期望保持了經(jīng)典數(shù)學期望除線性性質(zhì)之外的所有基本性質(zhì)。但G-期望的研究仍然是基于給定概率空間的,并且關(guān)于維納測度由G-期望確定的概率族是絕對連續(xù)的。換言之,G-期望的研究沒有脫離概率空間。鑒于此,2005年彭實戈又提出了一般的非概率框架下由馬爾可夫鏈所產(chǎn)生的非線性數(shù)學期望理論。接著,他在2006年提出了G-正態(tài)分布和G-期望的概念。關(guān)于維納測度由G-期望確定的概率族一般并不絕對連續(xù),但仍具有動態(tài)相容性。在這一框架下,他定義了G-期望下的G-布朗運動,建立了G-布朗運動的隨機積分,得到了相應的Ito-公式。這一概念受到數(shù)學家和金融學家的廣泛關(guān)注,可用它來研究證劵的收益率和波動率在不確定情形下金融風險的度量問題和隨機波動問題。在理論方面,它是柯爾莫哥洛夫概率公理體系的推廣。最近,彭實戈還證明了大數(shù)定律和中心極限定律,并給出了這些定律令人滿意的金融解釋。關(guān)于非線性數(shù)學期望及相應的隨機分析研究目前相對集中在:進一步加強倒向隨機微分方程理論的研究;研究G-風險度量與其他風險度量之間的關(guān)系,為金融業(yè)選擇合適的風險度量工具提供理論依據(jù);開展倒向重隨機控制系統(tǒng)的理論研究,以及各類反射倒向重隨機微分方程及相關(guān)的隨機偏微分方程理論研究,進一步刻畫重隨機干擾下隨機控制問題,包括最大值原理及動態(tài)規(guī)劃原理的研究;利用隨機分析的核心工具研究倒向隨機系統(tǒng)的濾波理論,進一步開展部分信息下隨機控制問題的研究,包括部分信息下隨機遞歸和隨機控制問題的最大值原理以及線性二次控制問題等。另外,G-期望是一個新興的研究方向,還處在初創(chuàng)階段,還有許多基礎(chǔ)理論問題尚未解決,需要進一步發(fā)展和完善G-期望下的隨機分析理論。2.4隨機復雜網(wǎng)絡的應用應用概率研究的內(nèi)涵和外延,一直隨著歷史和概率理論應用的發(fā)展而在不斷地變化和發(fā)展。下面將集中介紹近期受到概率界廣泛關(guān)注的幾方面研究,即隨機矩陣、隨機復雜網(wǎng)絡、滲流模型(PercolationTheory)和保險數(shù)學理論。隨機矩陣研究始于1928年維希特(J.Wishart)關(guān)于多元統(tǒng)計分析的工作。上世紀30年代,中國數(shù)學家許寶騄在多元統(tǒng)計分析研究中獲得了許多重要結(jié)果,對隨機矩陣理論發(fā)展做出了重要貢獻。50年代,受到核物理和量子力學研究的重大推動,隨機矩陣理論在數(shù)學和理論物理兩個領(lǐng)域中都獲得了迅速發(fā)展。隨機矩陣理論關(guān)注的核心問題是,刻畫滿足某種對稱性條件的高維隨機矩陣如下相關(guān)量的漸近分布,它們是:特征值和特征向量、最大特征值、特征值之間的間隙等。特別是它們的普適性問題,即不同類型的隨機矩陣模型的特征值和特征向量是否具有某種共同的漸近分布。1952年,物理學家維格納證明了高斯型厄米隨機矩陣模型(GaussianUnitaryModel)的特征譜測度弱收斂到半圓周律。隨后,又有一些其他類型隨機矩陣模型的特征譜和最大特征值的漸近分布被確定。非常有趣的是,蒙哥馬利(H.Montgomery)關(guān)于黎曼-ζ函數(shù)非平凡零點對分布規(guī)律的關(guān)聯(lián)猜想,被物理學家和隨機矩陣專家弗里曼·戴森(FreemanDyson)指出,其密度函數(shù)正好是高斯型厄米隨機矩陣模型特征值對的關(guān)聯(lián)密度函數(shù)。后來,奧德里茲科(A.M.Odlyzko)做了大量的數(shù)值計算,經(jīng)過適當?shù)臍w一化后,驗證了黎曼-ζ函數(shù)非平凡零點的間距分布與高斯型厄米隨機矩陣模型特征值間距分布確實相同。這為蒙哥馬利所猜測的零點分布與隨機矩陣理論間的聯(lián)系提供了大量的數(shù)值證據(jù),其被稱為蒙哥馬利-奧德里茲科定律(Montgomery-OdlyzkoLaw)。該定律說明,黎曼-ζ函數(shù)非平凡零點與一個典型隨機矩陣的特征值相對應。這與希爾伯特-波利亞猜測(Hilbert-Polyaconjecture)很相似。這一猜想預言,黎曼-ζ函數(shù)非平凡零點與某個厄米算符(Hermitianoperator)的特征值相對應。這促使一些學者利用隨機矩陣理論去研究著名的黎曼-ζ函數(shù)猜測。隨機矩陣理論目前的研究包括:隨機多項式、隨機全純函數(shù)及全純截面的零點分布,隨機矩陣與典型域上的積分理論,酉群上的Harish-Chandra-Itzkson-Zuber積分,以及隨機矩陣與曲線??臻g上的相交理論等。隨機復雜網(wǎng)絡理論始于1998年沃茲(D.J.Watts)和斯道格茲(S.H.Strogatz)在《自然》的一篇文章,在文章中引入了一個“小世界”網(wǎng)絡模型,用于描寫人際關(guān)系網(wǎng)絡。1999年,鮑勞巴希(A-L.Barabasi)和艾伯特(R.Albert)在《科學》上又發(fā)表了一篇文章,引入了無標度網(wǎng)絡的模型,用于刻畫互聯(lián)網(wǎng)和科學家之間合作關(guān)系的網(wǎng)絡。隨后,隨機復雜網(wǎng)絡研究便成為熱點。許多領(lǐng)域中都發(fā)現(xiàn)了這種網(wǎng)絡結(jié)構(gòu),比如基因調(diào)控網(wǎng)就是無標度網(wǎng)絡等。這些大規(guī)模網(wǎng)絡是不斷地發(fā)生變化的,且從對它們的統(tǒng)計研究結(jié)果來看,它們整體上呈現(xiàn)出類似于隨機變動的行為。因此,可以選擇某個典型網(wǎng)絡的隨機模型來研究它們。隨機復雜網(wǎng)絡研究目前集中在3個方面:(1)利用現(xiàn)代概率論思想與方法研究小世界網(wǎng)絡、無標度隨機網(wǎng)絡和演化網(wǎng)絡等隨機復雜網(wǎng)絡的構(gòu)造及特征性質(zhì);尋求新的方法來研究小世界網(wǎng)絡、無標度隨機網(wǎng)絡和演化網(wǎng)絡等隨機復雜網(wǎng)絡若干重要特征刻畫的解析表達式,探索構(gòu)造演化網(wǎng)絡的新機制,建立更符合現(xiàn)實世界的網(wǎng)絡模型。(2)構(gòu)建群體遺傳中新的隨機復雜網(wǎng)絡模型及其統(tǒng)計推斷方法,并應用于同物種內(nèi)不同亞種生物進化歷史研究;利用隨機復雜網(wǎng)絡的概率特征,研究不同類型生物基因組和蛋白質(zhì)組的差異和功能預測;利用隨機復雜網(wǎng)絡方法研究基因動態(tài)調(diào)控模型、非編碼區(qū)的遺傳功能及其與編碼基因的關(guān)系;利用隨機復雜網(wǎng)絡的形成機制與結(jié)構(gòu)穩(wěn)定性,構(gòu)建干細胞等重要生物體的演化模型并研究它們的生物功能特征。(3)考察計算機病毒在互聯(lián)網(wǎng)或郵件網(wǎng)絡中的傳播與計算機黑客對計算機網(wǎng)站進攻的演化過程,SARS、禽流感和艾滋病等惡性傳染病在人群構(gòu)成的復雜網(wǎng)絡中的傳播,以及信用風險與非法資金在金融機構(gòu)形成的復雜網(wǎng)絡中的傳播和擴散等;建立描述復雜網(wǎng)絡中隨機過程的數(shù)學模型并研究其基本性質(zhì),要求其涵蓋上述現(xiàn)實網(wǎng)絡中重點關(guān)注信息的傳播和擴散現(xiàn)象。滲流模型具有十分明確的應用背景,用于描述地下巖層中石油流動的不規(guī)則通道,在如何轟炸和封鎖跑道等軍事問題的研究中也有應用。在理論上,滲流模型展示“相變”現(xiàn)象?!跋嘧儭笔墙y(tǒng)計物理中的一個重要概念,它是指當某些參數(shù)連續(xù)變化時,系統(tǒng)驟然間發(fā)生了巨大變化,表現(xiàn)為某個宏觀觀察量的不連續(xù)性。在滲流模型中這個參數(shù)就是每條邊為“開通”的概率p。當p很小時,開通的邊所連接而成的連通分支(opencluster)是有限的;而當p上升且超過臨界值時,該連通分支包含了無窮多個頂點。滲流模型主要研究臨界值和連通分支的大小以及一系列相關(guān)量的估計。自上世紀90年代以來,滲流模型的研究范圍被大大擴展。人們發(fā)現(xiàn)滲流模型在許多其他學科的應用,可由此挖掘出更加精細且豐富的性質(zhì)。滲流模型的研究,相對集中在兩方面:(1)研究與驗證隨機勞威納演化有關(guān)的滲流模型的精準的估計。滲流模型中與隨機勞威納演化緊密相關(guān),例如,三角形格點上滲流模型的標度極限已被證明是隨機勞威納演化。目前人們還只能對幾個特殊模型驗證隨機勞威納演化理論成立。驗證隨機勞威納演化通常需要4個步驟,其中一步就是要建立非常精準的估計,而這需要對滲流模型有深刻的認識。(2)研究滲流模型中無窮連通分支上的隨機游動以及其他隨機過程。無窮連通分支雖然很不規(guī)則,人們卻相信,它與原圖具有相同或相近的性質(zhì),其上的隨機過程也應該具有相同或相近的性質(zhì)。例如,三維歐氏格點上無窮連通分支的隨機游動是非常返的,隨機游動的熱核估計也與普通歐氏格點上隨機游動具有相同的形式,以及不變原理依然成立。換言之,經(jīng)過適當?shù)臉硕茸兓?無窮連通分支上的隨機游動非常接近布朗運動。如果把隨機運動替換為其他隨機過程,如無窮粒子系統(tǒng),則許多問題有待研究,例如不變分布的存在唯一性,其他分布收斂到不變分布的速度等。保險數(shù)學理論是保險公司對其風險進行定量分析和預測并根據(jù)這些結(jié)果管理與控制風險的一般理論。它的主要研究內(nèi)容包括,保險模型的建立、破產(chǎn)理論、分紅理論、風險分析以及決策與風險控制等。破產(chǎn)理論是經(jīng)典保險理論的核心內(nèi)容。瑞典精算師林德伯格(F.Lundberg)1903年的博士論文是破產(chǎn)理論研究的源頭。利用隨機過程理論,1955年瑞典概率論學家克萊默(H.Cramer)建立了林德伯格破產(chǎn)理論的嚴格數(shù)學基礎(chǔ)。后來,利用隨機過程與分析理論,破產(chǎn)理論得到突飛猛進的發(fā)展。通俗地講,在忽略投資回報、利率和通貨膨脹等金融因素影響的前提下,破產(chǎn)理論從理賠的角度研究了破產(chǎn)風險對保險公司償付能力的影響。它主要研究保險公司所關(guān)心的如下幾個精算量:破產(chǎn)概率、破產(chǎn)時、破產(chǎn)前余額以及破產(chǎn)赤字等。然而,隨著金融保險業(yè)的空前發(fā)展和金融業(yè)一體化進程的加快,保險公司面臨著如何動態(tài)地采取更為有效的方式,來規(guī)避風險以達到自身效益的最大化。因此,破產(chǎn)理論中原有的幾個靜態(tài)保險精算量的刻畫,已經(jīng)不再能滿足保險公司的需求。保險公司需要進行風險決策與控制。事實上,許多金融保險公司所面臨的風險決策與控制問題,均可轉(zhuǎn)化為相應的隨機控制問題。離散時間的隨機控制理論稱為馬爾可夫決策理論,主要研究受控制馬爾可夫鏈的優(yōu)化問題。連續(xù)時間的隨機控制理論,主要利用馬爾可夫過程控制理論和粘性解理論進行研究。保險數(shù)學理論目前的研究包括,多維風險模型的研究,博弈論應用于再保險市場的研究,以及對投資連結(jié)保險中最優(yōu)控制問題的研究等。2.5自正則化極限定理概率論中的極限理論從概率論誕生起就一直是一個重要研究方向。它直接為統(tǒng)計學中的大樣本理論和統(tǒng)計推斷理論等提供理論支撐,許多研究內(nèi)容來自于統(tǒng)計學的需求。因此,研究內(nèi)容很豐富,我們僅介紹較熟悉的兩個方面。斯坦(C.Stein)方法和自正則化極限理論。利用正態(tài)分布的分部積分公式,斯坦于1972年精確估計了不同概率逼近的差異。特別地,他估計了獨立隨機變量和與正態(tài)分布的差異,得到了著名的中心極限定理以及一致與非一致的Berry-Essen界。斯坦方法是一種精確估計各種概率逼近的有力工具,無論對獨立與相依隨機變量列還是正態(tài)逼近與非正態(tài)逼近都適用。同時,利用斯坦方法可以研究概率逼近的絕對誤差和相對誤差。自正則化方法則是用隨機變量列部分和的經(jīng)驗方差取代理論方差,來正則化隨機變量列的部分和。自正則化極限定理的主要優(yōu)點是,不像經(jīng)典的極限定理,對隨機變量矩條件的假設無要求或要求很弱。將斯坦方法和自正則化方法結(jié)合,可以獲得許多假設條件很弱的概率逼近的絕對誤差和相對誤差估計。很多時候,斯坦方法、自正則化方法再結(jié)合正態(tài)隨機變量的小概率估計方法,可以解決組合學和離散數(shù)學等領(lǐng)域中難度很大的問題。目前,這一方面相對集中的研究,是對來自于海量復雜數(shù)據(jù)統(tǒng)計理論的問題的研究,以及隨機組合概率模型和統(tǒng)計力學模型標度極限理論中的相關(guān)問題的研究。例如,隨機配置中最優(yōu)配置方差的精確漸近界與中心極限定理,歐氏空間上極小生成樹和最短路徑的統(tǒng)計量概率極限性質(zhì),不同概率測度下隨機劃分的漸近性質(zhì),隨機劃分和隨機矩陣之間內(nèi)在聯(lián)系的刻畫,以及隨機劃分所生成的點過程及其極限點過程和極限過程分布性質(zhì)的刻畫等。大偏差理論。大偏差理論的研究,可以追溯到20世紀30年代初關(guān)于隨機變量尾概率的精確漸近性的研究。在克萊默、薩諾夫(I.N.Sanov)和斯萊德(M.Schilder)等人工作的基礎(chǔ)上,瓦拉德汗(S.R.SVaradhan)于1966年提出了大偏差原理的現(xiàn)代定義。70—80年代,唐斯克(M.D.Donsker)和瓦拉德汗為了認識薛定諤算子第一本征值的變分公式與大偏差的關(guān)系,建立了馬爾可夫過程大時間漸近行為的大偏差原理。為了研究狄利克雷邊值問題基本解的小時間漸近性質(zhì),瓦拉德汗建立了擴散過程的小時間大偏差原理。馬爾可夫過程的大偏差理論已被廣泛應用于許多相關(guān)問題,例如:維納Sausage問題、極問題與流體力學極限等。馬爾可夫過程的大偏差理論還被推廣到平穩(wěn)過程、動力系統(tǒng)、吉布斯測度等。對一些隨機環(huán)境中隨機游動和擴散過程、隨機矩陣以及無窮交互粒子系統(tǒng)模型也建立了大偏差和中偏差原理。70年代,為了研究動力系統(tǒng)的隨機擾動問題,在斯萊德的工作基礎(chǔ)上,弗瑞德林(M.I.Freidlin)和溫茨爾(A.D.Wentzell)系統(tǒng)地發(fā)展了隨機擾動的大偏差理論。這方面的結(jié)果已經(jīng)成為研究動力系統(tǒng)隨機擾動穩(wěn)定性、排隊網(wǎng)絡等相關(guān)問題的一個強有力工具。20世紀末和本世紀初,為了研究隨機過程的軌道大偏差,隨機過程大偏差的弱收斂方法已被提出,并對一些隨機偏微分方程建立了Freidlin-Wentzell型的大偏差估計。目前,大偏差理論相對集中于研究來自海量復雜數(shù)據(jù)統(tǒng)計理論中相關(guān)精確估計的問題,以及統(tǒng)計力學模型標度極限研究中相關(guān)精確漸近估計問題等。3統(tǒng)計學方法的主要內(nèi)容和方法分為感知類研究和統(tǒng)計特性研究,描述對數(shù)據(jù)的研究統(tǒng)計學在埃貢·皮爾遜和紐曼建立了一般假設檢驗的數(shù)學理論后迅速發(fā)展,逐步突破了經(jīng)典理論的標準假設。例如,處理的數(shù)據(jù)由數(shù)值向多維向量甚至無窮維向量和各種集合值發(fā)展,以及由靜態(tài)數(shù)據(jù)向時間序列數(shù)據(jù)發(fā)展,如時空數(shù)據(jù)、函數(shù)型數(shù)據(jù)、多尺度數(shù)據(jù)、縱向數(shù)據(jù)、區(qū)間數(shù)據(jù)、圖像數(shù)據(jù)和文本數(shù)據(jù)等;估計的類型由點估計向半?yún)?shù)估計和非參數(shù)估計發(fā)展;數(shù)據(jù)與殘差的性質(zhì)由獨立性與正態(tài)性向各種相依性和非正態(tài)性發(fā)展,以及由簡單性向各種復雜性發(fā)展;數(shù)據(jù)的規(guī)模由適當規(guī)模向小子樣和海量發(fā)展;數(shù)據(jù)的完整性由完全數(shù)據(jù)向各種非完全數(shù)據(jù)發(fā)展;以及模型假設由線性假設向非線性假設甚至無模型假設發(fā)展等。從歷史角度看,統(tǒng)計學理論和方法的研究熱點,與自然科學、工程技術(shù)和社會經(jīng)濟等領(lǐng)域的熱點需求是一致的,而且統(tǒng)計學的研究重點是統(tǒng)計方法,而統(tǒng)計理論對一般統(tǒng)計方法起支撐作用。這與數(shù)學的其他分支有所不同。所以,在此僅介紹現(xiàn)代統(tǒng)計學的主要方法,而且選擇我們比較了解的主要方法加以介紹。3.1大維隨機矩陣的譜分析由于當代計算技術(shù)的迅速發(fā)展,可以搜集、存儲和處理海量的高維數(shù)據(jù),而且數(shù)據(jù)的維數(shù)可以隨著樣本量的增加而迅速增加。這類數(shù)據(jù)被稱為大維數(shù)據(jù)。通俗地講,對大維數(shù)數(shù)據(jù),數(shù)據(jù)的維數(shù)上界與樣本量之比趨于無窮。這與經(jīng)典統(tǒng)計的假設完全不同,也使許多經(jīng)典的統(tǒng)計方法失效。在這種情況下,大維隨機矩陣的譜分析理論成為目前唯一可用于大維數(shù)據(jù)分析的極限理論。通過發(fā)展大維隨機矩陣的譜分析理論,并將其用于大維數(shù)據(jù)的樣本協(xié)方差陣分析,人們發(fā)現(xiàn),像均值與協(xié)方差陣的似然比檢驗都需要修正。不僅如此,實際中樣本量永遠不會是無窮,人們還需要發(fā)展對數(shù)據(jù)大維性的判別方法。通過大維隨機矩陣的譜分析理論,人們可找到適當?shù)慕y(tǒng)計方法來完成此事。為了擴展大維數(shù)據(jù)分析的應用范圍,就需要逐步放寬對樣本協(xié)方差陣的限制條件,這導致一些已有的大維隨機矩陣的譜分析理論不適用于這樣的大維數(shù)據(jù)分析。因此,需要進一步發(fā)展相應的大維隨機矩陣的譜分析理論。下面的問題需要重點進行研究,即樣本協(xié)方差陣的弱Haar猜測,以及Tracy-Widom律和特征根間隙極限的普適性。3.2降維技術(shù)在傳統(tǒng)統(tǒng)計方法中的應用目前,幾乎各個科學與工程技術(shù)領(lǐng)域都普遍存在如下的數(shù)據(jù),即表面上數(shù)據(jù)量很大,但由于對可以唯一確定所考察對象狀態(tài)的適當特征數(shù)目幾乎一無所知,而只知道幾乎所有可能來確定該考察對象狀態(tài)的特征;然而,這些幾乎所有可能的特征數(shù)目巨大,平均到每個特征的樣本量很少,從而導致經(jīng)典的統(tǒng)計方法失效。通俗地,這種類型的數(shù)據(jù)被稱為大規(guī)模數(shù)據(jù)。為分析這樣的數(shù)據(jù),人們需要發(fā)展統(tǒng)計方法,去估計可唯一確定所考察對象狀態(tài)的適當特征數(shù)目以及可包含所給數(shù)據(jù)的適當空間,使得可對這些數(shù)據(jù)進行可靠的統(tǒng)計分析。粗略講,用來達到上述目標的統(tǒng)計方法被稱為降維技術(shù),可包含所給數(shù)據(jù)的適當空間被稱為中心降維子空間,其維數(shù)被稱為結(jié)構(gòu)維數(shù)。人們已提出有效的統(tǒng)計方法,處理相關(guān)問題,如,識別中心降維子空間的切片逆回歸方法,估計結(jié)構(gòu)維數(shù)的貝葉斯(T.Bayes)信息型準則等。目前,需要進一步研究的問題很多。例如,當數(shù)據(jù)的表觀維數(shù)相對于樣本量非常大甚至大于樣本數(shù)時,如何進行降維。3.3回歸模型測試變系數(shù)模型是近年來受到重視的高維數(shù)據(jù)回歸分析的一個新的建模技術(shù),是線性模型的推廣。其特點是,模型的回歸系數(shù)是某些因子的函數(shù)。這一模型既保留了參數(shù)模型容易解釋的優(yōu)點,又保留了非參數(shù)回歸模型的靈活性與穩(wěn)健性,還可以減少建模偏差和避免維數(shù)禍根。另外,它還包含了可加模型、部分線性模型、單指標系數(shù)回歸模型以及自適應變系數(shù)線性模型等。已有成果包括了獨立數(shù)據(jù)和縱向數(shù)據(jù),并對回歸系數(shù)估計使用了許多有效的非參數(shù)估計方法。值得研究的問題是,發(fā)展一些復雜數(shù)據(jù)下變系數(shù)模型和半?yún)?shù)變系數(shù)模型的統(tǒng)計方法。3.4縱向數(shù)據(jù)的統(tǒng)計分析對一系列不同的個體在不同時間點上重復觀察獲得的數(shù)據(jù)稱為縱向數(shù)據(jù)或面板數(shù)據(jù)??v向數(shù)據(jù)在生物醫(yī)學、臨床實驗和社會經(jīng)濟等領(lǐng)域大量出現(xiàn),需要對其進行統(tǒng)計分析。分析縱向數(shù)據(jù)的目的在于:針對單一個體獲得其隨時間變化的規(guī)律;研究個體間的差異;確定關(guān)注變量與其他變量的關(guān)系。若把縱向數(shù)據(jù)按個體順序排成列,再按時間順序排成矩陣,則它是列相關(guān)且行獨立的隨機矩陣。因此,不同于一般的時間序列數(shù)據(jù),需要專門的統(tǒng)計分析方法。根據(jù)上述特點知,縱向數(shù)據(jù)的內(nèi)部相關(guān)性,一個來自于個體間的差異,一個來自于單一個體的不同時間的差異。前一個用回歸系數(shù)的隨機性來刻畫,后一個用測量誤差來反映。根據(jù)不同要求,可用很多方法對縱向數(shù)據(jù)進行建模和推斷。從縱向數(shù)據(jù)出現(xiàn)的領(lǐng)域及要達到的目的看,所建模型要對數(shù)據(jù)的分布律有一定的穩(wěn)定性。因此,要求所建模型的推斷具有穩(wěn)健性。目前,已有一些建模方法符合上述要求。進一步研究的問題有,不完全縱向數(shù)據(jù)的分析以及縱向數(shù)據(jù)模型的模型選擇。3.5測量誤差模型在對經(jīng)濟學、流行病學、化學與工程等領(lǐng)域的許多數(shù)據(jù)進行分析時,常出現(xiàn)以下情況,理論或經(jīng)驗知識告訴人們,可以用回歸方法進行分析,但結(jié)果總不能令人滿意。出現(xiàn)上述情況的一個較大的可能性是,獲得的數(shù)據(jù)帶有一定的誤差,未能較真實地反映所考察對象的信息。這就是所謂的帶測量誤差的數(shù)據(jù),對其所建的模型就稱為測量誤差模型。對測量誤差的幾種較簡單類型,雖然問題具有難度,但仍給出了有效的統(tǒng)計方法去處理它們。目前,所研究的測量誤差的類型在不斷變復雜,值得深入研究。特別是,當測量誤差是非線性復雜數(shù)據(jù)時,對它的各種統(tǒng)計推斷方法和穩(wěn)健統(tǒng)計方法的研究是很值得深入研究的。3.6缺失機制當多維數(shù)據(jù)的部分分量因某種原因無法完全獲得時,這類數(shù)據(jù)稱為缺失數(shù)據(jù),其在醫(yī)學和社會經(jīng)濟等領(lǐng)域普遍出現(xiàn)。由于刪除這些無法完全獲得的數(shù)據(jù)會造成信息損失,人們需要根據(jù)不同的缺失機制來研究此問題。通??紤]如下3種缺失機制:(1)完全隨機缺失(MCAR)機制,指的是,數(shù)據(jù)缺失不依賴其他任何變量;(2)隨機缺失(MAR)機制,指的是,數(shù)據(jù)缺失僅依賴被觀察到的部分而不依賴可能缺失的部分。這種情況在現(xiàn)實中更常見。最后是,不可忽略缺失或非隨機機制,指的是,數(shù)據(jù)缺失依賴可能缺失的部分。一般,人們考慮隨機缺失機制,可以根據(jù)情況采用似然方法、插補方法、逆概率加權(quán)法以及經(jīng)驗似然方法等來分析。3.7復發(fā)事件數(shù)據(jù)的研究復發(fā)事件數(shù)據(jù)是指,對一些個體進行觀察時,一些令人感興趣的事件重復發(fā)生的時間組成的數(shù)據(jù)。這類數(shù)據(jù)經(jīng)常出現(xiàn)在生物和社會經(jīng)濟等領(lǐng)域。由于這類數(shù)據(jù)有次序和相依性,同時由于刪失了很多時間且這些刪失的時間可能與該事件發(fā)生的時間具有相依性,使得復發(fā)事件數(shù)據(jù)的分析、建模和統(tǒng)計推斷變得困難。然而,復發(fā)事件數(shù)據(jù)既具有重要特點又有廣泛應用,對它的研究受到高度重視。近十幾年來,隨著生物和醫(yī)學統(tǒng)計的進步,復發(fā)事件數(shù)據(jù)的研究已取得快速發(fā)展。這些研究,主要根據(jù)對時間間隔的假設以及事件發(fā)生的時間與刪失時間相依程度由簡單到復雜的順序開展。3.8試驗設計的隨機化原則尋找事物之間因果關(guān)系,幾乎是所有科學研究的最重要目的之一。這是因為,當作為原因的事件發(fā)生時,利用因果關(guān)系我們可以斷言或預測作為結(jié)果的事件必然發(fā)生。然而,當事件之間僅知道存在相關(guān)和關(guān)聯(lián)關(guān)系時,人們不好做出上述的斷言或預測。根據(jù)費歇爾提出的試驗設計的隨機化原則我們知道,只要可以控制試驗使其完全隨機化,人們?nèi)钥梢岳迷囼灚@得的數(shù)據(jù)推斷事件之間的因果關(guān)系。事實上,由于很多原因人們無法使試驗完全隨機化,只能獲得觀測的數(shù)據(jù)。對這類觀測數(shù)據(jù)尋找統(tǒng)計方法,努力對事件之間的因果關(guān)系作出推斷,就是因果推斷。統(tǒng)計推斷的目的是研究變量之間的相關(guān)和關(guān)聯(lián)關(guān)系,而因果推斷則是研究變量之間的因果機制。關(guān)于因果推斷的模型主要有3個:(1)潛在結(jié)果模型,通過引入潛在變量推斷因果關(guān)系;(2)因果網(wǎng)絡模型,利用有向非循環(huán)圖來描述因果關(guān)系;(3)格蘭杰(C.W.Granger)因果模型,利用對兩個事件觀察獲得的時間序列數(shù)據(jù)之間的預測關(guān)系,來推斷這兩個事件之間的因果關(guān)系。除了因果模型的研究,還需要深入研究現(xiàn)實中出現(xiàn)的替代指標問題和混雜因素的判斷問題。3.9基于定價和風險度量理論的事件序列模型一般根據(jù)時間順序獲得的數(shù)據(jù)稱為時間序列數(shù)據(jù),對它的統(tǒng)計分析就是時間序列分析。勿用置疑,時間序列數(shù)據(jù)遍布各個領(lǐng)域,它是人們經(jīng)常遇到的數(shù)據(jù),長期以來在金融領(lǐng)域尤其受關(guān)注。受資產(chǎn)定價和風險度量理論的影響和推動,各種自回歸條件異方差時間序列模型被提出,并被廣泛研究。原因是,這類模型可以用來揭示和估計蘊藏在金融資產(chǎn)價格過程中的風險變動情況。這其中比較著名和常用的是ARCH模型和GARCH模型。事實上,在很合理的經(jīng)濟假設下,可以從理論上證明,資產(chǎn)的價格序列符合GARCH模型。對這類事件序列的理論研究需要運用現(xiàn)代馬爾科夫過程理論和遍歷理論。另外,海量復雜的金融資產(chǎn)價格序列在不同時間尺度上表現(xiàn)出不同的高頻震蕩特征,也向這類數(shù)據(jù)的時間序列分析與建模提出了挑戰(zhàn),需要發(fā)展新的時間序列模型去研究分析它。3.10靠性推定的理論與方法在實際中,有許多產(chǎn)品不可能通過大量的試驗來驗證其可靠性,只能進行很少的試驗。如何從這些少量的試驗數(shù)據(jù)來推斷該產(chǎn)品的可靠性?研究這一問題的統(tǒng)計理論與方法就是小子樣數(shù)據(jù)可靠性推斷的理論與方法。這一理論與方法的基本思想是:所考察的產(chǎn)品一般有許多部件,這些部件和它們之間的相互關(guān)系形成了一個網(wǎng)絡,通過分析每個部件生產(chǎn)過程中積累的歷史數(shù)據(jù),或?qū)σ恍╆P(guān)鍵部件進行適量的試驗,就可獲得各個部件的可靠程度與壽命分布。然后,利用概率統(tǒng)計知識和部件的網(wǎng)絡關(guān)系圖,就可以得到該產(chǎn)品的可靠程度與壽命分布。最后,結(jié)合這些少量的試驗數(shù)據(jù)就可以對該產(chǎn)品的可靠性做出推斷。在部件的網(wǎng)絡關(guān)系圖不太復雜時,上述思想行之有效,但當比較復雜且部件數(shù)量巨大時,如何實施上述思想需要在理論和方法上進一步研究。4國內(nèi)概率統(tǒng)計教學科研隊伍已經(jīng)形成我國現(xiàn)代概率統(tǒng)計的教學科研始于許寶録1940年底從英國回到西南聯(lián)大執(zhí)教。在1956年制定的《全國科學發(fā)展十二年遠景規(guī)劃》中把概率統(tǒng)計列為數(shù)學的3個重點發(fā)展方向之一。隨后,許寶録在上級和同行專家大力支持下,招收來自全國的進修教師和學生在北京大學集中開班,延聘外國知名學者來華講學,開設現(xiàn)代概率統(tǒng)計課程,組織概率統(tǒng)計教材建設和學術(shù)討論班,帶領(lǐng)青年教師和學生開展概率統(tǒng)計研究。目前,一支活躍在教學科研一線的高質(zhì)量的概率統(tǒng)計教學科研隊伍已經(jīng)形成。當選為中科院院士的概率統(tǒng)計學者有6位,獲國家基金委創(chuàng)新群體資助的概率統(tǒng)計研究團隊有3個,獲國家基金委杰出青年資助的概率統(tǒng)計學者有17位。還有4個概率統(tǒng)計的省部級重點實驗室,4人次擔任科技部“973”項目首席科學家。中國的概率統(tǒng)計研究處于國際學術(shù)前沿,部分研究工作處于國際領(lǐng)先地位。然而,無論是從國際概率統(tǒng)計的發(fā)展趨勢還是從我國建設創(chuàng)新型國家的需求來看,我國的概率統(tǒng)計研究還有很大的提升空間,鑒于概率統(tǒng)計在數(shù)學領(lǐng)域的特殊地位及其重大的應用價值,建議國家有關(guān)部門應著手籌建概率統(tǒng)計國家重點實驗室,以更有效地組織隊伍為我國的概率統(tǒng)計學科的崛起奠基,為我國經(jīng)濟社會發(fā)展做出更大貢獻。2.1隨機偏微分方程的研究20世紀40年代,從美國數(shù)學家杜布系統(tǒng)地研究一般的鞅以及日本數(shù)學家伊藤清引入隨機積分概念開始,經(jīng)過幾代學者的努力形成了現(xiàn)代概率論的隨機分析研究方向。隨機分析借鑒數(shù)學中分析學的思想方法研究隨機過程的局部結(jié)構(gòu)和整體特征,被稱為是“具有隨機趣味的分析學”。隨機分析主要包括一般半鞅理論、隨機微分方程、隨機偏微分方程、馬列奧萬(P.Malliavin)分析與隨機微分幾何以及狄氏型理論等。其在數(shù)學其他分支、力學、物理、化學、生物與醫(yī)學、經(jīng)濟金融、管理科學以及工程技術(shù)等領(lǐng)域有廣泛應用。一般半鞅理論研究,目前集中在3個方面:(1)利用半鞅理論中擴大過程信息流的方法,研究含有信用風險等道德風險的資產(chǎn)定價與風險度量問題;(2)依據(jù)行為金融學中的情景理論,重新研究資產(chǎn)定價和風險度量問題;(3)對長記憶與強關(guān)聯(lián)的隨機過程類,包括可描述復雜網(wǎng)絡上信息傳輸過程的分數(shù)維布朗運動等,發(fā)展它們的隨機積分理論。隨機微分方程研究,目前集中在兩個方面:(1)在系數(shù)僅滿足某種非李普希茨條件時,研究隨機微分方程解的基本性質(zhì),以及利用隨機分析方法,研究系數(shù)僅具有弱正則性時常微分方程解的基本性質(zhì);(2)動力系統(tǒng)與不確定環(huán)境耦合后動力學行為變化特征的研究。這其中包括了隨機動力系統(tǒng)以及目前最受國際數(shù)學界關(guān)注的隨機勞威納演化(StochasticLoewnerEvolution,SLE)研究。我們稍后介紹隨機勞威納演化情況。值得特別強調(diào)的是研究如下情況的重要性。目前,我們可以大量獲得關(guān)于宇宙深處天體的海量復雜數(shù)據(jù),然而,對該天體周圍環(huán)境的物理力學狀況幾乎一無所知,僅根據(jù)宇宙學知道在不與環(huán)境耦合時它的動力系統(tǒng)描述方式。事實上,類似情況在自然科學領(lǐng)域廣泛存在。這與以往動力系統(tǒng)研究的狀況完全不同,需要結(jié)合獲得的海量復雜數(shù)據(jù),借鑒隨機分析、動力系統(tǒng)和統(tǒng)計學的思想方法,發(fā)展適合的理論與方法,研究這些動力系統(tǒng)與不確定環(huán)境耦合后動力學行為的變化特征。隨機偏微分方程的研究,目前相對集中在這樣的方程,它們是力學、物理以及工程技術(shù)等領(lǐng)域的重要偏微分方程,但帶有隨機驅(qū)動噪聲。(1)研究這類方程解的存在唯一性以及遍歷性等基本性質(zhì)。這其中具有挑戰(zhàn)性的是隨機噪聲退化的情況,目前僅有不多的研究成果,需要發(fā)展新的隨機分析理論;(2)研究與這些方程有關(guān)的控制問題,其中一些問題具有很強的挑戰(zhàn)性。比如,處于隨機復雜環(huán)境中的傳感器網(wǎng)絡與智能機械等柔性和彈性系統(tǒng)都是典型的無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論