概率論與數(shù)理統(tǒng)計(jì)統(tǒng)計(jì)規(guī)律_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)統(tǒng)計(jì)規(guī)律_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)統(tǒng)計(jì)規(guī)律_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)統(tǒng)計(jì)規(guī)律_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)統(tǒng)計(jì)規(guī)律_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

概率論與數(shù)理統(tǒng)計(jì)統(tǒng)計(jì)規(guī)律匯報(bào)人:AA2024-01-20BIGDATAEMPOWERSTOCREATEANEWERA目錄CONTENTS概率論基本概念隨機(jī)變量及其分布數(shù)理統(tǒng)計(jì)基本概念統(tǒng)計(jì)推斷方法方差分析與回歸分析應(yīng)用時(shí)間序列分析與預(yù)測(cè)方法BIGDATAEMPOWERSTOCREATEANEWERA01概率論基本概念樣本空間與事件事件必然事件樣本空間的子集,即某些可能結(jié)果的集合。包含樣本空間中所有樣本點(diǎn)的事件。樣本空間基本事件不可能事件所有可能結(jié)果的集合,常用大寫字母S表示。只包含一個(gè)樣本點(diǎn)的事件。不包含任何樣本點(diǎn)的事件。概率定義及性質(zhì)概率定義在相同條件下,某一事件A可能出現(xiàn)也可能不出現(xiàn),當(dāng)試驗(yàn)次數(shù)充分大后,事件A出現(xiàn)的頻率穩(wěn)定于某個(gè)常數(shù)p,則稱p為事件A的概率。概率性質(zhì)非負(fù)性、規(guī)范性(必然事件的概率為1)、可加性(互斥事件的概率和)。VS在事件B發(fā)生的條件下,事件A發(fā)生的概率,記作P(A|B)。事件的獨(dú)立性如果事件A的發(fā)生與否對(duì)事件B發(fā)生的概率沒(méi)有影響,則稱事件A與B相互獨(dú)立。條件概率條件概率與獨(dú)立性如果事件B1、B2、...、Bn構(gòu)成一個(gè)完備事件組,且都有正概率,則對(duì)任一事件A,有P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...+P(A|Bn)P(Bn)。全概率公式在全概率公式的假定下,有P(Bi|A)=[P(A|Bi)P(Bi)]/P(A),其中i=1,2,...,n。貝葉斯公式用于在已知某些條件下,求解另一相關(guān)事件的概率。貝葉斯公式全概率公式與貝葉斯公式BIGDATAEMPOWERSTOCREATEANEWERA02隨機(jī)變量及其分布定義隨機(jī)變量是定義在樣本空間上的實(shí)值函數(shù),它將樣本空間中的每一個(gè)樣本點(diǎn)映射到一個(gè)實(shí)數(shù)。分類隨機(jī)變量可分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。離散型隨機(jī)變量的取值是有限個(gè)或可列個(gè),而連續(xù)型隨機(jī)變量的取值則充滿某個(gè)區(qū)間。隨機(jī)變量定義及分類離散型隨機(jī)變量分布律離散型隨機(jī)變量的分布律描述了隨機(jī)變量取各個(gè)值的概率。對(duì)于離散型隨機(jī)變量X,其分布律可以用概率函數(shù)P(X=x)來(lái)表示,其中x為隨機(jī)變量X的所有可能取值。分布律定義常見(jiàn)的離散型隨機(jī)變量分布包括二項(xiàng)分布、泊松分布、幾何分布等。這些分布各自具有不同的特點(diǎn)和適用場(chǎng)景。常見(jiàn)離散型隨機(jī)變量分布概率密度函數(shù)定義連續(xù)型隨機(jī)變量的概率密度函數(shù)是一個(gè)描述隨機(jī)變量取值概率的連續(xù)函數(shù)。對(duì)于連續(xù)型隨機(jī)變量X,其概率密度函數(shù)f(x)滿足:對(duì)于任意實(shí)數(shù)a和b(a<b),P(a<X≤b)=∫abf(x)dx,表示X落在區(qū)間(a,b]內(nèi)的概率。常見(jiàn)連續(xù)型隨機(jī)變量分布常見(jiàn)的連續(xù)型隨機(jī)變量分布包括正態(tài)分布、均勻分布、指數(shù)分布等。這些分布各自具有不同的概率密度函數(shù)和特性。連續(xù)型隨機(jī)變量概率密度函數(shù)隨機(jī)變量函數(shù)的定義設(shè)X是一個(gè)隨機(jī)變量,g(x)是一個(gè)實(shí)值函數(shù),則Y=g(X)也是一個(gè)隨機(jī)變量,稱為X的函數(shù)。要點(diǎn)一要點(diǎn)二隨機(jī)變量函數(shù)的分布求法求隨機(jī)變量函數(shù)的分布通常需要先確定原隨機(jī)變量的分布類型,然后根據(jù)函數(shù)關(guān)系進(jìn)行變換,得到新的分布類型及參數(shù)。常見(jiàn)的求法包括公式法、分布函數(shù)法、卷積公式等。隨機(jī)變量函數(shù)分布BIGDATAEMPOWERSTOCREATEANEWERA03數(shù)理統(tǒng)計(jì)基本概念研究對(duì)象的全體個(gè)體組成的集合,通常用一個(gè)隨機(jī)變量及其分布來(lái)描述。總體從總體中隨機(jī)抽取的一部分個(gè)體組成的集合,用于推斷總體的性質(zhì)。樣本樣本中包含的個(gè)體數(shù)目,通常用n表示。樣本容量總體與樣本統(tǒng)計(jì)量樣本的函數(shù),用于描述樣本的特征,如樣本均值、樣本方差等。統(tǒng)計(jì)量的性質(zhì)包括無(wú)偏性、有效性和一致性等,用于評(píng)價(jià)統(tǒng)計(jì)量的優(yōu)劣。統(tǒng)計(jì)量及其性質(zhì)當(dāng)樣本容量足夠大時(shí),樣本均值趨近于總體均值。大數(shù)定律當(dāng)樣本容量足夠大時(shí),樣本均值的分布近似于正態(tài)分布,無(wú)論總體分布是什么。中心極限定理用于描述樣本均值與總體均值的差異程度,尤其在樣本容量較小且總體標(biāo)準(zhǔn)差未知時(shí)。t分布抽樣分布定理用樣本統(tǒng)計(jì)量的某個(gè)值來(lái)估計(jì)總體參數(shù)的方法,如最大似然估計(jì)、最小二乘估計(jì)等。根據(jù)樣本統(tǒng)計(jì)量的分布性質(zhì),構(gòu)造一個(gè)包含總體參數(shù)的置信區(qū)間,并給出該區(qū)間的置信水平。常見(jiàn)的區(qū)間估計(jì)方法有樞軸量法、Bootstrap方法等。點(diǎn)估計(jì)區(qū)間估計(jì)參數(shù)估計(jì)方法BIGDATAEMPOWERSTOCREATEANEWERA04統(tǒng)計(jì)推斷方法作出決策根據(jù)檢驗(yàn)統(tǒng)計(jì)量的值和拒絕域,作出是否拒絕原假設(shè)的決策。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值根據(jù)樣本數(shù)據(jù),計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值。確定拒絕域根據(jù)顯著性水平$alpha$和檢驗(yàn)統(tǒng)計(jì)量的分布,確定拒絕域。建立假設(shè)根據(jù)實(shí)際問(wèn)題,提出原假設(shè)$H_0$和備擇假設(shè)$H_1$。選擇檢驗(yàn)統(tǒng)計(jì)量根據(jù)假設(shè)和樣本數(shù)據(jù),選擇合適的檢驗(yàn)統(tǒng)計(jì)量。假設(shè)檢驗(yàn)原理及步驟當(dāng)總體服從正態(tài)分布$N(mu,sigma^2)$,其中$sigma^2$已知時(shí),可以使用$Z$檢驗(yàn)對(duì)總體均值$mu$進(jìn)行假設(shè)檢驗(yàn);當(dāng)$sigma^2$未知時(shí),可以使用$t$檢驗(yàn)。單個(gè)正態(tài)總體均值假設(shè)檢驗(yàn)當(dāng)總體服從正態(tài)分布$N(mu,sigma^2)$,其中$mu$已知時(shí),可以使用$chi^2$檢驗(yàn)對(duì)總體方差$sigma^2$進(jìn)行假設(shè)檢驗(yàn)。單個(gè)正態(tài)總體方差假設(shè)檢驗(yàn)單個(gè)正態(tài)總體均值和方差假設(shè)檢驗(yàn)兩個(gè)正態(tài)總體均值比較假設(shè)檢驗(yàn)當(dāng)兩個(gè)總體分別服從正態(tài)分布$N(mu_1,sigma_1^2)$和$N(mu_2,sigma_2^2)$,其中$sigma_1^2$和$sigma_2^2$已知時(shí),可以使用$Z$檢驗(yàn)對(duì)兩個(gè)總體均值$mu_1$和$mu_2$進(jìn)行比較假設(shè)檢驗(yàn);當(dāng)$sigma_1^2$和$sigma_2^2$未知但相等時(shí),可以使用$t$檢驗(yàn);當(dāng)$sigma_1^2$和$sigma_2^2$未知且不相等時(shí),可以使用近似$t$檢驗(yàn)或威爾科克森秩和檢驗(yàn)。兩個(gè)正態(tài)總體方差比較假設(shè)檢驗(yàn)當(dāng)兩個(gè)總體分別服從正態(tài)分布$N(mu_1,sigma_1^2)$和$N(mu_2,sigma_2^2)$,其中$mu_1$和$mu_2$已知時(shí),可以使用$F$檢驗(yàn)對(duì)兩個(gè)總體方差$sigma_1^2$和$sigma_2^2$進(jìn)行比較假設(shè)檢驗(yàn)。兩個(gè)正態(tài)總體均值和方差比較假設(shè)檢驗(yàn)符號(hào)檢驗(yàn)用于檢驗(yàn)兩個(gè)配對(duì)樣本的中位數(shù)之差是否為零。威爾科克森符號(hào)秩檢驗(yàn)用于檢驗(yàn)兩個(gè)配對(duì)樣本的分布是否存在差異。曼-惠特尼$U$檢驗(yàn)用于檢驗(yàn)兩個(gè)獨(dú)立樣本的分布是否存在差異。克魯斯卡爾-瓦利斯檢驗(yàn)用于檢驗(yàn)多個(gè)獨(dú)立樣本的分布是否存在差異。非參數(shù)假設(shè)檢驗(yàn)方法BIGDATAEMPOWERSTOCREATEANEWERA05方差分析與回歸分析應(yīng)用單因素方差分析原理及應(yīng)用舉例原理通過(guò)比較不同水平下樣本均值的差異,推斷總體均值是否存在顯著差異。應(yīng)用舉例研究不同品種小麥的產(chǎn)量是否有顯著差異。VS同時(shí)考慮兩個(gè)因素對(duì)試驗(yàn)結(jié)果的影響,通過(guò)比較不同水平組合下樣本均值的差異,推斷兩個(gè)因素對(duì)總體均值的影響是否顯著。應(yīng)用舉例研究不同品種小麥在不同施肥條件下的產(chǎn)量是否有顯著差異。原理雙因素方差分析原理及應(yīng)用舉例通過(guò)最小二乘法確定回歸系數(shù),建立一元線性回歸方程。模型建立利用F檢驗(yàn)、t檢驗(yàn)等方法對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),判斷自變量對(duì)因變量的影響是否顯著。模型檢驗(yàn)一元線性回歸模型建立與檢驗(yàn)?zāi)P徒⑼ㄟ^(guò)最小二乘法確定回歸系數(shù),建立多元線性回歸方程。模型檢驗(yàn)利用F檢驗(yàn)、t檢驗(yàn)等方法對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),判斷多個(gè)自變量對(duì)因變量的影響是否顯著。同時(shí),還需要進(jìn)行多重共線性診斷、異方差性檢驗(yàn)等,以確保模型的穩(wěn)定性和可靠性。多元線性回歸模型建立與檢驗(yàn)BIGDATAEMPOWERSTOCREATEANEWERA06時(shí)間序列分析與預(yù)測(cè)方法時(shí)間序列概念及特點(diǎn)按時(shí)間順序排列的一組數(shù)據(jù),反映現(xiàn)象隨時(shí)間變化的發(fā)展過(guò)程。時(shí)間序列定義動(dòng)態(tài)性、連續(xù)性、周期性、隨機(jī)性。時(shí)間序列特點(diǎn)圖形法通過(guò)觀察時(shí)間序列的折線圖、自相關(guān)圖等圖形,判斷其是否具有平穩(wěn)性。統(tǒng)計(jì)檢驗(yàn)法運(yùn)用統(tǒng)計(jì)量對(duì)時(shí)間序列進(jìn)行假設(shè)檢驗(yàn),如AD

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論