




已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多元統(tǒng)計(jì)分析簡(jiǎn)介,多元統(tǒng)計(jì)分析:通過對(duì)多個(gè)隨機(jī)變量觀測(cè)數(shù)據(jù)的分析,來研究變量之間的相互關(guān)系以及解釋這些變量?jī)?nèi)在的變化規(guī)律。,一元統(tǒng)計(jì)分析一個(gè)隨機(jī)變量的 統(tǒng)計(jì)規(guī)律 多元統(tǒng)計(jì)分析多個(gè)隨機(jī)變量之間的 相互依賴關(guān)系及內(nèi)在統(tǒng)計(jì)規(guī)律性,多元統(tǒng)計(jì)分析應(yīng)用: 經(jīng)濟(jì)學(xué)、工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)、教育學(xué)、生態(tài)學(xué)、地質(zhì)學(xué)、社會(huì)學(xué)、考古學(xué)、環(huán)境學(xué)、氣象、文學(xué)等許多領(lǐng)域,多元統(tǒng)計(jì)分析主要內(nèi)容: 1、多元正態(tài)總體的參數(shù)估計(jì)和假設(shè)檢驗(yàn) 2、常用的處理多元數(shù)據(jù)的統(tǒng)計(jì)方法: 1)聚類分析 2)判別分析 3)主成分分析 4)因子分析 5)多重多元回歸分析等等,第一章 多元統(tǒng)計(jì)中的基本概念,第一節(jié) 基本概念 第二節(jié) 多元正態(tài)分布 第三節(jié) 多元統(tǒng)計(jì)中的常用分布,第一節(jié) 基本概念,1.隨機(jī)向量 Def1:將p個(gè)隨機(jī)變量 的整體稱為p維隨機(jī)向量,記作 。,分布函數(shù),離散型:分布律 連續(xù)型:密度函數(shù),分布密度函數(shù),滿足,分布密度函數(shù)應(yīng)滿足的兩個(gè)條件?,Def2:設(shè) 是p維隨機(jī)向量,稱由它的q(qp)個(gè)分量組成的子向量 的分布為 的邊緣分布,相對(duì)的把 的分布稱為聯(lián)合分布。,邊緣分布函數(shù)和邊緣分布密度可由聯(lián)合分布和聯(lián)合密度確定。,Def3:若p個(gè)隨機(jī)變量 的聯(lián)合分布等于各自的邊緣分布的乘積,則稱 是相互獨(dú)立的。,2.隨機(jī)向量的數(shù)字特征,(1)數(shù)學(xué)期望,其中,,均值向量具有如下性質(zhì):,(2)協(xié)方差矩陣 設(shè) 稱,為X的協(xié)差陣。,若X的協(xié)差陣存在,且每個(gè)分量的方差大于0,則稱隨機(jī)變量X的相關(guān)陣為 ,其中 為相關(guān)系數(shù)。,設(shè)標(biāo)準(zhǔn)離差陣為 則有,稱X和Y的協(xié)差陣為:,協(xié)差陣具有如下性質(zhì):(試證之),多元分析的任務(wù)分析各變量之間的關(guān)系,推斷總體的性質(zhì),為一維隨機(jī)變量 為多維隨機(jī)變量 (隨機(jī)向量),3.多元總體 多元分析研究具有多個(gè)(如p個(gè))屬性(指標(biāo))的對(duì)象組成的總體-多元總體。 從總體中任意抽出一個(gè)對(duì)象(總體單元),其p個(gè)屬性的值為,多元總體多維隨機(jī)變量(隨機(jī)向量)可能取值的全體。,觀測(cè)矩陣(隨機(jī)) (樣本資料陣),4.多元樣本的相關(guān)概念,從多元總體中隨機(jī)抽取n個(gè)個(gè)體。,i.i.d. 簡(jiǎn)單隨機(jī)樣本,多元分析的 研究對(duì)象,(1) 樣本平均值,樣本平均值是n個(gè) 樣本點(diǎn)的重心,(2) 樣本離差陣,樣本均值和樣本離差陣的矩陣表示:,(3) 樣本協(xié)差陣,(4) 樣本相關(guān)陣,-樣本相關(guān)系數(shù),非負(fù)定矩陣,第二節(jié) 多元正態(tài)分布,1. 多元正態(tài)分布,若隨機(jī)向量 的分布密度函數(shù)為,則稱 服從p維正態(tài)分布。記作: 其數(shù)學(xué)期望與協(xié)方差矩陣分別為:,其中,為對(duì)稱正定矩陣,,特例1(一元正態(tài)分布),則,特例2 (二元正態(tài)分布),設(shè),則,2. 多元正態(tài)分布的常用性質(zhì),分布?,第三節(jié) 多元統(tǒng)計(jì)中的常用分布,在一元統(tǒng)計(jì)中,卡方分布、t分布和F分布在參數(shù)估計(jì)和假設(shè)檢驗(yàn)中起著非常重要的作用。在多元統(tǒng)計(jì)中,他們分別發(fā)展為Wishart分布、Hotelling-T2分布和Wilks分布,在多元參數(shù)估計(jì)和假設(shè)檢驗(yàn)中占有非常重要的地位。,1、Wishart分布 (1) Wishart分布由Wishart在1928年推導(dǎo)出來。,(2) Wishart分布的性質(zhì),2、Hotelling-T2分布,(2) Hotelling-T2分布的性質(zhì),3、Wilks分布,多元正態(tài)總體下的假設(shè)檢驗(yàn)問題。,附 錄,指標(biāo):定量;定性 類型: 間隔尺度:用連續(xù)的量來表示 ,如長(zhǎng)度,重量等;若存在絕對(duì)零點(diǎn),又稱比例尺度; 有序尺度:沒有明確的數(shù)量表示,只是劃分一些等級(jí),等級(jí)間有次序關(guān)系,如產(chǎn)品分上中下三等,有次序關(guān)系,但無數(shù)量表示。 名義尺度:既無數(shù)量表示,又無次序關(guān)系,如某物體有紅黃白三種顏色,回答問卷中是與否等等。,一、 三種數(shù)據(jù)類型,二、 距離,1. 距離的概念 (描述樣本間差異程度的量),2. 距離的定義 定義如果第i號(hào)樣本 和第j號(hào)樣本 的函數(shù) 滿足 i) 當(dāng)且僅當(dāng) 時(shí) ; ii) 對(duì)一切 iii) 則稱 是一種廣義距離。如果進(jìn)一步還滿足 iv) 則稱 是一種距離。,3. 歐幾里德距離(歐氏距離),歐氏距離的性質(zhì) ) 平移不變性 將每個(gè)坐標(biāo) 加上一個(gè)常數(shù) 后,任何二點(diǎn)之間的距離保持不變。 ) 對(duì)正交變換的不變性 ) 如果將每個(gè)點(diǎn)的坐標(biāo)都增加C倍,點(diǎn)間距離也增加C倍。 缺點(diǎn) 與測(cè)量單位有關(guān),不同屬性之間的差別等同看待。,4. 馬氏距離(Mahalanobis),設(shè)X是原始數(shù)據(jù)矩陣,S是其協(xié)方差矩陣,則馬氏距離 定義為,馬氏距離的性質(zhì) ) 平移不變性 ) 對(duì)任意可逆線性變換的不變性 設(shè) 為可逆矩陣,若對(duì)任何一個(gè)點(diǎn) 做變換 而得到一個(gè)新的點(diǎn) ,這個(gè)變換叫可逆線性變換。 由標(biāo)準(zhǔn)化數(shù)據(jù)和中心化數(shù)據(jù)計(jì)算出的兩點(diǎn)間的馬氏距離 相同,且與測(cè)量單位無關(guān)。進(jìn)一步,作可逆變換后仍舊不 變。 缺點(diǎn)夸大了變化微小的變量的作用。,5. B模距離,設(shè)X是原始數(shù)據(jù)矩陣,B是一個(gè)正定矩陣,則B模距離 定義為,說明 時(shí)為歐氏距離, 時(shí)為馬氏距離。 當(dāng)各變量對(duì)區(qū)分樣本有不同作用時(shí),可以給各變量以 不同權(quán)重。這時(shí)可取B為 B矩陣元素的作用-權(quán)重。(根據(jù)專業(yè)知識(shí)或用統(tǒng)計(jì)方法 來確定。),特別,當(dāng)q=1時(shí),即為絕對(duì)距離:,當(dāng)q=無窮大時(shí),即為 切比雪夫距離:,7. 注釋 可根據(jù)實(shí)際問題的要求,自己定義所需要的距離。 樣本單元之間的差異大小還可以用相似系數(shù)來表示。,6.明氏(Minkowski)距離,當(dāng)q=2時(shí),即為 歐氏距離,三、 相似系數(shù),1. 概述,如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- JG/T 164-2004砌筑砂漿增塑劑
- JG/T 146-2002鋼筋直螺紋成型機(jī)
- GB/T 42231-2022綜合客運(yùn)樞紐通用要求
- DZ/T 0191-19971∶250 000地質(zhì)圖地理底圖編繪規(guī)范
- DZ/T 0009-1991砂礦勘探鉆機(jī)系列
- DZ 45-1987立軸式地質(zhì)巖心鉆機(jī)技術(shù)條件
- CJ/T 96-1999城市生活垃圾有機(jī)質(zhì)的測(cè)定灼燒法
- CJ/T 409-2012玻璃鋼化糞池技術(shù)要求
- CJ/T 246-2007城鎮(zhèn)供熱預(yù)制直埋蒸汽保溫管管路附件技術(shù)條件
- 針對(duì)性復(fù)習(xí)2025年系統(tǒng)分析師試題及答案
- 裝配式建筑練習(xí)測(cè)試題附答案
- 遼寧省大連市金普新區(qū)2023-2024學(xué)年部編版七年級(jí)下學(xué)期期末歷史試卷
- 加工紙張合同協(xié)議書
- 智聯(lián)國(guó)企行測(cè)筆試真題
- 概率論在實(shí)際生活中的應(yīng)用
- 醫(yī)療科研成果的轉(zhuǎn)化與應(yīng)用
- 歌曲《花非花》教案設(shè)計(jì)
- 2024年江西省中考生物試卷(含答案)
- 辦公樓室內(nèi)裝飾工程施工設(shè)計(jì)方案技術(shù)標(biāo)范本
- 2024年無錫市濱湖區(qū)名小六年級(jí)畢業(yè)考試語(yǔ)文模擬試卷
- 校服供貨服務(wù)方案
評(píng)論
0/150
提交評(píng)論