統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)

上傳人：m*** IP屬地：貴州上傳時(shí)間：2020-10-19 格式：DOCX 頁(yè)數(shù)：11 大?。?32.85KB 積分：20 舉報(bào) 版權(quán)申訴

統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第2頁(yè)

統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第3頁(yè)

統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第4頁(yè)

統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第5頁(yè)

已閱讀5頁(yè)，還剩6頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基本統(tǒng)計(jì)方法第一章概論1. 總體（Population）：根據(jù)研究目的確定的同質(zhì)對(duì)象的全體（集合）；樣本（Sample）：從總體中隨機(jī)抽取的部分具有代表性的研究對(duì)象。2. 參數(shù)（Parameter）：反映總體特征的統(tǒng)計(jì)指標(biāo)，如總體均數(shù)、標(biāo)準(zhǔn)差等，用希臘字母表示，是固定的常數(shù)；統(tǒng)計(jì)量（Statistic）：反映樣本特征的統(tǒng)計(jì)指標(biāo)，如樣本均數(shù)、標(biāo)準(zhǔn)差等，采用拉丁字字母表示，是在參數(shù)附近波動(dòng)的隨機(jī)變量。3. 統(tǒng)計(jì)資料分類：定量（計(jì)量）資料、定性（計(jì)數(shù)）資料、等級(jí)資料。第二章計(jì)量資料統(tǒng)計(jì)描述1. 集中趨勢(shì)：均數(shù)（算術(shù)、幾何）、中位數(shù)、眾數(shù)2. 離散趨勢(shì)：極差、四分位間距（QR=P75-P25）、標(biāo)

2、準(zhǔn)差（或方差）、變異系數(shù)（CV）3. 正態(tài)分布特征：X軸上方關(guān)于X=m對(duì)稱的鐘形曲線；X=m時(shí)，f(X)取得最大值；有兩個(gè)參數(shù)，位置參數(shù)m和形態(tài)參數(shù)s；曲線下面積為1，區(qū)間ms的面積為68.27%，區(qū)間m1.96s的面積為95.00%，區(qū)間m2.58s的面積為99.00%。4. 醫(yī)學(xué)參考值范圍的制定方法：正態(tài)近似法：；百分位數(shù)法：P2.5-P97.5。第三章總體均數(shù)估計(jì)和假設(shè)檢驗(yàn)1. 抽樣誤差（Sampling Error）：由個(gè)體變異產(chǎn)生、隨機(jī)抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。抽樣誤差不可避免，產(chǎn)生的根本原因是生物個(gè)體的變異性。2. 均數(shù)的標(biāo)準(zhǔn)誤（Standard error of M

3、ean, SEM）：樣本均數(shù)的標(biāo)準(zhǔn)差，計(jì)算公式：。反映樣本均數(shù)間的離散程度，說(shuō)明抽樣誤差的大小。3. 降低抽樣誤差的途徑有：通過(guò)增加樣本含量n；通過(guò)設(shè)計(jì)減少S。4. t分布特征：?jiǎn)畏宸植迹?為中心，左右對(duì)稱；形態(tài)取決于自由度n，n越小，t值越分散，t分布的峰部越矮而尾部翹得越高；當(dāng)n逼近,逼近, t分布逼近u分布，故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例。5. 置信區(qū)間（Confidence Interval, CI）：按預(yù)先給定的概率（1-a）確定的包含總體參數(shù)的一個(gè)范圍，計(jì)算公式：或。95%CI含義：從固定樣本含量的已知總體中進(jìn)行重復(fù)抽樣試驗(yàn)，根據(jù)每個(gè)樣本可得到一個(gè)置信區(qū)間，則平均有95%的置信區(qū)間

4、包含了總體參數(shù)。6. 假設(shè)檢驗(yàn)的基本原理：小概率反證法的思想。反證法：從問(wèn)題的對(duì)立面(H0)出發(fā)間接判斷要解決的問(wèn)題(H1)是否成立。小概率事件：在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量，根據(jù)概率分布確定檢驗(yàn)水準(zhǔn)a下P值大小，判斷是否為小概率事件（通常Pa視為小概率事件，a通常取0.05），是則拒絕H0，接受H1；否則尚不能拒絕H0。7. 假設(shè)檢驗(yàn)一般步驟：建立假設(shè)（反證法，H0和H1），確定檢驗(yàn)水準(zhǔn)（a）；計(jì)算統(tǒng)計(jì)量：u, t，F(xiàn)；確定概率值P，做出推斷結(jié)論。8. t檢驗(yàn)需滿足的條件：比較的兩個(gè)樣本相互獨(dú)立、均服從正態(tài)分布。9. P的含義：是指從H0規(guī)定的總體隨機(jī)抽樣，抽得等于及大于(或/和等于及小

5、于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量(如t、u等)值的概率。10. 型錯(cuò)誤（Type error）：拒絕了實(shí)際上成立的H0，這類“棄真”的錯(cuò)誤稱為型錯(cuò)誤，型錯(cuò)誤的大小為檢驗(yàn)水準(zhǔn)a。型錯(cuò)誤（Type error）：接受了實(shí)際上不成立的H0，這類“存?zhèn)巍钡腻e(cuò)誤稱為型錯(cuò)誤，型錯(cuò)誤的大小用b表示，1-b表示檢驗(yàn)效能。a越小，b越大，增大樣本量可以同時(shí)降低a和b。11. 置信區(qū)間和假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系：可以通過(guò)判斷置信區(qū)間是否包含零假設(shè)，判斷單樣本均數(shù)是否來(lái)自已知的總體；置信區(qū)間不但能回答差別有無(wú)統(tǒng)計(jì)學(xué)意義，還可提示差別有無(wú)實(shí)際意義。假設(shè)檢驗(yàn)可提供置信區(qū)間不能提供的信息，如P值和檢驗(yàn)效能等。第四章方差分析1.

6、方差分析的基本思想：根據(jù)研究目的和設(shè)計(jì)類型，把所有測(cè)量值的總變異按照處理因素和水平等分解成兩部分（組內(nèi)變異和組間變異）或更多部分，同時(shí)把對(duì)自由度相應(yīng)進(jìn)行分解，再進(jìn)行比較，評(píng)價(jià)由處理因素引起的變異是否具有統(tǒng)計(jì)學(xué)意義。2. 方差分析的應(yīng)用條件：各樣本是相互獨(dú)立的隨機(jī)樣本，均來(lái)自正態(tài)分布的總體，各樣本的總體方差相等（具有方差齊性）。3. 方差分析表：變異來(lái)源SSMSFP組間變異ag-1a/(g-1)MS組間/MS組內(nèi)組內(nèi)變異bN-gb/(N-g)總變異a+bN-14. g=2時(shí)，隨機(jī)區(qū)組設(shè)計(jì)的方差分析與配對(duì)設(shè)計(jì)資料t檢驗(yàn)等價(jià)，。5. 多個(gè)樣本均數(shù)間的多重比較：LSD-t檢驗(yàn)，即最小顯著差異t檢驗(yàn)，

7、適用于一對(duì)或幾對(duì)在專業(yè)上有特殊意義的樣本均數(shù)間的比較；Dunnett-t檢驗(yàn)：適用于g-1個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)差別的多重比較；SNK-q檢驗(yàn)：適用于多個(gè)樣本均數(shù)兩兩之間的全面比較。第五章計(jì)數(shù)資料的統(tǒng)計(jì)描述1. 相對(duì)數(shù)的類型：強(qiáng)度相對(duì)數(shù)（率，如死亡率、發(fā)病率等）；結(jié)構(gòu)相對(duì)數(shù)（構(gòu)成比）；相對(duì)比（如性別比等）2. 應(yīng)用相對(duì)數(shù)的注意事項(xiàng)：結(jié)構(gòu)相對(duì)數(shù)不能代替強(qiáng)度相對(duì)數(shù)；計(jì)算相對(duì)數(shù)應(yīng)有足夠的數(shù)量；正確計(jì)算合計(jì)率；注意資料的可比性；對(duì)比不同時(shí)期資料應(yīng)注意客觀條件是否相同；樣本率（或構(gòu)成比）的抽樣誤差。3. 標(biāo)準(zhǔn)化率（Standardization rate）：采用標(biāo)準(zhǔn)化法進(jìn)行計(jì)算，消除數(shù)據(jù)內(nèi)部構(gòu)成的差

8、異，使標(biāo)化后的合計(jì)率具有可比性，這種經(jīng)過(guò)標(biāo)化后的合計(jì)率稱為標(biāo)準(zhǔn)化率。4. 標(biāo)準(zhǔn)化率的注意事項(xiàng)：只適用于內(nèi)部構(gòu)成不同，影響總率的可比性的問(wèn)題；選擇的標(biāo)準(zhǔn)不同，計(jì)算得到的標(biāo)準(zhǔn)化率也不同，多個(gè)標(biāo)準(zhǔn)化率比較時(shí)，應(yīng)選同一標(biāo)準(zhǔn)；標(biāo)準(zhǔn)化率已經(jīng)不再反映當(dāng)?shù)氐膶?shí)際水平；樣本標(biāo)準(zhǔn)化率是樣本值，存在抽樣誤差。比較兩樣本標(biāo)準(zhǔn)化率，當(dāng)樣本量較小時(shí)，需做假設(shè)檢驗(yàn)。第六章幾種離散型變量的分布及應(yīng)用1. 二項(xiàng)分布XB(n, p)的適用條件：每次試驗(yàn)只發(fā)生兩種對(duì)立的可能結(jié)果之一；每次試驗(yàn)產(chǎn)生某結(jié)果的概率p固定不變；重復(fù)試驗(yàn)是相互獨(dú)立的。2. 二項(xiàng)分布的性質(zhì)：陽(yáng)性次數(shù)X的總體均數(shù)（）、標(biāo)準(zhǔn)差（）；樣本率p的均數(shù)（）、標(biāo)準(zhǔn)差（，

9、即率的標(biāo)準(zhǔn)誤）。二項(xiàng)分布的正態(tài)近似條件：np和n(1-p)均大于5。3. 泊松分布XP(l)的性質(zhì)：總體均數(shù)l和總體方差s2相等；當(dāng)n很大，p很小，且np= l為常數(shù)時(shí)，二項(xiàng)分布近似泊松分布；l20時(shí)，泊松分布近似正態(tài)分布；泊松分布具備可加性。第七章 c2檢驗(yàn)1. c2檢驗(yàn)的基本思想：根據(jù)c2分布特征，通過(guò)比較實(shí)際頻數(shù)與理論頻數(shù)的差異，確定在H0成立的條件下該差異由抽樣誤差造成是否為小概率事件，進(jìn)而判斷差異是否具有統(tǒng)計(jì)學(xué)意義。c2值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。2. RC列聯(lián)表中的各格子T1，并且1T5的格子數(shù)不宜超過(guò)1/5格子總數(shù)，否則可能產(chǎn)生偏差。處理方法有三種：增加樣本量，使理論頻

10、數(shù)增大；根據(jù)專業(yè)知識(shí)，刪除或合并行列；采用Fisher確切概率法分析。3. 有序分組資料表線性趨勢(shì)檢驗(yàn)：雙向無(wú)序的RC列聯(lián)表：多個(gè)樣本率的比較采用RC列聯(lián)表的c2檢驗(yàn)；兩個(gè)分類變量的關(guān)聯(lián)性分析則采用RC列聯(lián)表的c2檢驗(yàn)和Pearson列聯(lián)系數(shù)進(jìn)行分析。單向有序的RC列聯(lián)表：行有序而列無(wú)序：RC列聯(lián)表的c2檢驗(yàn)；行無(wú)序而列有序，采用Wilcoxon秩和檢驗(yàn)。雙向有序?qū)傩韵嗤腞C列聯(lián)表：配對(duì)四格表的擴(kuò)展，采用一致性檢驗(yàn)（Kappa檢驗(yàn)）。雙向有序?qū)傩圆煌腞C列聯(lián)表：樣本率的比較采用Wilcoxon秩和檢驗(yàn)；相關(guān)性分析采用Spearman相關(guān)分析；線性變化趨勢(shì)分析采用有序分組資料的線性趨勢(shì)檢驗(yàn)或

11、CMHc2檢驗(yàn)等。第八章非參數(shù)檢驗(yàn)1. 秩和檢驗(yàn)的適用范圍：總體分布偏態(tài)的計(jì)量資料；數(shù)據(jù)兩端有不確定值；等級(jí)資料；各組離散程度相差懸殊，總體方差不齊的資料。2. 非參數(shù)檢驗(yàn)對(duì)總體分布的形狀差別不敏感，只對(duì)總體分布位置差別敏感；非參數(shù)檢驗(yàn)沒(méi)有充分利用資料信息，較參數(shù)檢驗(yàn)的檢驗(yàn)效低。故能用參數(shù)檢驗(yàn)盡量采用參數(shù)檢驗(yàn)，不滿足參數(shù)檢驗(yàn)條件才使用非參數(shù)檢驗(yàn)。3. 不同數(shù)據(jù)類型的統(tǒng)計(jì)分析路徑：（1）樣本均數(shù)與總體均數(shù)的比較：正態(tài)，樣本均數(shù)與總體均數(shù)的t檢驗(yàn)；非正態(tài)，Wilcoxon符號(hào)秩檢驗(yàn)。（2）兩樣本均數(shù)比較：獨(dú)立正態(tài)：兩獨(dú)立樣本t檢驗(yàn)；獨(dú)立非正態(tài)：兩獨(dú)立樣本的Wilcoxon秩和檢驗(yàn)；配對(duì)設(shè)計(jì)差值正

12、態(tài)，配對(duì)t檢驗(yàn)；配對(duì)設(shè)計(jì)差值非正態(tài)，Wilcoxon符號(hào)秩檢驗(yàn)。（3）多樣本均數(shù)比較：獨(dú)立正態(tài)（方差齊），方差分析；獨(dú)立非正態(tài) Kruskal-Wails H檢驗(yàn)；非獨(dú)立正態(tài)，重復(fù)測(cè)量資料的方差分析；非獨(dú)立非正態(tài)，F(xiàn)riedman M檢驗(yàn)第九章雙變量回歸和相關(guān)1. 直線回歸應(yīng)滿足的條件：自變量與因變量呈線性關(guān)系、觀察值之間相互獨(dú)立、因變量Y隨機(jī)正態(tài)、對(duì)任何X因變量Y的標(biāo)準(zhǔn)差相等。直線回歸方程的一般形式為：，為截距，為回歸系數(shù)，回歸系數(shù)的估計(jì)采用最小二乘法原則（Least Squares Method，使殘差平方和最?。┻M(jìn)行估計(jì)。2. 決定系數(shù)（coefficient of determina

13、tion）：回歸平方和與總平方和的比值，R2=SS回/SS總。R2取值01之間無(wú)單位，其數(shù)值大小反映回歸貢獻(xiàn)的相對(duì)程度，即總變異中回歸模型能夠解釋的百分比。3. 秩相關(guān)的應(yīng)用適用范圍：（1）不服從雙變量正態(tài)分布而不宜作Pearson相關(guān)分析；（2）總體分布型未知；（3）等級(jí)資料的相關(guān)分析。4. 相關(guān)與回歸的區(qū)別與聯(lián)系區(qū)別（1）區(qū)別：資料：回歸分析資料要求Y為正態(tài)隨機(jī)變量，X為選定變量；相關(guān)分析資料X、Y服從雙變量正態(tài)分布。應(yīng)用：回歸分析是由一個(gè)變量值推算另一個(gè)變量值（依存關(guān)系）；相關(guān)分析只反映兩個(gè)變量間的相互關(guān)系。回歸系數(shù)b與原度量單位有關(guān)，而相關(guān)系數(shù)r無(wú)關(guān)。b的絕對(duì)值越大，回歸直線越陡

14、，即X變化1個(gè)單位時(shí)Y的平均變化越大；r的絕對(duì)值越大，所有點(diǎn)越趨近于一條直線，兩變量的關(guān)系越密切，相關(guān)度越高。（2）聯(lián)系： r與b值可相互換算，； r與b正負(fù)號(hào)一致； r與b的假設(shè)檢驗(yàn)等價(jià)：對(duì)于同一資料，檢驗(yàn)完全等價(jià)；回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r2(決定系數(shù))是回歸平方和與總的離均差平方和之比（SS回/SS總）。5. 應(yīng)用直線回歸時(shí)的注意事項(xiàng)（1）作回歸分析要有實(shí)際意義，不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象作回歸分析，必須對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認(rèn)識(shí)。（2）在進(jìn)行直線回歸分析之前，應(yīng)繪制散點(diǎn)圖，當(dāng)觀察點(diǎn)的分布有直線趨勢(shì)時(shí)，才適宜作直線回歸分析，散點(diǎn)圖還能提示資料有無(wú)異常點(diǎn)。異常點(diǎn)的存在往往對(duì)方程中

15、的系數(shù)（a、b）的估計(jì)產(chǎn)生較大影響。因此，需對(duì)異常點(diǎn)進(jìn)行復(fù)查。（3）建立直線回歸方程后，要對(duì)系數(shù)進(jìn)行假設(shè)檢驗(yàn)，以確定回歸方程有無(wú)意義。（4）直線回歸方程的適用范圍一般以自變量的取值范圍為限，避免外延。獲得自變量值的手段也應(yīng)與建立方程時(shí)相同。否則會(huì)產(chǎn)生較大偏差。第十章統(tǒng)計(jì)表和統(tǒng)計(jì)圖1. 統(tǒng)計(jì)表的基本要求（1）標(biāo)題：概括表的主要內(nèi)容（時(shí)間、地點(diǎn)、研究?jī)?nèi)容等），放在表的上方。表編號(hào)與標(biāo)題間間隔一個(gè)漢字距離；如整個(gè)表指標(biāo)統(tǒng)一，還應(yīng)將指標(biāo)的單位標(biāo)在標(biāo)題后面。（2）標(biāo)目：分別用橫標(biāo)目和縱標(biāo)目說(shuō)明每行和每列內(nèi)容或數(shù)字的意義，標(biāo)明指標(biāo)的單位。通常描述的對(duì)象為橫標(biāo)目，內(nèi)容（指標(biāo)）為縱標(biāo)目，從左向右讀可以構(gòu)成完

16、整的一句話。（3）線條：至少用3條線：頂線、底線和縱標(biāo)目線。頂線和底線將表格與文章其他部分分隔開(kāi)，縱標(biāo)目線將標(biāo)目的文字區(qū)與表格的數(shù)字區(qū)隔開(kāi)，還可用橫線將合計(jì)和兩重縱標(biāo)目隔開(kāi)，其他豎線和斜線一概省去。頂線和底線線條粗細(xì)一般為1.5磅，其他線條一般為0.5磅。（4）數(shù)字：用阿拉伯?dāng)?shù)字表示。無(wú)數(shù)字用“”表示，缺失數(shù)字用“”表示，數(shù)值為0者記為“0”，不留空項(xiàng)。數(shù)字按小數(shù)點(diǎn)位數(shù)對(duì)齊，同一指標(biāo)最好保留相同位數(shù)的小數(shù)位數(shù)。（5）備注：表中數(shù)字區(qū)不要插入文字。必須說(shuō)明者表“*”，在表下方以備注的形式說(shuō)明。高級(jí)統(tǒng)計(jì)方法第十二章重復(fù)測(cè)量資料的方差分析1. 重復(fù)測(cè)量設(shè)計(jì)與隨機(jī)區(qū)組設(shè)計(jì)的區(qū)別：（1）重復(fù)測(cè)量設(shè)計(jì)中

17、“處理”是在區(qū)組（受試者）間隨機(jī)分配，區(qū)組內(nèi)的各時(shí)間點(diǎn)是固定的，不能隨機(jī)分配；（2）重復(fù)測(cè)量設(shè)計(jì)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此不獨(dú)立；2. 球?qū)ΨQ（sphericity）：所有兩兩時(shí)間點(diǎn)變量間差值對(duì)應(yīng)的方差相等，即重復(fù)測(cè)量的誤差的協(xié)方差經(jīng)正交對(duì)比變換后與單位矩陣成比例。3. 重復(fù)測(cè)量資料方差分析的資料條件：（1）正態(tài)性：處理因素的各水平樣本個(gè)體間是相互獨(dú)立的隨機(jī)樣本，其總體均數(shù)服從正態(tài)分布（個(gè)體間獨(dú)立，個(gè)體內(nèi)不獨(dú)立）；（2）方差齊性：相互比較的各處理水平的總體方差相等，即具有方差齊同；（3）各時(shí)間點(diǎn)組成的協(xié)方差陣具有球形性特征。第十五章多元線性回歸分析1. 偏回歸系數(shù)（partial regressio

18、n coefficient）：多元線性回歸模型中自變量Xj的系數(shù)bj，表示在其他自變量保持不變時(shí)，Xj增加或減少一個(gè)單位是Y的平均變化量。2. 復(fù)相關(guān)系數(shù)（multiple correlation coefficient）：，表示因變量Y與多個(gè)自變量的線性相關(guān)程度，也是觀察值Y與估計(jì)值之間的相關(guān)程度。若只有一個(gè)自變量，。3. 標(biāo)準(zhǔn)化回歸系數(shù)：對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化后得到的標(biāo)準(zhǔn)化回歸方程的回歸系數(shù)即為標(biāo)準(zhǔn)化回歸系數(shù)，用來(lái)比較各個(gè)自變量對(duì)Y的影響強(qiáng)度，在有統(tǒng)計(jì)學(xué)意義的前提下，標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值越大說(shuō)明相應(yīng)自變量對(duì)Y的作用越大。4. 多元線性回歸模型（）應(yīng)滿足的條件： Y與X1，X2，Xm之間具有線性關(guān)系

19、；各例觀察值Yi相互獨(dú)立；殘差e服從正態(tài)分布。5. 啞變量（dummy variable）：在多元線性回歸模型中，當(dāng)自變量為多分類變量（g個(gè)水平）時(shí)，需要將原來(lái)的多分類變量轉(zhuǎn)化為（g-1）個(gè)啞變量并進(jìn)行編碼，每個(gè)啞變量只代表兩個(gè)級(jí)別或多個(gè)級(jí)別間的差異。應(yīng)用啞變量時(shí)要注意：啞變量同時(shí)存在，其統(tǒng)計(jì)學(xué)意義是相對(duì)而言的，不能采用常規(guī)的逐步回歸進(jìn)行變量選擇；可采用加與不加入啞變量的偏回歸平方和F檢驗(yàn)確定啞變量有無(wú)意義。6. 多重共線性（collinearity）：某些自變量間存在較強(qiáng)的線性關(guān)系，使得一個(gè)或幾個(gè)自變量可以由另外的自變量的線性關(guān)系表示，則該變量與另外的自變量間存在多重共線性。多重共線性

20、可能導(dǎo)致回歸方程不穩(wěn)定、參數(shù)估計(jì)值標(biāo)準(zhǔn)誤變得很大、t檢驗(yàn)不準(zhǔn)確、估計(jì)值的正負(fù)符號(hào)與實(shí)際不符等。7. 交互作用：當(dāng)某一自變量對(duì)因變量的作用大小與另一自變量的取值有關(guān)，則這兩個(gè)自變量有交互作用。是否考慮交互作用主要靠專業(yè)知識(shí)判斷。為了檢驗(yàn)兩個(gè)自變量是否具有交互作用，普遍的做法是在模型中加入它們的乘積項(xiàng)（作為交互項(xiàng)）。8. 線性回歸分析的SAS結(jié)果解釋：（1）線性回歸方程：；（2）該線性回歸模型的統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果：模型的方差分析統(tǒng)計(jì)量F=6.91，P=0.03030.05，說(shuō)明該線性回歸模型具有統(tǒng)計(jì)學(xué)意義。（3）R-Square=0.46353的意義：該線性回歸模型可以解釋因變量Y的總變異的46.35

21、3%；（4）回歸系數(shù)估計(jì)值b=0.99733的意義：表示X對(duì)Y影響的大小，X每改變一個(gè)單位，Y改變0.99733個(gè)單位；其假設(shè)檢驗(yàn)結(jié)果合方差分析結(jié)果的聯(lián)系：方差分析結(jié)果說(shuō)明X與Y之間存在的線性關(guān)系，t檢驗(yàn)結(jié)果說(shuō)明計(jì)算得到的回歸系數(shù)b有統(tǒng)計(jì)學(xué)意義，在此問(wèn)題中，二者是等價(jià)的，均說(shuō)明該回歸模型具有統(tǒng)計(jì)學(xué)意義。（5）相關(guān)系數(shù)及其檢驗(yàn)結(jié)果并解釋該結(jié)果：r=0.68073，對(duì)r進(jìn)行t檢驗(yàn)得到P=0.03030.05，則該相關(guān)系數(shù)具有統(tǒng)計(jì)學(xué)意義，說(shuō)明X與Y之間具有中等強(qiáng)度的正相關(guān)關(guān)系。第十六章 Logistic回歸分析1. logistic回歸模型一般形式：。將某事件的陽(yáng)性與陰性結(jié)果概率之比去自然對(duì)數(shù)稱為l

22、ogit變換，記為logit (P)。2. 回歸系數(shù)采用最大似然估計(jì)（maximum likelihood estimate, MLE，使在一次抽樣中獲得現(xiàn)有樣本的概率最大）得到表示自變量Xj改變一個(gè)單位時(shí)logit P的改變量。多變量調(diào)整后的優(yōu)勢(shì)比，表示扣除了其他自變量的影響后危險(xiǎn)因素的作用。ORj=1，說(shuō)明Xj對(duì)疾病發(fā)生不起作用ORj1，說(shuō)明Xj是一個(gè)危險(xiǎn)因素；ORj1，說(shuō)明Xj是一個(gè)保護(hù)因素，ORj的可信區(qū)間為：。3. logistic回歸模型假設(shè)檢驗(yàn)的方法：似然比法（，適合單個(gè)和多個(gè)自變量的假設(shè)檢驗(yàn)）、Wald檢驗(yàn)（或，適合單個(gè)自變量的假設(shè)檢驗(yàn)）和計(jì)分檢驗(yàn)（適合樣本量較小的情況）。變量

23、篩選的方法：前進(jìn)法、后退法、逐步法。4. 條件logistic回歸：適用于1:M配對(duì)設(shè)計(jì)資料，條件似然函數(shù)估計(jì)的是在M+1個(gè)觀察對(duì)象中恰好第一個(gè)觀察對(duì)象屬于病例組的條件概率，它只估計(jì)了表示危險(xiǎn)因素作用的，表示匹配組效應(yīng)的常數(shù)項(xiàng)被消去。5. 有序logistic回歸基于累積概率構(gòu)建回歸模型，g個(gè)類別的因變量Y的有序logistic回歸包括g-1個(gè)方程，這些方程的回歸系數(shù)均相同，差別主要體現(xiàn)在各方程的常數(shù)項(xiàng)不同。在對(duì)因變量Y賦值時(shí)，應(yīng)將專業(yè)上最不利的等級(jí)賦最小值，最有利的等級(jí)賦最大值。6. 多分類logistic回歸是二分類logistic回歸的擴(kuò)展，即選擇一個(gè)參照類別，擬合剩余各類別相對(duì)于參照類

24、別的logistic回歸模型。第十七章生存分析1. 生存分析的數(shù)據(jù)特點(diǎn)：（1）同時(shí)考慮生存時(shí)間和生存結(jié)局；（2）通常含有刪失數(shù)據(jù)（censoring，可能的原因：研究截止但終點(diǎn)事件仍未出現(xiàn)；失去聯(lián)系或其他原因?qū)е率гL；死于其他“事件”）；（3）生存時(shí)間的分布通常不服從正態(tài)分布。2. 統(tǒng)計(jì)學(xué)分析方法：由于生存時(shí)間一般不呈正態(tài)分布，且需考慮是否為刪失值，所以生存分析有其獨(dú)特的統(tǒng)計(jì)方法。（1）非參數(shù)法：生存率的估計(jì)采用Kaplan-Meier法、壽命表法（頻數(shù)表資料）；兩組或多組生存率的比較，常用log-rank檢驗(yàn)（時(shí)序法，權(quán)重，對(duì)觀察后期差別敏感）和Breslow檢驗(yàn)（權(quán)重，為期初人數(shù)，隨

25、生存時(shí)間增大而逐漸減小，Breslow檢驗(yàn)給觀察早期差別更大權(quán)重，故對(duì)觀察早期差別敏感）。（2）半?yún)?shù)法：多因素生存分析常采用Cox比例風(fēng)險(xiǎn)模型（前提條件：假定風(fēng)險(xiǎn)比值h(t)/h0(t)為固定值，即協(xié)變量對(duì)生存率的影響不隨時(shí)間的改變而改變。檢驗(yàn)此前提的方法：分類協(xié)變量每組的K-M生存曲線無(wú)交叉；協(xié)變量與生存時(shí)間的交互項(xiàng)無(wú)統(tǒng)計(jì)學(xué)意義等。其參數(shù)估計(jì)方法為最大似然法）。（3）參數(shù)法：指數(shù)分布法、Weibull分布法等回歸模型。3. 多元線性回歸、logistic回歸和Cox回歸的相同點(diǎn)和不同點(diǎn)（1）相同點(diǎn)：自變量可為連續(xù)變量和多分類變量，多分類變量需啞變量化，啞變量在模型中是一個(gè)整體，必須同時(shí)“

26、進(jìn)”同時(shí)“出”；自變量間存在較強(qiáng)相關(guān)關(guān)系時(shí)可能導(dǎo)致多重共線性問(wèn)題；自變量間可能存在交互作用，模型中通常采用自變量的乘積作為交互項(xiàng)；均可采用逐步回歸篩選變量；均可進(jìn)行影響因素分析、混雜因素校正、預(yù)測(cè)分析等。（2）不同點(diǎn)：第十八、十九章判別分析和聚類分析1. 判別分析(discriminant analysis)：根據(jù)一批分類明確的樣本在若干指標(biāo)上的觀察值，建立一個(gè)關(guān)于指標(biāo)的判別函數(shù)和判別準(zhǔn)則，然后根據(jù)這個(gè)判別函數(shù)和判別準(zhǔn)則對(duì)新的樣本進(jìn)行分類，并且根據(jù)回代判別的準(zhǔn)確率評(píng)估它的實(shí)用性。2. Fisher判別準(zhǔn)則：它使得類間點(diǎn)的距離最大，而類內(nèi)點(diǎn)的距離最小，適合于兩類的判別分析；Bayes判

27、別準(zhǔn)則：它使得每一類中的每個(gè)樣本都以最大的概率進(jìn)入該類，適合于多類的判別分析。3. 評(píng)估判別函數(shù)的判別效能：原始數(shù)據(jù)的分類要可靠準(zhǔn)確；指標(biāo)變量對(duì)判別函數(shù)的作用要顯著；判別函數(shù)的回代錯(cuò)判率和事后概率錯(cuò)誤率要小。4. 聚類分析（Cluster Analysis）：對(duì)于總體分類未知的一群事物依照“物以類聚”思想，把性質(zhì)相近的事物歸入同一類，而把性質(zhì)相差較大的事物歸入不同類的一種統(tǒng)計(jì)分析方法。5. 聚類分析和判別分析的區(qū)別和聯(lián)系（1）區(qū)別：聚類分析可以對(duì)樣本進(jìn)行分類，也可以對(duì)指標(biāo)進(jìn)行分類；而判別分析只能對(duì)樣本進(jìn)行分類；聚類分析事先不知道事物的類別，也不知道應(yīng)分幾類；而判別分析必須事先知道事物的類別

28、，也知道應(yīng)分幾類；聚類分析不需要分類的歷史資料，能直接對(duì)樣本進(jìn)行分類；而判別分析需要分類歷史資料去建立判別函數(shù)，然后才能對(duì)樣本進(jìn)行分類。（2）聯(lián)系：先采用聚類分析獲得各個(gè)個(gè)體的類別（classification）；然后采用判別分析建立判別函數(shù)，對(duì)新個(gè)體進(jìn)行類型識(shí)別（(identification ）第二十章主成分分析和因子分析1. 主成分的性質(zhì)（1）主成分互不相關(guān)；（2）主成分的貢獻(xiàn)率和累積貢獻(xiàn)率：貢獻(xiàn)率越大，表明主成分綜合原始指標(biāo)信息的能力越強(qiáng)；累積貢獻(xiàn)率越高，說(shuō)明前k個(gè)主成分綜合原始資料信息的比例越高；（3）主成分個(gè)數(shù)的選?。?以累計(jì)貢獻(xiàn)率確定：累積貢獻(xiàn)率70%為宜；以特征根值大小確定

29、：特征根值1。（4）因子荷載：因子荷載反映主成分與原始指標(biāo)間密切程度與作用方向；（5）樣品的主成分得分：根據(jù)主成分表達(dá)式計(jì)算樣品的主成分值，推斷和評(píng)價(jià)樣品的特性。2. 因子模型的性質(zhì)：（1）公共度：共性方差hi2反映全體原始指標(biāo)Xi對(duì)所有公因子的依賴程度；（2）因子貢獻(xiàn)及因子貢獻(xiàn)率：gj2的值越大，則Fj對(duì)原始指標(biāo)的影響越大；（3）因子荷載及因子荷載矩陣：因子荷載反映公因子與原始指標(biāo)間密切程度與作用方向；2. 主成分分析和因子分析的區(qū)別和聯(lián)系（1）聯(lián)系：都是根據(jù)變量之間內(nèi)部相關(guān)性來(lái)提取主要信息，獲得新的變量（公因子變量和主成分變量），達(dá)到減少變量個(gè)數(shù)（降維）的目的；主成分分析模型兩端同時(shí)乘以，則有，即為無(wú)特殊因子的公因子模型；因子分析的結(jié)果（主成分解）即為主成分分析的結(jié)果，因子分析的主因子解也常常由主成分分析的結(jié)果作為hi2的初始值計(jì)算。（2）區(qū)別：主成分分析是將m個(gè)原變量提取I (Im)個(gè)互不相關(guān)的主成分，準(zhǔn)確計(jì)算各主成分的得分，其分析重點(diǎn)在于通過(guò)主成分綜合原始變量的信息；因子分析是提取I (Im)個(gè)支配原變量的共性因子和1個(gè)特殊因子，各因子之間可以互不相關(guān)或相關(guān)，根據(jù)共性因子得分系數(shù)估計(jì)因子得分，其分析重點(diǎn)是通過(guò)尋找共性因子解釋原始變量之間的關(guān)系。第二十一章典型相關(guān)分析1. 典型相關(guān)（Canonical Corre

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔