廣中醫(yī)針推統(tǒng)計學(xué)診斷_第1頁
廣中醫(yī)針推統(tǒng)計學(xué)診斷_第2頁
廣中醫(yī)針推統(tǒng)計學(xué)診斷_第3頁
廣中醫(yī)針推統(tǒng)計學(xué)診斷_第4頁
廣中醫(yī)針推統(tǒng)計學(xué)診斷_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)以理解為主,沒有名解第一章 緒論(概念、區(qū)別變量類型和參數(shù)統(tǒng)計量)1.抽樣從研究總體中抽取一部分有代表性的個體。2.同質(zhì)同一總體的個體具有共性(大同小異)。變異同一總體中不同個體間存在的差異。定量變量離散型變量:只可取整數(shù)值(月份)連續(xù)型變量:可取實數(shù)軸上任何數(shù)值(血壓)3.變量類型(區(qū)別)定性變量分類變量(名義變量):如二分類變量(性別-男女)、多分類變量(職業(yè))有序變量(等級變量):如藥物療效-無效/一般/好轉(zhuǎn)變量的轉(zhuǎn)化只能”高級”到”低級”:定量有序分類二值4.參數(shù)描述總體分布數(shù)量特征的統(tǒng)計指標(biāo)值(總體統(tǒng)計指標(biāo)值)。其大小是客觀存在的,但往往是未知的,需要通過樣本資料來估計。統(tǒng)計量

2、由觀察資料(樣本資料)計算出來的量(樣本統(tǒng)計指標(biāo)值)。是對總體參數(shù)的估計。抽樣誤差由抽樣而造成的樣本統(tǒng)計指標(biāo)(統(tǒng)計量)與總體統(tǒng)計指標(biāo)(參數(shù))之差。統(tǒng)計學(xué)關(guān)心的常常是總體參數(shù)的大小,其依據(jù)卻是統(tǒng)計量及其性質(zhì)。研究設(shè)計收集資料5.統(tǒng)計工作的基本步驟整理資料定量資料統(tǒng)計描述平均數(shù)統(tǒng)計描述定性資料統(tǒng)計描述相對數(shù)分析資料 參數(shù)估計統(tǒng)計推斷(由樣本信息對相應(yīng)總體的特征進行推斷)假設(shè)檢驗第2章 定量變量的統(tǒng)計描述1. 頻率分布表(圖)的用途:描述變量的分布類型:對稱,非對稱(偏鋒)揭示變量的分布特征:集中趨勢、離散趨勢集中趨勢與離散趨勢同時存在,是隨機變量分布的兩個重要特征,通過描述變量的平均水平(集中趨勢

3、)和變異程度(離散趨勢)可較全面地揭示數(shù)據(jù)分布的特征(1)集中趨勢的描述- 平均數(shù)是分析定量資料的基本指標(biāo)。用于描述一組同質(zhì)觀察值(變量值)的集中位置,反映一組觀察值的平均水平或集中趨勢。應(yīng)用分類算術(shù)平均數(shù)(均數(shù))幾何均數(shù)中位數(shù)適用范圍適用于對稱分布資料,尤其是正態(tài)分布或近似正態(tài)分布資料。1.原始觀察值分布不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布(正態(tài)分布)的變量。2.當(dāng)變量值之間呈倍數(shù)關(guān)系(等比數(shù)列)。3.頻率圖呈正偏鋒分布,均數(shù)變量平均水平的代表性較差1.當(dāng)一組變量值呈偏態(tài)(峰)分布;2.資料的分布類型不清楚時;3.數(shù)據(jù)大部分比較集中,少部分偏向一側(cè);4.資料的一端或兩端無界限(2)離散趨勢的描述

4、-變異指標(biāo):極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、變異系數(shù)。其中以標(biāo)準(zhǔn)差最常用。特點:四分位數(shù)間距常與中位數(shù)結(jié)合來描述變量的平均水平和變異程度。四分位數(shù)間距的適用范圍即中位數(shù)適用范圍。標(biāo)準(zhǔn)差常與均數(shù)結(jié)合起來,從平均水平和變異程度兩方面描述變量的分布特征。標(biāo)準(zhǔn)差適用范圍即均數(shù)適用范圍。2. 描述分布形態(tài)的統(tǒng)計指標(biāo):偏度系數(shù)、峰度系數(shù)正態(tài)分布時,偏度系數(shù)與峰度系數(shù)均為0.3. 統(tǒng)計表的結(jié)構(gòu):表號及標(biāo)題、標(biāo)目、線條(三線表:頂線、底線、縱標(biāo)目分割線)、數(shù)字。第3章 定性變量的統(tǒng)計描述1. 定性資料常用相對數(shù)作為統(tǒng)計描述指標(biāo)。常用的相對數(shù)有:頻率、強度、相對比。應(yīng)用相對數(shù)的注意事項:1、防止概念混淆; 2、計算

5、相對數(shù)時分母應(yīng)有足夠數(shù)量;3、正確計算合計率;4、樣本相對數(shù)的統(tǒng)計推斷;5. 注意資料的可比性;6、頻率型指標(biāo)的解釋要緊扣總體與屬性(總體不同、屬性不同);2. 應(yīng)用粗率標(biāo)準(zhǔn)化法的注意事項:標(biāo)準(zhǔn)化法的應(yīng)用范圍很廣;標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時當(dāng)?shù)氐膶嶋H水平,它只表示相互比較的資料間的相對水平。選擇不同的”標(biāo)準(zhǔn)”,算出的標(biāo)準(zhǔn)化率也會不同,比較的結(jié)果也未必相同。兩樣本標(biāo)準(zhǔn)化率是樣本值。存在抽樣誤差。比較兩樣本的標(biāo)準(zhǔn)化率,當(dāng)樣本含量較小時,還應(yīng)作假設(shè)檢驗。3. 動態(tài)數(shù)列按時間順序?qū)⒁幌盗薪y(tǒng)計指標(biāo)(可以是絕對數(shù),相對數(shù)或平均數(shù))排列起來,用以觀察和比較該事物在時間上的變化和發(fā)展趨勢。l 常用的

6、動態(tài)數(shù)列分析指標(biāo)有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度。l 動態(tài)數(shù)列的分析不僅可以總結(jié)過去,而且可以進行預(yù)測,即根據(jù)平均發(fā)展速度公式計算幾年后達(dá)到的指標(biāo)。第4章 常用概率分布1. 二項分布l 概念:觀察結(jié)果是以兩分類變量來表示的,如果每個觀察對象陽性結(jié)果的發(fā)生概率均為,陰性結(jié)果的發(fā)生概率均為(1);而且各個觀察對象的結(jié)果是相互獨立的,重復(fù)觀察n次,發(fā)生陽性結(jié)果的次數(shù)X的概率分布為二項分布,記作B(n,)。l 特點:結(jié)果只有兩種可能;事件的概率不變;每次事件相互獨立。l 當(dāng)n相當(dāng)大(n100),只要不太靠近0或1,特別是當(dāng)n和n(1)都大于5時,二項分布近似正態(tài)分布。2.

7、 正態(tài)分布(1) 形狀:一條高峰位于中央,兩側(cè)逐漸下降并完全對稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。(2) 參數(shù):位置參數(shù)即總體均數(shù),描述正態(tài)分布的集中位置。變異度參數(shù)(形狀參數(shù))為總體標(biāo)準(zhǔn)差,描述正態(tài)分布的離散程度。(3) z變換與標(biāo)準(zhǔn)正態(tài)分布l 任意一個服從正態(tài)分布N(,2)的隨機變量,均可以作標(biāo)準(zhǔn)化變換(也稱z變換)。l 變換后的z值仍服從正態(tài)分布,且總體均數(shù)0,總體標(biāo)準(zhǔn)差1。此正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,用N(0,1)表示。(4)正態(tài)曲線下面積分布規(guī)律:l 1.96范圍內(nèi)的面積占曲線下總面積的95.00(該范圍內(nèi)的頻數(shù)占總觀察單位數(shù)的95%)。l 2.58范圍內(nèi)的面積占曲線下總面積的9

8、9.00(該范圍內(nèi)的頻數(shù)占總頻數(shù)的99%)。標(biāo)準(zhǔn)正態(tài)分布中(-1.96,1.96)=95%;(-2.58,2.58)=99%(5) 醫(yī)學(xué)參考值范圍指特定的“正常”人群(排除了對所研究指標(biāo)有影響的疾病和有關(guān)因素的特定人群)的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個體的取值所在的范圍。l 確定醫(yī)學(xué)參考值的方法:百分位數(shù)法:可用于任何分布類型的資料,較適合偏態(tài)分布;正態(tài)分布法:適用于正態(tài)分布。第5章 參數(shù)估計基礎(chǔ) 1.參數(shù)估計根據(jù)樣本統(tǒng)計量估計總體參數(shù)的過程。定量資料的參數(shù)估計:均數(shù)的抽樣誤差、均數(shù)的標(biāo)準(zhǔn)誤、t分布、總體均數(shù)的可信區(qū)間定性資料的參數(shù)估計:率的抽樣誤差、率的標(biāo)準(zhǔn)誤、二項分

9、布、總體率的可信區(qū)間2.抽樣誤差由抽樣而造成的樣本統(tǒng)計量與總體參數(shù)、樣本統(tǒng)計量之間的差異。3.正態(tài)分布總體樣本均數(shù)抽樣分布的特點:各樣本均數(shù)未必等于總體均數(shù)。各樣本均數(shù)間存在差異。樣本均數(shù)圍繞總體均數(shù),中間多、兩邊少,左右基本對稱,呈近似正態(tài)分布;事實上,如果原總體呈正態(tài)分布,樣本均數(shù)圍繞總體均數(shù)亦呈正態(tài)分布。樣本均數(shù)的變異范圍較原變量的變異范圍小。隨著n增加,樣本均數(shù)的變異程度減小。4.當(dāng)樣本量n較小時,樣本均數(shù)的分布并非正態(tài)分布,而樣本量足夠大時(例如,n50),樣本均數(shù)的分布近似于正態(tài)分布。5.均數(shù)的標(biāo)準(zhǔn)誤樣本均數(shù)的標(biāo)準(zhǔn)差??捎糜诜从尘鶖?shù)的抽樣誤差大小。l 均數(shù)的標(biāo)準(zhǔn)誤可衡量樣本均數(shù)(估

10、計總體均數(shù))的可靠性。l 二項分布中,頻率的標(biāo)準(zhǔn)誤=均數(shù)的標(biāo)準(zhǔn)誤。6. t分布(1)t分布與標(biāo)準(zhǔn)正態(tài)分布(z分布)比較相似:t分布和z分布都是以0為中心,中間高,兩邊低,左右對稱的光滑曲線;不同:t分布是一簇單峰分布曲線。比z分布的離散度更大,其性狀與自由度有關(guān),越小,t值分布越分散。(即t分布離散度大,z分布離散度?。┞?lián)系:隨著自由度的增大,t分布越來越接近z分布,當(dāng)自由度為無窮大時,t分布即為z分布。t分布不是正態(tài)分布,但標(biāo)準(zhǔn)正態(tài)分布(z分布)為特殊的t分布(2)統(tǒng)計學(xué)關(guān)心的是t分布曲線下的尾部面積(即概率P)與橫軸t值的關(guān)系。自由度相同時,|t|值越大,t分布的尾部概率越??;t臨界值相同

11、時,雙側(cè)尾部概率為單側(cè)尾部概率的兩倍。(3)t分布的用途:總體均數(shù)的區(qū)間估計;兩均數(shù)差別的假設(shè)檢驗t檢驗。7. 總體均數(shù)及總體概率的估計(1) 參數(shù)估計:用樣本指標(biāo)(統(tǒng)計量)估計總體指標(biāo)(參數(shù))。包括點估計和區(qū)間估計。點估計難以反映參數(shù)估計值對其真值的代表性,多不用。區(qū)間估計用已知樣本統(tǒng)計量和標(biāo)準(zhǔn)誤,按一定的概率估計可能包含總體參數(shù)在內(nèi)的一個范圍。而這個范圍稱為總體參數(shù)的置信區(qū)間。l 1稱為置信度,值一般取0.05或0.01,故最常用總體參數(shù)的95%或99%置信區(qū)間。l 估計總體均數(shù)的置信區(qū)間方法:t分布法(當(dāng)未知且n較小,小樣本)正態(tài)近似法(當(dāng)已知,或未知但n足夠大,大樣本)8.標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)

12、誤比較標(biāo)準(zhǔn)差(S)標(biāo)準(zhǔn)差(Sx)相似反映觀察值的離散程度反映樣本均數(shù)的離散程度不同意義表示觀察值的變異程度,衡量均數(shù)的代表性表示樣本均數(shù)抽樣誤差的大小,衡量樣本均數(shù)的可靠性應(yīng)用制定醫(yī)學(xué)參考值范圍估計總體均數(shù)可信區(qū)間第6章 假設(shè)檢驗基礎(chǔ)1.假設(shè)檢驗判斷樣本統(tǒng)計量與總體參數(shù)之間的差別(或兩個或兩個以上樣本統(tǒng)計量之間的差別)是否由于抽樣誤差所致的方法。2.區(qū)別參數(shù)估計和假設(shè)檢驗參數(shù)估計假設(shè)檢驗同由樣本推總體異已知樣本統(tǒng)計量的值推總體統(tǒng)計量的范圍假設(shè)已知樣本統(tǒng)計量的比較,推總體樣本統(tǒng)計量比較結(jié)果是否相同。3. 假設(shè)檢驗的基本步驟:(1)建立假設(shè)零假設(shè)(原假設(shè)或檢驗假設(shè)) :假設(shè)差別是由抽樣誤差引起(差

13、別無統(tǒng)計學(xué)意義)備擇假設(shè)(對立假設(shè)) :假設(shè)差別是由處理因素所致(差別有統(tǒng)計學(xué)意義)(2) 確定檢驗水準(zhǔn)一般取= 0.05(3)選擇檢驗方法,計算檢驗統(tǒng)計量 選擇檢驗方法的依據(jù):研究目的、研究設(shè)計的類型、資料特點(變量種類、樣本大小)等(4) 確定P值P值的定義:在零假設(shè)成立的條件下,出現(xiàn)統(tǒng)計量目前值及更不利于零假設(shè)數(shù)值的概率。(5) 作出推論(結(jié)果推斷)定量資料假設(shè)檢驗4. (小樣本資料兩均數(shù)比較)t檢驗的應(yīng)用條件:(1)隨機獨立樣本(2)樣本來自正態(tài)分布總體(3)兩樣本均數(shù)比較的t檢驗要求兩樣本所來自的總體方差相等,(即方差齊性)單樣本資料的t檢驗配對設(shè)計定量資料的t檢驗兩獨立樣本資料的t

14、檢驗(兩樣本來自正態(tài)分布總體)目的推斷樣本來自的總體均數(shù)與已知的某一總體均數(shù)0(常為理論值或標(biāo)準(zhǔn)值)有無差別。著眼于配對設(shè)計(異體配對和自身配對)每一對中兩個觀察值之差,這些差值構(gòu)成一組資料,用t檢驗推斷差值的總體均數(shù)是否為”0”。判斷兩獨立樣本資料的總體均數(shù)是否相等。分兩種情況(樣本量大可不檢方差齊性):總體方差相等(方差齊性)總體方差不等檢驗方差齊性,用兩獨立樣本資料的方差齊性檢驗(F檢驗)。5. 二項分布資料的z檢驗(大樣本)近似正態(tài)分布,應(yīng)用條件:n足夠大,不太靠近0和1;或n和n(1-)均大于5。6. 假設(shè)檢驗的功效(1)假設(shè)檢驗的兩類錯誤第類錯誤:拒絕了實際上成立的H0。第類錯誤的

15、概率大小用表示。第類錯誤:不拒絕實際上不成立的H0。第類錯誤的概率用表示。當(dāng)樣本例數(shù)n確定時,愈小,愈大;反之,愈大,愈小。要同時減少及,唯一的方法是增加樣本例數(shù)。(2) 假設(shè)檢驗的功效又稱為檢驗效能或把握度,用符號1-表示。意義是:當(dāng)所研究的總體與H0確有差別時,按規(guī)定檢驗水準(zhǔn)能夠發(fā)現(xiàn)該差異(拒絕H0)的能力(概率)。影響因素:總體參數(shù)的差異、個體差異(標(biāo)準(zhǔn)差)、樣本量、檢驗水準(zhǔn)應(yīng)用假設(shè)檢驗需要注意的問題:a.事先進行嚴(yán)密的統(tǒng)計學(xué)設(shè)計:1、樣本是從同質(zhì)總體中隨機抽取的一部分2、應(yīng)注意樣本含量是否合理3、假設(shè)檢驗的先決條件是比較組間資料是可比的(組間非處理因素均衡)4、單側(cè)檢驗和雙側(cè)檢驗的選擇

16、b.應(yīng)用假設(shè)檢驗方法必須符合其適用條件c.權(quán)衡兩類錯誤的危害來確定的大小d.正確理解假設(shè)檢驗的結(jié)論1、 有無差別是相對的2、 正確理解P值的意義3、 結(jié)合專業(yè)知識作出推斷結(jié)論第7章 方差分析基礎(chǔ)1. 方差分析通過對數(shù)據(jù)變異的分解來判斷不同樣本所代表的總體均數(shù)是否相同,用于比較兩個或兩個以上均數(shù)的差別。(當(dāng)用于兩兩比較時,同一資料所得結(jié)果與t檢驗等價,即t2=F)(1)基本思想:把全部數(shù)據(jù)的總離均差平方和(SS總)分解為若干部分,其總自由度(v總)也作相應(yīng)的分解。每一部分表示一定意義,其中至少有一個部分表示各組均數(shù)間的變異情況,另一部分表示誤差。l 總變異,組間變異(同時反映處理因素和隨機誤差)

17、,組內(nèi)變異(只反映隨機誤差)l SS離均差平方和;MS均方(即方差)l F值為MS組間與MS組內(nèi)之比。如果處理因素不起作用,MS組間與MS組內(nèi)之比應(yīng)近于或等于1;如果試驗因素確有作用,則MS組間與MS組內(nèi)之比應(yīng)明顯大于1。(2)兩種計算方法:l 完全隨機設(shè)計資料方差分析(單一因素方差分析)也適用3種t檢驗l 隨機區(qū)組設(shè)計資料的方差分析(雙因素方差分析)適用于除配對設(shè)計t檢驗外的另外兩種t檢驗通常是將受試對象按性質(zhì)(非實驗因素)相同或相近者組成b個區(qū)組(配伍組),每個區(qū)組中的k個受試對象分別隨機分配到k個處理組中去,構(gòu)成bk個格子。l 隨機區(qū)組設(shè)計與完全隨機設(shè)計相比,因利用區(qū)組控制了可能的混雜因

18、素,并在進行方差分析時將區(qū)組的變異從原組的變異中分解出來。(3) 多個樣本均數(shù)兩兩比較l SNK法(q檢驗):區(qū)組中每兩組之間比較l Dunnett法:多個實驗組與一個對照組均數(shù)的比較l Bonferroni法:調(diào)整值,確定每次比較的檢驗水準(zhǔn)=/m。使多次比較后犯第一類錯誤的累計概率較少,適用于所有兩兩比較。(4) 方差分析的前提條件各樣本是相互獨立的隨機樣本樣本來自正態(tài)分布總體各樣本的總體方差相等,即方差齊性(即方差分析前須檢驗方差齊性)(5) 數(shù)據(jù)變換(對于符合方差分析假定條件的資料,可用方法有:1.數(shù)據(jù)變換;2.非參數(shù)統(tǒng)計分析;3采用近似檢驗)對數(shù)變換:(1)對數(shù)正態(tài)分布資料;(2)標(biāo)準(zhǔn)

19、差與均數(shù)成比例,或變異系數(shù)接近甚至等于某一常數(shù)的資料。平方根變換:適用于方差與均數(shù)成比例的資料,如服從Poisson分布的資料。平方根反正弦變換:適用于二項分布(百分比)的數(shù)據(jù)資料。定性資料假設(shè)檢驗第八章 1.可用于:(1)檢驗兩個或多個頻率(率或構(gòu)成比)間的差異;(2)判斷兩種屬性或現(xiàn)象間是否存在關(guān)聯(lián)性;(3)了解實際分布與某種理論分布是否吻合;(4)判斷兩個數(shù)列間是否存在差異等。2.獨立樣本22列聯(lián)表資料的 2檢驗:l 條件:n40,T5(四個格子的理論數(shù)均大于5)組別屬性合計Y1Y2甲a(T11)b(T12)n1=a+b乙c(T21)d(T22)n2=c+d合計m1=a+cm2=b+dn

20、=a+b+c+dl 四格表:l 公式:3.22列聯(lián)表資料 2檢驗校正公式:l 條件:n40,任一格理論數(shù):1T5。l 公式:(校正后2值變?。?. Fisher確切概率法:n40或T1,不能用2方檢驗,須用Fisher確切概率法直接計算概率。5. 四格表資料的卡方檢驗注意事項:校正公式僅用于四格表資料;不滿足2檢驗條件時(n40或T1)用Fisher確切概率法直接計算概率;組間比較注意可比性。6. 多個獨立樣本RC列聯(lián)表資料的2檢驗l 條件:T5的格子不超過總格子數(shù)的1/5,且T1l RC列聯(lián)表卡方檢驗的注意事項:(1)在RC列聯(lián)表表資料中,當(dāng)有1/5以上格子的理論數(shù)小于5或有任一格子內(nèi)理論數(shù)

21、小于1時,處理的方法有:增大觀察例數(shù)再做研究將T5或T1所在的行或列與性質(zhì)相同的相鄰行或列合并,刪除T5或T1所在的行或列改用RC表的Fisher確切概率法(2) 注意對比組之間的可比性(3) RC表資料卡方檢驗結(jié)果,當(dāng)P0.05,按=0.05的水準(zhǔn),認(rèn)為被比較的幾個率之間總的來說有差別,但不能據(jù)此作出任何兩組間均有差別的結(jié)論。究竟哪兩組間有差別,還需作兩兩比較。(4) 如果行或列的變量是有序的(單向有序),比較兩組(或幾組)總的程度有無不同,宜用秩和檢驗。卡方檢驗比較的是幾組構(gòu)成比(頻率分布)有無不同。7. 2檢驗用于擬合優(yōu)度檢驗:根據(jù)樣本的頻率分布檢驗其總體分布是否等于某給定的理論分布(泊

22、松分布、二項分布、正態(tài)分布等)第9章 基于秩次的非參數(shù)檢驗參數(shù)檢驗以特定的總體分布為前提,對未知的總體參數(shù)做推斷的假設(shè)檢驗方法。非參數(shù)檢驗不以特定的總體分布為前提,也不針對決定總體分布的參數(shù)做推斷的假設(shè)檢驗方法,又稱任意分布檢驗。1.秩和檢驗應(yīng)用條件:l 總體分布類型未知,或資料分布類型已知,但不符合正態(tài)分布的資料。l 某些可能無法精確測量,只能以嚴(yán)重程度、優(yōu)劣等級、次序先后等表示的等級資料。l 個別數(shù)據(jù)偏大或數(shù)據(jù)的某一端或兩端為不確定值的資料。l 各總體方差不齊的資料。但符合參數(shù)檢驗應(yīng)用條件的定量資料,如果選用秩和檢驗進行統(tǒng)計分析,可能會降低檢驗功效。2. 平均秩次:當(dāng)差值絕對值相等時,若符

23、號相同,可順次編秩也可求平均秩次,若符號不同,求平均秩次并記原來符號。3. 秩和檢驗的方法:(1) 配對設(shè)計資料的符號秩和檢驗:混合編秩次,分別求秩和。(2) 兩組獨立樣本比較的秩和檢驗:混合編秩次,分組求秩和。兩組連續(xù)型變量資料的秩和檢驗兩組有序分類變量資料的秩和檢驗(1)和(2)均可查表,或樣本量較大可用正態(tài)近似法z檢驗,但相同秩次(相持現(xiàn)象)超過25%,則要校正。(3) 多組獨立樣本比較的秩和檢驗:混合編秩次,分組求秩和。多組連續(xù)變量資料的秩和檢驗多組有序變量資料的秩和檢驗(3)求統(tǒng)計量H,若超出H界值表則查2界值表。4. 隨機區(qū)組設(shè)計資料的秩和檢驗:按區(qū)組編秩次,按區(qū)組求秩和。(M檢驗

24、)5. 多個樣本間的多重比較第10章 兩變量關(guān)聯(lián)性分析(兩定量變量間的線性關(guān)系)1. 線性相關(guān)系數(shù)簡稱相關(guān)系數(shù),是定量描述兩個隨機變量間線性關(guān)系密切程度和相關(guān)方向的統(tǒng)計指標(biāo)。(總體相關(guān)系數(shù),樣本相關(guān)系數(shù)r)l 相關(guān)系數(shù)無單位,其值變動于-1與+1之間。l 當(dāng)0,稱X和Y線性相關(guān),簡稱相關(guān);=0,零相關(guān)或X和Y無線性相關(guān)。l 0,正相關(guān);0,負(fù)相關(guān)。l |=1,完全相關(guān)(函數(shù)關(guān)系);|愈接近1,表示兩變量間關(guān)系愈密切;|愈接近0,表示兩變量間關(guān)系愈不密切 。2. 常用線性相關(guān)系數(shù)假設(shè)檢驗方法有兩種:(1)直接查相關(guān)系數(shù)臨界值表(2)采用回歸系數(shù)t檢驗假設(shè)檢驗?zāi)康脑谟诙ㄐ缘鼗卮饍勺兞恐g是否存在線

25、性相關(guān),P值越小并不表示相關(guān)性越強。3.線性相關(guān)分析應(yīng)用中應(yīng)注意的問題;(1)在作直線相關(guān)分析前,應(yīng)先繪散點圖,當(dāng)散點圖有線性趨勢時,才進行相關(guān)分析。(2)線性相關(guān)分析要求兩個變量都是隨機變量,且呈二元正態(tài)分布,當(dāng)兩變量均明顯不呈正態(tài)分布時,最好采用數(shù)據(jù)變換或采用秩相關(guān)(等級相關(guān))分析。(3)相關(guān)關(guān)系不一定是因果關(guān)系,需從專業(yè)角度分析(4)出現(xiàn)離群值時慎用相關(guān)(5)注意假相關(guān):分層資料盲目合并易出假象。4.秩相關(guān):適用于不服從正態(tài)分布、總體分布未知以及原始數(shù)據(jù)用等級表示的資料。常用Spearman秩相關(guān)系數(shù)rs(又稱等級相關(guān)系數(shù))描述兩個變量間關(guān)聯(lián)的程度與方向。第十一章 簡單線性回歸1.線性相

26、關(guān)與線性回歸比較線性相關(guān)線性回歸同線性相關(guān)與回歸分析研究兩個(定量)變量間的線性關(guān)系。異分析研究兩個變量間線性關(guān)系的強度和方向分析研究兩個連續(xù)型變量之間線性依存關(guān)系以及建立一個線性回歸方程來定量地表達(dá)兩變量間的線性關(guān)系??捎糜诠烙?、預(yù)測。2. 回歸分析研究一個變量如何隨另一些變量變化的常用方法。線性回歸分析研究兩個定量變量X與Y之間線性依存關(guān)系,并建立一個線性回歸方程來定量地表達(dá)兩變量間依存變化的數(shù)量關(guān)系的統(tǒng)計分析方法。3. 回歸系數(shù)為直線的斜率,它表示X每變動一個單位時,Y變動的單位數(shù)。(即相關(guān)系數(shù))4. 線性回歸模型的適用條件LINE(1)(L)-線性(linear):X與Y呈直線關(guān)系(2

27、)(I)-獨立(independent):每個個體觀察值之間相互獨立(3)(N)-正態(tài)(normal):任意給定X值,對應(yīng)的隨機變量Y都服從正態(tài)分布(4)(E)等方差(equal variance):不同的X值所對應(yīng)的隨機變量Y的方差相等5. 遵循最小二乘法則:保證各實測點距回歸直線的縱向距離的平方和為最小。即估計誤差平方和 最小。殘差(剩余值)實測值y與回歸線上的估計值 的縱向距離 6. 總體回歸系數(shù)的統(tǒng)計推斷:t檢驗:檢驗總體回歸系數(shù)是否不為0F檢驗:檢驗回歸方程是否成立(即檢驗回歸系數(shù)是否不全為0)當(dāng)僅一個自變量時: t2=F7. 決定系數(shù)回歸平方和與總離均差平方和之比,記為R2。通過決

28、定系數(shù)大小反映回歸的實際效果。當(dāng)X與Y都是正態(tài)隨機變量時,相關(guān)系數(shù)的平方在數(shù)值上就等于決定系數(shù) 。8. 線性回歸的應(yīng)用:(1) 統(tǒng)計預(yù)測:Y的總體均數(shù)的置信區(qū)間;給定X=Xp時,Yp的總體均數(shù)的點估計為 。計算出對應(yīng)于所有X值的Y總體均數(shù)的置信區(qū)間,以相應(yīng)X為橫坐標(biāo),Y為縱坐標(biāo),將置信區(qū)間的上下限分別連起來形成兩條弧線間的區(qū)域,稱為回歸直線的置信帶。(1-)置信帶的意義:在滿足線性回歸的假設(shè)條件下,可以認(rèn)為真實的回歸直線落在兩條弧形曲線所形成的區(qū)帶內(nèi),其置信度為1-。個體Y值的預(yù)測區(qū)間。給定X=Xp時,對應(yīng)的個體Y值存在一個波動范圍。計算出對應(yīng)于所有X值的Y的預(yù)測范圍,以相應(yīng)的X橫坐標(biāo),Y為縱坐標(biāo),將預(yù)測區(qū)間的上下限分別連起來形成的兩條弧形線間的區(qū)域,稱為Y值的預(yù)測帶。內(nèi):Y的總體均數(shù)的置信區(qū)間 外:個體Y值的預(yù)測區(qū)間第12章 多重線性回歸與相關(guān)1.多重線性回歸與多重相關(guān)是研究一個連續(xù)型變量和其他多個變量間線性關(guān)系的統(tǒng)計學(xué)分析方法。2.j 自變量Xj對Y的偏回歸系數(shù),表示當(dāng)方程中其它自變量保持不變時,Xj

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論