第2講 計(jì)量資料的基本統(tǒng)計(jì)分析方法_第1頁
第2講 計(jì)量資料的基本統(tǒng)計(jì)分析方法_第2頁
第2講 計(jì)量資料的基本統(tǒng)計(jì)分析方法_第3頁
第2講 計(jì)量資料的基本統(tǒng)計(jì)分析方法_第4頁
第2講 計(jì)量資料的基本統(tǒng)計(jì)分析方法_第5頁
已閱讀5頁,還剩73頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講

計(jì)量資料的基本統(tǒng)計(jì)分析方法QuantitativedataStatisticalAnalysis2024/2/2612024/2/2621.計(jì)量資料(或定量變量)

measurmentdata,quantitativedata,定義:測(cè)定每個(gè)觀察單位的某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料。其變量值是定量的,一般帶有度量衡或其它單位。

特點(diǎn):每個(gè)觀察單位的觀察值之間有量的區(qū)別。

統(tǒng)計(jì)資料的分類2024/2/263某市110名健康男性工人的血紅蛋白量(g/L)1181481581631381561341401521321491651601191741371521541401221381481391681601201511211461351561491351481381331501321531401481351461581371531421551141471331271321551341381391311421351451341431281471371421191391311451411501521251471441311621381461211431301411501281421501071231431401401471301411261511491401391401251471291491421541512024/2/264

定義:將觀察單位按某種屬性或類別分組計(jì)數(shù),分組匯總得到各組觀察單位數(shù)稱為計(jì)數(shù)資料。特點(diǎn):計(jì)數(shù)排列是無序分組,同組各觀察單位之間沒有量的差別,但各組間有質(zhì)的不同,各組互不相容。二項(xiàng)分類和多項(xiàng)分類2.計(jì)數(shù)資料(或定性變量,無序分類變量)

enumerationdata,qualitativedata,unorderedcategorydata2024/2/265戰(zhàn)期死亡人數(shù)存活人數(shù)合計(jì)第一戰(zhàn)期281442第二戰(zhàn)期71623第三戰(zhàn)期121022合計(jì)474087各戰(zhàn)期戰(zhàn)士破傷風(fēng)病死率比較2024/2/2663.等級(jí)資料(或半定量資料,有序分類變量)

rankeddata,semi-quantitativedata,

ordinalcategorydata定義:將觀察單位按某個(gè)指標(biāo)量的大小分成等級(jí)或某種屬性的不同程度分成等級(jí)后分組計(jì)數(shù),分類匯總各組的觀察單位數(shù)稱為等級(jí)資料。特點(diǎn):等級(jí)是有序分組。同計(jì)數(shù)資料的區(qū)別是:屬性的分組有程度的差別,各組按一定順序排列;與計(jì)量資料的區(qū)別是:每個(gè)觀察單位未確切定量,所以又稱為半定量資料。2024/2/267季節(jié)營(yíng)養(yǎng)狀況缺乏不足適宜合計(jì)夏季57820冬季119222某地居民體內(nèi)核黃素營(yíng)養(yǎng)狀況調(diào)查結(jié)果*核黃素營(yíng)養(yǎng)狀況評(píng)價(jià)標(biāo)準(zhǔn):缺乏為<400μg,不足為400~1000μg,適宜為>1000μg。

2024/2/268計(jì)量資料的統(tǒng)計(jì)描述StatisticalDescription2024/2/269某市110名健康男性工人的血紅蛋白量(g/L)1181481581631381561341401521321491651601191741371521541401221381481391681601201511211461351561491351481381331501321531401481351461581371531421551141471331271321551341381391311421351451341431281471371421191391311451411501521251471441311621381461211431301411501281421501071231431401401471301411261511491401391401251471291491421541512024/2/26102024/2/2611平均數(shù)指標(biāo)平均數(shù)(average)是描述一群同質(zhì)變量值集中位置的特征值,用以說明同類現(xiàn)象或事物數(shù)量的中等水平(集中趨勢(shì))。常用指標(biāo):算術(shù)均數(shù)、中位數(shù)等。2024/2/2612

1.定義:簡(jiǎn)稱均數(shù),符號(hào)為(相應(yīng)的總體均數(shù)記為μ)。定義公式為(一)算術(shù)均數(shù)(mean)2024/2/2613算術(shù)均數(shù)適合于對(duì)稱分布的資料,如分布均勻的小樣本數(shù)據(jù)或近似正態(tài)分布的大樣本數(shù)據(jù);算術(shù)均數(shù)容易受極端值的影響。

2.均數(shù)的應(yīng)用與特點(diǎn)2024/2/2614將一組變量值按大小順序排列,位次居中的變量值即為中位數(shù)。中位數(shù)將變量值一分為二,一半比它小,一半比它大。符號(hào)為M、Md。1.中位數(shù)的計(jì)算(二)中位數(shù)(median)2024/2/26152.中位數(shù)的應(yīng)用與特點(diǎn)中位數(shù)將頻數(shù)等分為二,所以中位數(shù)適合各種類型的資料,尤其適合于大樣本偏態(tài)分布的資料。由于中位數(shù)總處在居中的位置上,因而它不受特大或特小值的影響。2024/2/2616變異指標(biāo)——又稱離散指標(biāo),用以描述一組計(jì)量資料各觀察值之間參差不齊的程度。變異指標(biāo)越大,觀察值之間差異愈大,說明平均數(shù)的代表性就越差;反之亦然。變異指標(biāo)2024/2/2617三組同性別、同年齡兒童體重甲組2628303234乙組2427303336丙組2629303124丙組乙組甲組三組均數(shù)均為302024/2/2618一.四分位數(shù)間距

四分位數(shù)間距(Q)包括了全部變量值中居于中間水平的一半數(shù)據(jù)的分布范圍。Q=P75–P25缺點(diǎn):比較穩(wěn)定,但不能反映其余數(shù)據(jù)的變異情況,沒有充分利用每個(gè)變量值的信息。四分位數(shù)間距僅用來描述大樣本偏態(tài)資料的變異情況。Q2024/2/2619二.方差與標(biāo)準(zhǔn)差方差(Variance)分為樣本方差和總體方差。樣本方差符號(hào)為,相應(yīng)的總體方差符號(hào)為。(一)方差的定義2024/2/26202024/2/2621(二)標(biāo)準(zhǔn)差的定義標(biāo)準(zhǔn)差即為方差的平方根,樣本標(biāo)準(zhǔn)差符號(hào)為s,相應(yīng)的總體標(biāo)準(zhǔn)差符號(hào)為σ。

2024/2/2622丙組乙組甲組三組同性別、同年齡兒童體重甲組2628303234乙組2427303336丙組26293031242024/2/2623方差或標(biāo)準(zhǔn)差屬同類變異指標(biāo),它們多用來描述均勻分布或近似正態(tài)分布的資料,大、小樣本均可,其中以標(biāo)準(zhǔn)差的應(yīng)用最廣,通常與均數(shù)結(jié)合使用。比如在許多醫(yī)學(xué)研究報(bào)告中常用的形式表達(dá)資料。(三)方差與標(biāo)準(zhǔn)差的應(yīng)用2024/2/2624三.變異系數(shù)變異系數(shù)(CV):2024/2/2625例2-12

某部隊(duì)干部體檢得到體脂的均數(shù)和標(biāo)準(zhǔn)差分別為18.9%和5.8%,血清膽固醇的均數(shù)與標(biāo)準(zhǔn)差分別為4.84mmol/L和1.03mmol/L,試比較兩者的變異情況。體脂變異系數(shù):

血清膽固醇變異系數(shù):

2024/2/2626變異系數(shù)可用于不同類型資料間變異程度的比較,如比較兒童的身高與體重的變異,比較同性別、同年齡的正常人的血壓與血脂的變異等;變異系數(shù)也可用于均數(shù)相差懸殊時(shí)同單位資料間變異程度的比較,如不同年齡段同性別兒童的體重變異大小比較等。2024/2/2627

常用統(tǒng)計(jì)指標(biāo)的特點(diǎn)及其應(yīng)用場(chǎng)合指標(biāo)特點(diǎn)應(yīng)用場(chǎng)合精確,易受極端值影響均勻分布的小樣本數(shù)據(jù)或近似正態(tài)分布數(shù)據(jù)穩(wěn)定,不受特大或特小值的影響應(yīng)用范圍廣,特別是大樣本偏態(tài)分布資料標(biāo)準(zhǔn)差與均數(shù)的比值,無單位比較不同資料或同類資料均數(shù)相差懸殊時(shí)變異程度2024/2/2628計(jì)量資料的統(tǒng)計(jì)推斷StatisticalInference2024/2/2629教學(xué)的設(shè)計(jì)和理念強(qiáng)調(diào)SPSS結(jié)果解釋強(qiáng)調(diào)設(shè)計(jì)模型以實(shí)例引入2024/2/2630假設(shè)檢驗(yàn)WhyWhatHowWhere2024/2/2631依據(jù)隨機(jī)樣本對(duì)未知事物進(jìn)行判斷和決策

--假設(shè)檢驗(yàn)一是需要從全局的范圍,即從總體上對(duì)問題作出判斷,單純比較樣本會(huì)有風(fēng)險(xiǎn);二是不可能或不允許對(duì)研究總體的每一個(gè)個(gè)體均作觀察。Why2024/2/2632

假設(shè)檢驗(yàn)(hypothesistesting)亦稱顯著性檢驗(yàn)(significancetesting):它是利用小概率反證法思想,目的是通過考察一部分樣本對(duì)總體作出二擇一的決策。What2024/2/2633實(shí)例通過以往大規(guī)模調(diào)查,已知某地一般新生兒的頭圍均數(shù)為34.50cm,標(biāo)準(zhǔn)差為1.99cm。為研究某礦區(qū)新生兒的發(fā)育狀況,現(xiàn)從該地某礦區(qū)隨機(jī)抽取新生兒55人,測(cè)得其頭圍均數(shù)為33.89cm,問該礦區(qū)新生兒的頭圍總體均數(shù)與一般新生兒頭圍總體均數(shù)是否不同?

假設(shè)檢驗(yàn)的目的——就是判斷差別是由哪種原因造成的。①

抽樣誤差造成的②

本質(zhì)差異造成的How2024/2/2634

根據(jù)變量和資料類型、設(shè)計(jì)方案、統(tǒng)計(jì)推斷的目的、是否滿足特定條件等(如數(shù)據(jù)的分布類型)選用適當(dāng)?shù)慕y(tǒng)計(jì)方法,選擇并計(jì)算相應(yīng)的統(tǒng)計(jì)量(如t,u,,F值)。Where2024/2/2635P值概念

P值概念——錯(cuò)誤拒絕H0的概率。即在H0所規(guī)定的總體中作隨機(jī)抽樣,得到絕對(duì)值等于或大于上一步計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的概率。2024/2/2636

若P<α,結(jié)論為按所取α檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義;其統(tǒng)計(jì)學(xué)依據(jù)是,在H0成立的情況下,得到現(xiàn)有統(tǒng)計(jì)量的概率P<α,是小概率事件,因?yàn)樾「怕适录豢赡茉谝淮纬闃又邪l(fā)生,所以拒絕H0。

若P>α,結(jié)論為按所取檢驗(yàn)水準(zhǔn)不拒絕H0,差別沒有統(tǒng)計(jì)學(xué)意義。不拒絕H0,但不能下“無差別”或“相等”的結(jié)論,只能下“根據(jù)目前試驗(yàn)結(jié)果,尚不能認(rèn)為有差別”的結(jié)論。2024/2/2637P值和α的關(guān)系

P和α本質(zhì)相同,都為概率,P是根據(jù)當(dāng)前試驗(yàn)計(jì)算的概率,α是預(yù)先給定的概率,為檢驗(yàn)水準(zhǔn),是定義了的小概率上限。因此計(jì)算得到的P值要與α進(jìn)行比較才能給出假設(shè)檢驗(yàn)的結(jié)論。P值的意義:如果總體狀況和H0一致,統(tǒng)計(jì)量獲得的現(xiàn)有數(shù)值以及更不利于H0的數(shù)值的可能性(概率)有多大?α值的意義:錯(cuò)誤地拒絕H0

的概率或接受H1

的風(fēng)險(xiǎn)。一般α=0.05或0.012024/2/2638假設(shè)檢驗(yàn)的注意事項(xiàng)

(1)可比性(2)正確選用假設(shè)檢驗(yàn)方法(3)判斷結(jié)論時(shí)不能絕對(duì)化,提倡使用精確P值。(4)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)(5)可信區(qū)間與假設(shè)檢驗(yàn)各自不同的作用,要結(jié)合使用。95%CI既能說明差別的大小,也具有檢驗(yàn)的作用,建議使用。2024/2/2639樣本均數(shù)與已知總體均數(shù)比較兩樣本均數(shù)比較配對(duì)樣本均數(shù)比較多個(gè)樣本均數(shù)比較單因素計(jì)量資料的分析兩組樣本2024/2/2640t檢驗(yàn)t-test2024/2/2641t檢驗(yàn)(t-test)源于t分布t分布是英國(guó)統(tǒng)計(jì)學(xué)家W.S.Gosset于1908年以“Student”筆名發(fā)表論文提出的,所以又稱“Student’st-distribution”。t分布的發(fā)現(xiàn)使得小樣本統(tǒng)計(jì)推斷成為可能,它被認(rèn)為是統(tǒng)計(jì)學(xué)發(fā)展歷史中的里程碑之一。以t分布為基礎(chǔ)的檢驗(yàn)稱為t檢驗(yàn),在醫(yī)學(xué)統(tǒng)計(jì)學(xué)中,t檢驗(yàn)是非常活躍的一類假設(shè)檢驗(yàn)方法。2024/2/2642應(yīng)用:1.小樣本均數(shù)與總體均數(shù)的比較;

2.配對(duì)資料的比較;3.兩樣本均數(shù)的比較。

t檢驗(yàn)(t-test)主要用于樣本含量較小,總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布資料。2024/2/2643樣本均數(shù)與已知總體均數(shù)比較2024/2/2644樣本與總體比較正態(tài)或轉(zhuǎn)換后為正態(tài)非正態(tài)單樣本t檢驗(yàn)(均數(shù))Wilcoxon符號(hào)秩和檢驗(yàn)(中位數(shù))2024/2/2645例

某地正常成年男子凝血酶時(shí)間(TT)均數(shù)為16.00s。某研究小組測(cè)得30例男性肺癌患者的凝血酶時(shí)間均數(shù)為18.39s,標(biāo)準(zhǔn)差為4.66s,問肺癌患者的凝血酶時(shí)間是否高于正常男子?

注意:醫(yī)學(xué)中一些公認(rèn)的生理常數(shù)一般可看作總體均數(shù)μ0。凝血酶時(shí)間21.2215.8015.8314.4616.3412.0621.2118.3716.4015.2712.6718.0821.8519.5525.3312.8027.6521.8017.3918.0819.6922.6611.3312.5429.8825.2518.0019.3114.1616.852024/2/2646例SPSS操作結(jié)果正態(tài)性檢驗(yàn)結(jié)果P=0.200>0.05,資料符合正態(tài)分布。2024/2/2647基本統(tǒng)計(jì)描述均數(shù)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤2024/2/2648單樣本t檢驗(yàn)結(jié)果P值自由度t值與總體均數(shù)差值的可信區(qū)間檢驗(yàn)統(tǒng)計(jì)量t=2.811,P=0.009<0.05,差異有統(tǒng)計(jì)學(xué)意義。2024/2/2649統(tǒng)計(jì)分析步驟單變量分析;資料類型為計(jì)量資料;樣本均數(shù)與已知的總體均數(shù)比較;該資料是否符合正態(tài)分布;若資料符合正態(tài)分布,則采用單樣本t檢驗(yàn);若不符合正態(tài)分布,則考慮變量變換或選用非參數(shù)檢驗(yàn)方法。2024/2/2650兩獨(dú)立樣本比較正態(tài)、方差齊(可變換)方差不齊/非正態(tài)獨(dú)立樣本t檢驗(yàn)(均數(shù))Wilcoxon秩和檢驗(yàn)(中位數(shù))/t’檢驗(yàn)配對(duì)樣本比較差值正態(tài)(可轉(zhuǎn)換)差值非正態(tài)配對(duì)樣本t檢驗(yàn)(均數(shù))Wilcoxon符號(hào)秩和檢驗(yàn)(中位數(shù))兩樣本比較2024/2/2651配對(duì)樣本均數(shù)比較2024/2/2652實(shí)驗(yàn)設(shè)計(jì)類型對(duì)同窩、同性別大鼠施以兩種處理;對(duì)雙胞胎生理、心理測(cè)量結(jié)果等。對(duì)同一份血液樣品用兩種方法進(jìn)行檢測(cè)。對(duì)同一病人自身治療前后比較;將同一份標(biāo)本一分為二分別處理等。1.兩個(gè)同質(zhì)受試對(duì)象分別接受不同處理2.同一受試對(duì)象分別接受不同的處理3.同一受試對(duì)象接受處理前后2024/2/2653例10名戰(zhàn)士在平原與高原的血氧飽和度(%)見表,試檢驗(yàn)平原與高原的血氧飽和度相差是否顯著。2024/2/2654例SPSS操作結(jié)果正態(tài)性檢驗(yàn)結(jié)果P=0.200>0.05,資料符合正態(tài)分布。2024/2/2655基本統(tǒng)計(jì)描述2024/2/2656配對(duì)t檢驗(yàn)結(jié)果t值P值差值均數(shù)的95%可信區(qū)間差值均數(shù)差值的標(biāo)準(zhǔn)差差值均數(shù)的標(biāo)準(zhǔn)誤檢驗(yàn)統(tǒng)計(jì)量t=12.319,P=0.000<0.05,差異有統(tǒng)計(jì)學(xué)意義。2024/2/2657例2024/2/2658統(tǒng)計(jì)分析步驟單變量分析;資料類型為計(jì)量資料;配對(duì)設(shè)計(jì)的樣本均數(shù)比較;該資料是否符合正態(tài)分布的條件;若資料符合正態(tài)分布,則選用配對(duì)t檢驗(yàn);若不符合正態(tài)分布,則考慮變量變換或選用配對(duì)的秩和檢驗(yàn)。2024/2/2659兩獨(dú)立樣本均數(shù)比較2024/2/2660例

某高原研究組將籍貫相同、年齡相同、身高體重接近的20名新戰(zhàn)士隨機(jī)分為甲、乙兩組,甲組為鍛煉組,每天除常規(guī)訓(xùn)練外,接受中速長(zhǎng)跑與健身操鍛煉,乙組為對(duì)照組,按常規(guī)訓(xùn)練,一月后測(cè)定肺活量(L)結(jié)果見表。試比較兩組的肺活量有無差別。

表20名戰(zhàn)士肺活量(L)鍛煉組4.414.884.463.984.784.463.934.014.184.08對(duì)照組3.324.444.323.443.863.983.983.964.053.562024/2/2661例SPSS操作結(jié)果基本統(tǒng)計(jì)描述2024/2/2662獨(dú)立樣本t檢驗(yàn)結(jié)果F值P值(方差齊性檢驗(yàn))方差齊性檢驗(yàn)方差齊方差不齊檢驗(yàn)統(tǒng)計(jì)量F=0.003,P=0.960>0.05,方差齊性。2024/2/2663t檢驗(yàn)結(jié)果均數(shù)差值均數(shù)差值的標(biāo)準(zhǔn)誤均數(shù)差值的95%可信區(qū)間t值自由度P值獨(dú)立樣本t檢驗(yàn)結(jié)果檢驗(yàn)統(tǒng)計(jì)量t=2.734,P=0.014<0.05,差異有統(tǒng)計(jì)學(xué)意義。2024/2/2664例2024/2/2665統(tǒng)計(jì)分析步驟單變量分析;資料類型為計(jì)量資料;完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)比較;該資料是否符合正態(tài)分布和方差齊性的條件;若資料符合正態(tài)分布和方差齊性,則選用獨(dú)立樣本比較t檢驗(yàn);若不符合正態(tài)分布和方差齊性,則考慮變量變換或選用兩樣本比較的秩和檢驗(yàn)。2024/2/2666動(dòng)動(dòng)腦筋2024/2/26672024/2/2668單因素方差分析One-wayAnalysisofVariance-ANOVA2024/2/2669例

某高原

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論