版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章緒論1、記錄學(xué),是關(guān)于數(shù)據(jù)收集、整理、分析、表達(dá)和解釋的普遍原理和方法。2、研究對象:具有不擬定性結(jié)果的事物。3、記錄學(xué)作用:可以透過偶爾現(xiàn)象來探測其規(guī)律性,使研究結(jié)論具有科學(xué)性。4、記錄分析要點(diǎn):對的選用記錄分析方法,結(jié)合專業(yè)知識作出科學(xué)的結(jié)論。5、醫(yī)學(xué)記錄學(xué)基本內(nèi)容:記錄設(shè)計(jì)、數(shù)據(jù)整理、記錄描述、記錄推斷。6、醫(yī)學(xué)記錄學(xué)中的基本概念(1)同質(zhì)與變異同質(zhì),指根據(jù)研究目的所擬定的觀測單位其性質(zhì)應(yīng)大體相同。變異,指總體內(nèi)的個(gè)體間存在的、絕對的差異。記錄學(xué)通過對變異的研究來探索事物。(2)變量與數(shù)據(jù)類型變量,是反映實(shí)驗(yàn)或觀測對象生理、生化、解剖等特性的指標(biāo)。變量的觀測值,稱為數(shù)據(jù)分為三種類型:定量數(shù)據(jù),也稱計(jì)量資料,指對每個(gè)觀測單位某個(gè)變量用測量或其他定量方法準(zhǔn)確獲得的定量結(jié)果。(如身高、體重、血壓、溫度等)定性數(shù)據(jù),也稱計(jì)數(shù)資料,指將觀測單位按某種屬性分組計(jì)數(shù)的定性觀測結(jié)果。涉及二分類、無序多分類。(進(jìn)一步分為二分類和多分類,如性別分為男和女,血型分為A、B、O、AB等)有序數(shù)據(jù),也稱半定量數(shù)據(jù)或等級資料,指將觀測單位按某種屬性的不同限度或順序提成等級后分組計(jì)數(shù)的觀測結(jié)果,具有半定量性質(zhì)。記錄方法的選用與數(shù)據(jù)類型有密切的關(guān)系。(3)總體與樣本總體,指根據(jù)研究目的擬定的所有同質(zhì)觀測單位的全體,涉及所有定義范圍內(nèi)的個(gè)體變量值。樣本,是從研究總體中隨機(jī)抽取部分有代表性的觀測單位,對變量進(jìn)行觀測得到的數(shù)據(jù)。抽樣,是從研究總體中隨機(jī)抽取部分有代表性的觀測單位。參數(shù),指描述總體特性的指標(biāo)。記錄量,指描述樣本特性的指標(biāo)。(4)誤差誤差,指觀測值與真實(shí)值、記錄量與參數(shù)之間的差別??煞譃槿N:系統(tǒng)誤差,也稱記錄偏倚,是某種必然因素所致,不是偶爾機(jī)遇導(dǎo)致的,誤差的大小通常恒定,具有明確的方向性。隨機(jī)測量誤差,是偶爾機(jī)遇所致,誤差沒有固定的大小和方向。抽樣誤差,是抽樣引起的記錄量與參數(shù)間的差異。抽樣誤差重要來源于個(gè)體的變異。記錄學(xué)重要研究抽樣誤差。(5)概率概率,是描述某事件發(fā)生也許性大小的量度。必然事件,事件肯定發(fā)生,概率P(U)=1;隨機(jī)事件,事件也許發(fā)生,也許不發(fā)生,概率介于0≤P(A)≤1;不也許事件,事件肯定不發(fā)生,概率P(∮)=0;小概率事件,事件發(fā)生的也許性很小,概率P(A)≤0.05、或P(A)≤0.01。醫(yī)學(xué)科研中,P(A)≤0.05作為事物差別有記錄意義,P(A)≤0.01作為事物差別有高度記錄意義。第二章定量數(shù)據(jù)的記錄描述定量數(shù)據(jù)的記錄描述方法:頻數(shù)表、直方圖、記錄指標(biāo)。(1)頻數(shù)分布頻數(shù)分布的目的:了解數(shù)據(jù)的分布范圍、集中位置以及分布形態(tài)等特性,以便根據(jù)資料分布情況選擇合適的記錄方法。頻數(shù)分布的用途:①作為陳述資料的形式;②便于觀測數(shù)據(jù)的分布類型;③便于發(fā)現(xiàn)數(shù)據(jù)中特大或特小的可疑值;④當(dāng)樣本量大時(shí),可用各組段的頻率作為概率的估計(jì)值。計(jì)算全距(range,R):是一組數(shù)據(jù)的最大值與最小值之差。R=Max-Min擬定組數(shù)與組距樣本量在100例左右,組數(shù)選擇8~15之間,一般取10組左右。組距≈全距/組數(shù)擬定組限第一組段必須涉及最小值,最后一組段必須涉及最大值。最后一組段涉及最大值,且一般情況下應(yīng)包含該組段上限,其余各組段區(qū)間左閉右開。計(jì)算各組段頻數(shù)(frequency):即計(jì)算各組段內(nèi)觀測值的個(gè)數(shù)。計(jì)算各組段頻率(percent):即計(jì)算各組段頻數(shù)與總觀測值個(gè)數(shù)之比,用百分?jǐn)?shù)表達(dá)。計(jì)算累計(jì)頻數(shù)(cumulativefrequency)和累計(jì)頻率(cumulativepercent):累計(jì)頻數(shù)是由上至下將頻數(shù)累加;累計(jì)頻率是由上至下將頻率累加。(2)直方圖直方圖,是以垂直條段代表頻數(shù)分布的一種圖形。(3)頻數(shù)分布表的用途1、作為稱述資料的形式,可以代替原始資料,便于進(jìn)一步分析。2、便于觀測數(shù)據(jù)的分布類型。資料分布類型分為:對稱分布和偏態(tài)分布。在記錄分析時(shí)常需要根據(jù)資料的分布形式選擇相應(yīng)的記錄分析方法,因此對數(shù)據(jù)分布形式的鑒定非常重要。3、便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小值。4、當(dāng)樣本含量比較大時(shí),可用各組段的頻率作為概率的估計(jì)值。集中趨勢的記錄指標(biāo)平均數(shù),是描述一組觀測值集中位置或平均水平的記錄指標(biāo),常作為一組數(shù)據(jù)的代表值用于分析和進(jìn)行組間的比較。常用的有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)等。算術(shù)均數(shù),等于一個(gè)變量所有觀測值的和除以觀測值個(gè)數(shù)??傮w均數(shù)用希臘字母μ表達(dá),樣本均數(shù)用符號Χ拔表達(dá)。算術(shù)均數(shù)合用于對稱分布的資料,如分布均勻的小樣本數(shù)據(jù)或近似正態(tài)分布的大樣本數(shù)據(jù)。算術(shù)均數(shù)易受極端值的影響,并且受極大值的影響大于受極小值的影響。幾何均數(shù)幾何均數(shù)(geometricmean,G),等于一個(gè)變量所有n個(gè)觀測值的乘積的n次方根。幾何均數(shù)合用于取對數(shù)后近似呈對稱分布的資料,特別是右偏態(tài)分布數(shù)據(jù)。醫(yī)學(xué)研究中常用于比例數(shù)據(jù)。【注】計(jì)算幾何均數(shù)的觀測值不能小于或等于0,由于無法求對數(shù)。中位數(shù)中位數(shù)(median,M),是在按大小順序排列的變量的所有觀測值中,位于正中間的一個(gè)或兩個(gè)數(shù)值。當(dāng)數(shù)據(jù)呈偏態(tài)分布、或頻數(shù)分布兩端無擬定數(shù)值,均宜采用中位數(shù)描述集中趨勢。中位數(shù)的擬定取決于它在數(shù)據(jù)序列中的位置,因此對極端值不敏感。百分位數(shù)百分位數(shù)(percentile),是一個(gè)位置指標(biāo),它將一組變量值排列后劃分為若干相等部分的分割點(diǎn)數(shù)值。用Px表達(dá),X用百分?jǐn)?shù)表達(dá)。表達(dá)在按照升序排列的數(shù)據(jù)中,其左側(cè)(≤Px)的觀測值個(gè)數(shù)在整個(gè)樣本中所占比例為X%,其右側(cè)(≥Px)的觀測值個(gè)數(shù)在整個(gè)樣本中所占比例為(100-X)%。百分位數(shù)不管資料分布類型均可計(jì)算,在實(shí)際工作中常用于擬定醫(yī)學(xué)參考值范圍;在假設(shè)檢查中用作拒絕或不拒絕檢查假設(shè)的界值。百分位數(shù)并非由所有觀測值綜合計(jì)算得來,因此,它不如均數(shù)和標(biāo)準(zhǔn)差精確;然而中間部分的百分位數(shù)因不受資料中個(gè)別極端數(shù)據(jù)的影響,具有較好的穩(wěn)定性。小結(jié)指標(biāo)意義合用場合均數(shù)個(gè)體的平均值對稱分布,特別是正態(tài)分布資料。幾何均數(shù)平均倍數(shù)取對數(shù)后對稱分布。中位數(shù)位次居中的觀測值①非對稱分布;②半定量資料;③末端無確切數(shù)值;④分布不明。變異限度的記錄指標(biāo)變異指標(biāo),又稱離散指標(biāo),用以描述一組計(jì)量資料各觀測值之間參差不齊的限度。變異指標(biāo)越大,觀測值之間差異愈大,說明變異限度越大;反之亦然。常用的有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。極差極差(range,R),等于一個(gè)變量所有觀測值中最大值與最小值之間的差值。R=Max-Min缺陷:①沒有運(yùn)用觀測值的所有信息,不能反映其它數(shù)據(jù)的離散度;②各樣本含量大小懸殊時(shí),不宜比較其極差;③極差的抽樣誤差也較大,所以不夠穩(wěn)定。極差僅合用于對未知分布的小樣本資料作粗略的分析。四分位數(shù)間距四分位數(shù),是記錄學(xué)對特殊的三個(gè)百分位數(shù)P25%、P50%和P75%的統(tǒng)稱四分位數(shù)間距(quartilerange,Q),等于第三四分位數(shù)與第一四分位數(shù)之間的差值。Q=P75%-P25%缺陷:①沒有運(yùn)用觀測值的所有信息,不能反映其它數(shù)據(jù)的離散度;四分位數(shù)間距僅用來描述大樣本偏態(tài)資料的變異情況。方差方差(variance),是描述一個(gè)變量的所有觀測值與總體均數(shù)的平均離散限度的指標(biāo)??傮w方差用σ2表達(dá),樣本方差用S2表達(dá)。標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standarddeviation,S),是描述一個(gè)變量的所有觀測值與均數(shù)的平均離散限度的指標(biāo)??傮w標(biāo)準(zhǔn)差用σ表達(dá),樣本標(biāo)準(zhǔn)差用S表達(dá)。標(biāo)準(zhǔn)差方差或標(biāo)準(zhǔn)差屬同類變異指標(biāo),它們多用來描述均勻分布或近似正態(tài)分布的資料,大、小樣本均可,其中以標(biāo)準(zhǔn)差的應(yīng)用最廣,通常與均數(shù)結(jié)合使用。比如在許多醫(yī)學(xué)研究報(bào)告中常用X拔±S的形式表達(dá)資料。變異系數(shù)變異系數(shù)(coefficientofvariation,CV),是一個(gè)度量相對離散限度的指標(biāo)。CV是無量綱的指標(biāo),可以用來比較幾個(gè)量綱不同的指標(biāo)變量之間的離散限度的差異,或比較量綱相同但均數(shù)相差懸殊的變量之間的離散限度的差異。小結(jié)指標(biāo)意義合用場合極差觀測值的取值范圍不拘分布形式,概略分析。四分位數(shù)間距居中半數(shù)觀測值的極差①非對稱分布;②半定量資料;③末端無確切數(shù)值;④分布不明。標(biāo)準(zhǔn)差
(方差)觀測值距離均數(shù)的平均限度對稱分布,特別是正態(tài)分布資料。變異系數(shù)變異限度大小的對比①不同量綱的變量間比較;②量綱相同但數(shù)量級相差懸殊的變量間比較。第三章正態(tài)分布與醫(yī)學(xué)參考值范圍正態(tài)分布,是一種連續(xù)型隨機(jī)變量常見而重要的分布。正態(tài)曲線,是一條高峰位于中央,兩側(cè)逐漸下降并完全對稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。假如隨機(jī)變量X的分布服從概率密度函數(shù)和概率分布函數(shù)稱連續(xù)型隨機(jī)變量X服從正態(tài)分布,記為X~N(μ,σ2)。π為圓周率,
e為自然對數(shù)的底值,?σ為總體標(biāo)準(zhǔn)差,?μ為總體均數(shù)。正態(tài)分布的特性1、正態(tài)分布是單峰分布,以X=μ為中心,左右完全對稱,正態(tài)曲線以X軸為漸近線,兩端與X軸不相交。2、正態(tài)曲線在X=μ處有最大值,其值為f(μ)=1/(μ√2π);X越遠(yuǎn)離μ,f(X)值越小,在X=μ±σ處有拐點(diǎn),呈現(xiàn)鐘形。3、正態(tài)分布完全由參數(shù)μ和σ決定。μ是位置參數(shù),決定正態(tài)曲線在X軸上的位置。在σ一定期,μ增大,曲線沿橫軸向右移動;μ較小,曲線沿橫軸向左移動。σ是形狀參數(shù),決定正態(tài)曲線的分布形態(tài)。σ越大,曲線的形狀越“矮胖”,表達(dá)數(shù)據(jù)分布越分散;σ越小,曲線的形狀越“瘦高”,表達(dá)數(shù)據(jù)分布越集中。正態(tài)曲線下面積分布規(guī)律1、服從正態(tài)分布的隨機(jī)變量在某一區(qū)間上的曲線下面積與其在同一區(qū)間上取值的概率相等。2、曲線下的總面積為1或100%,以μ為中心左右兩側(cè)面積各占50%,越靠近μ處曲線下面積越大,兩邊逐漸減少。3、所有的正態(tài)曲線,在μ左右的任意個(gè)標(biāo)準(zhǔn)差范圍內(nèi)面積相同。一些特殊情況,在μ±σ范圍內(nèi)的面積約為68.27%,在μ±1.96σ范圍內(nèi)的面積約為95.00%,在μ±2.58σ范圍內(nèi)的面積約為99.00%。標(biāo)準(zhǔn)正態(tài)分布對任意一個(gè)服從N(μ,σ2)分布的隨機(jī)變量X,經(jīng)Z=X-μ/σ變換都可以轉(zhuǎn)為μ=0、σ=1的標(biāo)準(zhǔn)正態(tài)分布,也稱隨機(jī)變量的標(biāo)準(zhǔn)化變換。標(biāo)準(zhǔn)正態(tài)分布的應(yīng)用實(shí)際應(yīng)用中,經(jīng)z變換可把求解任意一個(gè)正態(tài)分布曲線下面積的問題,轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布曲線下相應(yīng)面積的問題。正態(tài)分布的應(yīng)用1、制定醫(yī)學(xué)參考值范圍2、質(zhì)量控制3、正態(tài)分布是很多記錄方法的理論基礎(chǔ)醫(yī)學(xué)參考值范圍醫(yī)學(xué)參考值范圍,指正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動范圍。醫(yī)學(xué)參考值范圍,習(xí)慣上是包含95%的參照總體的范圍。制訂的注意事項(xiàng)a、抽取足夠例數(shù)的同質(zhì)“正常人”樣本★“正常人”的定義,樣本量(n>120),隨機(jī)化。b、擬定具有實(shí)際意義的統(tǒng)一測量標(biāo)準(zhǔn)★指標(biāo)的測量方法等要有規(guī)定,控制測量誤差。c、根據(jù)指標(biāo)的性質(zhì)擬定是否要分組★根據(jù)實(shí)際情況、專業(yè)知識。d、根據(jù)指標(biāo)含義決定單、雙側(cè)范圍★單側(cè)下限,過低異常;單側(cè)上限,過高異常;雙側(cè),過高、過低均異常。e、選擇適當(dāng)?shù)陌俜址秶锝^大多數(shù)人,一般80%、90%、95%、99%;★減少誤診,取較大范圍;減少漏診,取較小范圍。f、估計(jì)參考值范圍★根據(jù)資料分布類型:正態(tài)分布法、百分位數(shù)法。第四章定性數(shù)據(jù)的記錄描述相對數(shù),是兩個(gè)有關(guān)的絕對數(shù)之比,也可以是兩個(gè)記錄指標(biāo)之比。計(jì)算相對數(shù)的意義重要是把基數(shù)化作相等,便于互相比較。相對數(shù)重要用于定性資料的記錄描述。常用的指標(biāo)有頻率、構(gòu)成比、相對比。頻率頻率(rate),表達(dá)在一定范圍內(nèi)某現(xiàn)象的發(fā)生數(shù)與也許發(fā)生的總數(shù)之比,說明某現(xiàn)象出現(xiàn)的頻率或概率??傮w率用π來表達(dá),樣本率用P來表達(dá)。需要注意的是,率在更多情況下是一個(gè)具有時(shí)間概念的指標(biāo),即用于說明在一段時(shí)間內(nèi)某現(xiàn)象發(fā)生的強(qiáng)度或頻率。構(gòu)成比構(gòu)成比,表達(dá)某事物內(nèi)部各組成部分在整體中所占的比重。構(gòu)成比之和應(yīng)為100%,某一構(gòu)成部分的增減會影響其他構(gòu)成部分相應(yīng)的減少或增長;而某一部分率的變化并不影響其他部分率的變化,且其平均率不能簡樸地將各率相加后平均求得。相對比相對比,是A、B兩個(gè)有關(guān)聯(lián)指標(biāo)之比,用以描述兩者的對比水平。相對危險(xiǎn)度(relativerisk,RR),用于流行病學(xué)中隊(duì)列研究資料。比數(shù)比(oddsrat(yī)io,OR),用于流行病學(xué)中病例對照研究資料。小結(jié)指標(biāo)計(jì)算公式合用場合頻率n/N估計(jì)總體中某一結(jié)局發(fā)生的概率或也許性構(gòu)成比n1/N,n2/N,…,nk/N估計(jì)總體中所有也許結(jié)局所占的比例或比重相對比A/B估計(jì)兩個(gè)指標(biāo)的相對大小構(gòu)成比表達(dá)某事物內(nèi)部各部分所占的比例或比重,頻率是表白某現(xiàn)象發(fā)生的頻率或概率。構(gòu)成比的分子中的個(gè)體一定是分母中的一部分,而相對比則不一定;構(gòu)成比是同一類事物的數(shù)值之比,相對比可以是任意兩個(gè)數(shù)值之比。相對數(shù)的使用注意a、區(qū)別構(gòu)成比和頻率★頻率,強(qiáng)度相對數(shù);構(gòu)成比,結(jié)構(gòu)相對數(shù)。b、使用相對數(shù)時(shí)分母不宜過小★如分母太小,用絕對數(shù)表達(dá),如“3例中死亡1例”。c、注意相對數(shù)的可比性★研究對象要同質(zhì),方法要相同,觀測時(shí)期要一致等。d、考慮存在抽樣誤差★對總體進(jìn)行推斷應(yīng)作記錄學(xué)檢查。率的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化率,是為了在比較兩個(gè)不同人群的患病率、發(fā)病率、死亡率等資料時(shí),消除內(nèi)部構(gòu)成(如年齡、性別、工齡、病程長短等)不同而不能直接比較所產(chǎn)生的影響。標(biāo)準(zhǔn)化率僅用于互相比較,不代表實(shí)際水平;當(dāng)標(biāo)準(zhǔn)構(gòu)成不同時(shí),標(biāo)準(zhǔn)化率一般也不相同。標(biāo)準(zhǔn)構(gòu)成的選取★從外部取一個(gè)公認(rèn)的標(biāo)準(zhǔn)構(gòu)成比,如全國范圍或全省范圍的數(shù)據(jù)、國際間比較時(shí)取世界通用標(biāo)準(zhǔn)?!飳讉€(gè)組的觀測例數(shù)合并,計(jì)算出合并的構(gòu)成比,以其作為標(biāo)準(zhǔn)構(gòu)成比。★取某一個(gè)組的構(gòu)成比為標(biāo)準(zhǔn)構(gòu)成比。醫(yī)學(xué)中常用相對數(shù)指標(biāo)死亡率,又稱粗死亡率,表達(dá)某年某地每千人中的死亡人數(shù)。反映本地居民總體死亡水平。對不同地區(qū)的死亡率進(jìn)行比較時(shí),應(yīng)注意不同地區(qū)人口年齡或性別構(gòu)成的影響。若年齡或性別構(gòu)成存在差異,需先將死亡率標(biāo)化后再進(jìn)行比較。年齡別死亡率,表達(dá)某年某地某年齡組每千人口中的死亡數(shù)。死因別死亡率,表達(dá)某年某地每10萬人中因某種疾病死亡的人數(shù)。反映各類病傷死亡對居民生命的危害限度。死亡(因)構(gòu)成,也稱相對死亡比,表達(dá)所有死亡人數(shù)中,死于某死因者占總死亡數(shù)的比例。反映各種死因的相對重要性。疾病記錄指標(biāo)發(fā)病率,表達(dá)在一定期間內(nèi),一定人群中某病新發(fā)生的病例出現(xiàn)的頻率。反映疾病對人群健康影響和描述疾病分布狀態(tài)的一項(xiàng)測量指標(biāo)。患病率,也稱現(xiàn)患率,表達(dá)某一時(shí)點(diǎn)某人群中患某病的頻率。反映病程較長的慢性病的發(fā)生或流行情況。病死率,表達(dá)某期間內(nèi),某病患者中因某病死亡的頻率。反映該疾病的嚴(yán)重限度和醫(yī)療水平。治愈率,表達(dá)接受治療的病人中治愈的頻率。第五章登記表與記錄圖登記表,把反映某事物的數(shù)量特性以及互相關(guān)系的記錄數(shù)字用表格的形式歸納起來。特點(diǎn):①避免冗長的文字?jǐn)⑹觥p少篇幅;②便于表達(dá)事物間的內(nèi)在聯(lián)系和區(qū)別;③便于分析、比較并易于發(fā)現(xiàn)和糾正錯(cuò)誤。編制原則a、重點(diǎn)突出,簡樸明了★一張表表達(dá)一個(gè)中心內(nèi)容或主題。b、主謂分明,層次清楚★定語在標(biāo)題內(nèi),主語作為橫標(biāo)目,謂語作為縱標(biāo)目。c、數(shù)據(jù)表達(dá)規(guī)范、文字和線條從簡結(jié)構(gòu)a、標(biāo)題★位于登記表的最上部,應(yīng)涉及表的編號。b、標(biāo)目★縱標(biāo)目的示相應(yīng)一列(或數(shù)列)的內(nèi)容;橫標(biāo)目的示相應(yīng)行的內(nèi)容。c、線條★不宜太多,一般為三線表;★不允許使用豎線與斜線。d、數(shù)字★一律使用阿拉伯?dāng)?shù)字;★同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次要對齊;★數(shù)值為零時(shí)應(yīng)寫“0”,缺省用“…”表達(dá),不存在或不需要用“—”表達(dá)。e、備注★不是登記表的必須項(xiàng)目,需要時(shí)才用;★位于登記表的最下部,表格之外,用“*”號標(biāo)出。記錄圖記錄圖,是指用幾何圖形(點(diǎn)、線段、直條等)顯示記錄指標(biāo)的大小、對比關(guān)系或變化趨勢。特點(diǎn):與登記表相比,記錄圖更加直觀,更便于比較和分析。但它不能確切地顯示數(shù)字大小,因此常與登記表一并使用。常用的記錄圖有:條圖、圓圖、百分條圖、線圖、直方圖等。制作原則a、根據(jù)資料性質(zhì)、分析目的選用適當(dāng)?shù)挠涗泩Db、一個(gè)圖表達(dá)一個(gè)中心內(nèi)容或主題。c、圖形應(yīng)準(zhǔn)確、美觀。結(jié)構(gòu)a、標(biāo)題★位于記錄圖的下方,應(yīng)涉及圖的編號。b、圖域★一般用直角坐標(biāo)系第一象限的位置表達(dá)圖域。c、標(biāo)目★縱標(biāo)目和橫標(biāo)目,表達(dá)縱軸和橫軸數(shù)字刻度;★一般有度量衡單位。d、圖例★對圖中不同顏色或圖案代表的指標(biāo)進(jìn)行注釋;★圖例放在橫標(biāo)目與標(biāo)題之間,或放在圖域中。e、刻度★刻度數(shù)值從小到大,縱軸由下向上,橫軸由左向右。描述定量數(shù)據(jù)的記錄圖直方圖,用于表達(dá)連續(xù)變量頻數(shù)分布情況。線圖,合用于描述一個(gè)變量隨另一個(gè)變量變化的趨勢。半對數(shù)線圖,用來比較事物之間相對的變化速度。箱圖,合用于比較多組資料的集中趨勢和離散趨勢。一般選用五個(gè)描述記錄量(Min、P25、M、P75、Max)來繪制。誤差條圖,合用于比較多組資料的均值和可信區(qū)間。散點(diǎn)圖,用點(diǎn)的密集限度和變化趨勢來表達(dá)兩指標(biāo)之間的直線或曲線關(guān)系。條圖,合用于各組資料之間指標(biāo)的比較。圓圖,描述一組構(gòu)成比資料。百分條圖,描述多組構(gòu)成比資料小結(jié)圖形重要目的說明條圖比較各組之間的記錄指標(biāo)的差別一個(gè)坐標(biāo)軸為組名稱,另一個(gè)坐標(biāo)軸為頻率;多個(gè)指標(biāo)變量可放在一個(gè)圖中圓圖描述變量的構(gòu)成比沒有坐標(biāo)軸;用圖例區(qū)分各部分百分條圖比較多個(gè)指標(biāo)變量的構(gòu)成比一個(gè)坐標(biāo)軸為各變量名稱,另一個(gè)坐標(biāo)軸刻度為0~100%;用圖例區(qū)分各部分線圖描述一個(gè)變量隨另一個(gè)變量變化的趨勢兩個(gè)變量的觀測值必須一一相應(yīng);橫軸為自變量,縱軸為因變量半對數(shù)線圖同上因變量的變異較大時(shí)使用;其他同上箱圖比較一個(gè)變量在多個(gè)組上的分布一個(gè)坐標(biāo)軸為組名稱,另一個(gè)坐標(biāo)軸為該變量的取值散點(diǎn)圖描述兩個(gè)指標(biāo)變量之間的直線相關(guān)關(guān)系兩個(gè)變量的觀測值可以不一一相應(yīng);橫軸為自變量,縱軸為因變量第六章參數(shù)估計(jì)抽樣誤差:由個(gè)體差異和抽樣導(dǎo)致的樣本記錄量與總體參數(shù)的差異。涉及:樣本記錄量與總體參數(shù)間的差異,樣本記錄量間的差異。具有如下特點(diǎn):1、各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異;3、樣本均數(shù)的分布圍繞著總體均數(shù)呈現(xiàn)中間多、兩邊少、左右基本對稱,近似服從正態(tài)分布;4、樣本均數(shù)的變異范圍較之原變量的變異范圍小;5、隨著樣本含量的增大,樣本均數(shù)的變異范圍逐漸縮小。均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(standarderror,SE),指樣本記錄量的標(biāo)準(zhǔn)差。均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM),指樣本均數(shù)的標(biāo)準(zhǔn)誤。它反映樣本均數(shù)間的離散限度,反映樣本均數(shù)與相應(yīng)總體均數(shù)間的差異,說明了均數(shù)抽樣誤差的大小。在n一定的情況下,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比,說明當(dāng)總體中各觀測值變異較小時(shí),抽到的X拔與μ也許相差較小,X拔用估計(jì)μ的可靠限度高;反之,當(dāng)總體中各觀測值變異較大時(shí),可靠限度較低。標(biāo)準(zhǔn)誤與樣本含量的平方根呈反比,說明在同一總體中隨機(jī)抽樣,n越大,標(biāo)準(zhǔn)誤越小。率的抽樣誤差率的標(biāo)準(zhǔn)誤(standarderrorofrate,SER),指樣本率的標(biāo)準(zhǔn)誤。它反映樣本率間的離散限度,反映樣本率與相應(yīng)總體率間的差異,說明了率抽樣誤差的大小。總體率標(biāo)準(zhǔn)誤用σp表達(dá),樣本率標(biāo)準(zhǔn)誤用Sp表達(dá)。總體均數(shù)的估計(jì)概述點(diǎn)估計(jì)(pointestimation),是用樣本記錄量直接作為其總體參數(shù)的估計(jì)值。區(qū)間估計(jì)(intervalestimat(yī)ion),是按預(yù)先給定的概率(1-α)所擬定的包含未知總體參數(shù)的一個(gè)范圍。點(diǎn)估計(jì):優(yōu)點(diǎn):表達(dá)簡樸缺陷:未考慮抽樣誤差,無法評價(jià)參數(shù)估計(jì)的準(zhǔn)確限度可信區(qū)間在區(qū)間估計(jì)中,預(yù)先給定的概率(1-α),稱為可信度(confidencelevel),常取95%或99%。通過可信度,計(jì)算得到的區(qū)間范圍,稱為可信區(qū)間(confidenceinterval,CI)。可信區(qū)間由兩個(gè)數(shù)值界定的可信限(confidencelimit,CL)構(gòu)成,較小的數(shù)值為下限(lowerlimit,L),較大的數(shù)值為上限(upperlimit,U),一般表達(dá)為L~U。可信度為95%可信區(qū)間的涵義:若反復(fù)100次樣本含量相同的抽樣,每個(gè)樣本均按同一方法構(gòu)建95%可信區(qū)間,則理論上平均有95個(gè)可信區(qū)間包含了總體均數(shù),只有5個(gè)可信區(qū)間未包含。可信區(qū)間估計(jì)的優(yōu)劣:準(zhǔn)確性,反映可信度1-α的大小,其值越接近1越好。精確性,用可信區(qū)間的寬度CU-CL衡量,寬度越小越好。t分布t分布:重要用于總體均數(shù)的區(qū)間估計(jì)和t檢查等。ν為自由度(degreeoffreedom,df),指可以自由取值的變量個(gè)數(shù)。t分布的特點(diǎn):1、t分布圖是一簇曲線,曲線的形態(tài)變化與自由度有關(guān)。2、隨ν的增大,曲線越來越接近標(biāo)準(zhǔn)正態(tài)分布曲線;3、當(dāng)ν→∞時(shí),t分布的極限分布就是標(biāo)準(zhǔn)正態(tài)分布。4、t分布的密度曲線下面積有一定的規(guī)律性。在t界值表中,橫標(biāo)目為自由度,縱標(biāo)目為尾部概率。一側(cè)尾部面積稱為單側(cè)概率(one-tailedprobability),兩側(cè)尾部面積之和稱為雙側(cè)概率(two-tailedprobability)。從t界值表中看出:在相同自由度時(shí),│t│值越大,概率P越小。小結(jié)估計(jì)絕大多數(shù)觀測對象某項(xiàng)指標(biāo)的分布范圍估計(jì)絕大多數(shù)觀測對象某項(xiàng)指標(biāo)的分布范圍估計(jì)總體均數(shù)用途n越大,參考值范圍越穩(wěn)定n越大,CI越?。籲→∞,CI→0樣本量
的作用正態(tài)分布:±zα/2S(雙側(cè))偏態(tài)分布:Px~P100-x(雙側(cè))σ未知:σ已知或σ未知但n>60:計(jì)算
公式“正常人”的解剖,生理,生化等某項(xiàng)指標(biāo)的波動范圍。個(gè)體值的波動范圍按預(yù)先給定的概率擬定的未知參數(shù)μ的也許范圍??傮w均數(shù)的波動范圍含義參考值范圍總體均數(shù)的可信區(qū)間區(qū)別點(diǎn)兩總體均數(shù)差值的區(qū)間估計(jì)在實(shí)際工作中,經(jīng)常需要估計(jì)兩總體均數(shù)之差μ1-μ2的大小,需估計(jì)兩總體均數(shù)差值的可信區(qū)間。總體率的區(qū)間估計(jì)小樣本率的區(qū)間估計(jì):在樣本例數(shù)較小,且樣本率接近1或0時(shí),運(yùn)用二項(xiàng)分布可估計(jì)其總體率的(1-α)可信區(qū)間。當(dāng)n≤50,樣本例數(shù)n和陽性例數(shù)X≤n/2時(shí),直接查表得到95%和99%可信區(qū)間。當(dāng)陽性例數(shù)X>n/2時(shí),用n-X查表,獲得總體陰性率可信區(qū)間,再用1減去總體陰性率可信區(qū)間,既為總體陽性率可信區(qū)間。大樣本率的區(qū)間估計(jì)在樣本例數(shù)較大,且p和1-p均不太小,如np與n(1-p)均大于5時(shí),樣本率p的抽樣分布近似正態(tài)分布,可按正態(tài)分布近似法求總體率的(1-α)可信區(qū)間。兩總體率差值的區(qū)間估計(jì)設(shè)兩樣本率分別為p1和p2,當(dāng)n1與n2均較大,且p1,1-p1及p2,1-p2均不太小,如n1p1、n1(1-p1)、n2p2、n2(1-p2)均大于5時(shí),可采用正態(tài)近似法對兩總體率差值進(jìn)行可信區(qū)間估計(jì)。第七章假設(shè)檢查假設(shè)檢查(hypothesistesting)也稱顯著性檢查(significancetest),是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別導(dǎo)致的記錄推斷方法。假設(shè)檢查的基本思想反證法思想:先提出假設(shè),再用適當(dāng)?shù)挠涗浄椒〝M定假設(shè)成立的也許性大小,如也許性小,則認(rèn)為假設(shè)不成立。小概率事件:是指在一次實(shí)驗(yàn)中基本上不大會發(fā)生的事件。假設(shè)檢查的基本環(huán)節(jié)建立假設(shè)無效假設(shè)(nullhypothesis),記為H0,指需要檢查的假設(shè),即μ1=μ2。擬定檢查水準(zhǔn)檢查水準(zhǔn)(levelofatest)也稱為顯著性水準(zhǔn)(significancelevel),是預(yù)先規(guī)定的判斷小概率事件的概率尺度,記為α。實(shí)際中一般取α=0.05或α=0.01。c、選擇檢查方法,計(jì)算記錄量根據(jù)資料類型、研究設(shè)計(jì)方案和記錄推斷的目的,選擇適當(dāng)?shù)臋z查方法和計(jì)算公式。如:t檢查、u檢查、F檢查、χ2檢查。擬定P值,作出記錄推斷結(jié)論P(yáng)值(probabilityvalue),指由H0所規(guī)定的總體做反復(fù)隨機(jī)抽樣,獲得等于及大于當(dāng)前檢查記錄量的概率。擬定P值的方法:依據(jù)檢查記錄量的自由度、檢查水準(zhǔn),查檢查記錄量相應(yīng)的界值表,通過檢查界值,得到與檢查記錄量相相應(yīng)的P值范圍。如:u0.05/2=1.96相應(yīng)的P值為0.05。擬定P值,作出記錄推斷結(jié)論假設(shè)檢查規(guī)定:假如一次實(shí)驗(yàn)結(jié)果P≤α,拒絕H0,結(jié)論為“差別有記錄學(xué)意義”。P≥α,不拒絕H0,結(jié)論為“差別沒有記錄學(xué)意義”。P值的習(xí)慣表述:P>0.05稱“不顯著”(notsignificant);P≤0.05稱“顯著”(significant);P≤0.01稱“非常顯著”(highlysignificant)。假設(shè)檢查中兩類錯(cuò)誤假設(shè)檢查是運(yùn)用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立,然后在假定H0成立的條件下計(jì)算檢查記錄量,最后根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕H0,都也許犯錯(cuò)誤。檢查效能(poweroftest),指當(dāng)兩總體確有差別,按α水準(zhǔn),假設(shè)檢查能發(fā)現(xiàn)其差別的能力。記為1-β。α愈小,β愈大;α愈大,β愈小。若要同時(shí)減小Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤,唯一方法是增長樣本量。第七章單樣本t檢查(onesamplet-test),合用于樣本均X拔與已知均數(shù)μ0的比較,目的是檢查樣本均數(shù)μ0所代表的未知總體均數(shù)μ是否與已知總體均數(shù)μ0有差別。已知總體均數(shù)μ0一般指理論值、標(biāo)準(zhǔn)值或通過大量觀測所得到的穩(wěn)定值。配對樣本均數(shù)t檢查(pairedt-test),合用于配對設(shè)計(jì)的計(jì)量資料兩相關(guān)樣本均數(shù)的比較,目的是檢查兩相關(guān)樣本均數(shù)所代表的未知總體均數(shù)是否有差別。配對設(shè)計(jì)(paireddesign),是將受試對象按某些重要特性相近的原則配成對子,每對中的兩個(gè)個(gè)體隨機(jī)地給予兩種解決。配對設(shè)計(jì)解決分派方式:將同一受試對象解決前后的結(jié)果進(jìn)行比較;同一受試對象隨機(jī)分派接受不同解決;同一標(biāo)本的兩個(gè)部位測試同一指標(biāo);兩個(gè)同質(zhì)受試對象分別接受兩種解決。兩獨(dú)立樣本均數(shù)t檢查(twoindependentsamplest-test),合用于完全隨機(jī)設(shè)計(jì)兩獨(dú)立樣本均數(shù)的比較,目的是檢查兩獨(dú)立樣本均數(shù)所代表的未知總體均數(shù)是否有差別。完全隨機(jī)設(shè)計(jì)(completelyrandomdesign):從某研究總體隨機(jī)抽取一定數(shù)量的研究對象,將其隨機(jī)分派到兩組,接受不同的解決后,測量某指標(biāo)后進(jìn)行組間比較。兩獨(dú)立樣本均數(shù)t檢查規(guī)定兩樣本所代表的總體方差相等,即方差齊性注意事項(xiàng):a、假設(shè)檢查結(jié)論對的的前提★作假設(shè)檢查用的樣本資料,必須能代表相應(yīng)的總體,各對比組具有良好的組間均衡性。b、檢查方法的選用及其合用條件★根據(jù)分析目的、研究設(shè)計(jì)、資料類型、樣本量大小等選用適當(dāng)?shù)臋z查方法。c、雙側(cè)檢查與單側(cè)檢查的選擇★根據(jù)研究目的和專業(yè)知識予以選擇,一般選用雙側(cè)檢查。d、假設(shè)檢查的結(jié)論不能絕對化★列出概率的確切數(shù)值或給出范圍,注明采用單側(cè)檢查還是雙側(cè)檢查。e、對的理解P值的記錄意義第八章方差分析方差分析,能用于兩個(gè)或兩個(gè)以上樣本均數(shù)的比較,還可分析兩個(gè)或多個(gè)研究因素的交互作用以及線性回歸方程的假設(shè)檢查等?;舅枷胧牵悍治鲎儺悾簿褪欠纸庾儺?,即將數(shù)據(jù)總的變異分解為解決因素引起的變異和隨機(jī)誤差引起的變異,通過對兩者進(jìn)行比較作出解決因素有無作用的記錄推斷。應(yīng)用條件各組樣本是互相獨(dú)立的隨機(jī)樣本各組樣本都來自正態(tài)總體。各組總體方差相等,即方差齊性。完全隨機(jī)設(shè)計(jì)的方差分析完全隨機(jī)設(shè)計(jì),是按一個(gè)解決因素隨機(jī)分組,記錄分析解決因素各個(gè)水平組間均數(shù)差別有無記錄學(xué)意義。變異的分解自由度分解估計(jì)方差(均方)F記錄量的計(jì)算F分布及擬定P值隨機(jī)區(qū)組設(shè)計(jì)的方差分析隨機(jī)區(qū)組設(shè)計(jì)(randomizedblockdesign),是先按對實(shí)驗(yàn)結(jié)果有影響的非研究因素將受試對象配成若干個(gè)區(qū)組,再分別將各區(qū)組內(nèi)的受試對象隨機(jī)分派到解決水平不同的各個(gè)組。多個(gè)樣本均數(shù)的兩兩比較經(jīng)方差分析,若各組的均數(shù)差別無記錄學(xué)意義,則不需要作進(jìn)一步的記錄解決,但是當(dāng)方差分析結(jié)果為P<α?xí)r,只說明各組總體均數(shù)不相同或不全相同,不能說明各組總體均數(shù)間有差別。假如要分析哪兩組間均數(shù)有差別,需進(jìn)行多組均數(shù)間的多重比較。多個(gè)樣本均數(shù)兩兩比較方法選擇策略第九章卡方檢查方差齊性檢查的作用:Bartlett檢查法重要合用于正態(tài)分布資料的方差齊性檢查問題??ǚ綑z查常用于推斷兩個(gè)總體率(或構(gòu)成比)之間有無差別。χ2值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合限度。若假設(shè)成立,實(shí)際頻數(shù)與理論頻數(shù)的差值較小,χ2值也較小;若假設(shè)不成立,實(shí)際頻數(shù)與理論頻數(shù)的差值較大,χ2值也較大。配對四格表資料的卡方檢查計(jì)數(shù)資料的配對設(shè)計(jì)常用于兩種檢查方法、培養(yǎng)方法、診斷方法的比較。特點(diǎn)是對樣本中各觀測單位分別用兩種方法解決,然后觀測兩種解決方法的某兩分類變量的計(jì)數(shù)結(jié)果R×C列聯(lián)表資料的卡方檢查用于多個(gè)樣本率的比較、兩個(gè)或多個(gè)構(gòu)成比的比較?;緮?shù)據(jù)為:⑴多個(gè)樣本率比較時(shí),有R行2列;⑵兩個(gè)樣本構(gòu)成比比較時(shí),有2行C列;⑶多個(gè)樣本構(gòu)成比比較時(shí),有R行C列。采用Bonferroni法進(jìn)行多個(gè)樣本率的兩兩比較,環(huán)節(jié)如下:①對需要比較的行×列表資料進(jìn)行χ2分割,變成多個(gè)四格表;②對每個(gè)四格表進(jìn)行χ2檢查;③采用(α‘=α/比較次數(shù))計(jì)算調(diào)整的水準(zhǔn),其中α為事先擬定的水準(zhǔn);④以α‘調(diào)整作為檢查檢查水準(zhǔn),作出結(jié)論。R×C列表表χ2檢查注意事項(xiàng):若有1/5以上的格子出現(xiàn)1≤T<5,則增大樣本含量,以達(dá)成增大理論頻數(shù)的目的;結(jié)合專業(yè),刪去理論頻數(shù)太小的格子相應(yīng)的行或列;結(jié)合專業(yè),將理論頻數(shù)太小的行或列與性質(zhì)相近的行或列合并;用雙向無序R×C表資料的Fisher確切概率法。b、多個(gè)樣本率比較,若記錄推斷為拒絕H0,接受H1,只能認(rèn)為各總體率或構(gòu)成比之間總的來說有差別。若要進(jìn)一步了解哪兩者之間有差別,可用卡方分割法,或者調(diào)整檢查水準(zhǔn)。c、對于單向有序的R×C表資料,在比較各解決組的效應(yīng)有無差別時(shí),應(yīng)當(dāng)用秩和檢查。第十章非參數(shù)秩和檢查參數(shù)檢查,是基于隨機(jī)樣本來自某已知分布的總體,推斷兩個(gè)或兩個(gè)以上總體參數(shù)是否相同的方法。常用的方法有:t檢查、方差分析。特點(diǎn)重要有:①對總體參數(shù)進(jìn)行估計(jì)或檢查是重要目的;②規(guī)定總體分布已知;③記錄量有明確的理論依據(jù);④有嚴(yán)格的使用條件,規(guī)定總體分布符合正態(tài)分布、總體方差齊性、數(shù)據(jù)間互相獨(dú)立。非參數(shù)檢查(nonparametrictest),是在不考慮總體參數(shù)和分布類型的情況下,對總體的參數(shù)和分布位置進(jìn)行檢查的方法。常用的方法有:秩和檢查、符號檢查。特點(diǎn)重要有:①合用范圍廣,可應(yīng)用于總體分布類型未知的計(jì)量資料、偏態(tài)分布的資料、等級資料、不滿足參數(shù)檢查條件的資料等;②受限條件少,更適合一般情況;③具有較好的穩(wěn)健性;④方法簡便,易于理解和掌握。秩和檢查(ranksumtest
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025北京市個(gè)體工商戶雇工勞動合同書范文
- 2025年度按摩店合伙人市場分析與競爭策略協(xié)議3篇
- 2025年度農(nóng)村墓地建設(shè)項(xiàng)目投資合作協(xié)議書
- 二零二五年度養(yǎng)老公寓入住與休閑娛樂服務(wù)合同3篇
- 二零二五年度公司企業(yè)間新能源車輛購置借款合同3篇
- 2025年度工傷賠償爭議解決機(jī)制協(xié)議書3篇
- 二零二五年度養(yǎng)老機(jī)構(gòu)兼職校醫(yī)照護(hù)服務(wù)合同3篇
- 二零二五年度養(yǎng)殖場專業(yè)技術(shù)人員聘用合同3篇
- 二零二五年度地下停車場開發(fā)與運(yùn)營管理合同3篇
- 二零二五年度智能電網(wǎng)設(shè)備采購合同風(fēng)險(xiǎn)識別與防范3篇
- TSG 51-2023 起重機(jī)械安全技術(shù)規(guī)程 含2024年第1號修改單
- 《正態(tài)分布理論及其應(yīng)用研究》4200字(論文)
- GB/T 45086.1-2024車載定位系統(tǒng)技術(shù)要求及試驗(yàn)方法第1部分:衛(wèi)星定位
- 浙江省杭州市錢塘區(qū)2023-2024學(xué)年四年級上學(xué)期英語期末試卷
- 1古詩文理解性默寫(教師卷)
- 廣東省廣州市越秀區(qū)2021-2022學(xué)年九年級上學(xué)期期末道德與法治試題(含答案)
- 2024-2025學(xué)年六上科學(xué)期末綜合檢測卷(含答案)
- 在線教育平臺合作合同助力教育公平
- 工地鋼板短期出租合同模板
- 女排精神課件教學(xué)課件
- 2024年湖南省公務(wù)員考試《行測》真題及答案解析
評論
0/150
提交評論