醫(yī)學(xué)科研設(shè)計(jì)的基本原則與統(tǒng)計(jì)分析方法_第1頁
醫(yī)學(xué)科研設(shè)計(jì)的基本原則與統(tǒng)計(jì)分析方法_第2頁
醫(yī)學(xué)科研設(shè)計(jì)的基本原則與統(tǒng)計(jì)分析方法_第3頁
醫(yī)學(xué)科研設(shè)計(jì)的基本原則與統(tǒng)計(jì)分析方法_第4頁
醫(yī)學(xué)科研設(shè)計(jì)的基本原則與統(tǒng)計(jì)分析方法_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

科研設(shè)計(jì)的基本原則

統(tǒng)計(jì)分析的思維方法

暨南大學(xué)醫(yī)學(xué)院第一頁,共七十六頁。為什么要進(jìn)行可科研設(shè)計(jì)?醫(yī)學(xué)科學(xué)研究的實(shí)驗(yàn)設(shè)計(jì)是醫(yī)學(xué)科研中至關(guān)重要的一個(gè)環(huán)節(jié)。一項(xiàng)好的實(shí)驗(yàn)設(shè)計(jì)——可以節(jié)約大量的人力、物力、財(cái)力和時(shí)間,保證實(shí)驗(yàn)的科學(xué)性、可靠性和誠信度。第二頁,共七十六頁??蒲性O(shè)計(jì)的一般要求1.科學(xué)性能回答科研提出的問題。2.嚴(yán)密性通過大量查閱文獻(xiàn)和現(xiàn)場調(diào)查,搜集科學(xué)資料,或在進(jìn)一步進(jìn)行預(yù)備實(shí)驗(yàn)或可行性調(diào)查實(shí)驗(yàn)的基礎(chǔ)上,進(jìn)行嚴(yán)密的設(shè)計(jì)。第三頁,共七十六頁。3.合理性能保證通過設(shè)計(jì)方案的實(shí)施,取得可靠的研究成果,具有普遍意義,經(jīng)得住實(shí)踐的考驗(yàn)。4.高效性以最少的人力、財(cái)力、物力,得出有意義的結(jié)果。5.道德性符合社會道德規(guī)范,決不損害人的身心健康。第四頁,共七十六頁??蒲性O(shè)計(jì)的基本原則隨機(jī)原則對照原則均衡原則重復(fù)原則盲法原則(臨床試驗(yàn)時(shí),可屬均衡之列)這些原則的作用是減少誤差,提高實(shí)驗(yàn)效率。第五頁,共七十六頁。對照原則對照就是對受試對象不施加處理因素或施加處理因素前的一種處理狀態(tài)用于與施加處理因素或處理后狀態(tài)進(jìn)行比較,充分暴露處理因素的效應(yīng)。第六頁,共七十六頁。1.對照的意義:沒有比較就沒有鑒別,任何事物間的差異都是通過比較而顯示出來的,比較的基準(zhǔn)就是對照。設(shè)置對照是為了更好的評價(jià)和鑒別實(shí)驗(yàn)結(jié)果的科學(xué)性、真實(shí)性,避免偏倚而產(chǎn)生錯(cuò)誤的結(jié)論。第七頁,共七十六頁。甄別處理因素與非處理因素效應(yīng),排除非處理因素干擾,減少實(shí)驗(yàn)誤差公式表達(dá)如下:T+SE+e式中:T為處理因素,E為處理因素效應(yīng),S為非處理因素,e為非處理因素效應(yīng)。第八頁,共七十六頁。對照的原理T+S1E

+e1‖‖0+S20’+e2TE第九頁,共七十六頁。兩個(gè)實(shí)驗(yàn)組相互比較的原理

T1+S1

E1+e1T2+S2

E2+e2如果S1=

S2,

e1=

e2那么——T1-T2

E1-E2Td

Ed

第十頁,共七十六頁。2.對照的要求:①對等:除處理因素外,對照組要具備與實(shí)驗(yàn)組對等的非處理因素。②同步:對照組與實(shí)驗(yàn)組設(shè)立之后,在整個(gè)研究進(jìn)程中始終處于同一空間和同一時(shí)間。③專設(shè):任何一個(gè)對照組都是為相應(yīng)的實(shí)驗(yàn)組專門設(shè)立的。不得借用文獻(xiàn)上記載或以往的結(jié)果或其他研究資料作為本研究對照。

第十一頁,共七十六頁。3.對照的形式①同期隨機(jī)對照:相同時(shí)間、地點(diǎn)選擇研究對象,以隨機(jī)分配方式分組;其可比性強(qiáng),避免了選擇性偏倚,結(jié)果更具說服力。②自身對照:對照與實(shí)驗(yàn)在同一受試對象進(jìn)行。③歷史性對照:將新的干預(yù)性措施的結(jié)果與過去的研究比較,即將研究者以往的研究結(jié)果或他人的研究結(jié)果與本次研究結(jié)果作對照。第十二頁,共七十六頁。④非隨機(jī)同期對照:研究對象是同時(shí)間、同地點(diǎn),用非隨機(jī)分配的方法分為實(shí)驗(yàn)組和對照組,分組的方法不是隨機(jī)的。⑤配對對照:將實(shí)驗(yàn)組的觀察對象按照配對因素與對照組相配對。⑥陽性對照:與已知療效的典型藥進(jìn)行比較。⑦空白對照:對照組不施加任何處理因素。⑧實(shí)驗(yàn)對照(效應(yīng)特異性對照):采用與實(shí)驗(yàn)組條件一致的對照措施。第十三頁,共七十六頁。隨機(jī)化原則隨機(jī)化(randomization)指從總體中抽取個(gè)體或樣本時(shí),每個(gè)個(gè)體或樣本都有同等被抽取的機(jī)會。隨機(jī)抽樣指各個(gè)個(gè)體或樣本都有同等機(jī)會被抽取的抽樣。第十四頁,共七十六頁。隨機(jī)不同于通常意義的“隨意”、“隨便”兩詞例如一個(gè)籠子里有10只小老鼠,要求均分到對照和試驗(yàn)組中去,如果研究者規(guī)定“短尾巴老鼠分到對照組、長尾巴老鼠分到實(shí)驗(yàn)組”就屬于“隨意”分組,包含有主觀選擇;如果研究者規(guī)定“閉上眼睛捉老鼠,先捉住的作為對照組,后捉住的作為實(shí)驗(yàn)組”則屬于“隨便”分組,包含有客觀選擇。因此隨機(jī)抽樣,可以理解為既沒有主觀選擇、也沒有客觀選擇的一種抽樣方法。第十五頁,共七十六頁。隨機(jī)化具體體現(xiàn)在如下幾方面:①抽樣隨機(jī):每一個(gè)符合條件的實(shí)驗(yàn)對象參加實(shí)驗(yàn)的機(jī)會相同。②分組隨機(jī):每個(gè)實(shí)驗(yàn)對象分到處理組和對照組的機(jī)會相同,以保證各處理組間實(shí)驗(yàn)對象盡可能均衡一致,以提高各組間的可比性。③實(shí)驗(yàn)順序隨機(jī):每個(gè)實(shí)驗(yàn)對象接收處理先后的機(jī)會相同,以消除不平衡的實(shí)驗(yàn)順序所產(chǎn)生的偏差。第十六頁,共七十六頁。隨機(jī)化方法

1.抽簽法例如要把12只動物分為兩組,先將動物編號1、2、3…12,同時(shí)制作數(shù)字為1~12的標(biāo)簽,標(biāo)簽充分混勻后,按預(yù)先規(guī)定抽取6個(gè)簽號,將動物對號入座分到第1組,余下的6個(gè)標(biāo)簽號的動物分第2組。2.隨機(jī)數(shù)字表法根據(jù)隨機(jī)抽樣的原理編制而成的,用于隨機(jī)分配和隨機(jī)抽樣。

3.Excel編程第十七頁,共七十六頁。重復(fù)原則重復(fù)(replication)有兩層含意:一是指實(shí)驗(yàn)的樣本量必須足夠大,在相同實(shí)驗(yàn)條件下充分的重復(fù),以避免實(shí)驗(yàn)結(jié)果的偶然性,突出表現(xiàn)其必然規(guī)律;二是指任何實(shí)驗(yàn)結(jié)果的可靠世經(jīng)得起重復(fù)實(shí)驗(yàn)的考驗(yàn),重復(fù)實(shí)驗(yàn)是檢查實(shí)驗(yàn)結(jié)果可靠性的惟一方法。一個(gè)不可重復(fù)的研究是沒有科學(xué)性的。第十八頁,共七十六頁。重復(fù)的目的有兩個(gè):一是穩(wěn)定標(biāo)準(zhǔn)差,獲得實(shí)驗(yàn)誤差估計(jì)值;二可使均值接近真實(shí)值,實(shí)驗(yàn)組與對照組差異能夠準(zhǔn)確地顯露出來。第十九頁,共七十六頁。樣本大小的影響因素1.總體參數(shù)()指兩個(gè)樣本均數(shù)或兩個(gè)率比較時(shí),其總體均數(shù)或率的差值。越大,說明差異越明顯,需要的樣本量越小。2.實(shí)驗(yàn)誤差實(shí)驗(yàn)方法越準(zhǔn)確,個(gè)體間差異越小,實(shí)驗(yàn)誤差必然較小,越易達(dá)到統(tǒng)計(jì)等顯著性,所需樣本越??;否則,樣本要大。第二十頁,共七十六頁。3.檢驗(yàn)水準(zhǔn)實(shí)驗(yàn)所需樣本數(shù)與實(shí)驗(yàn)設(shè)計(jì)規(guī)定的檢驗(yàn)水準(zhǔn)成反比,檢驗(yàn)水準(zhǔn)定得愈低,所需樣本含量愈大,=0.01所需樣本數(shù)大于=0.05所需樣本數(shù)。4.檢驗(yàn)效能(1一)檢驗(yàn)效能指當(dāng)兩總體確有差別時(shí),按檢驗(yàn)水準(zhǔn)發(fā)現(xiàn)它們有顯著差別的能力。檢驗(yàn)效能由(第二類錯(cuò)誤的概率)大小所決定,當(dāng)=0.1,=0.2時(shí),相應(yīng)的檢驗(yàn)效能為0.8和0.9。檢驗(yàn)效能越大,所需要的時(shí)間樣本量也越大。第二十一頁,共七十六頁。5.資料性質(zhì)同等情況下,數(shù)值變量資料所需樣本量少于分類變量。如果分類變量結(jié)果上相差懸殊,對照組全為陰性,實(shí)驗(yàn)組全為陽性,則少數(shù)樣本也達(dá)到統(tǒng)計(jì)學(xué)的顯著性。6.實(shí)驗(yàn)結(jié)果的可能性雙向結(jié)果(存在A≥B或A≤B兩種可能性)所需樣本數(shù)多單向結(jié)果(只存在A≥B或A≤B一種可能性)所需樣本數(shù)少。7.實(shí)驗(yàn)設(shè)計(jì)的類型完全隨機(jī)實(shí)驗(yàn)設(shè)計(jì)所需樣本多配對設(shè)計(jì)隨機(jī)區(qū)組實(shí)驗(yàn)設(shè)計(jì)所需樣本較少拉丁方實(shí)驗(yàn)設(shè)計(jì)所需樣本更少序貫實(shí)驗(yàn)設(shè)計(jì)所需樣本數(shù)又可少30%~50%第二十二頁,共七十六頁。樣本大小的估計(jì)方法樣本含量越大或重復(fù)次數(shù)越多,越能反應(yīng)變異的客觀真實(shí)情況。若樣本含量過大,浪費(fèi)人力物力。若樣本含量過小,有專業(yè)意義的差異,也可能沒有統(tǒng)計(jì)學(xué)意義,造成假陰性錯(cuò)誤。

第二十三頁,共七十六頁。粗估法動物實(shí)驗(yàn)時(shí)——大動物(犬、貓)5~15只/組;中等動物(兔、豚鼠10~20只/組;小動物(大鼠、小鼠)15~30只/組。臨床研究一般難治愈的疾病——療效顯著時(shí)(如癌癥)5~10例即可;急重病死亡率高的(如休克、心衰、腎衰、呼吸衰竭)需30~50例;一般病和慢性病300~500例;按WHO規(guī)定——血清流行病學(xué)調(diào)查需300~600例,一般流行病學(xué)調(diào)查和正常值調(diào)查則常需千例以上。惡性腫瘤的流行病學(xué)調(diào)查至少10萬人口以上;多因素分析時(shí),樣本含量數(shù)是研究因素?cái)?shù)的5~10倍以上。第二十四頁,共七十六頁。計(jì)算法

見樣本含量的計(jì)算(Excel程序)第二十五頁,共七十六頁。均衡性原則均衡(balance)即實(shí)驗(yàn)組和對照組或各實(shí)驗(yàn)組之間,除了觀察的受試因素外,其他一切條件應(yīng)盡可能相同或一致如動物的種屬、品系、窩別、年齡、性別、體重、健康狀況、生理?xiàng)l件、飼養(yǎng)環(huán)境等要保持一致。如果受試對象是病人,則要求病人的病種、病期、病型、病程、年齡、性別、生活、社會、心理等因素保持均衡一致。均衡的意義在于更好地避免偏性,減少誤差,提高實(shí)驗(yàn)的精確性。第二十六頁,共七十六頁。均衡的方法1.交叉均衡法2.分層均衡法第二十七頁,共七十六頁。均衡性檢查先按主要影響因素分層,然后在層內(nèi)隨機(jī)抽樣,這樣組間均衡性較好。但若樣本分配并不是采用分層隨機(jī),而是使用完全隨機(jī)的方法,在小樣本實(shí)驗(yàn)中則可能出現(xiàn)嚴(yán)重不平衡狀態(tài)。為彌補(bǔ)這一缺陷,應(yīng)在實(shí)驗(yàn)樣本數(shù)達(dá)到預(yù)定數(shù)80%~90%時(shí)進(jìn)行均衡性檢查。若發(fā)現(xiàn)不平衡指數(shù)(影響因素差數(shù)絕對值之和,∑di)較大時(shí),隨后的樣本分配應(yīng)以如何使不平衡指數(shù)減小為原則。第二十八頁,共七十六頁。例如,比較復(fù)方青黛與馬利蘭對慢性粒細(xì)胞白血病的療效,預(yù)定觀察20例,每組10例,按完全隨機(jī)已收治17例。若性別、年齡、病情與病程是其主要影響因素,則按此進(jìn)行均衡性檢查。第二十九頁,共七十六頁?!芼i=12檢查結(jié)果不平衡指數(shù)∑di)較大,故隨后繼續(xù)進(jìn)來的病例應(yīng)當(dāng)以使∑di減少為原則。如新來一位符合受試條件的本病患者系男性青年,病情較重,確診已達(dá)1年半。若將此患者分至馬利蘭組,則∑di增至16,若將其分至復(fù)方青黛組,則∑di減至8,故應(yīng)將此患者分至復(fù)方青黛組。第三十頁,共七十六頁。盲法原則盲法(blindness)是指按試驗(yàn)方案的規(guī)定,不讓參與研究的受試者和(或)觀察者、其他有關(guān)工作人員(部分設(shè)計(jì)者)知道病人所接受的是何種處理(試驗(yàn)藥或?qū)φ账?,從而避免他們對試驗(yàn)結(jié)果的人為干擾和心理因素的影響。

第三十一頁,共七十六頁。單盲法(singleblindness)單盲法:在研究中,受試對象不知道接受什么處理。單盲法的優(yōu)點(diǎn):避免研究對象的主觀因素所致的偏差。單盲還保留非盲法的優(yōu)點(diǎn),即實(shí)施起來容易,在研究對象出現(xiàn)任何變化時(shí),擔(dān)任觀察任務(wù)的研究人員容易判斷其原因,并決定是否終止試驗(yàn)或改變方案,以保證處理因素使用的安全性。單盲法的缺點(diǎn):不能避免研究人員主觀因素所產(chǎn)生的偏倚,單盲獲得結(jié)論的客觀性和可信度低于雙盲法。用于單盲的對照藥物既可是安慰劑,也可以是有效藥物或標(biāo)準(zhǔn)治療。第三十二頁,共七十六頁。雙盲法(doubleblindness):研究中,受試者和承擔(dān)觀察任務(wù)的研究人員均不知道每個(gè)受試對象的分組和接受處理的情況可避免受試對象的主觀偏差和研究者的人為偏差。第三十三頁,共七十六頁。需要用雙盲臨床試驗(yàn)在臨床研究中——反映療效和安全性的主要指標(biāo)如果是主觀、定性的,或者雖是定量指標(biāo),但容易受心理、精神因素影響的。新的新藥評審辦法——化學(xué)藥品第一、二、三類藥物;五類藥物中需延長用藥周期和(或)降低劑量的藥物要進(jìn)行Ⅱ期臨床實(shí)驗(yàn)的。第三十四頁,共七十六頁。雙盲法較為復(fù)雜,實(shí)際執(zhí)行起來困難較大。在研究過程中,由于種種原因容易造成盲底泄露,稱為破盲。在執(zhí)行雙盲法時(shí),如果病情發(fā)生變化,不能準(zhǔn)確判斷并及時(shí)處理。第三十五頁,共七十六頁。雙盲法臨床試驗(yàn)注意的問題:(1)嚴(yán)格隨機(jī)分組,認(rèn)真、客觀填寫病例報(bào)告表。(2)實(shí)驗(yàn)組與對照組所用的藥物外觀、形狀、劑型等必須高度一致。(3)要有一套完善的執(zhí)行盲法編碼制度,受試對象的所有記錄、請求單、回報(bào)單等全采用代號制。第三十六頁,共七十六頁。(4)每個(gè)盲法試驗(yàn)應(yīng)指定一位第三者作為統(tǒng)籌負(fù)責(zé)和監(jiān)督整個(gè)研究工作的監(jiān)視員。其職責(zé)是監(jiān)督盲法執(zhí)行,保證結(jié)果的可靠性,保證受試對象的安全,分發(fā)應(yīng)急信件,保管盲底,試驗(yàn)終末揭盲等。第三十七頁,共七十六頁。(5)設(shè)有應(yīng)急信件和緊急情況個(gè)別病例揭盲規(guī)定。臨床試驗(yàn)必須符合科學(xué)和道德倫理原則:為防止試驗(yàn)中出現(xiàn)緊急情況貽誤病人治療,應(yīng)為每一個(gè)編盲號設(shè)置一個(gè)應(yīng)急信件(內(nèi)容為病例用藥編號、藥名),以便在緊急情況對個(gè)別病例揭盲搶救治療。第三十八頁,共七十六頁。(6)盲態(tài)核查指最后一例受試者的最后一次觀察完成后,數(shù)據(jù)管理員將病歷報(bào)告表輸入數(shù)據(jù)庫,并經(jīng)過復(fù)核、直到數(shù)據(jù)鎖定,以及第一次揭盲間對數(shù)據(jù)的核查和評價(jià)等所做的工作。是雙盲臨床實(shí)驗(yàn)中標(biāo)準(zhǔn)操作規(guī)范中的一個(gè)必要環(huán)節(jié),必須嚴(yán)格實(shí)施。第三十九頁,共七十六頁。三盲法(tripleblindness)三盲法是雙盲法的擴(kuò)展,即受試對象、研究人員和資料分析人員均不知道受試對象的分組和管理情況。理論上可以減少資料分析上的偏差分析時(shí)減弱了對整個(gè)研究工作的全局了解,對研究的安全性要求較高,在執(zhí)行時(shí)也較嚴(yán)密,難度較大。第四十頁,共七十六頁。統(tǒng)計(jì)分析的思維方法第四十一頁,共七十六頁。統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念1、總體與樣本總體(population)是根據(jù)研究目的確定的同質(zhì)觀察單位的全體,更確切地說,是同質(zhì)的所有觀察單位某種變量值的集合。根據(jù)總體所含有觀察單位的個(gè)數(shù)是否可以清點(diǎn)數(shù)目,分為有限總體(finitepopulation)和無限總體(infinitepopulation)。在實(shí)際工作中,對于無限總體或有限總體多采用隨機(jī)化抽樣進(jìn)行研究,目的是通過樣本信息推斷總體特征。按照隨機(jī)化抽樣原則,從總體中抽取的部分觀察單位的某變量值的集合稱為樣本(sample),這時(shí)的樣本對總體具有較好的代表性。第四十二頁,共七十六頁。樣本(sample)是按照隨機(jī)化抽樣原則,從總體中抽取的部分觀察單位的某變量值的集合這時(shí)的樣本對總體具有較好的代表性。樣本所包含的個(gè)體數(shù)量,稱為樣本含量(samplesize),用符號n表示。如上例,在2006年某地正常成年男子中隨機(jī)抽取120人,這120人的身高值即為樣本。120為樣本例數(shù)(即n=120)。

第四十三頁,共七十六頁。2、變量觀察單位的某項(xiàng)特征指標(biāo)稱為變量(variable),對變量的測量值稱為變量值(valueofvariable)或觀察值(observedvalue),用符號x表示,一群變量值構(gòu)成一組資料(data)。例如,以人為觀察單位,調(diào)查某地某年1歲男童的身體發(fā)育狀況,身高、體重等都屬于變量。第四十四頁,共七十六頁。按變量值是定量的還是定性的,可將變量分為以下類型。(1)數(shù)值變量數(shù)值變量(numericalvariable)或稱定量變量,是通過儀器設(shè)備測量出來的,其變量值是定量的,表現(xiàn)有量的大小、值的高低,通常具有度量衡單位。如人的體溫(℃)、呼吸(次/min)、體重(kg)、血壓(kPa)等。第四十五頁,共七十六頁。(2)分類變量分類變量(categoricalvariable)或稱定性變量,是通過清點(diǎn)數(shù)目得到的,其變量值是定性的,表現(xiàn)為互不相容的類別或?qū)傩缘膫€(gè)數(shù)多少。第四十六頁,共七十六頁。根據(jù)類別之間是否有程度上的差別又分為:a、無序分類變量各類別之間有性質(zhì)上的不同,而無程度上的差別。b、有序分類變量相對獨(dú)立、自成一組,但組間排列有序、存在程度上的差別比如觀察某人群成年男子的血紅蛋白含量,按血紅蛋白含量的多少可分為五個(gè)等級:重度貧血、中度貧血、輕度貧血、正常、血紅蛋白增高;又如觀察用某藥治療某病患者的療效,以每名患者為觀察單位,臨床療效分為治愈、顯效、好轉(zhuǎn)、無效四級。第四十七頁,共七十六頁。(3)變量間的轉(zhuǎn)化根據(jù)研究分析的需要,在一定條件下各類變量之間可以相互轉(zhuǎn)化。如人的血壓屬數(shù)值變量,當(dāng)分析需要時(shí)可轉(zhuǎn)化成無序分類變量(血壓正常與異常)和有序分類變量(低血壓、正常血壓、高血壓)。有時(shí)還可以將分類變量數(shù)量化,如無序分類的性別(女、男)可轉(zhuǎn)為0、1;有序分類的血壓等級(低血壓、正常血壓、高血壓)分別轉(zhuǎn)成1、2、3。第四十八頁,共七十六頁。3、同質(zhì)與變異同質(zhì)(homogeneity)是指研究事物具有相同或相近的性質(zhì)、條件或影響因素。客觀上,完全同質(zhì)是做不到或難以做到的,所以統(tǒng)計(jì)學(xué)中的同質(zhì)是指對觀察指標(biāo)影響較大的、且可以控制的主要因素的相同,如研究某藥物對肺結(jié)核病的治療效果,要求結(jié)核病人被確診,其病情、病程、年齡、性別相同或相似,等等;第四十九頁,共七十六頁。變異(variation)是指同質(zhì)基礎(chǔ)上的個(gè)體間的差異。個(gè)體差異主要來源于一些已知的或未知的,甚至是某些不可控制的因素所導(dǎo)致的隨機(jī)誤差。如將對身高影響較大的因素控制在相同條件下,測試一批大學(xué)生身高,每個(gè)人的測得值并不完全相同,這種差異稱為身高的變異。統(tǒng)計(jì)研究的任務(wù)就是在同質(zhì)分組的基礎(chǔ)上,通過對個(gè)體變異的研究,透過偶然現(xiàn)象,反映同質(zhì)事物的本質(zhì)特征與規(guī)律。第五十頁,共七十六頁。4、參數(shù)與統(tǒng)計(jì)量參數(shù)(parameter)是通過總體的所有變量值計(jì)算的描述總體特征的指標(biāo)用希臘字母代表,如:總體均數(shù)μ、總體率π、總體標(biāo)準(zhǔn)差σ等。統(tǒng)計(jì)量(statistic)是根據(jù)樣本的變量值計(jì)算的描述樣本特征的指標(biāo),用拉丁字母代表,如:樣本均數(shù)、樣本率p、樣本標(biāo)準(zhǔn)差S等。第五十一頁,共七十六頁。前述某地2006年所有正常成年男子身高值的均數(shù)為參數(shù),120人的樣本均數(shù)為統(tǒng)計(jì)量。對于一個(gè)總體來說,總體的參數(shù)是固定、唯一的,而來自同一總體的不同樣本的統(tǒng)計(jì)量是有差別的。第五十二頁,共七十六頁。5、隨機(jī)化第五十三頁,共七十六頁。6、誤差誤差(error)泛指測量值與真實(shí)值之差根據(jù)其產(chǎn)生的原因和性質(zhì)——隨機(jī)誤差(randomerror)非隨機(jī)誤差(nonrandomerror)第五十四頁,共七十六頁。隨機(jī)誤差是由許多無法控制的因素引起的一類不恒定的誤差。包括隨機(jī)測量誤差、抽樣誤差。隨機(jī)測量誤差指在同一條件下對同一對象進(jìn)行測量,雖極力控制或消除系統(tǒng)誤差,測量結(jié)果之間仍然存在差別,呈隨機(jī)的變化;抽樣誤差是由于抽樣而使獲得的樣本統(tǒng)計(jì)量與總體參數(shù)之間存在差別。隨機(jī)誤差的特點(diǎn):隨機(jī)誤差是不可避免的,因?yàn)闊o法控制引起隨機(jī)誤差的因素。隨機(jī)誤差呈正態(tài)分布,可以用統(tǒng)計(jì)學(xué)的方法加以分析。第五十五頁,共七十六頁。非隨機(jī)誤差分為——系統(tǒng)誤差是一類恒定,由可知或可控制的因素引起的誤差。如測量儀器未經(jīng)校準(zhǔn)就進(jìn)行測量,使測量結(jié)果一致的偏大或偏小。系統(tǒng)誤差可以通過周密的設(shè)計(jì)和要嚴(yán)格的技術(shù)措施加以消除或控制。非系統(tǒng)誤差又稱過失誤差,是由于研究者的偶然過失而造成的誤差。如差錯(cuò)數(shù)字,點(diǎn)錯(cuò)小數(shù)點(diǎn)等。這類誤差應(yīng)通過認(rèn)真核查加以消除。第五十六頁,共七十六頁。7、抽樣誤差抽樣誤差(samplingerror)是指由于隨機(jī)抽樣的原因引起的樣本指標(biāo)(統(tǒng)計(jì)量)與總體指標(biāo)(參數(shù))之間差別,或從同一總體抽取的不同樣本指標(biāo)之間的差別。根本原因是由于總體中的個(gè)體間存在變異因?yàn)樯飩€(gè)體之間的差異總是客觀存在,所以抽樣誤差不可避免,但大小有規(guī)律可循。第五十七頁,共七十六頁。8、概率概率(probability)又稱為幾率或或然率,以符號P表示,是反映某一事件發(fā)生的可能性大小的量,P越接近1表示該事件發(fā)生的可能性越大,P越接近0表示該事件發(fā)生的可能性越小。其取值范圍在0到1之間,可以用小數(shù)或百分?jǐn)?shù)表示。第五十八頁,共七十六頁。9、隨機(jī)事件、必然事件、不可能事件隨機(jī)事件有廣義隨機(jī)事件和狹義隨機(jī)事件之分。廣義隨機(jī)事件是指概率值在0和1之間,包括0和1的事件。其中P=1的事件稱為必然事件;P=0事件稱為不可能事件。所以,P=1和P=0可看成是廣義隨機(jī)事件的特例。狹義隨機(jī)事件指概率值在0和1之間,不包括0和1的事件,即不包括必然事件和不可能事件。第五十九頁,共七十六頁。10、小概率事件習(xí)慣上,把P≤0.05或P≤0.01的事件稱為小概率事件。這就是為什么通常把P=0.05或P=0.01作為劃分事物差異是否具有統(tǒng)計(jì)學(xué)意義界限的理論依據(jù)。第六十頁,共七十六頁。4、假設(shè)檢驗(yàn)的基本思想(思維方法)

——小概率事件的反證法小概率事件實(shí)際不可能發(fā)生原理:小概率事件(P<0.01或P<0.05)在一次試驗(yàn)中實(shí)際上是不可能發(fā)生的。反證法思想:先提出無效假設(shè)H0(備擇假設(shè)H1),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定H0成立的概率P。如果P小,則拒絕H0成立,承認(rèn)H1成立;若P不小,則沒有理由拒絕H0成立,即接受H0,拒絕H1。

第六十一頁,共七十六頁。比喻:公安局辦理一起“盜竊案”一起高層居民樓發(fā)生盜竊案最后懷疑張三、李四兩人由于張三是慣偷,先假定是張三所為調(diào)查證據(jù)和分析:盜竊案發(fā)生在10樓攀墻、越窗進(jìn)入張三是瘸子所以,張三盜竊的可能性很?。≒<0.01或P<0.05)結(jié)論:不是張三干的,是李四所為!第六十二頁,共七十六頁。假設(shè)檢驗(yàn)是如此“辦案”的一起樣本均數(shù)與總體均數(shù)比較的假設(shè)檢驗(yàn)已經(jīng)確定差別由抽樣誤差或本質(zhì)差異引起抽樣誤差經(jīng)常存在,先假定是抽樣誤差H0所致計(jì)算由抽樣誤差所致的統(tǒng)計(jì)量(如t-值、F-值、χ2-值……)和概率結(jié)論:拒絕H0,接受H1,認(rèn)為存在本質(zhì)差異!第六十三頁,共七十六頁。

根據(jù)研究目的,提出假設(shè)無效假設(shè)H0:抽樣誤差所致備擇假設(shè)H1:本質(zhì)差異造成確定顯著性水準(zhǔn)α(α=0.05or0.01)計(jì)算統(tǒng)計(jì)量(如t-值、F-值、χ2-值……),確定P值作出結(jié)論P(yáng)<α,拒絕H0、接受H1;否則,接受H0、拒絕H1假設(shè)檢驗(yàn)的基本步驟第六十四頁,共七十六頁。統(tǒng)計(jì)資料的類型統(tǒng)計(jì)資料按其性質(zhì)一般分為——計(jì)數(shù)資料計(jì)量資料等級資料不同類型的統(tǒng)計(jì)資料應(yīng)采用不同的統(tǒng)計(jì)分析方法。第六十五頁,共七十六頁。1、計(jì)數(shù)資料(measurementdata)是先將觀察單位按某種屬性或類別分成相互獨(dú)立的若干組,再清點(diǎn)各組觀察單位個(gè)數(shù)所得到的資料。如對一批某病患者檢驗(yàn)完畢后,清點(diǎn)呈陽性或陰性反應(yīng)的人數(shù)。又如調(diào)查某人群的血型分布,先按A、B、AB、O四型分組,再清點(diǎn)各血型組的例數(shù)。計(jì)數(shù)資料所對應(yīng)的測量指標(biāo)稱為分類變量,所以計(jì)數(shù)資料也稱為分類變量資料,相對于后述的有序分類變量資料而言,此類資料一般指的是無序分類變量資料,可計(jì)算百分比或率等相對數(shù),需要時(shí)做百分比或率之間的比較,也可做兩事物之間相關(guān)的相關(guān)分析。第六十六頁,共七十六頁。2、計(jì)量資料(enumerationdata)是用測量儀器或其它定量方法對每個(gè)觀察單位的某項(xiàng)指標(biāo)進(jìn)行測定所得到的一組數(shù)值,一般帶有度量衡單位。如檢查某地青少年的體重,需要體重計(jì)稱量,以公斤等為單位,測得大小不一的體重值。其它如身長(cm)、血壓(mmHg)、脈搏(次/分)、紅細(xì)胞(萬/mm3)、轉(zhuǎn)氨酶(單位)等,都屬于計(jì)量資料。計(jì)量資料所對應(yīng)的測量指標(biāo)稱為數(shù)值變量,所以計(jì)量資料也稱為數(shù)值變量資料,可計(jì)算平均數(shù)與標(biāo)準(zhǔn)差等指標(biāo),需要時(shí)做各均數(shù)之間的比較或各變量之間的分析。

第六十七頁,共七十六頁。3、等級資料(rankeddata)又稱半定量資料,是將觀察單位按某種屬性或某個(gè)特征的等級順序分組,然后清點(diǎn)各組觀察單位的個(gè)數(shù)得來的資料。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論