[醫(yī)藥衛(wèi)生]護(hù)理科研統(tǒng)計(jì)方法_第1頁(yè)
[醫(yī)藥衛(wèi)生]護(hù)理科研統(tǒng)計(jì)方法_第2頁(yè)
[醫(yī)藥衛(wèi)生]護(hù)理科研統(tǒng)計(jì)方法_第3頁(yè)
[醫(yī)藥衛(wèi)生]護(hù)理科研統(tǒng)計(jì)方法_第4頁(yè)
[醫(yī)藥衛(wèi)生]護(hù)理科研統(tǒng)計(jì)方法_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 什么是t檢驗(yàn)?1、當(dāng)總體呈正態(tài)分布,如果總體標(biāo)準(zhǔn)差未知,而且樣本容量30,那么這時(shí)一切可能的樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈t分布。2、t檢驗(yàn)是用t分布理論來(lái)推論差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著。3、應(yīng)用條件:隨機(jī)樣本,來(lái)自正態(tài)總體,兩獨(dú)立樣本比較要求方差齊性。 形式: 單樣本資料的t檢驗(yàn) 配對(duì)設(shè)計(jì)資料的t檢驗(yàn) 兩組獨(dú)立樣本資料的t檢驗(yàn)a、一組樣本資料的t 檢驗(yàn) : 單總體檢驗(yàn)是檢驗(yàn)一個(gè)樣本平均數(shù)與一已知的總體平均數(shù)的差異是否顯著。b、配對(duì)設(shè)計(jì)資料的t檢驗(yàn) : 配對(duì)設(shè)計(jì)是研究者為了控制可能存在的主要非處理因素而采用的一種試驗(yàn)設(shè)計(jì)方法。形式:將某些重要特征相似的每?jī)蓚€(gè)受試對(duì)

2、象配成對(duì)子,同對(duì)的兩個(gè)對(duì)象分別接受不同處理;同一受試對(duì)象的兩個(gè)部位,分別接受不同處理(或測(cè)量),可視為自己和自己配對(duì)。同一受試對(duì)象處理前后,數(shù)據(jù)作對(duì)比。c、兩組獨(dú)立樣本資料的t 檢驗(yàn) : (1) 將受試對(duì)象隨機(jī)分配成兩個(gè)處理組,每一組隨機(jī)接受一種處理。一般把這樣獲得的兩組資料視為代表兩個(gè)不同總體的兩份樣本,據(jù)此推斷其對(duì)應(yīng)的總體均數(shù)是否相等。(2)從兩個(gè)人群分別隨機(jī)抽取一定數(shù)量的觀察對(duì)象,測(cè)量某項(xiàng)指標(biāo)進(jìn)行比較,也屬于兩獨(dú)立樣本的資料 兩樣本所屬總體方差相等,即具有方差齊性 兩組獨(dú)立樣本資料的方差齊性檢驗(yàn) 按=0.05水準(zhǔn)拒絕h0,接受h1,故可認(rèn)為兩個(gè)總體 方差不相等。4、方差不齊時(shí),兩樣本均數(shù)

3、的比較,可選擇以下方法: 1)采用適當(dāng)?shù)淖兞孔儞Q,達(dá)到方差齊性 2)采用秩和檢驗(yàn) 3)采用t檢驗(yàn) 大樣本資料(n 100)時(shí)z檢驗(yàn)卡方檢驗(yàn)1、假設(shè)檢驗(yàn)基本步驟: 建立假設(shè) h。:原假設(shè) h1:備擇假設(shè) 確定檢驗(yàn)水準(zhǔn) 選擇檢驗(yàn)方法,并計(jì)算檢驗(yàn)統(tǒng)計(jì)量 確定p值 做出統(tǒng)計(jì)推斷 p,拒絕h0,接受h1 p,不拒絕h02、四格表資料的x2檢驗(yàn):兩獨(dú)立樣本率的比較 行x列表資料的x2檢驗(yàn):多個(gè)樣本率或構(gòu)成比的比較 配對(duì)四格表資料的x2檢驗(yàn):配對(duì)設(shè)計(jì)資料率的比較 應(yīng)用條件:1、n40 且t5 用基本公式(非校正) 2、n40 、1t5 用校正公式 3、n40 或t1 用fisher確切檢驗(yàn)3、a、四格表資料

4、的x2檢驗(yàn):兩獨(dú)立樣本率的比較n 40且t 5時(shí)用上面公式; n 40且1 t 5時(shí)用下面的校正公式 b、行x列表資料的x2檢驗(yàn):多個(gè)樣本率或構(gòu)成比的比較不能有1/5以上的格子數(shù)1t 5或1個(gè)格子數(shù)t 1 c、配對(duì)四格表資料的x2檢驗(yàn):配對(duì)設(shè)計(jì)資料率的比較b+c 40用前者b+c2.15 單側(cè)=0.052 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 (1) 求差值 差值為各觀察值與已知總體中位數(shù)之差。 (2) 編秩次 方法同配對(duì)設(shè)計(jì)。 (3) 求秩和并確定統(tǒng)計(jì)量 本例t+=62.5,t-=3.5, 取t=3.5。3確定p 值,做出推斷結(jié)論 本例n =11,t =3.5,查t界值表,得p0.05;故按=0.05檢驗(yàn)水準(zhǔn),不

5、拒絕h0,尚不能認(rèn)為患者治療前后的白細(xì)胞總數(shù)的差別有統(tǒng)計(jì)學(xué)意義;即尚不能認(rèn)為中草藥“抗苯一號(hào)”對(duì)苯中毒患者的白細(xì)胞總數(shù)有影響。當(dāng)n5時(shí),應(yīng)用秩和檢驗(yàn)不能得出雙側(cè)有統(tǒng)計(jì)學(xué)意義的概率,故n必須大于5。正態(tài)近似法:若n 50,超出附表的范圍,用正態(tài)近似法作z 檢驗(yàn):若相同秩次較多時(shí)(不包括差值為0者),計(jì)算校正zc: 其中tj為第j(j = 1,2)個(gè)相同秩次的個(gè)數(shù)。 b、兩組獨(dú)立樣本比較的秩和檢驗(yàn)適用條件:完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本比較,若不滿足參數(shù)檢驗(yàn)的應(yīng)用條件,則用本法;兩個(gè)等級(jí)資料比較。 研究目的:推斷兩樣本分別代表的總體分布是否相同。連續(xù)性變量資料的兩樣本比較有序變量資料的兩樣本比較 一、連續(xù)

6、性變量資料的兩樣本比較某醫(yī)師為研究血鐵蛋白與肺炎的關(guān)系,隨機(jī)抽查了10名肺炎患者和16名正常志愿者,測(cè)得血鐵蛋白(mg/l)見(jiàn)表10-3,問(wèn)肺炎患者與正常人血鐵蛋白含量有無(wú)差別? 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) h0: 肺炎患者與正常人的血清鐵蛋白總體分布相同 h1: 肺炎患者與正常人的血清鐵蛋白總體分布不同 =0.05二、等級(jí)資料的兩樣本比較用某藥治療不同病型的老年慢性支氣管炎病人,療效見(jiàn)表10-4,試比較該藥對(duì)2種病型的療效? 1建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) h0: 兩種病型的病人療效總體分布相同 h1: 兩種病型的病人療效總體分布不同=0.052計(jì)算檢驗(yàn)統(tǒng)計(jì)量(1) 編秩 本例為等級(jí)資料,先計(jì)

7、算各等級(jí)的合計(jì)人數(shù),再確定各等級(jí)的秩次范圍,并計(jì)算其平均秩次。(2) 求秩和并計(jì)算檢驗(yàn)統(tǒng)計(jì)量 以各等級(jí)的平均秩次分別乘以兩組相應(yīng)等級(jí)的例數(shù),再分別求秩和得到t1、t2。 c、 多組獨(dú)立樣本比較的秩和檢驗(yàn) 適用條件:完全隨機(jī)設(shè)計(jì)的多個(gè)樣本比較,若不滿足參數(shù)檢驗(yàn)的應(yīng)用條件,則用本法;多個(gè)等級(jí)資料比較。研究目的:推斷各樣本分別代表的總體分布有無(wú)差別。定量變量多組獨(dú)立樣本的比較有序變量多組獨(dú)立樣本的比較一、定量變量多組獨(dú)立樣本的比較3種不同手術(shù)方法治療肝癌的效果有無(wú)不同?二、有序變量多組獨(dú)立樣本的比較某醫(yī)院在研究胎盤(pán)過(guò)早剝離者的出血情況時(shí),將妊娠時(shí)間分為早、中、晚3個(gè)階段,用來(lái)分析不同妊娠階段時(shí)胎盤(pán)過(guò)

8、早剝離的失血量,資料見(jiàn)表10-6。問(wèn)妊娠婦女在不同階段時(shí)胎盤(pán)過(guò)早剝離的出血量有無(wú)差別?7、 基于秩次的非參數(shù)統(tǒng)計(jì)適用條件:1、有序變量資料(尤其適用) 2、總體分布類(lèi)型不明的資料 3、分布不對(duì)稱(chēng)且無(wú)法轉(zhuǎn)化為正態(tài)分布資料 4、方差不齊,有無(wú)適當(dāng)變換方法達(dá)到方差 齊性的資料方差分析1、 方差分析的幾個(gè)名詞: 什么是方差?離均差平方和按例數(shù)n取平均 離均差 離均差平方和(ss) 方差(2 、s2 )均方(ms) 標(biāo)準(zhǔn)差:s方差的算術(shù)平方根 自由度:v當(dāng)樣本均數(shù)給定時(shí),隨機(jī)變量x能“自由”取值的個(gè)數(shù) 關(guān)系: ms= ss/ vn同類(lèi)資料比較時(shí),方差(標(biāo)準(zhǔn)差)越大意味著數(shù)據(jù)間離散程度越大,或者說(shuō)資料的變

9、異度越大2、用途:比較某實(shí)驗(yàn)(處理)因素不同水平樣本均數(shù)間差別有無(wú)統(tǒng)計(jì)學(xué)意義,而說(shuō)明該實(shí)驗(yàn)因素某水平是否有作用的方法。 也就是用于兩組或兩組以上樣本均數(shù)的比較。3、應(yīng)用條件:1)個(gè)樣本是相互獨(dú)立的隨機(jī)樣本 2)個(gè)樣本均數(shù)服從正態(tài)分布 3)相互比較的個(gè)樣本的總體均數(shù)方差相等,即方差齊性4、目的:就是通過(guò)分析各個(gè)處理組均數(shù)之間的差別,推斷它所代表的k個(gè)總體均數(shù)間是否存在差別,或k個(gè)處理組間均數(shù)的差別是否具有統(tǒng)計(jì)學(xué)意義。5、完全隨機(jī)設(shè)計(jì)資料的方差分析完全隨機(jī)設(shè)計(jì)又稱(chēng)單因素方差分析。該分析中僅涉及一個(gè)研究因素,此因素有k(k2)個(gè)水平或狀態(tài)。 完全隨機(jī)設(shè)計(jì)資料方差分析的基本步驟: 1)建立假設(shè)并確定檢

10、驗(yàn)水準(zhǔn) h0:三個(gè)總體均數(shù)相等 即1= 2= 3 h1:三個(gè)總體均數(shù)不等或不全相等 =0.05(2) 計(jì)算檢驗(yàn)統(tǒng)計(jì)量f值 (3)確定p值并作出推斷結(jié)論 以分子的自由度組間 =2為1 分母的自由度組內(nèi) =57為2 查方差分析用f界值表: f0.05(2,60)=3.15 f0.01(2,60)=4.98 f=5.537f0.01(2,60)=4.98,p 0.01。 在=0.01水準(zhǔn)上拒絕h0,接受 h1可以認(rèn)為三種人的血糖下降水平不同。/以上結(jié)論說(shuō)明三組人的血糖水平有差別,但不能說(shuō)明任何兩組之間都有差別,只能說(shuō)至少有兩組人的血糖水平有差別,可能有的組間沒(méi)有差別。若要了解哪些組間沒(méi)有差別可以進(jìn)一

11、步做兩兩比較。/完全隨機(jī)設(shè)計(jì)資料的方差分析時(shí)一定要做好方差齊性檢驗(yàn),如果不滿足方差齊性假定應(yīng)做秩和檢驗(yàn)完全隨機(jī)設(shè)計(jì)的方差分析 又稱(chēng)單因素方差分析 1)k=2時(shí)等價(jià)于完全隨機(jī)設(shè)計(jì)的t檢驗(yàn) 2)計(jì)算變異、計(jì)算均方、求f值、統(tǒng)計(jì)推斷 3)f分布與2個(gè)自由度有關(guān)(組間、組內(nèi)),t分布有一個(gè)自由度統(tǒng)計(jì)知識(shí)回顧總結(jié)1、基本步驟:設(shè)計(jì)(調(diào)查設(shè)計(jì),試驗(yàn)設(shè)計(jì)) 搜集資料 整理資料 分析資料(統(tǒng)計(jì)描述,統(tǒng)計(jì)推斷:參數(shù)估計(jì)假設(shè)檢驗(yàn))2、步驟:第一步 確定資料類(lèi)型 第二步 選擇統(tǒng)計(jì)方法 第三步 滿足檢驗(yàn)條件 第四步 建立檢驗(yàn)假設(shè)、計(jì)算統(tǒng)計(jì)量、確定p 第五步 做出統(tǒng)計(jì)推斷 三四五步由spass解決3、定量變量: 類(lèi)型:

12、離散型變量,連續(xù)型變量 方法:a.隨機(jī)樣本 b.來(lái)自正態(tài)總體 c. 方差齊性(獨(dú)立樣本) 符合:t檢驗(yàn),方差分析(參數(shù)統(tǒng)計(jì)) 不符合:秩和檢驗(yàn)(非參數(shù)統(tǒng)計(jì))4、 定性變量 分類(lèi):分類(lèi)變量(計(jì)數(shù)變量) 有序變量(等級(jí)變量) 方法(非參數(shù)統(tǒng)計(jì)):卡方檢驗(yàn)(計(jì)數(shù)資料) 秩和檢驗(yàn)(等級(jí)資料)相關(guān)與回歸1、 前面章節(jié)中講述了單一變量的統(tǒng)計(jì)分析方法,但在醫(yī)學(xué)科學(xué)研究中,常要分析變量間的關(guān)系,如年齡與血壓、藥物劑量和動(dòng)物死亡率、環(huán)境介質(zhì)中污染物濃度與污染源距離等,回歸與相關(guān)就是研究這種關(guān)系的統(tǒng)計(jì)方法,屬于雙變量分析范疇2、兩變量關(guān)聯(lián)性分析:線性相關(guān),秩相關(guān) 簡(jiǎn)單回歸分析:線性回歸,非線性回歸3、 a、兩變量

13、關(guān)聯(lián)性分析相關(guān):若一個(gè)變量x由小到大(或由大到?。硪蛔兞縴亦由小到大(或由大到?。?,則兩個(gè)變量的散點(diǎn)圖呈直線趨勢(shì),我們稱(chēng)這種現(xiàn)象為共變,也就是兩個(gè)變量之間有“相關(guān)關(guān)系”。1、 線性相關(guān)1、相關(guān)系數(shù):又稱(chēng)為積差相關(guān)系數(shù),以符號(hào)r 來(lái)表示相關(guān)系數(shù)。是說(shuō)明兩變量間相關(guān)關(guān)系的密切程度和相關(guān)方向。 -1r1, r0為正相關(guān),r=0,則稱(chēng)零相關(guān) 2、線性相關(guān)的步驟:畫(huà)散點(diǎn)圖 求r值 進(jìn)行假設(shè)檢驗(yàn) 對(duì)相關(guān)系數(shù)的假設(shè)檢驗(yàn)方法有兩種: 1、查表法person相關(guān)查表 2、采用t檢驗(yàn) 3、線性相關(guān)應(yīng)用中應(yīng)注意的問(wèn)題 1)散點(diǎn)圖能使我們直觀地看出兩變量間有無(wú)線性關(guān)系,所以在進(jìn)行相關(guān)分析前應(yīng)先繪出散點(diǎn)圖,當(dāng)散點(diǎn)圖

14、有線性趨勢(shì)時(shí),才進(jìn)行相關(guān)分析。 2)線性相關(guān)分析要求兩個(gè)變量都是隨機(jī)變量,而且僅適用于二元正態(tài)分布資料。 3)出現(xiàn)離群值時(shí)慎用相關(guān)。 4)相關(guān)關(guān)系并不一定是因果關(guān)系。 5)分層資料盲目合并易出假象。二、秩相關(guān) 1、秩相關(guān),又稱(chēng)為等級(jí)相關(guān),適用于下列資料 (1)不服從雙變量正態(tài)分布 (2)總體分布類(lèi)型未知 (3)用等級(jí)表示的原始資料 2、spearman等級(jí)相關(guān) 它是用等級(jí)相關(guān)系數(shù)rs說(shuō)明兩變量間相關(guān)關(guān)系的密切程度和方向。-1rs1, rs0為正相關(guān)。spearman秩相關(guān)系數(shù)計(jì)算:先將n對(duì)實(shí)測(cè)值xi與yi(i=1,2,3n)分別從小到大排序編秩;接著以秩次代入公式 rs也應(yīng)進(jìn)行相關(guān)性檢驗(yàn):在n

15、小于等于50時(shí)用查表法,秩相關(guān)查表.jpg當(dāng)n大于50時(shí)計(jì)算統(tǒng)計(jì)量t值:即前面的積差相關(guān)系數(shù)的檢驗(yàn)假設(shè)t值兩變量關(guān)聯(lián)性分析小結(jié):本章主要介紹了兩變量間的關(guān)聯(lián)性。對(duì)不同類(lèi)型,可用不同的統(tǒng)計(jì)方法去描述它們間的關(guān)聯(lián)程度。1、服從正態(tài)分布的兩連續(xù)變量,若有一份雙變量隨機(jī)樣本,可繪制散點(diǎn),發(fā)現(xiàn)有直線趨勢(shì),進(jìn)而計(jì)算pearson相關(guān)系數(shù),以描述兩變量的線性關(guān)系。2、對(duì)不滿足正態(tài)分布的兩連續(xù)變量,若有一份雙變量隨機(jī)樣本,仍可繪制散點(diǎn),發(fā)現(xiàn)有直線趨勢(shì),進(jìn)而計(jì)算spearman秩相關(guān)系數(shù),以描述兩變量的相關(guān)關(guān)系。 b、簡(jiǎn)單回歸分析回歸分析:研究一個(gè)變量如何隨另一些變量變化的方法,目的是找出應(yīng)變量與自變量的數(shù)量依

16、存關(guān)系。在描述兩變量的關(guān)系時(shí),一般把兩個(gè)變量中能精確容易測(cè)量的作自變量(x),不易測(cè)量作為因變量(y)。即用易測(cè)量的數(shù)據(jù)x估計(jì)不易測(cè)量的另一數(shù)據(jù)y。1、 線性回歸 1、直線回歸一般表達(dá)式: 其中:x 自變量 實(shí)測(cè)y值的估計(jì)值 a 在y軸上的截距 b 為斜率,表示x每改變一個(gè)單位,y的變化的值,稱(chēng)為回歸系數(shù) 2、線性回歸模型的前提條件(line)1)線性是指因變量y的總體平均值與自變量x呈線性關(guān)系2)獨(dú)立是指任意兩觀察值互相獨(dú)立。3)正態(tài)性是指任意給定x值,對(duì)應(yīng)的隨機(jī)變量y都服從正態(tài)分布4)等方差是指不同的x值所對(duì)應(yīng)的隨機(jī)變量y的方差相等。 3、回歸參數(shù)的估計(jì)最小二乘法它的基本思想是:使所有實(shí)測(cè)

17、值到回歸直線上對(duì)應(yīng)的估計(jì)值的距離的平方和為最小, 在這個(gè)準(zhǔn)則下可導(dǎo)出a、b的最小二乘估計(jì)如下: 4、步驟:1)由原始數(shù)據(jù)及散點(diǎn)圖觀察兩變量間是否有直線趨勢(shì)。 2)計(jì)算有關(guān)指標(biāo)的值 3)計(jì)算回歸系數(shù)和截距 4)列出回歸方程 5)繪制回歸直線 5、回歸系數(shù)的假設(shè)檢驗(yàn):建立樣本直線回歸方程,只是完成了統(tǒng)計(jì)分析中兩變量關(guān)系的統(tǒng)計(jì)描述,研究者還須回答它所來(lái)自的總體的直線回歸關(guān)系是否確實(shí)存在,即是否對(duì)總體有0? 總體回歸系數(shù)是總體回歸方程有無(wú)意義的關(guān)鍵,如果=0,那么=a是個(gè)常數(shù),無(wú)論x如何變化,都不影響y,回歸方程也就無(wú)實(shí)際意義。 方差分析 ,t檢驗(yàn) 1)建立假設(shè),確定檢驗(yàn)水準(zhǔn) 2)計(jì)算統(tǒng)計(jì)量值(見(jiàn)方差

18、分析用表) 3)確定p值,判斷結(jié)果 6、回歸 的應(yīng)用1.分析兩變量之間是否存在線性依存關(guān)系;2.利用回歸方程對(duì)因變量y進(jìn)行估計(jì);3.進(jìn)行統(tǒng)計(jì)控制,也就是利用回歸方程進(jìn)行逆運(yùn)算,通過(guò)控制自變量x取值來(lái)限定因變量y在一定范圍內(nèi)波動(dòng)。二、非線性回歸1.曲線直線化 當(dāng)散點(diǎn)分布的形狀接近某些常見(jiàn)的函數(shù)曲線時(shí),我們可以嘗試采取變量變換的方法,使變換后的兩個(gè)變量之間呈直線關(guān)系(通過(guò)散點(diǎn)圖判斷)。求出直線回歸方程后,再將方程中的變量還原,便得到曲線回歸方程。2.非線性回歸 當(dāng)不能通過(guò)變量變換的方法使曲線直線化或直接進(jìn)行曲線擬合時(shí),需利用非線性最小二乘估計(jì)的原則,采用迭代計(jì)算方法獲得非線性回歸方程。簡(jiǎn)單回歸分析

19、小結(jié):1、回歸分析是從預(yù)測(cè)的角度,通過(guò)建立線性回歸方程,找出兩變量之間的數(shù)量依存關(guān)系,以便用自變量(x)的數(shù)值估計(jì)因變量(y)的數(shù)值及變異;2、建立線性回歸的前提條件是線性、獨(dú)立、正態(tài)和等方差;3、最小二乘法用于回歸參數(shù)估計(jì),是指觀測(cè)樣本的實(shí)測(cè)反應(yīng)變量值與方程估計(jì)值之差的和最??;4、回歸分析的假設(shè)檢驗(yàn)方法主要包括方差分析和t檢驗(yàn);5、回歸分析可以用于統(tǒng)計(jì)預(yù)測(cè)和統(tǒng)計(jì)控制6、觀察散點(diǎn)圖是判斷線性關(guān)系或非線性關(guān)系及其類(lèi)型的既簡(jiǎn)單又直觀的方法;相關(guān)與回歸小結(jié)1、兩變量關(guān)聯(lián)性分分析:研究?jī)蓚€(gè)變量之間線性關(guān)系的強(qiáng)度和方向,兩變量均為結(jié)果變量,不分主次。在實(shí)際研究中,我們常需要通過(guò)可測(cè)或易測(cè)的變量對(duì)未知或難

20、測(cè)的變量進(jìn)行估計(jì),已達(dá)到預(yù)測(cè)目的。如年齡估算小兒體重等。 回歸分析:研究一個(gè)變量如何隨另一些變量變化的方法,研究的是變量間的依存關(guān)系。在描述兩變量的關(guān)系時(shí),一般把兩個(gè)變量中能精確容易測(cè)量的作自變量(x),不易測(cè)量作為因變量(y)。即用易測(cè)量的數(shù)據(jù)x估計(jì)不易測(cè)量的另一數(shù)據(jù)y。2、相關(guān)和回歸的區(qū)別與聯(lián)系:區(qū)別:1)相關(guān)適用于兩個(gè)變量都是正態(tài)分布的資料,回歸因變量是隨機(jī)變量,自變量既可以是隨機(jī)變量,也可以是給定的變量。2)線性相關(guān)表示兩個(gè)變量之間的相互關(guān)系是雙向的,回歸則反映變量之間的依存關(guān)系,是單向的。是一個(gè)因變量和一個(gè)自變量或者多個(gè)自變量之間的依存關(guān)系聯(lián)系:1)如果對(duì)同一資料進(jìn)行相關(guān)與回歸分析:

21、r,b同號(hào)。2)在相關(guān)分析時(shí),求出r后要進(jìn)行假設(shè)檢驗(yàn),同樣,在回歸分析中,對(duì)b也要進(jìn)行假設(shè)檢驗(yàn)。3)相關(guān)和回歸可以相互解釋。r的平方為確定系數(shù)。 越接近1,回歸效果越好。統(tǒng)計(jì)基礎(chǔ)知識(shí)1、基本步驟:設(shè)計(jì)(調(diào)查設(shè)計(jì),試驗(yàn)設(shè)計(jì)) 搜集資料 整理資料 分析資料(統(tǒng)計(jì)描述,統(tǒng)計(jì)推斷:參數(shù)估計(jì)假設(shè)檢驗(yàn))2、 基本概念: 總體與樣本:目標(biāo)總體,研究總體。概率抽樣,非概率抽樣(簡(jiǎn)單隨機(jī),系統(tǒng),分層,整群) 誤差:測(cè)量值與真實(shí)值之差(隨機(jī)誤差,系統(tǒng)誤差) 概率:p參數(shù):描述總體的統(tǒng)計(jì)指標(biāo).如總體均數(shù),總體率,總體標(biāo)準(zhǔn)差等。 統(tǒng)計(jì)量:描述樣本的統(tǒng)計(jì)指標(biāo)(用拉丁字母代表),如樣本率p,樣本標(biāo)準(zhǔn)差s等。統(tǒng)計(jì)學(xué)研究的目

22、的:就是要用樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù)-統(tǒng)計(jì)推斷。3、 定量資料的統(tǒng)計(jì)描述: 統(tǒng)計(jì)圖表:頻數(shù)分布圖(表) 統(tǒng)計(jì)指標(biāo):集中趨勢(shì)指標(biāo),離散趨勢(shì)指標(biāo)1)縱軸:頻率密度,即頻率/組距對(duì)稱(chēng)分布:頻數(shù)最多的組段在中央偏態(tài)分布:正偏峰分布:峰向左側(cè)偏移的分布,右側(cè)的組段數(shù)多于左側(cè),為右偏峰分布。負(fù)偏峰分布:峰向右側(cè)偏移的分布,左側(cè)的組段數(shù)多于右側(cè),為左偏峰分布。2) 集中趨勢(shì)統(tǒng)計(jì)指標(biāo):平均數(shù) 算術(shù)均數(shù):適合描述對(duì)稱(chēng)分布資料的集中位置(也稱(chēng)為平均水平)。對(duì)稱(chēng)分布資料,正態(tài)分布資料 幾何均數(shù):適用于樣本例數(shù)n較少的資料 對(duì)稱(chēng)正態(tài)分布,等比級(jí)數(shù)資料 注意事項(xiàng): 1.幾何均數(shù)常用于等比級(jí)數(shù)資料或資料呈倍數(shù)關(guān)系 2.觀

23、察值中不能有0。 3.觀察值中不能同時(shí)有正值和負(fù)值。 中位數(shù):偏態(tài)分布資料3) 離散趨勢(shì)統(tǒng)計(jì)指標(biāo) 極差:一組變量值最大值與最小值之差。 極差不能反映所有數(shù)據(jù)的變異大小,且受樣本含量的影響較大。樣本量接近的同類(lèi)資料相比較,極差越大意味著數(shù)據(jù)越離散。 四分位數(shù)間距:簡(jiǎn)記為q,可看為特定的百分位數(shù)。 p75表示全部觀察值中有25%(1/4)的觀察值比它大,記為上四分位數(shù)ql, p25表示全部觀察值中有25%(1/4)的觀察值比它小,記為下四分位數(shù)qu。 四分位數(shù)間距可用于描述各種分布資料,特別是對(duì)偏鋒分布資料,常把中位數(shù)和四分位數(shù)間距結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)。 方差:也稱(chēng)均方差(mean

24、 square deviation);反映一組數(shù)據(jù)的平均離散水平。同類(lèi)資料比較時(shí),方差越大意味著數(shù)據(jù)間變異越大。離均差:每一個(gè)觀察值(x)與均數(shù)()的差值(x-)。 離均差平方和(sum of squares):離均差平方后相加得到的值方差:離均差平方和除以觀察例數(shù)得到的值 變異系數(shù):用于量綱不同的變量間,或均數(shù)相差較大的變量間的比較。其計(jì)算公式為s為樣本標(biāo)準(zhǔn)差4、 定性資料的統(tǒng)計(jì)描述 相對(duì)數(shù)指標(biāo):構(gòu)成比(constituent ratio):說(shuō)明一事物內(nèi)部各組成部分在總體中所占的比重或分布,常用百分?jǐn)?shù)表示。 計(jì)算相對(duì)數(shù)的意義:使被比較的資料基數(shù)相同,扣除基數(shù)的影響,便于正確描述定性資料的水平

25、及進(jìn)行相互比較。相對(duì)數(shù)大致有三種類(lèi)型: 構(gòu)成比、率(頻率和強(qiáng)度)、相對(duì)比強(qiáng)度型指標(biāo):反映單位時(shí)間內(nèi)某現(xiàn)象發(fā)生的頻率相對(duì)比型指標(biāo) 相對(duì)比型指標(biāo)是a、b兩個(gè)有聯(lián)系的指標(biāo)之比。對(duì)比的兩個(gè)指標(biāo)可以性質(zhì)相同,也可以性質(zhì)不同。 公式為:相對(duì)比型指標(biāo)=a指標(biāo) / b指標(biāo) 注意: a、b可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)注意問(wèn)題:1.計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)有足夠的數(shù)量 2.防止概念混淆 3.正確的計(jì)算合計(jì)率(平均率) 4.相對(duì)數(shù)的對(duì)比應(yīng)注意可比性 1) 觀察對(duì)象同質(zhì),研究方法相同,觀察時(shí)間相等,以及民族、地區(qū)等客觀條件一致。2) 其他影響因素在各組的內(nèi)部構(gòu)成是否相同。 5.樣本相對(duì)數(shù)的統(tǒng)計(jì)推斷率的標(biāo)準(zhǔn)化:基本思想:就是

26、采用統(tǒng)一的標(biāo)準(zhǔn)構(gòu)成以消除內(nèi)部構(gòu)成不同對(duì)總率的影響,使標(biāo)化后的率(標(biāo)準(zhǔn)化率)具有可比性。死亡率的標(biāo)準(zhǔn)化:選擇標(biāo)準(zhǔn)人口構(gòu)成有三種途徑: 1)選擇甲組或乙組的數(shù)據(jù)做標(biāo)準(zhǔn) 。 2)選擇甲組和乙組的數(shù)據(jù)之和做標(biāo)準(zhǔn) 。 3)選擇有代表性的、較穩(wěn)定的、數(shù)量較大的人群的數(shù)據(jù)做標(biāo)準(zhǔn)(如全國(guó)、全省或本地區(qū)的數(shù)據(jù))。 ni標(biāo)準(zhǔn)組各年齡組的人口數(shù) pi被標(biāo)化組各年齡組的(死亡、出生、患?。┞?nipi被標(biāo)化組按標(biāo)準(zhǔn)組各年齡組的人口數(shù)算得的預(yù)期(死亡、出生、患?。┤藬?shù) n標(biāo)準(zhǔn)組的人口總數(shù) 預(yù)期(死亡、出生、患?。┛?cè)藬?shù)標(biāo)準(zhǔn)化法的注意事項(xiàng): 1.注意標(biāo)準(zhǔn)化法的適用條件 1)欲比較的兩個(gè)人群內(nèi)部的年齡分布不同。 2)每個(gè)人群內(nèi)部年齡別死亡率也各不相同。 2.標(biāo)化后的標(biāo)準(zhǔn)化率已不再反映當(dāng)?shù)芈实膶?shí)際水平,只表示相互比較幾組資料間的相對(duì)水平。 3.如不計(jì)算標(biāo)準(zhǔn)化率,而分別比較各小組的率,也可得出正確的結(jié)論,但不能比較總率的大小。5、常用概率分布 正態(tài)分布(連續(xù)性變量) 二項(xiàng)分布(離散型變量) poisson分布(離散型變量)1) 正態(tài)分布 概念和特征:若指標(biāo)x的頻率分布曲線對(duì)應(yīng)于數(shù)學(xué)上的正態(tài)分布曲線,則稱(chēng)該指標(biāo)服從正態(tài)分布。.關(guān)于 對(duì)稱(chēng)。即正態(tài)分布以均數(shù)為中心,左右對(duì)稱(chēng)。 2.在 處取得概率密度函數(shù)的最大值,即正態(tài)曲線在橫軸上方均數(shù)處最高。3.正態(tài)分布有兩個(gè)參數(shù),即均數(shù)和標(biāo)準(zhǔn)差。 是位置參數(shù),是變異度參

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論