![緒論定量數(shù)據(jù)描述演示文稿_第1頁](http://file4.renrendoc.com/view/77cf9df3710bcb677ea30520d443c52f/77cf9df3710bcb677ea30520d443c52f1.gif)
![緒論定量數(shù)據(jù)描述演示文稿_第2頁](http://file4.renrendoc.com/view/77cf9df3710bcb677ea30520d443c52f/77cf9df3710bcb677ea30520d443c52f2.gif)
![緒論定量數(shù)據(jù)描述演示文稿_第3頁](http://file4.renrendoc.com/view/77cf9df3710bcb677ea30520d443c52f/77cf9df3710bcb677ea30520d443c52f3.gif)
![緒論定量數(shù)據(jù)描述演示文稿_第4頁](http://file4.renrendoc.com/view/77cf9df3710bcb677ea30520d443c52f/77cf9df3710bcb677ea30520d443c52f4.gif)
![緒論定量數(shù)據(jù)描述演示文稿_第5頁](http://file4.renrendoc.com/view/77cf9df3710bcb677ea30520d443c52f/77cf9df3710bcb677ea30520d443c52f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
緒論定量數(shù)據(jù)描述演示文稿當(dāng)前第1頁\共有97頁\編于星期五\13點(diǎn)(優(yōu)選)緒論定量數(shù)據(jù)描述當(dāng)前第2頁\共有97頁\編于星期五\13點(diǎn)3工作生活中常見的統(tǒng)計(jì)學(xué)問題明天是否下雨?體育彩票能否中獎?(概率論)子女為什么象父母,其強(qiáng)度有多大?(相關(guān)與回歸)人口普查、疾病調(diào)查是如何進(jìn)行的?(調(diào)查設(shè)計(jì),抽樣)如何判斷藥物的療效?(假設(shè)檢驗(yàn))統(tǒng)計(jì)學(xué)是對令人困惑費(fèi)解的數(shù)字問題做出設(shè)想的藝術(shù)。當(dāng)前第3頁\共有97頁\編于星期五\13點(diǎn)4統(tǒng)計(jì)
是一種對客觀現(xiàn)象數(shù)量方面進(jìn)行的調(diào)查研究和分析;是收集、整理、分析、推斷、判斷等認(rèn)識活動的總稱。
當(dāng)前第4頁\共有97頁\編于星期五\13點(diǎn)統(tǒng)計(jì)學(xué)(Statistics)的定義
Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata.——Webster’InternationalDictionary
關(guān)于數(shù)據(jù)收集、整理、表達(dá)、分析與推斷的普遍原理和方法。當(dāng)前第5頁\共有97頁\編于星期五\13點(diǎn)統(tǒng)計(jì)學(xué)是工具學(xué)科,指導(dǎo)專業(yè)學(xué)科的學(xué)習(xí)和應(yīng)用統(tǒng)計(jì)學(xué)的發(fā)展史
源遠(yuǎn)流長統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域 日趨廣泛
當(dāng)前第6頁\共有97頁\編于星期五\13點(diǎn)7醫(yī)學(xué)統(tǒng)計(jì)學(xué)
是應(yīng)用統(tǒng)計(jì)學(xué)基本原理和方法(概率論和數(shù)理統(tǒng)計(jì)學(xué)為主)研究生物醫(yī)學(xué)領(lǐng)域問題和現(xiàn)象的一門學(xué)科。當(dāng)前第7頁\共有97頁\編于星期五\13點(diǎn)8 醫(yī)學(xué)統(tǒng)計(jì)方法在醫(yī)學(xué)研究中的運(yùn)用主要有三個方面:①以正確的方式收集數(shù)據(jù)(方法、工具)②描述數(shù)據(jù)的統(tǒng)計(jì)特征,如數(shù)據(jù)化簡、統(tǒng)計(jì)指標(biāo)的選擇與計(jì)算、統(tǒng)計(jì)結(jié)果的表達(dá)等③統(tǒng)計(jì)分析及得出正確結(jié)論,如根據(jù)概率分布,對實(shí)驗(yàn)和觀察結(jié)果存在的差異和關(guān)聯(lián)作出統(tǒng)計(jì)推斷
當(dāng)前第8頁\共有97頁\編于星期五\13點(diǎn)醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟科研設(shè)計(jì)(Designofstudy) 專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì);觀察性研究和實(shí)/試性驗(yàn)研究資料收集(Collectionofdata) 經(jīng)常性和一時性;準(zhǔn)確、及時、完整、規(guī)范原則資料整理(Classificationofdata) 系統(tǒng)化、條理化;質(zhì)分組和量分組資料分析(Analysisofdata) 統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷當(dāng)前第9頁\共有97頁\編于星期五\13點(diǎn)10統(tǒng)計(jì)資料的類型基本概念:變量及變量值,研究者對每個觀察單位的某項(xiàng)特征進(jìn)行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。按變量值的性質(zhì)可將資料分為定量資料(計(jì)量資料、數(shù)值變量)和定性資料(計(jì)數(shù)資料、分類變量)。分類變量包括無序分類(二分類、多分類)資料及有序分類(等級變量)資料。當(dāng)前第10頁\共有97頁\編于星期五\13點(diǎn)111.計(jì)量資料(定量數(shù)據(jù))定義:通過度量衡的方法,測量每一個觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):通常有單位(可沒有),數(shù)值大小衡量水平高低分為連續(xù)型和離散型例如:患者的身高(cm)、體重(kg)、血壓(mmHg)脈搏(次/分)、紅細(xì)胞計(jì)數(shù)(1012/L)當(dāng)前第11頁\共有97頁\編于星期五\13點(diǎn)12定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個數(shù)。特點(diǎn):通常沒有度量衡單位,互不相容的類別和屬性。多為間斷性資料(沒有程度和順序上的差別),如膚色(黑、白)、血型(ABO)、職業(yè)(工、農(nóng)、醫(yī))、性別(男、女)
2.計(jì)數(shù)資料(定性數(shù)據(jù))當(dāng)前第12頁\共有97頁\編于星期五\13點(diǎn)13定義:介于計(jì)量資料和計(jì)數(shù)資料之間的一種資料,通過半定量方法測量得到。特點(diǎn):各組之間有性質(zhì)上的差別,程度上的增減關(guān)系。①癌癥分期:早、中、晚。②藥物療效:治愈、好轉(zhuǎn)、無效、死亡。③尿蛋白:,,++,+++及以上3.等級資料(有序分類)當(dāng)前第13頁\共有97頁\編于星期五\13點(diǎn)判斷資料類型的標(biāo)準(zhǔn): 是否按屬性分類, 每個觀察對象是否有一個確切的值 有:計(jì)量 無:計(jì)數(shù)
當(dāng)前第14頁\共有97頁\編于星期五\13點(diǎn)住院號年齡身高體重住院天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局20256552716571.55無中學(xué)順產(chǎn)足月20256532216074.05無小學(xué)助產(chǎn)足月20258302515868.06管理員大學(xué)順產(chǎn)足月20225432316169.05無中學(xué)剖宮產(chǎn)足月20224662515962.011商業(yè)中學(xué)剖宮產(chǎn)足月20245352715768.02無小學(xué)順產(chǎn)早產(chǎn)20258342015866.04無中學(xué)助產(chǎn)早產(chǎn)20194642415870.53無中學(xué)助產(chǎn)足月20257832915457.07干部中學(xué)剖宮產(chǎn)足月Quantitativedata計(jì)量資料Qualitativedata計(jì)數(shù)資料變量觀察單位當(dāng)前第15頁\共有97頁\編于星期五\13點(diǎn)16三類資料間關(guān)系
例:一組2040歲成年人血壓(100人)以12kPa為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù)
<8低血壓
8
正常血壓
12
輕度高血壓
15
中度高血壓
17
重度高血壓計(jì)量資料等級資料計(jì)數(shù)資料當(dāng)前第16頁\共有97頁\編于星期五\13點(diǎn)17資料的轉(zhuǎn)化(變量類型的轉(zhuǎn)化)
數(shù)值變量分類變量
例如:測得5人的白細(xì)胞(個/mm3)數(shù)如下:
300060005000800012000數(shù)值變量異常正常正常正常異常分類變量若按正常3人,異常2人分組→二分類變量若按過低(1人),正常(3人),過高(1人)分組→等級資料高級向低級,高精度向低精度當(dāng)前第17頁\共有97頁\編于星期五\13點(diǎn)復(fù)習(xí): 1、調(diào)查某地某年7歲正常男童的身高 2、觀察某人群脈搏數(shù)(次/分) 3、小鼠染毒后細(xì)胞轉(zhuǎn)化率分別為20%,50%,75%,…… 4、觀察某人群脈搏數(shù),定義脈搏數(shù)在 60次/分~100次/分為正常,<60次/分或>100次/分為異常,按“正常”與“異?!狈謩e清點(diǎn)人數(shù)得到的資料當(dāng)前第18頁\共有97頁\編于星期五\13點(diǎn)統(tǒng)計(jì)學(xué)中的基本概念
(一)同質(zhì)與變異(二)總體與樣本(三)參數(shù)與統(tǒng)計(jì)量(四)誤差(五)概率與頻率當(dāng)前第19頁\共有97頁\編于星期五\13點(diǎn)(一)同質(zhì)與變異
homogeneityandvariation
1、同質(zhì):是指符合研究目的所確定的納入對象和排除對象的條件組合。觀察單位性質(zhì)大致相同如:研究兒童的生長發(fā)育,規(guī)定的同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)的兒童。2、變異:同質(zhì)研究對象某種效應(yīng)指標(biāo)測量值的波動性。性質(zhì)相同的同質(zhì)對象的某個或某幾個特征的差異,而使得測量結(jié)果不同。這種個體間的差異即為變異。當(dāng)前第20頁\共有97頁\編于星期五\13點(diǎn)同質(zhì)與變異的舉例例1調(diào)查2006年重慶7歲男童的身高和體重同質(zhì):2006年、重慶市、7歲男童變異:身高和體重各不相同例2研究某降壓藥的療效同質(zhì):高血壓患者、用某藥治療變異:療效各不相同當(dāng)前第21頁\共有97頁\編于星期五\13點(diǎn)(二)總體與樣本
populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對象測量值的全體,其某種變量值的集合。分有限總體與無限總體樣本:從總體中隨機(jī)抽取的部分觀察單位,其實(shí)測值的集合。
當(dāng)前第22頁\共有97頁\編于星期五\13點(diǎn)當(dāng)前第23頁\共有97頁\編于星期五\13點(diǎn)樣本可靠性、代表性的條件隨機(jī)抽樣(隨機(jī)≠隨便)樣本含量:足夠數(shù)量構(gòu)成:樣本的分布與總體的分布一致當(dāng)前第24頁\共有97頁\編于星期五\13點(diǎn)隨機(jī)抽樣
randomsampling隨機(jī)抽樣方法(在總體中每個個體具有相同的機(jī)會被抽到)。當(dāng)前第25頁\共有97頁\編于星期五\13點(diǎn)樣本含量充足:根據(jù)一定條件計(jì)算樣本的結(jié)構(gòu)分布與總體的分布特征一致例如:欲研究重慶市7歲兒童的生長發(fā)育情況總體:男107:女100樣本:應(yīng)該接近或近似男107:女100當(dāng)前第26頁\共有97頁\編于星期五\13點(diǎn)(三)參數(shù)與統(tǒng)計(jì)量
parameterandstatistic參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。固定的常數(shù)
總體樣本抽取部分觀察單位統(tǒng)計(jì)量
參數(shù)
推斷inference統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為
。是參數(shù)附近波動的隨機(jī)變量。當(dāng)前第27頁\共有97頁\編于星期五\13點(diǎn)(四)誤差error誤差:實(shí)際觀察值與客觀真實(shí)值之間的差別,以及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別。實(shí)際觀測過程中,在相同條件下,由受試對象、研究者、儀器設(shè)備、研究方法、非實(shí)驗(yàn)因素影響等原因(4ME)造成的測定值的波動性和對真實(shí)值的偏離。根據(jù)性質(zhì)和來源分為(1)系統(tǒng)誤差(2)隨機(jī)誤差當(dāng)前第28頁\共有97頁\編于星期五\13點(diǎn)(1)系統(tǒng)誤差systematicerror特點(diǎn):大小恒定、傾向性、周期性、累加性的偏離真值??梢酝ㄟ^嚴(yán)格的實(shí)驗(yàn)設(shè)計(jì)預(yù)防和技術(shù)措施消除當(dāng)前第29頁\共有97頁\編于星期五\13點(diǎn)(2)隨機(jī)誤差randomerror排除系統(tǒng)誤差后尚存的誤差,受多種無法控制的因素的影響。特點(diǎn):大小方向不一的隨機(jī)變化,客觀不可避免。隨機(jī)測量誤差:由于偶然因素,對于同一樣本多次測定結(jié)果不完全一樣,結(jié)果有時偏大有時偏小,沒有傾向性,多次測量計(jì)算平均值可以減小甚至消除。隨機(jī)抽樣誤差:由抽樣造成(個體變異造成)的樣本統(tǒng)計(jì)量和總體參數(shù)間的差異。(1)改進(jìn)抽樣方法,增加樣本的代表性。
樣本量n相等的情況下:
整群抽樣>單純隨機(jī)抽樣>系統(tǒng)抽樣>分層抽樣(2)增加樣本量n(3)選擇變異程度較小的研究指標(biāo)當(dāng)前第30頁\共有97頁\編于星期五\13點(diǎn)(五)概率與頻率
probabilityandfrequency
確定性現(xiàn)象:在某種條件下,一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。
隨機(jī)現(xiàn)象:在同樣條件下可能會出現(xiàn)多種結(jié)果,究竟會發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機(jī)事件。隨機(jī)事件的特征:①隨機(jī)性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。概率:描述隨機(jī)事件發(fā)生的可能性大小的度量,用大寫的P
表示,是一個穩(wěn)定的值;取值[0,1]。當(dāng)前第31頁\共有97頁\編于星期五\13點(diǎn)必然事件P=1不可能事件P=0隨機(jī)事件0<P<1小概率事件:P≤0.05(5%)或P≤0.01(1%)的隨機(jī)事件稱為小概率事件。小概率原理:在統(tǒng)計(jì)學(xué)上,小概率事件在一次抽樣或一次實(shí)驗(yàn)中當(dāng)作不發(fā)生。(結(jié)論有風(fēng)險)小概率事件當(dāng)前第32頁\共有97頁\編于星期五\13點(diǎn)樣本的實(shí)際發(fā)生率稱為頻率,具有波動性。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。頻率與概率間的關(guān)系:樣本頻率總是圍繞概率上下波動重復(fù)次數(shù)越多,樣本含量越大,波動幅度越小,頻率越接近概率。即概率可以用穩(wěn)定的頻率進(jìn)行解釋。頻率frequency當(dāng)前第33頁\共有97頁\編于星期五\13點(diǎn)學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的問題1、統(tǒng)計(jì)學(xué)研究的是群體(總體)的數(shù)量特征;↑適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)2、學(xué)會統(tǒng)計(jì)學(xué)的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性↑醫(yī)學(xué)專業(yè)知識解釋當(dāng)前第34頁\共有97頁\編于星期五\13點(diǎn)學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的問題3、不要求公式來源、推導(dǎo),不要求復(fù)雜公式的記憶,但要了解其意義、用途和應(yīng)用條件4、不同資料類型采用不同統(tǒng)計(jì)方法進(jìn)行分析,因此一定要能正確區(qū)分統(tǒng)計(jì)資料的類型。5、正確理解統(tǒng)計(jì)學(xué)的基本概念當(dāng)前第35頁\共有97頁\編于星期五\13點(diǎn)資料的統(tǒng)計(jì)描述當(dāng)前第36頁\共有97頁\編于星期五\13點(diǎn)統(tǒng)計(jì)描述的意義社會活動看似雜亂無章,對個體來說有很多不確定性,但總體上都是服從一些統(tǒng)計(jì)規(guī)律的。醫(yī)學(xué)工作有很多數(shù)據(jù),統(tǒng)計(jì)學(xué)描述就是對這些數(shù)據(jù)進(jìn)行加工和提煉,找出規(guī)律、預(yù)測未知。當(dāng)前第37頁\共有97頁\編于星期五\13點(diǎn) 概念: 用適當(dāng)?shù)慕y(tǒng)計(jì)統(tǒng)計(jì)圖(表)和統(tǒng)計(jì)指標(biāo)對原始數(shù)據(jù)的分布規(guī)律及其數(shù)量特征進(jìn)行測定和描述。 特點(diǎn):
用直觀、簡單的形式揭示數(shù)據(jù)資料蘊(yùn)含的內(nèi)在信息。是統(tǒng)計(jì)推斷的基礎(chǔ)。
當(dāng)前第38頁\共有97頁\編于星期五\13點(diǎn)計(jì)量資料離散型計(jì)量資料:變量取值可一一列舉。如:正常人的脈搏次數(shù)、每個育齡婦女的現(xiàn)有子女?dāng)?shù)等。連續(xù)型計(jì)量資料:變量取值不能一一列舉,而是一定范圍內(nèi)的任意值。如人體身高、體重的變化、大氣中二氧化碳濃度等。當(dāng)前第39頁\共有97頁\編于星期五\13點(diǎn)計(jì)量資料的統(tǒng)計(jì)描述方法:(單變量)1.通過頻數(shù)表描述數(shù)據(jù)特征2.用統(tǒng)計(jì)指標(biāo)描述數(shù)據(jù)的特征。
當(dāng)前第40頁\共有97頁\編于星期五\13點(diǎn)頻數(shù)和頻數(shù)表頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù),即某個測量值的個(例)數(shù)。頻數(shù)分布表(frequencydistributiontable):
又稱頻數(shù)表,是將原始數(shù)據(jù)進(jìn)行適當(dāng)分組后得到各組的頻數(shù)而形成的表格。 通過頻數(shù)表可了解數(shù)據(jù)分布范圍、集中位置、分布形態(tài)等特征。編制方法:手工、軟件(如SAS、SPSS等)當(dāng)前第41頁\共有97頁\編于星期五\13點(diǎn)離散型變量的頻數(shù)分布 例1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4等共96個數(shù)值當(dāng)前第42頁\共有97頁\編于星期五\13點(diǎn)表1998年某地96名婦女產(chǎn)前檢查次數(shù)分布檢查次數(shù)頻數(shù)頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.561212.596100.0合計(jì)96100
制作要點(diǎn):分別清點(diǎn)每一種取值的個數(shù);也可以將尾部的多個取值作為一個組進(jìn)行計(jì)數(shù)。本例編制頻數(shù)表如下:當(dāng)前第43頁\共有97頁\編于星期五\13點(diǎn)6當(dāng)前第44頁\共有97頁\編于星期五\13點(diǎn)連續(xù)型變量的頻數(shù)分布 將數(shù)據(jù)分成適當(dāng)組段,計(jì)數(shù)每組的頻數(shù),編制成的頻數(shù)分布表,則能顯示出數(shù)據(jù)分布的特點(diǎn)。
例:某年某市120名12歲男童的身高(cm)資料如下,作統(tǒng)計(jì)描述。當(dāng)前第45頁\共有97頁\編于星期五\13點(diǎn)142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9當(dāng)前第46頁\共有97頁\編于星期五\13點(diǎn)1、求數(shù)據(jù)的極差(全距)(range):極差是全部數(shù)據(jù)中的最大值與最小值之差,它描述了數(shù)據(jù)變異的幅度。本例極差:
R=160.9-125.9=35cm當(dāng)前第47頁\共有97頁\編于星期五\13點(diǎn)142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2
125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7
160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9當(dāng)前第48頁\共有97頁\編于星期五\13點(diǎn)2、劃分組段(1)確定組數(shù):制作頻數(shù)表是為了簡化資料,顯示數(shù)據(jù)的分布規(guī)律,因此組數(shù)不能太多。也不能太少,太少會掩蓋數(shù)據(jù)分布的規(guī)律。適宜的分組數(shù)與觀察值的個數(shù)n的多少有關(guān)。n在50以下,可分5~8組,n在50以上,可分9~15組,一般取10組左右。當(dāng)前第49頁\共有97頁\編于星期五\13點(diǎn)(2)確定組距一般采取等距分組。組距=極差/組數(shù)取整數(shù),或根據(jù)專業(yè)習(xí)慣取整齊數(shù)值
本例組距=35/10=3.5≈4當(dāng)前第50頁\共有97頁\編于星期五\13點(diǎn)(3)確定各組段的組限:下限(lowlimit):每個組段的起點(diǎn)上限(upperlimit):每個組段的終點(diǎn) 上限=下限+組距
第一組段必須包含最小值,其下限一般取包含最小值的較為整齊的數(shù)值。本例最小值為125.9,取125為第一組段的下限。其上限=125+4=129。各組段不能重疊,每一組段均為半開區(qū)間當(dāng)前第51頁\共有97頁\編于星期五\13點(diǎn)3、統(tǒng)計(jì)頻數(shù)繪制頻數(shù)表當(dāng)前第52頁\共有97頁\編于星期五\13點(diǎn)4、頻率與累計(jì)頻率頻率:頻數(shù)表中的各組頻數(shù)之和等于總例數(shù)n,將各組的頻數(shù)除以n所得的比值被稱為頻率。累計(jì)頻數(shù):某組段及前面各組段的頻數(shù)之和。累計(jì)頻率:累計(jì)頻數(shù)除以總例數(shù)。當(dāng)前第53頁\共有97頁\編于星期五\13點(diǎn)125129133137141145149153157對稱分布當(dāng)前第54頁\共有97頁\編于星期五\13點(diǎn)(二)頻數(shù)分布特征從頻數(shù)表,特別是頻數(shù)分布圖可以看到頻數(shù)分布有兩個特征:1、集中位置:數(shù)據(jù)向某個位置聚集或集中地傾向。大多數(shù)12歲男童的身高集中在中央部分;2、離散程度:數(shù)據(jù)分散性和變異程度。少數(shù)男童具有較低和較高身高,頻數(shù)向兩端逐漸減少。當(dāng)前第55頁\共有97頁\編于星期五\13點(diǎn)(三)頻數(shù)分布的類型1、對稱分布:指集中位置在中間,左右兩側(cè)對稱。正態(tài)分布:中間組段頻數(shù)最多,兩側(cè)對稱,規(guī)律下降2、偏態(tài)分布:指集中位置偏向一側(cè),頻數(shù)分布不對稱。 正偏態(tài):集中位置偏向數(shù)值較小一側(cè)(左側(cè))
負(fù)偏態(tài):集中位置偏向數(shù)值較大一側(cè)(右側(cè))當(dāng)前第56頁\共有97頁\編于星期五\13點(diǎn)圖2-1
101名正常成年女性血清總膽固醇頻數(shù)分布
頻數(shù)血清總膽固醇對稱分布當(dāng)前第57頁\共有97頁\編于星期五\13點(diǎn)圖2-259名鏈球菌咽喉炎患者潛伏期正偏態(tài)分布當(dāng)前第58頁\共有97頁\編于星期五\13點(diǎn)
負(fù)偏態(tài)分布當(dāng)前第59頁\共有97頁\編于星期五\13點(diǎn)(五)頻數(shù)分布表的用途1、揭示資料的分布特征及類型2、便于發(fā)現(xiàn)某些特大或特小的可疑值3、組段的頻率作為概率的估計(jì)4、便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理當(dāng)前第60頁\共有97頁\編于星期五\13點(diǎn)4、某單位職工體檢101名正常成年女子的血清總膽固醇(mmol/L)5、某醫(yī)院1998年在某城區(qū)隨機(jī)調(diào)查了8589例60歲以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例,高血壓患病率為2823/8589*100/%=32.87% 總體與樣本、統(tǒng)計(jì)量與參數(shù)、系統(tǒng)誤差與抽樣誤差當(dāng)前第61頁\共有97頁\編于星期五\13點(diǎn)計(jì)量資料描述統(tǒng)計(jì)指標(biāo)當(dāng)前第62頁\共有97頁\編于星期五\13點(diǎn)一、描述集中位置的特征數(shù)(平均指標(biāo))總稱為平均數(shù)(average)反映了資料的集中傾向(centraltendency)的位置和平均水平。作用:是一組計(jì)量數(shù)據(jù)平均水平的代表值;可作為不同組間的比較值。常用的有:
1.算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)
(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
當(dāng)前第63頁\共有97頁\編于星期五\13點(diǎn)一、算術(shù)均數(shù)簡稱均數(shù)
總體均數(shù)用表示
樣本均數(shù)用表示頻數(shù)為正態(tài)或近似正態(tài)分布的計(jì)量資料適用條件當(dāng)前第64頁\共有97頁\編于星期五\13點(diǎn)1、直接法(樣本例數(shù)較少)將所有數(shù)據(jù)直接相加,再除以總例數(shù)n:當(dāng)前第65頁\共有97頁\編于星期五\13點(diǎn)例如:測定了5名健康人第一小時末血沉,分別是6、3、2、9、10mm,求均數(shù)當(dāng)前第66頁\共有97頁\編于星期五\13點(diǎn)2、加權(quán)法(樣本例數(shù)較多,近似計(jì)算) 觀察力數(shù)較多,編制頻數(shù)表后,用各組段的組中值代替該組段中的任一觀察值,該組段的頻數(shù)是f,即有f個組中值,則有組中值與頻數(shù)的乘積代替該組段的各個值相加。計(jì)算公式:當(dāng)前第67頁\共有97頁\編于星期五\13點(diǎn)利用頻數(shù)表,將每組段的組中值,即(下限+上限)/2,代替該組段觀察值的實(shí)際取值,用加權(quán)法求算術(shù)平均數(shù)。在樣本例數(shù)較多的情況下,加權(quán)法與直接法算得的結(jié)果相差不大。見P10當(dāng)前第68頁\共有97頁\編于星期五\13點(diǎn)均數(shù)的特征當(dāng)數(shù)據(jù)呈單峰對稱分布時,位于分布的中心,它是頻數(shù)分布最集中的位置。但易受極端值影響各觀察值與均數(shù)之差的總和等于0各觀察值的離均差平方和最小
當(dāng)前第69頁\共有97頁\編于星期五\13點(diǎn)均數(shù)的應(yīng)用:反應(yīng)一組同質(zhì)觀察值的平均水平作為樣本代表值與其他樣本比較適用于描述單峰對稱分布(正態(tài)或近似正態(tài))的集中位置當(dāng)前第70頁\共有97頁\編于星期五\13點(diǎn)二、幾何均數(shù)(G,geometricmean) 適用于①原始數(shù)據(jù)分布不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料;②滴度資料(等比資料)。 如抗體滴度、細(xì)菌計(jì)數(shù)等。公式:當(dāng)前第71頁\共有97頁\編于星期五\13點(diǎn) 例2.2測得10個人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。
當(dāng)前第72頁\共有97頁\編于星期五\13點(diǎn)幾何均數(shù)是對數(shù)轉(zhuǎn)換后的數(shù)據(jù)的算術(shù)均數(shù)的反對數(shù)。對于每組相同觀察值較多的資料,也可用加權(quán)法計(jì)算幾何均數(shù):例2.3(頻數(shù)表資料)應(yīng)用:主要用于血清學(xué)和微生物學(xué)中。
當(dāng)前第73頁\共有97頁\編于星期五\13點(diǎn)幾何均數(shù)應(yīng)用注意事項(xiàng):常用于等比資料和對數(shù)正態(tài)分布資料觀察值中不宜出現(xiàn)0和負(fù)值若觀察值全是負(fù)值,可先去掉負(fù)號,得出結(jié)果后加上。當(dāng)前第74頁\共有97頁\編于星期五\13點(diǎn)三、中位數(shù)(median)
中位數(shù)是指將一組觀察值從小到大排序后居于中間位置的那個數(shù)值,全部觀察值中,大于和小于中位數(shù)的觀察值個數(shù)相等。任何分布的定量數(shù)據(jù)均可用中位數(shù)描述其分布的集中位置。當(dāng)前第75頁\共有97頁\編于星期五\13點(diǎn)直接法公式:
當(dāng)n為偶數(shù)時 當(dāng)n為奇數(shù)時當(dāng)前第76頁\共有97頁\編于星期五\13點(diǎn)1.原始資料如測得5個人的VLDL中的apo_B的含量(mg/dl)為0.84、2.85、5.46、8.58、9.60,則
M=5.46(mg/dl)若測量結(jié)果:0.84、2.85、8.58、9.6,則
M=(2.85+8.58)/2=5.72(mg/dl)當(dāng)前第77頁\共有97頁\編于星期五\13點(diǎn)
2.頻數(shù)表資料表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數(shù)累積頻數(shù)累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.6M1.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0合計(jì)630--當(dāng)前第78頁\共有97頁\編于星期五\13點(diǎn)L、iM、fM分別為M所在組段的下限、組距和頻數(shù),fL為M所在組段之前各組段的累積頻數(shù)。當(dāng)前第79頁\共有97頁\編于星期五\13點(diǎn)連續(xù)型變量中位數(shù)的的計(jì)算可用公式:
組距中位數(shù)所在組前一組的累計(jì)頻數(shù)
中位數(shù)所在組下限中位數(shù)所在組的頻數(shù)下限值L上限值Ui
fm中位數(shù)Md當(dāng)前第80頁\共有97頁\編于星期五\13點(diǎn)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時:均數(shù)=中位數(shù)正偏態(tài)分布時:均數(shù)>中位數(shù)負(fù)偏態(tài)分布時:均數(shù)<中位數(shù)當(dāng)前第81頁\共有97頁\編于星期五\13點(diǎn)四、百分位數(shù)(percentile) 是一種位置指標(biāo),樣本的第X百分位數(shù)常記為PX(XPK),它是指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分成兩部分,在不包括PX的全部數(shù)據(jù)中有X%的數(shù)據(jù)小于PX
,有(100-X)%的數(shù)據(jù)大于PX
。當(dāng)前第82頁\共有97頁\編于星期五\13點(diǎn)中位數(shù)是特殊的百分位數(shù),第50百分位數(shù),M=P50
。連續(xù)性變量頻數(shù)表資料百分位數(shù)計(jì)算公式:P12例子當(dāng)前第83頁\共有97頁\編于星期五\13點(diǎn)百分位數(shù)的應(yīng)用1、中位數(shù)是百分位數(shù)的特例。其特點(diǎn)是不易受異常值的影響,適用于描述明顯偏態(tài)分布、或兩端無確定數(shù)值數(shù)據(jù)的平均水平。2、多個百分位數(shù)相結(jié)合可以用來說明一特定的問題:離散程度、參考值范圍、把資料劃分等級當(dāng)前第84頁\共有97頁\編于星期五\13點(diǎn)小結(jié):
集中位置的描述——平均數(shù)
平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。
不同的分布使用不同的指標(biāo)
(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料幾何均數(shù):對數(shù)正態(tài)分布或等比級數(shù)資料中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)當(dāng)前第85頁\共有97頁\編于星期五\13點(diǎn)二、描述離散程度的統(tǒng)計(jì)指標(biāo)
平均數(shù)并不能使我們?nèi)娴卣J(rèn)識事物,試看下例:例:
對甲、乙兩名高血壓患者連續(xù)觀察5天,測得的收縮壓分別為(mmHg):甲患者162145178142186(=162.6)乙患者164160163
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人股份轉(zhuǎn)讓協(xié)議書
- 勞務(wù)合同到期不續(xù)簽
- 信息管理系統(tǒng)建設(shè)及維護(hù)合同
- 石油鉆井服務(wù)合同
- 房屋委托租賃居間服務(wù)合同
- 大型挖掘機(jī)買賣合同
- 綜合辦公服務(wù)合同
- 雙11策劃活動方案模板
- 公司內(nèi)部借款協(xié)議
- 連鎖餐飲企業(yè)加盟合同
- 監(jiān)獄服裝加工企業(yè)開展全面
- 京東考試答案參考
- 建筑施工圖-剖面圖
- 我國動車組各型車輔助供電分析與比較
- 標(biāo)書密封條格式模版(共19頁)
- 小學(xué)一年級硬筆書法入門(課堂PPT)
- 色彩的形式美感
- SMT車間溫濕度點(diǎn)檢記錄表
- 畢赤酵母發(fā)酵手冊
- 罩極電機(jī)檢驗(yàn)細(xì)則
- 人音版一年級音樂下冊全冊教案(一)
評論
0/150
提交評論