




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
計量資料的統(tǒng)計描述1第2講_計量資料的統(tǒng)計描述統(tǒng)計學中的幾個基本概念1、同質(zhì)與變異2、總體與樣本3、普查與抽樣4、參數(shù)與誤差5、頻率與概率(小概率事件)
2第2講_計量資料的統(tǒng)計描述1.
同質(zhì)與
變異
同質(zhì)(homogeneity)
指事物某方面的性質(zhì)、影響條件或背景相同或相近變異(variation)
同質(zhì)個體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。是統(tǒng)計學存在的基礎。從本質(zhì)上說:統(tǒng)計學就是通過對個體變異的研究,揭示同質(zhì)事物的本質(zhì)特征與規(guī)律。
3第2講_計量資料的統(tǒng)計描述2.
總體與
樣本總體---參數(shù)(parameter)
根據(jù)研究目的確定的研究對象的全體,即性質(zhì)相同的所有觀察對象的集合;分為有限總體和無限總體。樣本---統(tǒng)計量(statistics)
總體中的部分;研究對象。總體與樣本的關(guān)系
統(tǒng)計學解決的問題:正確從樣本特征推測總體水平。抽樣:從總體中選擇樣本的過程。
樣本量(samplesize):樣本所包含的個體數(shù)目。4第2講_計量資料的統(tǒng)計描述2.
總體與
樣本參數(shù):總體統(tǒng)計學特性的數(shù)字,包括總體均數(shù)、總體方差、總體標準差;大多數(shù)得不到總體數(shù)據(jù),參數(shù)是未知的估計總體結(jié)果是統(tǒng)計學的目的之一5第2講_計量資料的統(tǒng)計描述3.普查與抽樣普查:全面調(diào)查,根據(jù)研究目的確定總體,人口普查,腫瘤普查是社會學/衛(wèi)生防疫的指標確定的依據(jù)注意時效性、變化性傳染病報告制度,地震傷亡等都屬于普查6第2講_計量資料的統(tǒng)計描述3.普查與抽樣選擇樣本的方法:概率抽樣和非概率抽樣
等概率抽樣非等概率抽樣單純隨機抽樣系統(tǒng)抽樣分層抽樣整群抽樣7第2講_計量資料的統(tǒng)計描述概率抽樣、非概率抽樣概率抽樣:每個對象被抽中的概率是已知/可計算的,其樣本統(tǒng)計量是參數(shù)估計和計算誤差的基礎;等概率抽樣:隨機抽樣不等概率抽樣:多單位被抽取的概率不同,可能會得到更有效的估計量非概率抽樣:抽樣概率未知/無法計算,按主觀、有目的、為方便進行抽樣;不能計算抽樣誤差,或一般按簡單隨機抽樣計算誤差。配額抽樣、滾雪球/識別抽樣8第2講_計量資料的統(tǒng)計描述A單純隨機抽樣 *將調(diào)查總體的全部觀察單位編號,*用抽簽法或隨機數(shù)字表法進行抽樣。*它是最基本的抽樣方法,也是其他抽樣方法的基礎。9第2講_計量資料的統(tǒng)計描述B系統(tǒng)抽樣
*按照一定順序機械地每隔若干個單位抽取一個單位,又稱機械抽樣、等距抽樣。*其抽樣間隔=(總體數(shù)量/樣本含量),一般是隨機找一個單位為起點,以后按抽樣間隔進行抽樣。10第2講_計量資料的統(tǒng)計描述C分層抽樣 *先將總體中所有觀察單位按主要特征(如年齡、性別、病情輕重等)分為若干層次.*在各層次中進行隨機抽樣。*要求層內(nèi)個體差異越小越好.層間差異越大越好。*優(yōu)點是抽樣誤差小,不同層可采用不同抽樣方法,各層可獨立進行分析。11第2講_計量資料的統(tǒng)計描述D、整群抽樣
整群抽樣不是按個體進行抽樣,而是抽取由個體組成的群體的抽樣方法。如抽取的是該地區(qū)若干個縣的全體居民。整群抽樣的主要持點是以“群”為基本抽樣單位。抽樣誤差由小到大的依次為:
分層抽樣<
系統(tǒng)抽樣<
單純隨機抽樣<
整群抽樣。思考題:普查和抽樣有什么區(qū)別和聯(lián)系?12第2講_計量資料的統(tǒng)計描述4.誤差誤差:統(tǒng)計上泛指測量值與真值之差,樣本指標與總體指標之差。主要有二種:系統(tǒng)誤差和隨機誤差(隨機測量誤差,抽樣誤差)。(1)系統(tǒng)誤差:指數(shù)據(jù)搜集和測量過程中由于儀器不準確、標準不規(guī)范等人為原因,造成觀察結(jié)果呈傾向性的偏大或偏小。
特點:具有累加性、方向性、可避免性(2).隨機誤差:由于一些非人為的偶然因素使得結(jié)果或大或小,是不確定、不可預知的。
特點:無方向性、不能避免。13第2講_計量資料的統(tǒng)計描述A、隨機測量誤差
在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對于同一樣本多次測定結(jié)果不完全一樣,結(jié)果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機測量誤差。
特點:沒有傾向性,多次測量計算平均值可以減小甚至消除隨機測量誤差。14第2講_計量資料的統(tǒng)計描述B、抽樣誤差
由于抽樣原因造成的樣本指標與總體指標之間的差別。特點:有抽樣,抽樣誤差就不可避免。但抽樣誤差有規(guī)律,統(tǒng)計上往往可以計算并在一定范圍內(nèi)控制抽樣誤差。15第2講_計量資料的統(tǒng)計描述4.頻率與概率
拋一枚硬幣,是否國徽面一定向上?明天的股市升還是降?某患者痊愈的可能性?這些問題的答案都不可能絕對。描述隨機事件發(fā)生的可能性大小的數(shù)值,常用P來表示。P的大小在0—1之間,越接近于1,說明發(fā)生的可能性越大,越接近于0,說明發(fā)生的可能性越小。
通常一個事件的發(fā)生小于5%,就叫小概率事件。頻率:在實際工作中,當觀察單位的例數(shù)足夠多時,可以用頻率來代替概率。頻率是概率的估計值。
16第2講_計量資料的統(tǒng)計描述1.統(tǒng)計工作的基本步驟是什么?2.統(tǒng)計資料分為幾類?特點?
判斷:大學教授的年收入,歐洲的國家數(shù),血紅蛋白含量,患者的資料情況。3.什么是總體?什么是樣本?4.基本的概率抽樣方法是什么?5.什么是抽樣誤差?如何減小?能否避免?小結(jié)17第2講_計量資料的統(tǒng)計描述統(tǒng)計資料的類型變量、變量值
三種基本類型:
計量資料,計數(shù)資料,等級資料*按變量值性質(zhì)——定量資料和定性資料。前講回顧18第2講_計量資料的統(tǒng)計描述計量資料的統(tǒng)計描述19第2講_計量資料的統(tǒng)計描述主要內(nèi)容頻數(shù)表與頻數(shù)圖計量資料的常用統(tǒng)計指標
(集中趨勢
離散趨勢)
正態(tài)分布正常值范圍估計20第2講_計量資料的統(tǒng)計描述第一節(jié)頻數(shù)表與頻數(shù)圖原始計量資料21第2講_計量資料的統(tǒng)計描述一.幾個基本概率
頻數(shù):當匯總大量的原始數(shù)據(jù)時,把數(shù)據(jù)按類型分組(組段),其中每個組的數(shù)據(jù)個數(shù),稱為該組的頻數(shù)。
頻數(shù)表(頻數(shù)分布):表示各組段頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。表4-1計數(shù)P44,表4-2等級,表4-3計量
P45,22第2講_計量資料的統(tǒng)計描述二、頻數(shù)表的編制得到統(tǒng)計資料找max、min、Range決定classinterval
=Range/ClassNumber確定組段的上、下限列表劃記23第2講_計量資料的統(tǒng)計描述1.求全距(R):R=最大值–
最小值
=173.6–154.7=18.9(cm)2.確定組數(shù):通常8~15組計算組距(i)i=R/組數(shù)
i=18.9/10=1.89cm取整數(shù)2cm
所以,i=2cm3.確定組段:
第一組段包括最小值,如本例為154
最后組段包括最大值,如本例172~1744.列表劃記24第2講_計量資料的統(tǒng)計描述1998年100名18歲健康女大學生身高的頻數(shù)分布身高組段(1)劃記頻數(shù)f(2)154~112156~11114158~11111,11111,111160~11111,11111,11113162~11111,11111,11111,11111,1122164~11111,11111,11111,111119166~11111,11111,1111115168~11111,11119170~11114172~17411合計10025第2講_計量資料的統(tǒng)計描述三、頻數(shù)表的主要用途:1.揭示計量資料的分布特征2.描述集中趨勢和離散趨勢3.發(fā)現(xiàn)特大和特小的可疑值26第2講_計量資料的統(tǒng)計描述四、頻數(shù)分布圖27第2講_計量資料的統(tǒng)計描述四、頻數(shù)分布圖計數(shù)資料頻數(shù)圖:橫軸等距標各類別,P47,圖4-1
;計數(shù)資料頻數(shù)圖:橫軸等距標各組段起始點,高度對應頻數(shù),圖4-2,P47。28第2講_計量資料的統(tǒng)計描述頻數(shù)分布的類型:對稱分布與偏態(tài)分布
(集中位置偏向小的一側(cè)叫正偏態(tài),又叫右偏態(tài),P48,圖4-3
反之集中位置偏大的一側(cè)叫負偏態(tài),又叫左偏態(tài),P48,圖4-4)頻數(shù)分布的兩個特征:集中趨勢與離散趨勢29第2講_計量資料的統(tǒng)計描述30第2講_計量資料的統(tǒng)計描述31第2講_計量資料的統(tǒng)計描述第二節(jié)計量資料的常用統(tǒng)計指標常用幾種平均值:1.算術(shù)均數(shù)2.幾何均數(shù)3.中位數(shù)一、集中趨勢的描述-平均值平均值是一組數(shù)據(jù)典型或有代表性的值。由于這樣典型的值趨向于落在根據(jù)數(shù)據(jù)大小排列的數(shù)據(jù)的波峰位置,因此可以用于度量集中位置。32第2講_計量資料的統(tǒng)計描述1.算術(shù)均數(shù)(均數(shù))意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示:(總體)X(樣本)計算:直接法、頻數(shù)表法特征:∑(X-X)=0注意:應用于正態(tài)分布或近似正態(tài)分布,才能求均數(shù),否則沒有意義。33第2講_計量資料的統(tǒng)計描述(1)直接計算法公式:舉例1:試計算1,3,7,9的均數(shù)?例2:試計算1,3,3,7,7,9,9,9的均數(shù)?34第2講_計量資料的統(tǒng)計描述(2)加權(quán)法35第2講_計量資料的統(tǒng)計描述100名18歲女大學生身高均數(shù)的計算(加權(quán)法)身高組段(1)頻數(shù)f(2)組中值X(3)f·X(4)154~2155310156~4157628158~111591749160~131612093162~221633586164~191653135166~151672505168~91691521170~4171684172~1741173173合計∑f=100∑f·X=163836第2講_計量資料的統(tǒng)計描述均數(shù)的特征37第2講_計量資料的統(tǒng)計描述2.幾何均數(shù)表示:Gpage50,4-4計算:直接法:
N個數(shù)值的乘積開N次方
加權(quán)法:X=lg-1[]應用:原始數(shù)據(jù)分布不對稱,但呈現(xiàn)倍數(shù)關(guān)系,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度,page50,例4-5
。ΣlgfX
Σf38第2講_計量資料的統(tǒng)計描述3.中位數(shù)、百份位數(shù)意義:將一組觀察值從小到大排序后,居于中間位置的那個值或兩個中間值的平均值。將N個觀察值從小到大依次排列,再分成100等份,對應于X%位的數(shù)值即為PX。中位數(shù)是百分位的特殊形式P50
。同樣的例子還有四分位數(shù)、十分位數(shù)等。表示:M、PX應用:偏態(tài)資料,開口資料計算:page51,4-6,4-7,4-839第2講_計量資料的統(tǒng)計描述
中位數(shù)11個大鼠存活天數(shù):4,10,7,50,3,15,2,9,13,>60,>60平均存活天數(shù)?中位數(shù)(median)是將每個變量值從小到大排列,位置居于中間的那個變量值。
存活天數(shù)2,3,4,7,9,10,13,15,50,>60,>60秩次123456789101140第2講_計量資料的統(tǒng)計描述計算
公式:
n為奇數(shù)時
n為偶數(shù)時
41第2講_計量資料的統(tǒng)計描述例9名中學生甲型肝炎的潛伏期分別為12,13,14,14,15,15,15,17,天,求其中位數(shù)。42第2講_計量資料的統(tǒng)計描述百分位數(shù)將N個觀察值從小到大依次排列,再分成100等份,對應于X%位的數(shù)值即為PX。中位數(shù)是百分位的特殊形式P50
。同樣還有四分位數(shù)、十分位數(shù)等。表示:PX=L+(nX%–ΣfL)
L組段下限,i組距,fX
組段頻數(shù),n總頻數(shù),ΣfL
以前累計頻數(shù)。應用:偏態(tài)資料計算:page51,4-8PX=12+(145×50%
–63)=13.5ifx63843第2講_計量資料的統(tǒng)計描述頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)M44第2講_計量資料的統(tǒng)計描述中位數(shù)的特征計算時只利用了位置居中的測量值優(yōu)點:對極值不敏感缺點:并非考慮到每個觀測值適用于各種分布類型的資料,特別適合于:大樣本偏態(tài)分布資料或者一端或兩端無確切數(shù)值的資料45第2講_計量資料的統(tǒng)計描述
例試分別求表3.3頻數(shù)表的第25、第75百分位數(shù)。P25=4.0+0.5x[(150x25%-36)/32]=4.02P75=5.0+0.5x[(150x75%-105)/22]=5.1746第2講_計量資料的統(tǒng)計描述
百分位數(shù)示意圖(二)百分位數(shù)47第2講_計量資料的統(tǒng)計描述一、離散趨勢的描述
集中趨勢指標(平均數(shù))只能反映指標的集中位置,不能反映變量值在分布上的“分散、參差”的離散程度,因此需要引入離散趨勢指標48第2講_計量資料的統(tǒng)計描述全距(R對變異性的描述不穩(wěn)定、粗略)四分位數(shù)間距:Q=QU-QL=P75-P25
(Q反映了中間一半觀察的極差,對變異性的描述也不夠理想)方差σ和標準差S
(方差和標準差反映了每個觀察值之間的離散程度)變異系數(shù):CV=S/x×100%
(單位不同的多組數(shù)據(jù)比較,均數(shù)相差懸殊的多組資料)49第2講_計量資料的統(tǒng)計描述方差和標準差相關(guān)概念:離均差X-μ,
離均差平方和SS=∑(X-μ)2,
方差(2,
S2):2=,
標準差(S,),
自由度n-1標準差的計算(實用公式):
S=()1/2∑fX02
-(∑fX0)2/nn-1∑(X-μ)2N50第2講_計量資料的統(tǒng)計描述標準差標準差的意義:全面反映了一組觀察值的變異程度.(越大說明圍繞均數(shù)越離散,反之說明較集中在均數(shù)周圍,均數(shù)代表性越好)標準差的應用:描述變異程度、計算標準誤、計算變異系數(shù)、描述正態(tài)分布、估計正常值范圍51第2講_計量資料的統(tǒng)計描述已知:x=119.95cm,s=4.72cm.
試問:(1)估計該地7歲男童身高在110cm以下者
占該地7歲男童的百分比。
(2)估計該地7歲男童身高在130cm
以上者占該地7歲男童的百分比。
(3)估計該地7歲男童身高在107.77cm到
132.13cm之間的占該地7歲男童的百分
比。
例題:某市1982年110名7歲男童的身高52第2講_計量資料的統(tǒng)計描述第三節(jié)正態(tài)分布1、圖形2、特征3、面積53第2講_計量資料的統(tǒng)計描述1、正態(tài)分布的圖形f(x)=1σ(2p)1/2
e–(x–μ)22σ2
54第2講_計量資料的統(tǒng)計描述正態(tài)分布55第2講_計量資料的統(tǒng)計描述2、正態(tài)分布的特征均數(shù)處最高;均數(shù)x=μ為中心對稱,兩邊以x軸為漸進線;2個參數(shù)N(位置參數(shù)u,形態(tài)參數(shù)
)曲線下的面積有一定規(guī)律,求函數(shù)積分。正態(tài)分布的特殊形式:標準正態(tài)分布N(0,1)56第2講_計量資料的統(tǒng)計描述3、面積57第2講_計量資料的統(tǒng)計描述標準正態(tài)曲線橫軸上曲線下的面積為1曲線下,橫軸上對稱于0的面積相等已經(jīng)做成標準表,供查u,已知時,進行標準正態(tài)變換再查表u,未知時,用樣本的均數(shù)和標準差代替如例6-1,page89.58第2講_計量資料的統(tǒng)計描述第四節(jié)醫(yī)學正常值范圍的估計
(又稱參考值范圍)是指特定健康人群的解剖、生理、生化等各種數(shù)據(jù)的波動范圍。習慣上是確定包括95%的人的界值。單雙側(cè):根據(jù)指標的實際用途,有的指標有上下界值,過高過低均屬異常;某些指標過高為異常,只需確定上限;某些指標過低為異常,只需確定下限。估計的方法:
1、正態(tài)分布法
2、百分位數(shù)法59第2講_計量資料的統(tǒng)計描述1.正態(tài)分布法應用條件:正態(tài)分布或近似正態(tài)分布資料計算:
雙側(cè)1–α參考范圍:X±uα/2S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國智能閥門定位器市場發(fā)展現(xiàn)狀及前景趨勢分析報告
- 2025-2030年中國建筑幕墻市場十三五規(guī)劃及投資戰(zhàn)略研究報告
- 2025-2030年中國家用電風扇市場競爭格局與前景發(fā)展策略分析報告
- 2025-2030年中國天然鈉基膨潤土行業(yè)現(xiàn)狀調(diào)研及投資策略分析報告
- 2025-2030年中國單反數(shù)碼相機市場運營狀況及發(fā)展前景分析報告
- 2025-2030年中國凹印制版行業(yè)運行態(tài)勢及投資戰(zhàn)略研究報告
- 2025-2030年中國二氧化氯發(fā)生器市場運行態(tài)勢及投資發(fā)展前景調(diào)研報告
- 人教版九年級上學期物理教學資源開發(fā)計劃
- 旅游行業(yè)客戶安全保護措施
- 電子物料基礎知識
- 外科疝氣的個案護理
- 2025屆江蘇省南京市鹽城市高三一模考試語文試題 課件
- 幼兒園保育教育質(zhì)量自評指導手冊(試行)
- 駕考科目一最完整考試題庫(完整版)包過關(guān)
- 青島版(六三制)小學數(shù)學二年級下冊全冊教學設計、教案
- 電力安全工作規(guī)程考試試題題庫
- 2024年糖尿病足診治指南解讀課件
- 兩個人合伙買攪拌車的合同
- 《商務溝通-策略、方法與案例》課件 第一章 商務溝通概論
- ISO9001、ISO14001、ISO45001三標一體內(nèi)部審核檢查表
評論
0/150
提交評論