版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章緒論主講老師:暨南大學(xué)
陳青山暨南大學(xué)醫(yī)學(xué)院第一章緒論主講老師:暨南大學(xué)醫(yī)學(xué)院統(tǒng)計(jì)學(xué)是一門透過同質(zhì)事物的變異性、揭示內(nèi)在事物規(guī)律性和實(shí)質(zhì)性的科學(xué),確切地講,是一門關(guān)于客觀數(shù)據(jù)分析的科學(xué),研究數(shù)據(jù)的收集、整理和分析。應(yīng)用統(tǒng)計(jì)分析是應(yīng)用者圍繞應(yīng)用分析的目的,根據(jù)數(shù)據(jù)或數(shù)據(jù)庫中變量的特征和類型,以及變量與變量間關(guān)系所實(shí)施的數(shù)據(jù)分析。認(rèn)識(shí)統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)分析統(tǒng)計(jì)學(xué)是一門透過同質(zhì)事物的變異性、揭示內(nèi)在事物規(guī)律性和實(shí)質(zhì)性第一節(jié)統(tǒng)計(jì)學(xué)的幾組基本概念一、指標(biāo)與變量指標(biāo)(index)即觀察指標(biāo),是由研究目的確定的觀察對(duì)象的內(nèi)在屬性特征或其相關(guān)的影響因素。例如,某地區(qū)小學(xué)生身體生長(zhǎng)發(fā)育(如身高、體重等)的影響因素研究中,身高、體重反映了小學(xué)生身體生長(zhǎng)發(fā)育的特征,分別稱為研究的身高指標(biāo)、體重指標(biāo),影響身高體重的有關(guān)因素有性別、年齡等,成為研究的性別指標(biāo)、年齡指標(biāo)等。第一節(jié)統(tǒng)計(jì)學(xué)的幾組基本概念一、指標(biāo)與變量例如,某地區(qū)小學(xué)生例如,小學(xué)生身體生長(zhǎng)發(fā)育的身高、體重指標(biāo),在統(tǒng)計(jì)計(jì)算時(shí),分別稱為身高變量、體重變量。統(tǒng)計(jì)學(xué)是一門關(guān)于變量(或變量值)分析的科學(xué)。變量(variable)觀察變量,也稱變化的量,實(shí)際上就是觀察指標(biāo),一般特指用于數(shù)學(xué)、統(tǒng)計(jì)或軟件計(jì)算的分析指標(biāo)。變量值,即為某一變量的觀察值或測(cè)量結(jié)果。例如,測(cè)得某個(gè)小學(xué)生的身高1.20m、體重30kg,可分別稱該小學(xué)生身高的變量值為1.20m、體重的變量值為30kg。例如,小學(xué)生身體生長(zhǎng)發(fā)育的身高、體重指標(biāo),在統(tǒng)計(jì)計(jì)算時(shí),分別二、影響變量與結(jié)果變量結(jié)果變量(outcomevariable)又稱因變量(dependentvariable)或反應(yīng)變量(responsevariable),指受到影響變量的影響而變化的量,是影響變量變化的結(jié)果。影響變量(affectvariable)也稱自變量(independentvariable),指自身變化并影響結(jié)果變量變化的量;二、影響變量與結(jié)果變量結(jié)果變量(outcomevariab統(tǒng)計(jì)學(xué)是一門關(guān)于結(jié)果變量與影響變量(簡(jiǎn)稱變量與變量)間關(guān)系分析的科學(xué)。如果分析某地小學(xué)生體重依賴于年齡的變化規(guī)律,那么年齡可看作是影響變量,體重則為結(jié)果變量;如果分析不同性別之間身高是否存在統(tǒng)計(jì)學(xué)差異,那么性別是影響變量,身高是結(jié)果變量。統(tǒng)計(jì)學(xué)是一門關(guān)于結(jié)果變量與影響變量(簡(jiǎn)稱變量與變量)間關(guān)系分總體(population)根據(jù)研究目的確定的同質(zhì)觀察單位的全體?;颍|(zhì)所有觀察對(duì)象某變量值的集合?;?,所有觀察對(duì)象的某個(gè)觀察指標(biāo)(即變量)的全部觀察值。三、總體與樣本例如,在飲用和不飲用早餐奶對(duì)某地區(qū)小學(xué)生身體生長(zhǎng)發(fā)育影響的研究中,該地區(qū)符合條件的所有小學(xué)生常常被認(rèn)為是該研究的總體。實(shí)際上還要具體區(qū)分不同指標(biāo)的總體,該研究的身高總體是所有研究對(duì)象的身高值,該研究的體重總體是所有研究對(duì)象的體重值。研究的總體中,有的研究對(duì)象(或變量值)的個(gè)數(shù)是可數(shù)的,稱為有限總體,有的是不可數(shù)的,稱為無限總體??傮w(population)三、總體與樣本例如,在飲用和不飲隨機(jī)抽樣:一種從總體中隨機(jī)抽取具有代表性的部分個(gè)體進(jìn)行統(tǒng)計(jì)分析并用以研究總體的方法。樣本(sample):從總體中隨機(jī)抽樣獲得的部分觀察對(duì)象的變量值。樣本含量(samplesize):樣本中變量值的個(gè)數(shù)隨機(jī)抽樣:已經(jīng)證明,一定樣本含量的樣本信息可以推斷其總體的相關(guān)特征。統(tǒng)計(jì)學(xué)是一門研究樣本,推論總體的科學(xué)。已經(jīng)證明,一定樣本含量的樣本信息可以推斷其總體的相關(guān)特征。統(tǒng)四、同質(zhì)與變異同質(zhì)(homogeneity):指研究對(duì)象具有相同或相近的性質(zhì)、條件或影響因素。在上述早餐奶對(duì)某地區(qū)小學(xué)生身高體重影響的研究中,該地區(qū)全體小學(xué)生可認(rèn)為是同質(zhì)的,因?yàn)檫@些研究對(duì)象具有相同的地域、相同的身份、相近的年齡……許多研究中常常給出篩選對(duì)象的診斷標(biāo)準(zhǔn)、納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn),目的就是為了保證研究對(duì)象的同質(zhì)性。四、同質(zhì)與變異同質(zhì)(homogeneity):指研究對(duì)象具有變異(variation):同質(zhì)研究對(duì)象中某些研究特征的差異性。在早餐奶的研究中,該地區(qū)全體小學(xué)生具有同質(zhì)性,但它們的身高有高有矮、體重有輕有重……表現(xiàn)為變異。同質(zhì)總體中個(gè)體變異的絕對(duì)性,是統(tǒng)計(jì)學(xué)賴以存在的基礎(chǔ)。因此,統(tǒng)計(jì)學(xué)是一門研究變異的科學(xué)。變異(variation):同質(zhì)總體中個(gè)體變異的絕對(duì)性,是統(tǒng)五、參數(shù)和統(tǒng)計(jì)量參數(shù)(parameter)描述研究總體特征的指標(biāo)。用希臘字母代表,如:總體均數(shù)μ、總體率π、總體標(biāo)準(zhǔn)差σ等。統(tǒng)計(jì)量(statistic)根據(jù)樣本變量值計(jì)算的、描述樣本特征的指標(biāo)。用拉丁字母代表,如:樣本均數(shù)x?、樣本率p、樣本標(biāo)準(zhǔn)差S等。總體參數(shù)未知時(shí),常常通過樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)或假設(shè)檢驗(yàn)。所以,統(tǒng)計(jì)學(xué)是一門研究樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的科學(xué)。五、參數(shù)和統(tǒng)計(jì)量參數(shù)(parameter)總體參數(shù)未知時(shí),常六、本質(zhì)差異和抽樣誤差本質(zhì)差異(essentialdifference)指不同的研究因素影響或作用于不同的研究總體,導(dǎo)致不同總體參數(shù)之間或相應(yīng)樣本統(tǒng)計(jì)量之間存在的差異。例如,飲用和不飲用早餐奶可引起兩組身高體重的不同,視為研究因素導(dǎo)致的本質(zhì)差異。六、本質(zhì)差異和抽樣誤差本質(zhì)差異(essentialdiff抽樣誤差(samplingerror)由于隨機(jī)抽樣的原因引起的樣本統(tǒng)計(jì)量與總體參數(shù)或不同樣本統(tǒng)計(jì)量之間的差異。例如,飲用同量早餐奶的全部小學(xué)生平均身高1.20m,隨機(jī)抽取了其中10名小學(xué)生的平均身高為1.19m,這兩個(gè)平均身高不等視為抽樣誤差。又如,飲用同量早餐奶的小學(xué)生如果用隨機(jī)分組方法分成兩組,一般來講兩組的平均體重不完全相同,也可看作是抽樣誤差。抽樣誤差(samplingerror)抽樣誤差的直接原因是隨機(jī)抽樣,內(nèi)在原因是總體中個(gè)體間的變異。因?yàn)閭€(gè)體變異的絕對(duì)性,所以抽樣誤差不可避免,但抽樣誤差的大小可用統(tǒng)計(jì)學(xué)方法予以估算。從此意義來理解,統(tǒng)計(jì)學(xué)則是一門研究抽樣誤差的科學(xué)。抽樣誤差的直接原因是隨機(jī)抽樣,內(nèi)在原因是總體中個(gè)體間的變異。七、正態(tài)分布與偏態(tài)分布正態(tài)分布(normaldistribution)又稱為高斯分布(Gaussiandistribution):是一種常見的、具有以均數(shù)為中心,左右兩側(cè)基本對(duì)稱,鐘形,兩頭低、中間高等特征的連續(xù)型分布。統(tǒng)計(jì)學(xué)上把以均數(shù)為μ、方差為σ^2的正態(tài)分布記作N(μ,σ^2),其中μ=0,σ^2=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,記作N(0,1)。大多數(shù)醫(yī)學(xué)數(shù)據(jù)呈正態(tài)分布或近似正態(tài)分布,或經(jīng)適當(dāng)?shù)淖兞孔儞Q,變換后的數(shù)據(jù)服從正態(tài)分布或近似正態(tài)分布。七、正態(tài)分布與偏態(tài)分布正態(tài)分布(normaldistrib偏態(tài)分布(skeweddistribution)是一種較為常見的、沒有或缺少正態(tài)分布曲線特征的連續(xù)型分布,表現(xiàn)為分布曲線的峰值與平均值不相等,即不以均數(shù)為中心,左右兩側(cè)明顯不對(duì)稱。根據(jù)曲線峰值小于或大于平均值可分為正偏態(tài)分布或負(fù)偏態(tài)分布。統(tǒng)計(jì)學(xué)是一門研究數(shù)據(jù)分布的科學(xué)。偏態(tài)分布(skeweddistribution)統(tǒng)計(jì)學(xué)是一八、頻率與概率頻率(frequency)在有限少量次數(shù),如幾次或幾十次試驗(yàn)中,某現(xiàn)象出現(xiàn)的次數(shù)與總試驗(yàn)次數(shù)的比值。概率(probability)在無限多次試驗(yàn)中,某現(xiàn)象出現(xiàn)的次數(shù)與總試驗(yàn)次數(shù)的比值,或者說是頻率的極限值。八、頻率與概率頻率(frequency)概率反映某一事件發(fā)生的可能性大小的量,常以符號(hào)P表示,P越接近1表示該事件發(fā)生的可能性越大,P越接近0表示該事件發(fā)生的可能性越小。其取值范圍在0到1之間,可以用小數(shù)或百分?jǐn)?shù)表示。統(tǒng)計(jì)學(xué)是一門研究概率大小的科學(xué)。概率反映某一事件發(fā)生的可能性大小的量,常以符號(hào)P表示,P越接第二節(jié)應(yīng)用統(tǒng)計(jì)分析的實(shí)質(zhì)和基本特征
統(tǒng)計(jì)學(xué)的實(shí)質(zhì):數(shù)據(jù)分析,包括理論和應(yīng)用兩部分。理論統(tǒng)計(jì)學(xué)是研究數(shù)據(jù)分析的原理、方法、條件和公式等;應(yīng)用統(tǒng)計(jì)學(xué)則應(yīng)用現(xiàn)代計(jì)算機(jī)技術(shù)(包括軟件技術(shù))和理論統(tǒng)計(jì)學(xué)的成果,圍繞分析目的,分析實(shí)際數(shù)據(jù)中變量與變量間的關(guān)系。第二節(jié)應(yīng)用統(tǒng)計(jì)分析的實(shí)質(zhì)和基本特征
統(tǒng)計(jì)學(xué)的實(shí)質(zhì):應(yīng)用統(tǒng)計(jì)學(xué)的一些基本特征:實(shí)用性解決實(shí)際數(shù)據(jù)的統(tǒng)計(jì)分析問題,不涉及或盡量少涉及統(tǒng)計(jì)理論、公式推導(dǎo)等內(nèi)容,甚至不太多的考慮其計(jì)算公式或中間的計(jì)算過程;目的性
有明確的實(shí)際應(yīng)用目的,一堆雜亂無章、沒有任何分析目的的數(shù)據(jù)是沒有價(jià)值的,盡管理論上有很好的分析方法;應(yīng)用統(tǒng)計(jì)學(xué)的一些基本特征:3.數(shù)據(jù)性
某種意義上,統(tǒng)計(jì)分析就是數(shù)據(jù)分析,因此收集的數(shù)據(jù),要按照數(shù)據(jù)間關(guān)系、數(shù)據(jù)庫的要求進(jìn)行整理呈現(xiàn),建立的數(shù)據(jù)庫能被統(tǒng)計(jì)軟件調(diào)用,并按目的要求進(jìn)行分析;4.借用性
借用理論統(tǒng)計(jì)學(xué)的研究成果和現(xiàn)代計(jì)算機(jī)的科學(xué)技術(shù)(包括軟件技術(shù))解決實(shí)際問題,主要強(qiáng)調(diào)如何應(yīng)用、如何得出結(jié)果。3.數(shù)據(jù)性某種意義上,統(tǒng)計(jì)分析就是數(shù)據(jù)分析,因此收集的第三節(jié)學(xué)好應(yīng)用統(tǒng)計(jì)分析的方法一、明確分析目的研究目的是統(tǒng)計(jì)分析的目標(biāo)和方向,決定了研究設(shè)計(jì)、研究對(duì)象、研究指標(biāo)等,而研究的設(shè)計(jì)方案、分析指標(biāo)是選擇不同統(tǒng)計(jì)分析方法的決定因素。第三節(jié)學(xué)好應(yīng)用統(tǒng)計(jì)分析的方法一、明確分析目的二、建好分析數(shù)據(jù)庫統(tǒng)計(jì)分析需要借助于統(tǒng)計(jì)分析軟件,而統(tǒng)計(jì)分析軟件要有完整、符合要求的數(shù)據(jù)或數(shù)據(jù)庫,所以建好分析數(shù)據(jù)庫是統(tǒng)計(jì)分析的必要條件。建好分析數(shù)據(jù)庫還可以理清分析思路,可以使觀察對(duì)象的研究指標(biāo)一目了然,使研究思路清晰明確。建好數(shù)據(jù)庫是統(tǒng)計(jì)分析的前提和基礎(chǔ)!二、建好分析數(shù)據(jù)庫建好數(shù)據(jù)庫是統(tǒng)計(jì)分析的前提和基礎(chǔ)!三、分清變量性質(zhì)和類型2023/1/324數(shù)值變量分類變量變量多項(xiàng)分類變量二項(xiàng)分類變量多項(xiàng)有序分類變量多項(xiàng)無序分類變量④①③②變量的性質(zhì):影響變量和結(jié)果變量統(tǒng)計(jì)學(xué)是一門變量與變量間關(guān)系分析的科學(xué)!變量的類別:三、分清變量性質(zhì)和類型2022/12/2624數(shù)值變量變量多四、正確選用統(tǒng)計(jì)學(xué)方法四、正確選用統(tǒng)計(jì)學(xué)方法五、熟悉常用的統(tǒng)計(jì)分析軟件統(tǒng)計(jì)分析系統(tǒng)SAS;社會(huì)學(xué)統(tǒng)計(jì)程序包SPSS;微軟公司的電子表格系統(tǒng)MicrosoftOfficeExcel。五、熟悉常用的統(tǒng)計(jì)分析軟件(一)統(tǒng)計(jì)分析系統(tǒng)SASSAS(StatisticsAnalysisSystem)是統(tǒng)計(jì)分析系統(tǒng)的英文縮稱,最早由北卡羅來納大學(xué)的兩位生物統(tǒng)計(jì)學(xué)研究生編制,1976年由SAS軟件研究所正式推出。SAS完全針對(duì)專業(yè)用戶進(jìn)行設(shè)計(jì),以編程為主。其最大特點(diǎn)是分析模塊調(diào)用,功能強(qiáng)大,深淺皆宜,簡(jiǎn)短編程即可同時(shí)對(duì)多個(gè)數(shù)據(jù)文件進(jìn)行分析。但對(duì)一般用戶而言,人機(jī)界面不太友好,初學(xué)者編寫、使用程序會(huì)存在各種難度。本書介紹的是SAS9.2版本的程序。(一)統(tǒng)計(jì)分析系統(tǒng)SAS本書介紹的是SAS9.2版本的程序(二)社會(huì)學(xué)統(tǒng)計(jì)程序包SPSSSPSS(Statisticalpackageforthesocialscience)是社會(huì)學(xué)統(tǒng)計(jì)程序包的英文縮稱,20世紀(jì)60年代末由美國(guó)斯坦福大學(xué)的三位研究生研制,1975年由芝加哥SPSS總部推出。SPSS系統(tǒng)的最大特點(diǎn)是菜單操作,方法齊全,繪制圖形、表格較為方便,輸出結(jié)果比較直觀。但其統(tǒng)計(jì)分析功能略顯遜色,特別是難以同時(shí)分析處理多個(gè)數(shù)據(jù)文件。本書介紹的是SPSS13.0版本的程序。(二)社會(huì)學(xué)統(tǒng)計(jì)程序包SPSS本書介紹的是SPSS13.0(三)MicrosoftOfficeExcelMicrosoftOfficeExcel(簡(jiǎn)稱Excel)是美國(guó)微軟公司開發(fā)的電子表格系統(tǒng),是目前應(yīng)用最為廣泛的辦公室表格處理軟件之一。Excel具有數(shù)據(jù)處理、函數(shù)運(yùn)算、數(shù)據(jù)庫、圖表制作等功能,進(jìn)行統(tǒng)計(jì)分析時(shí)具有易得、快速、直觀、簡(jiǎn)單、運(yùn)算可視等優(yōu)點(diǎn),也是建立數(shù)據(jù)庫、進(jìn)行常用統(tǒng)計(jì)分析的好工具。(三)MicrosoftOfficeExcel謝謝!謝謝!第一章緒論主講老師:暨南大學(xué)
陳青山暨南大學(xué)醫(yī)學(xué)院第一章緒論主講老師:暨南大學(xué)醫(yī)學(xué)院統(tǒng)計(jì)學(xué)是一門透過同質(zhì)事物的變異性、揭示內(nèi)在事物規(guī)律性和實(shí)質(zhì)性的科學(xué),確切地講,是一門關(guān)于客觀數(shù)據(jù)分析的科學(xué),研究數(shù)據(jù)的收集、整理和分析。應(yīng)用統(tǒng)計(jì)分析是應(yīng)用者圍繞應(yīng)用分析的目的,根據(jù)數(shù)據(jù)或數(shù)據(jù)庫中變量的特征和類型,以及變量與變量間關(guān)系所實(shí)施的數(shù)據(jù)分析。認(rèn)識(shí)統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)分析統(tǒng)計(jì)學(xué)是一門透過同質(zhì)事物的變異性、揭示內(nèi)在事物規(guī)律性和實(shí)質(zhì)性第一節(jié)統(tǒng)計(jì)學(xué)的幾組基本概念一、指標(biāo)與變量指標(biāo)(index)即觀察指標(biāo),是由研究目的確定的觀察對(duì)象的內(nèi)在屬性特征或其相關(guān)的影響因素。例如,某地區(qū)小學(xué)生身體生長(zhǎng)發(fā)育(如身高、體重等)的影響因素研究中,身高、體重反映了小學(xué)生身體生長(zhǎng)發(fā)育的特征,分別稱為研究的身高指標(biāo)、體重指標(biāo),影響身高體重的有關(guān)因素有性別、年齡等,成為研究的性別指標(biāo)、年齡指標(biāo)等。第一節(jié)統(tǒng)計(jì)學(xué)的幾組基本概念一、指標(biāo)與變量例如,某地區(qū)小學(xué)生例如,小學(xué)生身體生長(zhǎng)發(fā)育的身高、體重指標(biāo),在統(tǒng)計(jì)計(jì)算時(shí),分別稱為身高變量、體重變量。統(tǒng)計(jì)學(xué)是一門關(guān)于變量(或變量值)分析的科學(xué)。變量(variable)觀察變量,也稱變化的量,實(shí)際上就是觀察指標(biāo),一般特指用于數(shù)學(xué)、統(tǒng)計(jì)或軟件計(jì)算的分析指標(biāo)。變量值,即為某一變量的觀察值或測(cè)量結(jié)果。例如,測(cè)得某個(gè)小學(xué)生的身高1.20m、體重30kg,可分別稱該小學(xué)生身高的變量值為1.20m、體重的變量值為30kg。例如,小學(xué)生身體生長(zhǎng)發(fā)育的身高、體重指標(biāo),在統(tǒng)計(jì)計(jì)算時(shí),分別二、影響變量與結(jié)果變量結(jié)果變量(outcomevariable)又稱因變量(dependentvariable)或反應(yīng)變量(responsevariable),指受到影響變量的影響而變化的量,是影響變量變化的結(jié)果。影響變量(affectvariable)也稱自變量(independentvariable),指自身變化并影響結(jié)果變量變化的量;二、影響變量與結(jié)果變量結(jié)果變量(outcomevariab統(tǒng)計(jì)學(xué)是一門關(guān)于結(jié)果變量與影響變量(簡(jiǎn)稱變量與變量)間關(guān)系分析的科學(xué)。如果分析某地小學(xué)生體重依賴于年齡的變化規(guī)律,那么年齡可看作是影響變量,體重則為結(jié)果變量;如果分析不同性別之間身高是否存在統(tǒng)計(jì)學(xué)差異,那么性別是影響變量,身高是結(jié)果變量。統(tǒng)計(jì)學(xué)是一門關(guān)于結(jié)果變量與影響變量(簡(jiǎn)稱變量與變量)間關(guān)系分總體(population)根據(jù)研究目的確定的同質(zhì)觀察單位的全體?;颍|(zhì)所有觀察對(duì)象某變量值的集合。或,所有觀察對(duì)象的某個(gè)觀察指標(biāo)(即變量)的全部觀察值。三、總體與樣本例如,在飲用和不飲用早餐奶對(duì)某地區(qū)小學(xué)生身體生長(zhǎng)發(fā)育影響的研究中,該地區(qū)符合條件的所有小學(xué)生常常被認(rèn)為是該研究的總體。實(shí)際上還要具體區(qū)分不同指標(biāo)的總體,該研究的身高總體是所有研究對(duì)象的身高值,該研究的體重總體是所有研究對(duì)象的體重值。研究的總體中,有的研究對(duì)象(或變量值)的個(gè)數(shù)是可數(shù)的,稱為有限總體,有的是不可數(shù)的,稱為無限總體??傮w(population)三、總體與樣本例如,在飲用和不飲隨機(jī)抽樣:一種從總體中隨機(jī)抽取具有代表性的部分個(gè)體進(jìn)行統(tǒng)計(jì)分析并用以研究總體的方法。樣本(sample):從總體中隨機(jī)抽樣獲得的部分觀察對(duì)象的變量值。樣本含量(samplesize):樣本中變量值的個(gè)數(shù)隨機(jī)抽樣:已經(jīng)證明,一定樣本含量的樣本信息可以推斷其總體的相關(guān)特征。統(tǒng)計(jì)學(xué)是一門研究樣本,推論總體的科學(xué)。已經(jīng)證明,一定樣本含量的樣本信息可以推斷其總體的相關(guān)特征。統(tǒng)四、同質(zhì)與變異同質(zhì)(homogeneity):指研究對(duì)象具有相同或相近的性質(zhì)、條件或影響因素。在上述早餐奶對(duì)某地區(qū)小學(xué)生身高體重影響的研究中,該地區(qū)全體小學(xué)生可認(rèn)為是同質(zhì)的,因?yàn)檫@些研究對(duì)象具有相同的地域、相同的身份、相近的年齡……許多研究中常常給出篩選對(duì)象的診斷標(biāo)準(zhǔn)、納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn),目的就是為了保證研究對(duì)象的同質(zhì)性。四、同質(zhì)與變異同質(zhì)(homogeneity):指研究對(duì)象具有變異(variation):同質(zhì)研究對(duì)象中某些研究特征的差異性。在早餐奶的研究中,該地區(qū)全體小學(xué)生具有同質(zhì)性,但它們的身高有高有矮、體重有輕有重……表現(xiàn)為變異。同質(zhì)總體中個(gè)體變異的絕對(duì)性,是統(tǒng)計(jì)學(xué)賴以存在的基礎(chǔ)。因此,統(tǒng)計(jì)學(xué)是一門研究變異的科學(xué)。變異(variation):同質(zhì)總體中個(gè)體變異的絕對(duì)性,是統(tǒng)五、參數(shù)和統(tǒng)計(jì)量參數(shù)(parameter)描述研究總體特征的指標(biāo)。用希臘字母代表,如:總體均數(shù)μ、總體率π、總體標(biāo)準(zhǔn)差σ等。統(tǒng)計(jì)量(statistic)根據(jù)樣本變量值計(jì)算的、描述樣本特征的指標(biāo)。用拉丁字母代表,如:樣本均數(shù)x?、樣本率p、樣本標(biāo)準(zhǔn)差S等??傮w參數(shù)未知時(shí),常常通過樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)或假設(shè)檢驗(yàn)。所以,統(tǒng)計(jì)學(xué)是一門研究樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的科學(xué)。五、參數(shù)和統(tǒng)計(jì)量參數(shù)(parameter)總體參數(shù)未知時(shí),常六、本質(zhì)差異和抽樣誤差本質(zhì)差異(essentialdifference)指不同的研究因素影響或作用于不同的研究總體,導(dǎo)致不同總體參數(shù)之間或相應(yīng)樣本統(tǒng)計(jì)量之間存在的差異。例如,飲用和不飲用早餐奶可引起兩組身高體重的不同,視為研究因素導(dǎo)致的本質(zhì)差異。六、本質(zhì)差異和抽樣誤差本質(zhì)差異(essentialdiff抽樣誤差(samplingerror)由于隨機(jī)抽樣的原因引起的樣本統(tǒng)計(jì)量與總體參數(shù)或不同樣本統(tǒng)計(jì)量之間的差異。例如,飲用同量早餐奶的全部小學(xué)生平均身高1.20m,隨機(jī)抽取了其中10名小學(xué)生的平均身高為1.19m,這兩個(gè)平均身高不等視為抽樣誤差。又如,飲用同量早餐奶的小學(xué)生如果用隨機(jī)分組方法分成兩組,一般來講兩組的平均體重不完全相同,也可看作是抽樣誤差。抽樣誤差(samplingerror)抽樣誤差的直接原因是隨機(jī)抽樣,內(nèi)在原因是總體中個(gè)體間的變異。因?yàn)閭€(gè)體變異的絕對(duì)性,所以抽樣誤差不可避免,但抽樣誤差的大小可用統(tǒng)計(jì)學(xué)方法予以估算。從此意義來理解,統(tǒng)計(jì)學(xué)則是一門研究抽樣誤差的科學(xué)。抽樣誤差的直接原因是隨機(jī)抽樣,內(nèi)在原因是總體中個(gè)體間的變異。七、正態(tài)分布與偏態(tài)分布正態(tài)分布(normaldistribution)又稱為高斯分布(Gaussiandistribution):是一種常見的、具有以均數(shù)為中心,左右兩側(cè)基本對(duì)稱,鐘形,兩頭低、中間高等特征的連續(xù)型分布。統(tǒng)計(jì)學(xué)上把以均數(shù)為μ、方差為σ^2的正態(tài)分布記作N(μ,σ^2),其中μ=0,σ^2=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,記作N(0,1)。大多數(shù)醫(yī)學(xué)數(shù)據(jù)呈正態(tài)分布或近似正態(tài)分布,或經(jīng)適當(dāng)?shù)淖兞孔儞Q,變換后的數(shù)據(jù)服從正態(tài)分布或近似正態(tài)分布。七、正態(tài)分布與偏態(tài)分布正態(tài)分布(normaldistrib偏態(tài)分布(skeweddistribution)是一種較為常見的、沒有或缺少正態(tài)分布曲線特征的連續(xù)型分布,表現(xiàn)為分布曲線的峰值與平均值不相等,即不以均數(shù)為中心,左右兩側(cè)明顯不對(duì)稱。根據(jù)曲線峰值小于或大于平均值可分為正偏態(tài)分布或負(fù)偏態(tài)分布。統(tǒng)計(jì)學(xué)是一門研究數(shù)據(jù)分布的科學(xué)。偏態(tài)分布(skeweddistribution)統(tǒng)計(jì)學(xué)是一八、頻率與概率頻率(frequency)在有限少量次數(shù),如幾次或幾十次試驗(yàn)中,某現(xiàn)象出現(xiàn)的次數(shù)與總試驗(yàn)次數(shù)的比值。概率(probability)在無限多次試驗(yàn)中,某現(xiàn)象出現(xiàn)的次數(shù)與總試驗(yàn)次數(shù)的比值,或者說是頻率的極限值。八、頻率與概率頻率(frequency)概率反映某一事件發(fā)生的可能性大小的量,常以符號(hào)P表示,P越接近1表示該事件發(fā)生的可能性越大,P越接近0表示該事件發(fā)生的可能性越小。其取值范圍在0到1之間,可以用小數(shù)或百分?jǐn)?shù)表示。統(tǒng)計(jì)學(xué)是一門研究概率大小的科學(xué)。概率反映某一事件發(fā)生的可能性大小的量,常以符號(hào)P表示,P越接第二節(jié)應(yīng)用統(tǒng)計(jì)分析的實(shí)質(zhì)和基本特征
統(tǒng)計(jì)學(xué)的實(shí)質(zhì):數(shù)據(jù)分析,包括理論和應(yīng)用兩部分。理論統(tǒng)計(jì)學(xué)是研究數(shù)據(jù)分析的原理、方法、條件和公式等;應(yīng)用統(tǒng)計(jì)學(xué)則應(yīng)用現(xiàn)代計(jì)算機(jī)技術(shù)(包括軟件技術(shù))和理論統(tǒng)計(jì)學(xué)的成果,圍繞分析目的,分析實(shí)際數(shù)據(jù)中變量與變量間的關(guān)系。第二節(jié)應(yīng)用統(tǒng)計(jì)分析的實(shí)質(zhì)和基本特征
統(tǒng)計(jì)學(xué)的實(shí)質(zhì):應(yīng)用統(tǒng)計(jì)學(xué)的一些基本特征:實(shí)用性解決實(shí)際數(shù)據(jù)的統(tǒng)計(jì)分析問題,不涉及或盡量少涉及統(tǒng)計(jì)理論、公式推導(dǎo)等內(nèi)容,甚至不太多的考慮其計(jì)算公式或中間的計(jì)算過程;目的性
有明確的實(shí)際應(yīng)用目的,一堆雜亂無章、沒有任何分析目的的數(shù)據(jù)是沒有價(jià)值的,盡管理論上有很好的分析方法;應(yīng)用統(tǒng)計(jì)學(xué)的一些基本特征:3.數(shù)據(jù)性
某種意義上,統(tǒng)計(jì)分析就是數(shù)據(jù)分析,因此收集的數(shù)據(jù),要按照數(shù)據(jù)間關(guān)系、數(shù)據(jù)庫的要求進(jìn)行整理呈現(xiàn),建立的數(shù)據(jù)庫能被統(tǒng)計(jì)軟件調(diào)用,并按目的要求進(jìn)行分析;4.借用性
借用理論統(tǒng)計(jì)學(xué)的研究成果和現(xiàn)代計(jì)算機(jī)的科學(xué)技術(shù)(包括軟件技術(shù))解決實(shí)際問題,主要強(qiáng)調(diào)如何應(yīng)用、如何得出結(jié)果。3.數(shù)據(jù)性某種意義上,統(tǒng)計(jì)分析就是數(shù)據(jù)分析,因此收集的第三節(jié)學(xué)好應(yīng)用統(tǒng)計(jì)分析的方法一、明確分析目的研究目的是統(tǒng)計(jì)分析的目標(biāo)和方向,決定了研究設(shè)計(jì)、研究對(duì)象、研究指標(biāo)等,而研究的設(shè)計(jì)方案、分析指標(biāo)是選擇不同統(tǒng)計(jì)分析方法的決定因素。第三節(jié)學(xué)好應(yīng)用統(tǒng)計(jì)分析的方法一、明確分析目的二、建好分析數(shù)據(jù)庫統(tǒng)計(jì)分析需要借助于統(tǒng)計(jì)分析軟件,而統(tǒng)計(jì)分析軟件要有完整、符合要求的數(shù)據(jù)或數(shù)據(jù)庫,所以建好分析數(shù)據(jù)庫是統(tǒng)計(jì)分析的必要條件。建好分析數(shù)據(jù)庫還可以理清分析思路,可以使觀察對(duì)象的研究指標(biāo)一目了然,使研究思路清晰明確。建好數(shù)據(jù)庫是統(tǒng)計(jì)分析的前提和基礎(chǔ)!二、建好分析數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年電磁學(xué)計(jì)量標(biāo)準(zhǔn)器具項(xiàng)目資金籌措計(jì)劃書
- 《糖尿病規(guī)范管理》課件
- 高一演講稿集錦7篇
- 醫(yī)院胸外科聘用合同
- 電池庫存安全規(guī)范
- 音樂節(jié)展覽空間租賃協(xié)議
- 語文兼職教師聘用協(xié)議范本
- 水產(chǎn)養(yǎng)殖堰塘施工合同
- 公路設(shè)備加工場(chǎng)地租賃合同
- 快餐店翻新施工合同
- 35KV變電站地質(zhì)勘察與施工方案
- 2024年中學(xué)科技教育工作總結(jié)樣本(4篇)
- 2025年中國(guó)社會(huì)科學(xué)院外國(guó)文學(xué)研究所專業(yè)技術(shù)人員招聘3人歷年管理單位筆試遴選500模擬題附帶答案詳解
- 國(guó)家開放大學(xué)電大本科《理工英語3》期末試題題庫及答案1(試卷號(hào):1377)
- 湖北省十堰市2023-2024學(xué)年高二上學(xué)期期末調(diào)研考試 物理 含答案
- 《現(xiàn)代控制理論》全套課件(東北大學(xué))
- 專題21一次函數(shù)(原卷版+解析)
- 期末 (試題) -2024-2025學(xué)年人教PEP版英語六年級(jí)上冊(cè)
- 山東師范大學(xué)《計(jì)算機(jī)網(wǎng)絡(luò)》期末考試復(fù)習(xí)題及參考答案
- 旅行社公司章程53410
- 螺桿式制冷壓縮機(jī)操作規(guī)程完整
評(píng)論
0/150
提交評(píng)論