




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第八章流行病學資料的收集分析與表達,內(nèi) 容,第一節(jié) 資料的收集與整理 第二節(jié) 資料的描述性分析 第三節(jié) 資料的推斷性統(tǒng)計分析 第四節(jié) 資料的表達,(一)資料的收集,資料的收集(data collection)過程,就是按照研究設計所擬定的方法與過程,通過對研究對象的觀察及實驗,測量并記錄其結果,以形成研究的效應的原始統(tǒng)計數(shù)據(jù)。,第一節(jié)資料的收集與整理,1.資料來源根據(jù)信息來源可將數(shù)據(jù)分為三類:,2、收集計劃包括:,選擇收集資料的地點、人員和時間; 收集資料人員的培訓方案; 預調(diào)查或?qū)嶒灧桨傅臄M定; 資料的記錄方式; 調(diào)查表的擬定和印刷; 調(diào)查或?qū)嶒瀮x器、試劑的準備; 調(diào)查資料的抽樣復核比例和方
2、法; 收集資料所需經(jīng)費的準備等。,調(diào)查表的構成,標題:概括說明調(diào)查的主題。應簡明扼要,易引起回答者的興趣。 說明:簡短的指導或說明信。目的,意義,填表須知,交表時間,地點。 被訪者基本情況:社會人口學特征:性別,年齡,民族,家庭人口,婚姻,文化程度,職業(yè)等。 調(diào)查主要內(nèi)容 編碼:調(diào)查表編碼號,調(diào)查項目編碼,回答選項編號 過錄框。 作業(yè)證明的記載:調(diào)查員:姓名,調(diào)查日期,時間等,電話號碼,確定每個項目的提問形式和類型 直接性 假設性 問答題 間接性 開放性 問答題 封閉性 半封閉性,直接性問答題:是指在調(diào)查表中能夠通過直接提問方式得到答案的問答題。直接性問答題通常給被訪者一個明確的范圍,所問的是
3、個人基本情況或意見。例如:“您的性別?”,“您的文化程度?”,間接性問答題是指那些不便直接詢問的問答題(通常是會讓被訪者產(chǎn)生顧慮、不敢或不愿真實地回答的項目),常采用間接提問的方式得到所需回答。,假設性問答題:是通過假設某一情景或現(xiàn)象存在而向被訪者提出的問答題。例如:“有人認為目前醫(yī)療費上漲太快,您的看法如何?”,“如果您可以選擇,您愿意生一個、兩個還是多個孩子?”,開放性問答題:是指所提出的問題并不列出所有可能的答案,而是由被訪者自由作答。 如:您沒有去看病的原因是什么? 優(yōu)點:適用于較深層次問題的探討,有利于調(diào)動調(diào)查對象的主動性,便于獲取更豐富的建設性的信息。 缺點:答案無法預估,種類繁多
4、,容易離題,拒絕回答率較高,費時,費力,所收集的數(shù)據(jù)不易整理和分析,難以進行相互比較。,封閉性問答題:是指已事先設計了各種可能的答案、被訪者只要從中選定一個或幾個現(xiàn)成答案的提問方式。 優(yōu)點:答案統(tǒng)一、標準、易回答,節(jié)約時間,拒絕回答率很低,匯總歸納方便。 缺點:被訪者只能在規(guī)定的范圍內(nèi)回答,可能無法反映其他各種真實的想法。此外,它的設計受設計者相關知識范圍影響。,半封閉性問答題:是設計者根據(jù)可能情況提出固定答案備選,做出回答后,進一步表述調(diào)查對象的看法與認識。如 您生病后去地段醫(yī)院就診嗎?是否 請說明其主要原因,調(diào)查表制定中的注意問題,說明要簡單明了,打動人心; 避免用不確切的詞:如“很久”、
5、“經(jīng)?!?、“一些”等;如:您是否經(jīng)常生??? 地點?您在哪兒出生? 避免提斷定性問題;您一天抽多少支煙? 應在前面加上“過濾性”問題。,調(diào)查表制定中的注意問題,避免提雙重、雙否定的設問:如:您贊成還是反對醫(yī)療費用支付方式是投保記賬或現(xiàn)金支付?贊成反對雙重設問 正確的是:您對醫(yī)療費用改革的態(tài)度是贊成反對;您愿意采納那種醫(yī)療費用支付方式?現(xiàn)金支付投保記賬 如:醫(yī)院管理者不重視醫(yī)院急診工作不是一個重要問題,您同意嗎? 完全同意同意未決定不完全同意反對 醫(yī)院管理者是否重視醫(yī)院急診工作時一個重要問題,,調(diào)查表制定中的注意問題,避免引導性(誘導式)提問:暗示; 如:詢問術后病人情況時,問“佩戴這個止痛盒后,
6、疼痛比以前減輕了吧?”有人認為被動吸煙會導致肺癌,您同意嗎?”大忌,偏倚 避免令被訪者難堪和禁忌的敏感問題 (1)釋疑法 (2)假定法 (3)轉(zhuǎn)移法,調(diào)查表制定中的注意問題,避免提籠統(tǒng)、抽象或不確切的問題:年齡、收入、家庭人口等; 避免一問多答的問題:您的父母是知識分子嗎 注意提問的順序: 先易后難;從簡單到復雜;封閉性問題在前,開放型問題在后;專業(yè)性強、敏感性問題在后,注意邏輯順序。 定量指標最好定量調(diào)查,不行的話可設計成半定量指標。,3、收集資料的方式,觀察法 采訪 詢問 直接 開會 詢問法 訪談 信訪 間接 電話 電子郵件,資料的測量方法,查體法:臨床醫(yī)生憑借生物感覺對病人的體征進行觀察
7、,如望聞問切。 儀器測量法:身高計、體重計、血壓計、超聲波、心電圖、CT。 實驗室測量:通過化學、生物化學、微生物、血清學、免疫學等實驗對病人的生理病理現(xiàn)象進行測量。血液檢查、尿液檢查、肝功能檢查等。 詢問法:如疼痛、頭昏、失眠、關節(jié)僵硬、呼吸困難、咽部不適、憂郁、壓抑等,目前尚無較好的客觀定量測量方法,主要是通過詢問或問卷的方式,由病人根據(jù)自己的主觀感覺做出回答,4.要求,真實性 系統(tǒng)性和完整性 深刻性,5.基本原則收集資料要遵循的原則,堅持實事求是 注意分析研究 采用科學的方法和技術 注重研究對象的利益、符合倫理,(二)資料的整理,整理資料(data sorting)是將原始資料進行科學加
8、工,去粗取精,去偽存真,凈化原始數(shù)據(jù),使其系統(tǒng)化、條理化,便于進一步計算和分析。 在數(shù)據(jù)分析前需要對原始的流行病學調(diào)查研究數(shù)據(jù)進行一次審查,發(fā)現(xiàn)可能存在的錯誤、遺漏的研究變量取值和其他問題,并采取相應的措施進行處理。,回憶變量的類型,數(shù)值變量(計量資料),變量類型,無序分類變量 (計數(shù)資料),分類變量,有序分類變量 (等級資料),(一)計量資料(measurement data) 對每個觀察單位用定量的方法測定某項指標的具體數(shù)值所得資料稱為計量資料,又稱定量資料(quantitative data),亦稱數(shù)值變量(anumerical variable)。這類資料一般有度量衡單位。例如每個觀察
9、對象的血壓(kPa)、脈搏(次/分)、身高(cm)、體重(kg)及臨床上諸多定量檢測指標的檢測結果,都屬于計量資料。,離散型變量(discrete variable):只能取整數(shù)值的變量,如一月中的手術病人數(shù),一年里的新生兒數(shù) 連續(xù)型變量(continuous variable):可以取實數(shù)軸上的任何數(shù)值,多數(shù)由測量而得,如血壓、身高、體重、ALT等,(二)計數(shù)資料(enumeration data) 將觀察單位按性質(zhì)或類別分組,然后清點每組的個數(shù)所得資料稱為計數(shù)資料,又稱定性資料( qualitative data ),亦稱分類變量 (categorical variable)。這類資料一般
10、沒有度量衡單位,所得數(shù)據(jù)是各組觀察單位的個數(shù)。例如藥物治療的有效人數(shù)與無效人數(shù);化驗結果的陽性人數(shù)與陰性人數(shù);某病的患病人數(shù)與未患病人數(shù);某人群中A、B、AB、O各種血型的人數(shù)及臨床上諸多定性檢測指標的檢測結果,都屬計數(shù)資料。,(三)等級資料(ranked data) 將觀察單位按某種屬性的不同程度分組計數(shù),得到各組觀察單位個數(shù),稱為等級資料。等級資料具有計數(shù)資料的性質(zhì),又兼有半定量的性質(zhì),因其按等級大小排序,有人亦稱之為有序分類變量(ordinal categorical variable)。例如療效考核中的治愈、好轉(zhuǎn)、未愈、死亡;癥狀中的重、中、輕、無;某些檢測結果中的、等,都屬等級資料。
11、 三種資料可以轉(zhuǎn)化,3.等級資料(ranked data),亦稱有序變量(ordinal variables) 是將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察單位數(shù)。 等級資料具有計數(shù)資料的性質(zhì),又兼有半定量的性質(zhì),因其按等級大小排序,有人亦稱之為有序分類變量(ordinal categorical variable)。例如療效考核中的治愈、好轉(zhuǎn)、未愈、死亡;癥狀中的重、中、輕、無;某些檢測結果中的、等,都屬等級資料。,1.資料核查(data cleaning),完整性核查:對調(diào)查表全部項目進行檢查,核對填寫是否完整無缺,如有漏項,應立即補填。完整性檢查應在調(diào)查現(xiàn)場進行,否則難
12、于彌補。(隨時對資料進行核查) 邏輯核查法:主要檢查邏輯上的矛盾。如出生日期與死亡日期的矛盾等。 對數(shù)據(jù)變量要檢查其最小值(minimum)、最大值(maximum)、均數(shù)(mean)、中位數(shù)(median),并查看是否有異常取值(outlier),如極小值及極大值。 異常值若影響顯著時應刪除,2. 資料的數(shù)量化, 數(shù)值變量資料則可以直接用原始數(shù)值; 二分類變量一般以0和1表示; 多分類的變量數(shù)值化方法比較復雜: 若某多分類變量為有序變量,我們可參照等級變量賦值,但排序時應慎重,應有充分的排序依據(jù)。 若多分類為變量為無序變量,可考慮將其拆分成幾個二分類變量分別分析。,如:分類變量種族 白人1
13、黑人2 西班牙裔人3 亞太裔4 其它種族5 注意: 分類變量在進行多因素分析時,必須轉(zhuǎn)換成啞變量(dummy variable),不能直接將前述的取值1、2、3、4、5放入方程中進行分析。,有序變量的數(shù)量化順序合理,則可以直接進行分析 如:教育程度 文盲:0 小學:1 中學:2 高中及中專:3 大學:4 碩士及以上:5,變量的轉(zhuǎn)化: 只能由高級向低級轉(zhuǎn)化,不能作相反方向的轉(zhuǎn)化 連續(xù)變量有序變量 無序變量二分類變量,3.資料的分組,絕大多數(shù)研究都需要對資料進行分組,以便進行組間比較或更細致的描述。 若利用計算機分組,就應在建立數(shù)據(jù)庫時給以相應的數(shù)字標識,統(tǒng)計分析時計算機可按指令迅速自動分組,并整
14、理出頻數(shù)。,分類變量: 按其原有的分類進行分組,若有必要,可將性質(zhì)相近或差別不大的類別進行合并。如按教育程度、性別分組。,數(shù)值變量: 按照實際的生理、病理或臨床意義分組,如體重指數(shù):低體重、正常體重、超重和肥胖 按使用的方便程度和專業(yè)上慣用的方法分組,如年齡在某一個合適的范圍內(nèi)每5歲或10歲分成一組。 按分位數(shù)分組,即首先找出四分位數(shù)(quartile)或五分位數(shù)(quintile)的界值,然后應用這些界值將研究對象平均分成4組(每組25%的研究對象)或5組(每組20%的研究對象)。,(二)數(shù)據(jù)的轉(zhuǎn)換 1、非正態(tài)數(shù)據(jù)的變量轉(zhuǎn)換 原理: 正態(tài)分布 參數(shù)檢驗(parametric test) 非正
15、態(tài)數(shù)據(jù)非參數(shù)檢驗(non-parametric test) (不是對原始數(shù)據(jù)檢驗)如:秩和檢驗 (是對原始數(shù)據(jù)的秩次檢驗) 檢驗:正態(tài)性檢驗、方差齊性檢驗 方法:對數(shù)變換;平方根變換;倒數(shù)變換,2、分類變量轉(zhuǎn)換成啞變量 原理: 分類變量是二分類尺度及順序尺度,則可直接應用其原有的數(shù)量化數(shù)值。 名義尺度因為各類別間沒有順序關系,在進行不同分析(包括多元分析、logistic回歸、Cox回歸等)時,不能使用原始的計算機錄入數(shù)值,必經(jīng)進行變量轉(zhuǎn)換。即將該變量轉(zhuǎn)換成(水平數(shù)-1)個啞變量,再將這些新轉(zhuǎn)換的變量放入多因素模型中。,方法: 例如:將種族原始取值轉(zhuǎn)換成啞變量(新變量) 表1. 分類變量轉(zhuǎn)換成
16、啞變量的方法,新變量以白人為參照,X11表示黑人與白人比較,依此類推,統(tǒng)計方法分類,根據(jù)研究目的分為: 統(tǒng)計描述 (statistical description) 統(tǒng)計推斷(statistical inference),復習,第二節(jié) 資料的統(tǒng)計描述,一、統(tǒng)計描述的方法 一、資料基本情況的描述 二、主要研究項目的描述性統(tǒng)計分析,描述數(shù)值變量資料的統(tǒng)計指標,復習,描述分類變量資料的統(tǒng)計指標,一、資料基本情況的描述,(一)應答率(response rate) 失訪率(loss rate) (二)基本特征,(一)應答率或失訪率, 現(xiàn)況調(diào)查研究和病例對照研究的資料 應答率反映調(diào)查資料的完整性和納入統(tǒng)計
17、分析樣本的代表性。 一般要求應答率在85以上。 隊列研究的資料 失訪率 由于某種原因?qū)е卤辉囼瀸ο笾型就顺?失訪率最好控制在15以內(nèi),(二)基本特征,被觀察對象的人口學特征: 性別、年齡別構成、職業(yè)分布特點、民族構成等; 其次,描述某種現(xiàn)象或事物的特征:如糖尿病的類型、病情、病程等構成情況,主要研究項目的描述性統(tǒng)計分析,調(diào)查研究或?qū)嶒炑芯慷夹枰獙χ饕^察項目進行描述性統(tǒng)計分析(descriptive statistical analysis),以便使讀者了解主要觀察指標的高低及分布情況。 根據(jù)研究內(nèi)容不同,通常描述性統(tǒng)計分析多從疾病或健康狀況、研究因素等方面進行描述。,案例1:,劉卓等人在“非
18、典”流行高峰在武漢市四所大學對本科生進行了健康相關行為的調(diào)查。鑒于篇幅所限,摘錄部分基本特征分析(如表8-18-2)與研究項目分析(見表8-3)。通過閱讀這些統(tǒng)計表可以清楚地了解到當時調(diào)查的大學生性別、年齡等特征的分布以及健康相關行為特點。,表8-1 大學生性別、年齡分布,表8-1 大學生性別、年齡(歲)分布,表8-2 武漢市大學生各專業(yè)年級分布,表8-3 “非典”流行高峰時期的大學生行為,常見錯誤,雙氫青蒿素與磷酸喹哌治療惡性瘧療效比較,測量1000例高脂血癥患者的血脂水平: 單純高膽固醇血癥(80例):患病率8% 單純高甘油三酯(760例):患病率76% 兩者均增高(160例):患病率16
19、%,常見的統(tǒng)計學錯誤,描述性分析中常見的錯誤 計量資料:誤用正態(tài)分布的描述性統(tǒng)計指標描述呈偏態(tài)或幾何分布的資料。 計數(shù)資料:錯誤的將構成比當做率使用 錯誤的計算平均率 計算相對數(shù)時分母過小,第三節(jié) 資料的推斷性統(tǒng)計分析,一、統(tǒng)計推斷的方法 單因素分析 多因素分析 二、資料的重復性評價 三、研究結果的解釋,一、統(tǒng)計推斷,統(tǒng)計推斷: 利用樣本所提供的信息對總體進行估計或推斷,主要包括 參數(shù)估計:利用樣本指標估計總體參數(shù)。常用點估計和區(qū)間估計,如均數(shù)的可信區(qū)間、率的可信區(qū)間 假設檢驗:利用樣本提供的信息比較兩個或多個總體之間有無差別,如t檢驗、2檢驗等,資料的分析方法:,1.比較性研究的數(shù)據(jù)分析 2
20、.關聯(lián)性研究的數(shù)據(jù)分析,1.比較性研究的數(shù)據(jù)分析,(1)標準比較法 (2)兩兩比較法 (3)多組比較法,(1)標準比較法,標準比較法,即把研究對象的某一特征與公認的,或者正式頒布的標準進行比較,即樣本與總體的比較。比如,空氣、水、食物中有害物質(zhì)的濃度是否超過標準;某個人群的身高體重是否與一般人群不同等。,偏態(tài)分布用秩和檢驗,(2)兩兩比較法,對于計數(shù)資料,當樣本含量n較大,樣本率P與(1-p)均不太小時,樣本率的分布近似正態(tài)分布??捎胾檢驗。 當不滿足u檢驗的條件時,若樣本含量大于等于40,并且理論頻數(shù)大于5時,可用卡方檢驗,若1T5,采用校正卡方檢驗,若n40或T1,用精確概率法 兩組構成比
21、比較,用行乘列卡方檢驗。 等級資料比較用秩和檢驗。,案例:,劉永有等人對吸毒患者進行心理干預,比較了干預前后的焦慮狀況自評(SAS),見表8-6。從表中可以看出干預前兩組的焦慮得分平均值差別無統(tǒng)計學意義,干預后與干預前后的差值的差別均有統(tǒng)計學意義。,(3)多組比較法,根據(jù)研究需要,有時要求同時比較某個變量在多個組之間的差異。如比較某種藥物對多個不同群體的療效。,對于計量資料,若為完全隨機設計,當任何觀察值都是獨立地來自具有等方差的正態(tài)總體,采用完全隨機設計的單因素方差分析; 若為隨機區(qū)組設計,則采用隨機區(qū)組設計的方差分析。 需要進行多個樣本均數(shù)間的兩兩比較,常用的方法有LSD-t檢驗、Dunn
22、ett-t檢驗、SNK-q檢驗等。 若不滿足以上條件,則需要考慮非參數(shù)方法。,對于分類變量資料多組率或構成比的比較,可采用2K表或RC表的卡方檢驗資料的卡方檢驗,單應注意理論數(shù)小于1的格子數(shù)不能超過1/5,否則應采取增加樣本含量等措施。,案例:,劉永有等人研究吸毒組與正常對照組之間職業(yè)構成的比較,表8-7。,2.關聯(lián)性研究的數(shù)據(jù)分析,確定事物間的關系,定量表述事物間關系的方向、大小或強弱。如分析兒童的年齡與身高之間的關聯(lián)性,吸煙與肺癌之間因果關系。,對于計量資料,兩個變量或因變量服從正態(tài)分布,研究一個自變量對一個應變量影響的數(shù)量依存關系則用直線回歸分析方法,計算回歸系數(shù)與截距,建立回歸方程并進
23、行顯著性檢驗; 若通過繪制散點圖發(fā)現(xiàn)兩者的關系不呈直線關系,可考慮進行數(shù)據(jù)變換擬合非線性回歸。,若需要說明變量間的直線相關關系,兩個變量均服從正態(tài)分布,則用相關分析,計算Pearson相關系數(shù),并檢驗相關系數(shù)的顯著性;非正態(tài)雙變量資料,可進行等級相關分析,計算Spearman等級相關系數(shù)與假設檢驗。,分類資料采用卡方檢驗,雙向無序多項分類資料(RC表),除了采用卡方檢驗推測有無關聯(lián),還可以利用卡方值計算Pearson列聯(lián)相關系數(shù)反映關聯(lián)密切程度; 等級資料,采用Spearman等級相關或Kendall等級相關分析;有序分組資料可采用線性趨勢檢驗。,案例:,馬小玲等人研究了2006年5月廣州市某
24、區(qū)的PM2.5(可吸入顆粒物濃度)與同期門診病人關系,建立了非線性回歸模型,見表8-8。從中可以看出病人數(shù)與PM2.5的關聯(lián)程度較強。,表8-8 2006年1-4月各類門診病人數(shù)與PM2.5關系的非線性回歸模型,一、資料的組間均衡性檢驗,各種分析性研究的結論往往是從組間比較中得出的。 只有當各比較組人群之間研究因素以外的各種與研究結果有關的因素在組間都均衡可比時,所得研究因素在組間有無差異的結論才有說服力。,一、資料的組間均衡性檢驗,常需對某些特征(一般多為主要的混雜因素,如平均年齡、性別構成、病情構成等)進行比較組間的均衡性檢驗(差異顯著性檢驗)。 通常,單因素顯著性檢驗方法即可滿足均衡性檢
25、驗的需要。,把這些統(tǒng)計學方法用在流行病學研究中,案例:,某研究者對某種違法行為的人進行預防復發(fā)的干預試驗,評價研究結果時,首先對試驗組和對照組的人口學特征進行比較(見表8-4)。從表8-4中可以清楚地看到試驗組和對照組的性別構成、平均年齡和婚姻構成方面是均衡可比的。,表8-4 試驗組與對照組人口學特征比較,二、單因素分析,尋找相關因素,如某種疾病或現(xiàn)象的發(fā)生是否與性別、年齡、職業(yè)等因素有關? 臨床試驗中,在組間均衡可比的前提下將試驗組和對照組的統(tǒng)計指標進行單因素分析可判斷試驗效應是否由于試驗因素所致。 常常采用多因素分析方法來分析各種因素的作用大小。,二、單因素分析,通常先將所有變量做單因素分
26、析,篩出可能的影響因素(P值小于某個界值的變量)納入多因素分析。 此時的單因素分析不要求比較組間的均衡,因為混雜因素的干擾可在多因素分析中被排除,但要求放寬納入變量的多因素分析標準,如規(guī)定P值小于0.10者可進入多因素分析,以防范負混雜的干擾。,案例:,何倩等人對某市大學生毒品嘗試情況進行了調(diào)查,進行單因素分析,尋找嘗試毒品的可能相關因素,見表8-5。從單因素分析表中可以看出性別、年齡、身體健康狀況、睡眠狀況等都可能與毒品嘗試有關系。但是還需要進行多因素分析以判定在排除了其它因素的影響外,哪些因素仍然與毒品嘗試有關系。,不同的影響因素下大學生毒品嘗試率及其單因素分析結果,單因素分析主要了解因素
27、與結果之間有無統(tǒng)計學關聯(lián),并確定關聯(lián)強度的大小。 計算關聯(lián)強度指標,如相關系數(shù)、回歸系數(shù)等;病例對照研究計算比值比(OR),隊列研究計算相對危險度(RR)、和歸因危險度(AR)等,計算可信區(qū)間和進行差異顯著性檢驗。 等級資料,可對暴露效應隨暴露級別的變化而變動的趨勢做趨勢性檢驗。,三、多因素分析,多因素分析可一次觀察多個變量分別與因變量之間的獨立關系以及變量之間的交互作用。 以多因素分析方法控制各種影響因素的作用,完成資料的統(tǒng)計分析。 該類分析方法多種多樣,具體使用時一定要根據(jù)資料的特點、研究目的來選擇適當?shù)姆椒ā?1.研究多個變量之間的相互關系,多元相關分析: 多個自變量與一個因變量的相關關
28、系; 計算復相關系數(shù)和偏相關系數(shù)并進行假設檢驗。 典型相關分析: 一組自變量(體質(zhì)指標)與一組因變量(體能指標)之間的關系。,2.研究多個變量之間的依存關系,3.研究多個變量的內(nèi)在結構,對于涉及到多因素的醫(yī)學研究,常常需要了解所研究的多個變量之間的內(nèi)在聯(lián)系。通過變量內(nèi)在結構的分析,就可以把這些變量依據(jù)它們內(nèi)在的關系,客觀地歸納為若干類。,并估計潛在因子對可測變量的影響程度以及潛在因子之間的關聯(lián)性時,例如研究家庭環(huán)境、社會環(huán)境和學校環(huán)境對兒童智商的發(fā)育影響時,可以用因子分析;將樣本個體或指標變量按其具有的特性進行分類的研究,可以用聚類分析。,4.研究變量之間的關系網(wǎng),事物的特征通過不同的變量體現(xiàn)
29、出來。因此客觀事物之間的關系就體現(xiàn)為多變量之間的、無比復雜的網(wǎng)狀關系。對于這類分析,可以借用 路徑分析方法和結構方程分析方法。,典型錯誤,統(tǒng)計推斷中常見的統(tǒng)計學錯誤 計量資料: 忽視了t檢驗的使用條件 多個樣本均數(shù)比較時錯誤的使用了t檢驗 誤用t檢驗分析重復測量設計資料,計數(shù)資料 錯誤的選擇了四格表卡方檢驗方法-未選用fisher精確檢驗法:n40,或理論頻數(shù)1 錯誤選擇了四格表卡方檢驗方法-未選用配對卡方檢驗,某研究者用反向血凝法和elisa法分別對230份乙肝病人的血液標本進行檢測,反向血凝法檢測得55份樣本呈陽性結果,elisa法檢測得到45份標本為陽性結果。,錯誤分析等級變量資料 忽視
30、了內(nèi)部構成對兩個或多個總率比較的影響,相關與回歸分析常見錯誤,經(jīng)樣本求得的相關、回歸系數(shù)要做假設檢驗判斷兩變量線性關系的密切程度要看r2的大小 兩事物間有數(shù)量關系,可能是因果關系,也可能不存在因果關系,而僅僅是伴隨關系。例如,調(diào)查某地區(qū)的電視機擁有量和肺癌死亡率,這些年來,每百家庭的電視機擁有量在不斷增加,該地區(qū)的肺癌死亡率也在不斷上升,兩者在數(shù)量上是相關的,但看電視不見得是肺癌發(fā)病的原因。,多因素分析時常見的錯誤,多因素分析中常見的錯誤就是選用方法不當,如多元線性回歸要求因變量呈正態(tài)分布,如果不符合正態(tài)分布則要用對數(shù)等方法進行轉(zhuǎn)換以使符合或接近正態(tài)分布。而二分類變量要選用logistic回歸
31、,如果因變量受時間的影響,則要考慮用cox回歸。 再者在多元線性回歸因素分析中,自變量高度相關時,應考慮多重共線性的問題。,四、資料的重復性評價,計數(shù)資料可計算兩次調(diào)查結果的符合率或Kappa值,上述數(shù)值愈大表示一致性越好。 一般認為Kappa值在0.40.75時為有中、高度一致,大于0.75時為有極好的一致性。 計量資料,則可用相關系數(shù)表示兩次調(diào)查結果的符合程度。相關系數(shù)越大,一致性越好。,五、研究結果的解釋,P值(P value) 檢驗假設中的一個概率,它只能解釋該統(tǒng)計分析結果支持無效假設成立的概率有多大 P值越小,推翻無效假設的概率就越大,即接受備擇假設的概率就越大,無論在哪個水平上接受
32、無效假設( nullhypothesis) 還是備擇假設( alternativehypothesis),都意味著要犯第一類錯誤(type error)或第二類錯誤(type error)的風險。 犯上述錯誤的概率,用a和b表示。也就是說,在a0.05水平上認為某治療方法有效的同時,該療法還有5的可能是無效的。,某人在北京郊區(qū)調(diào)查居民被狗咬傷的情況,結果顯示:各年齡組中被狗咬傷的百分率是不同的,即:年齡由小到大,被狗咬傷餓百分率依次為:很小、較小、較大、很大、較大、較小、很小、較大。原作者的一個驚人的發(fā)現(xiàn)是:年齡與百分率之間的相關系數(shù)r=0.9956,p0.0001,因此擬合的直線回歸方程也是
33、有非常統(tǒng)計學意義的。故原作者認為:在所調(diào)查的市郊,被狗咬者的年齡與被狗咬傷的百分率之間有很好的線性關系,可用此直線回歸方程來預測該地任何一位居民被狗咬傷的概率,以便提醒人們外出時攜帶必要的防身器械,要加倍小心,盡可能減少被狗咬的機會。,第四節(jié)資料的表達,一、恰當選擇統(tǒng)計圖和統(tǒng)計表 二、論文撰寫,一、恰當選擇統(tǒng)計圖和統(tǒng)計表,統(tǒng)計圖(statistical chart)是將統(tǒng)計資料以幾何圖形形象化的表述,常以點的位置、線段的升降、直條的長短或面積的大小等形式直觀表示事物間的數(shù)量關系,但表達比較粗略,常附相應的統(tǒng)計表。 統(tǒng)計表(statistical table)則能客觀、準確、全面、簡捷地表達具體
34、數(shù)據(jù)。統(tǒng)計圖、表的有機結合可使文章簡明易讀、圖文并茂,使讀者印象清晰。,統(tǒng)計表,表格是用數(shù)字來代替復雜的文字敘述 統(tǒng)計表的結構,61,18,43,合計,32,14,18,甲硝唑,29,4,25,替硝唑,合計,未愈,治愈,分組,表1不同藥物治療急性冠周炎效果比較,標題,縱標目,橫標目,表值,頂線,分隔線,底線,統(tǒng)計表種類 簡單表:只按單一變量分組 組合表:將兩個或兩個以上變量組合起來分組,列表原則和基本要求 標題:概括說明表的內(nèi)容,包括表的編號。標題應位于統(tǒng)計表的最上部 標目:分為縱標目與橫標目??v標目標示相應一列(或數(shù)列)的內(nèi)容;橫標目標示相應行的內(nèi)容;文字簡明,有單位的標目要注明單位 線條:
35、不宜過多,不允許使用豎線與斜線。表格上下用粗線,兩端不封口,橫線不超過四條 數(shù)字:一律用阿拉伯數(shù)字表示,同一指標的小數(shù)位數(shù)應一致,位次對齊,表內(nèi)數(shù)字不宜留空格,可用“或”表示 注釋:一律列在表的下方,可用“ * ”號等表示,表11.5 兩個治療組對比,表11.5 西藥與中西藥結合治療急性心肌梗死并發(fā)休克患者的療效比較,統(tǒng)計圖,用形象化的資料補充文字之不足 制圖原則: 按資料的性質(zhì)和分析目的,正確選擇圖形 標題:位于圖正下方,扼要說明資料的內(nèi)容 條圖、散點圖、線圖和直方圖都有縱軸與橫軸,每個坐標均有標目名稱和單位 縱、橫坐標比例應適當,以5:7為佳 比較不同事物時,用不同的線條或顏色表示,要附圖
36、例說明。,各種圖形的選擇及應用 類型 資料的性質(zhì) 目 的 線圖 連續(xù)性 觀察升降趨勢 條圖 間斷性 觀察大小高低 構成圖(圓餅圖) 整體性 觀察構成比例 直方圖(點狀圖) 連續(xù)性 觀察分布狀態(tài) 相關圖 相關性 觀察變量相互關系,線圖(line graph),常用于研究某一事物的反應,有連續(xù)性,隨時間的進展呈動態(tài)性變化,累積病死率,(),追蹤年限(年),圖31-1 兩組高血壓病患者5年累積病死率,條圖(bar graph),常用于表示某種(些)獨立事物的發(fā)生率,及其互相比較,腦卒中發(fā)病率,(),DBP (mmHg),圖31-2 兩組患者不同的舒張壓水平5年累計腦卒中發(fā)病率,圓餅圖(circle
37、graph),用于表示全體中各部分的比重,1200例高脂血癥患者血脂類型分布,直方圖(histogram),用于表示連續(xù)變量的頻數(shù)分布,以橫軸表示被觀察現(xiàn)象,縱軸表示頻數(shù)或頻率,相關圖,發(fā)硒(1000ppm),5.14 某克山病區(qū)10名健康兒童發(fā)硒與血硒含量的散點圖,(5)統(tǒng)計地圖:表示疾病的地理分布,二、論文撰寫,(一) 科技論文的基本要求 (二) 科技論文的結構及要求,(一) 科技論文的基本要求,1.科學性 2.創(chuàng)新性 3.邏輯性 4.可讀性 5.規(guī)范性,1.科學性,科技論文需要合理的設計、真實的數(shù)據(jù)、可靠的方法,不能憑主觀臆斷或個人好惡隨意取舍素材或得出結論。論文中提出的論點應是將充足、
38、可靠和精確的數(shù)據(jù)進行邏輯推理而得出的科學觀點。對研究成果的價值也應做出實事求是的評價。,2.創(chuàng)新性,Science認為,創(chuàng)新是指,對自然或理論提出新見解,而不是對已有研究結論的再次論證,內(nèi)容激動人心并富有啟發(fā)性,具有廣泛的科學興趣。 科技論文應具有完全創(chuàng)新性或部分創(chuàng)新性。創(chuàng)新性的含義是:探求新理論、新論點、新解釋;觀察新現(xiàn)象;研究新材料、新工藝、新方法,也包含在現(xiàn)有水平上對研究方法的訂正、改進等。,3.邏輯性,一篇好的論文,除了要有好的研究成果外,還應該概念明確、判斷恰當、推理嚴謹。論文內(nèi)容不需要包含所有研究工作細節(jié)及研究數(shù)據(jù),只需列舉必要而充分的數(shù)據(jù)或證據(jù)即可。表述的內(nèi)容是否充分、恰當,以是
39、否符合科學性和邏輯性為準。只有這樣,方可使文章主題突出、脈絡清晰。,4.可讀性,寫科技文章要用書面語言,不要用口頭語、地方話和帶有感情色彩的詞語。一篇好的科技文章應該文字簡潔通順、層次分明、前后呼應、用詞準確、符合語法和修飾的要求??萍颊撐牡钠?,一般在25003500字左右。 論文的篇幅不是越長越好,也不是越短越好??偟囊笫?,用盡可能少的篇幅,表達盡可能多的內(nèi)容。,5.規(guī)范性,科技論文中的術語、縮寫、符號等均應符合國家或行業(yè)的規(guī)定標準。如計算單位要按照GB31003120-93量和單位的規(guī)定表示;縮略語代表的術語全稱應在前言中首次出現(xiàn)時寫出并注明縮略語;簡化字應以新華字典為準。,(二)科技
40、論文的結構及要求,國內(nèi)外的生物醫(yī)學期刊,基本上都按“溫哥華格式”書寫。該格式主要包括:文題作者摘要關鍵詞引言材料與方法結果討論總結致謝參考文獻等部分。,1、文題:要求不超過20個漢字(最多30個),用一句話寫完。標題太長可以加一個副標題,文題應包括文章的主要關鍵詞,不應有標點,盡可能回避縮寫、商品名等不常用的詞。文題能反映出文章的特定內(nèi)容和主題。 2、署名:原則上不超過五名,以擔負工作的多少及實際貢獻大小為序,不以職位高低為序。要用真實姓名,并標上作者單位和郵編;參與論文內(nèi)容構思、研究、撰稿、答辯等工作人員均可以署名。,3、摘要: 內(nèi)容包括:目的、方法、結果、結論。 A、一般要求150250個漢字,也可以適當多些。 B、目的:為什么要作本研究 C、方法:研究對象,觀察、治療、護理、統(tǒng)計等 D、結果:研究的結果、效果、數(shù)據(jù)等 E、結論:對結果進行分析、推理而得的判斷 F、結構嚴謹、表述簡明、不分段落、不用圖表、不用縮略語,4、關鍵詞: 一篇論文35個為宜,最多不超過8個。關鍵詞之間可用分號分開,也可以空一格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建對外經(jīng)濟貿(mào)易職業(yè)技術學院《藥物生物技術》2023-2024學年第二學期期末試卷
- 《大戰(zhàn)中的插曲》教學設計 2023-2024學年統(tǒng)編版高中語文選擇性必修上冊
- 海南熱帶海洋學院《男裝設計》2023-2024學年第二學期期末試卷
- 山東政法學院《數(shù)字集成電路設計》2023-2024學年第二學期期末試卷
- 太原幼兒師范高等??茖W校《高級管理統(tǒng)計》2023-2024學年第二學期期末試卷
- 皖江工學院《專業(yè)技能訓練化學教學技能與訓練》2023-2024學年第二學期期末試卷
- 鄭州體育職業(yè)學院《室內(nèi)空間設計公共》2023-2024學年第二學期期末試卷
- 吉林體育學院《生物工程專業(yè)分析》2023-2024學年第二學期期末試卷
- 河南2025年河南職業(yè)技術學院招聘30人筆試歷年參考題庫附帶答案詳解
- 免燒磚銷售合同范本
- 人教版(2025版)七年級下冊英語UNIT 1 Animal Friends 單元整體教學設計(6個課時)
- 項目管理知識手冊指南
- 2025年常熟市招聘進村人員歷年高頻重點提升(共500題)附帶答案詳解
- (主城一診)重慶市2025年高2025屆高三學業(yè)質(zhì)量調(diào)研抽測 (第一次)物理試卷(含答案)
- 2025年中國電信集團有限公司招聘筆試參考題庫含答案解析
- DB50T 393-2011 城市三維建模技術規(guī)范
- 《肺癌圍手術期護理》課件
- 《糖尿病足護理查房》課件
- 山東省臨沂市地圖矢量課件模板()
- 2024復工復產(chǎn)安全培訓
評論
0/150
提交評論