第五章 數(shù)據(jù)處理和檢驗(yàn)_第1頁(yè)
第五章 數(shù)據(jù)處理和檢驗(yàn)_第2頁(yè)
第五章 數(shù)據(jù)處理和檢驗(yàn)_第3頁(yè)
第五章 數(shù)據(jù)處理和檢驗(yàn)_第4頁(yè)
第五章 數(shù)據(jù)處理和檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩81頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大學(xué)生科研論文寫作入門,導(dǎo)入新課,科研的前期準(zhǔn)備工作結(jié)束后,收集了一些有用的實(shí)驗(yàn)或調(diào)查數(shù)據(jù),這些數(shù)據(jù)哪些是可靠的?哪些是可疑的?數(shù)據(jù)怎樣進(jìn)行分析處理?怎樣進(jìn)行統(tǒng)計(jì)檢驗(yàn)?這些是制作圖表的依據(jù),是寫論文之前必須完成的。 那么,有哪些方面的內(nèi)容呢?,第五章 數(shù)據(jù)處理和檢驗(yàn),一、有效數(shù)字 二、平均數(shù)和標(biāo)準(zhǔn)偏差 三、可疑值的舍去 四、常用檢驗(yàn)方法 1. t檢驗(yàn) 2. 方差檢驗(yàn),一、有效數(shù)字,在科學(xué)實(shí)驗(yàn)中,為了得到準(zhǔn)確的測(cè)量結(jié)果,不僅要準(zhǔn)確地測(cè)定各種數(shù)據(jù),而是還要正確地記錄和計(jì)算。所以,記錄實(shí)驗(yàn)數(shù)據(jù)和計(jì)算結(jié)果應(yīng)保留幾位數(shù)字是一件很重要的事,不能隨便增加或減少位數(shù)。例如用重量法測(cè)定硅酸鹽中的SiO2時(shí),若稱

2、取試樣重為0.4538克,經(jīng)過一系列處理后,灼燒得到SiO2沉淀重0.1374克,則其百分含量為: SiO2 % =(0.1374/0.4538)100%30.277655354%,上述分析結(jié)果共有11位數(shù)字,從運(yùn)算來講,并無(wú)錯(cuò)誤,但實(shí)際上用這樣多位數(shù)的數(shù)字來表示上述分析結(jié)果是錯(cuò)誤的,它沒有反映客觀事實(shí),因?yàn)樗玫姆治龇椒ê蜏y(cè)量?jī)x器不可能準(zhǔn)確到這種程度。那么在分析實(shí)驗(yàn)中記錄和計(jì)算時(shí),究竟要準(zhǔn)確到什么程度,才符合客觀事實(shí)呢?這就必須了解“有效數(shù)字”的意義。,有效數(shù)字的意義及位數(shù),有效數(shù)字是指在分析工作中實(shí)際上能測(cè)量到的數(shù)字。記錄數(shù)據(jù)和計(jì)算結(jié)果時(shí)究竟應(yīng)該保留幾位數(shù)字,須根據(jù)測(cè)定方法和使用儀器的準(zhǔn)確

3、程度來決定。在記錄數(shù)據(jù)和計(jì)算結(jié)果時(shí),所保留的有效數(shù)字中,只有最后一位是可疑的數(shù)字或者不定數(shù)字。,例如: 坩堝重18.5734克 六位有效數(shù)字 標(biāo)準(zhǔn)溶液體積24.41毫升 四位有效數(shù)字 由于萬(wàn)分之一的分析天平能稱準(zhǔn)至0.0001克,滴定管的讀數(shù)能讀準(zhǔn)至0.01毫升,故上述坩堝重應(yīng)是18.57340.0001克,標(biāo)準(zhǔn)溶液的體積應(yīng)是24.410.01毫升,因此這些數(shù)值的最后一位都是可疑的,這一位數(shù)字稱為“不定數(shù)字”。在分析工作中應(yīng)當(dāng)使測(cè)定的數(shù)值,只有最后一位是可疑的。,例如: 1.0005 五位有效數(shù)字 0.5000;31.05% ;6.023102 四位有效數(shù)字 0.0540;1.8610-5 三

4、位有效數(shù)字 0.0054;0.40% 兩位有效數(shù)字 0.5 ; 0.002% 一位有效數(shù)字 在1.0005克中的三個(gè)“0”,0.5000克中的后三個(gè)“0”,都是有效數(shù)字;在0.0054克中的“0”只起定位作用,不是有效數(shù);在0.0540克中,前面的“0”起定位作用,最后一位“0”是有效數(shù)字。同樣,這些數(shù)值的最后一位數(shù)字,都是不定數(shù)字。,數(shù)字修約規(guī)則 “四舍六入五留雙”,具體的做法是,當(dāng)尾數(shù)4時(shí)將其舍去;尾數(shù)6時(shí)就進(jìn)一位;如果尾數(shù)為5而后面的數(shù)為0時(shí)則看前方:前方為奇數(shù)就進(jìn)位,前方為偶數(shù)則舍去;當(dāng)“5”后面還有不是0的任何數(shù)時(shí),都須向前進(jìn)一位,無(wú)論前方是奇還是偶數(shù)?!?”則以偶數(shù)論。,有效數(shù)字修

5、約舉例,0.536640.5366 0.583460.5835 18.0650118.07 10.275010.28 16.405016.40,有效數(shù)字的運(yùn)算規(guī)則,(一)加減法 當(dāng)幾個(gè)數(shù)據(jù)相加或相減時(shí)、它們的和或差的有效數(shù)字的保留,應(yīng)以小數(shù)點(diǎn)后位效最少,即絕對(duì)誤差最大的的數(shù)據(jù)為依據(jù)。例如0.0121、25.64及1.05782三數(shù)相加,若各數(shù)最后一位為可疑數(shù)字,則25.64中的4已是可疑數(shù)字。因此,三數(shù)相加后,第二位小數(shù)已屬可疑,其余兩個(gè)數(shù)據(jù)可按規(guī)則進(jìn)行修約、整理到只保留到小數(shù)后2位。,因此,0.0121應(yīng)寫成0.01; 1.05782應(yīng)寫成1.06;三者之和為: 0.01+25.64+1.0

6、626.71 在大量數(shù)據(jù)的運(yùn)算中。為使誤差不迅速積累,對(duì)參加運(yùn)算的所有數(shù)據(jù),可以多保留一位可疑數(shù)字(多保留的這一位數(shù)字叫“安全數(shù)字”)。 如計(jì)算5.2727、0.075、3.7及2.12的總和時(shí),根據(jù)上述規(guī)則,只應(yīng)保留一位小數(shù)。但在運(yùn)算中可以多保留一位,故5.2727應(yīng)寫成5.27;0.075應(yīng)寫成0.08;2.12應(yīng)寫成2.12。因此其和為: 5.27+0.08+3.7+2.1211.17 然后、再根據(jù)修約規(guī)則把11.17整化成11.2。,(二)乘除法 幾個(gè)數(shù)據(jù)相乘除時(shí),積或商的有效數(shù)字的保留,應(yīng)以其中相對(duì)誤差最大的那個(gè)數(shù),即有效數(shù)字位數(shù)最少的那個(gè)數(shù)為依據(jù)。 例如求0.0121、25.64和

7、1.05782三數(shù)相乘之積。 第一個(gè)數(shù)是三位有效數(shù)字,其相對(duì)誤差最大,以此數(shù)據(jù)為依據(jù),確定其他數(shù)據(jù)的位數(shù),即按規(guī)則將各數(shù)都保留三位有效數(shù)字然后相乘: 0.012125.61.06 = 0.328 若是多保留一位可疑數(shù)字時(shí),則 0.012125.641.058 = 0.3282 然后再按“四舍六入五留雙”規(guī)則,將0.3282,改寫成0.328。,有效數(shù)字的運(yùn)算規(guī)則小結(jié) 1根據(jù)分析儀器和分析方法的準(zhǔn)確度正確讀出和記錄測(cè)定值,且只保留一位可疑數(shù)字。 2在計(jì)算結(jié)果之前,先根據(jù)運(yùn)算方法確定欲保留的位數(shù),然后按照數(shù)字修約規(guī)則對(duì)各測(cè)定值進(jìn)行修約,先修約,后計(jì)算。,二、平均數(shù)和標(biāo)準(zhǔn)偏差,1. 平均數(shù) 2. 標(biāo)

8、準(zhǔn)偏差,基本術(shù)語(yǔ),1.總 體 研究對(duì)象的全體,總體數(shù)目N。 2.樣本 自總體中隨機(jī)抽出一部分樣品, 通過樣品推斷總體的性質(zhì)。 3.樣本容量 樣本中所含個(gè)體的數(shù)目,n,平均值,樣本容量為n,其平均值為:,偏差,偏差d=測(cè)定值xi平均值x 平均偏差=(xi-x)n,樣本標(biāo)準(zhǔn)偏差,f = n-1, 自由度:n個(gè)測(cè)定數(shù)據(jù)能相互獨(dú)立比較的是n-1個(gè)。 引入n-1是為了校正以樣本平均值代替總體平均值引起的誤差。,相對(duì)標(biāo)準(zhǔn)偏差,(relative standard deviation-RSD) 又稱變異系數(shù) (coefficient of variation-CV),例1:重鉻酸鉀法測(cè)得中鐵的百分含 量為:

9、20.03%, 20.04%, 20.02%, 20.05%和20.06%。計(jì)算分析結(jié)果的平均值,標(biāo)準(zhǔn)偏差和相對(duì)標(biāo)準(zhǔn)偏差。,舉例,1.Excel(打開excel表第五章) 2.SPSS軟件,SPSS結(jié)果與excel計(jì)算的一樣。,三、可疑值的取舍 在實(shí)驗(yàn)中得到一組數(shù)據(jù),個(gè)別數(shù)據(jù)離群 較遠(yuǎn),這一數(shù)據(jù)稱為異常值、可疑值或極端 值。若是過失造成的,則這一數(shù)據(jù)必須舍去。 否則異常值不能隨意取舍,特別是當(dāng)測(cè)量數(shù) 據(jù)較少時(shí)。 處理方法有4d法、格魯布斯(Grubbs)法和Q檢驗(yàn)法。,1. 4d法 根據(jù)正態(tài)分布規(guī)律,可疑數(shù)值的偏差 ( 即|x 可疑-x |)超過4d時(shí),這一測(cè)定值出現(xiàn)在測(cè)定總體內(nèi)的概率小于0.

10、3%,故這一測(cè)量值通??梢陨崛ァ?檢驗(yàn)步驟,用4d法判斷異常值的取舍的步驟: 1.去掉異常值,計(jì)算其余數(shù)據(jù)的平均值x。 2.計(jì)算各數(shù)據(jù)偏差d=xi-x 2.計(jì)算數(shù)據(jù)的平均偏差d。d=di/n 3.異常值與平均值進(jìn)行比較: |x 可疑-x |大于4d,則將可疑值舍去,否則保留。 4d中的d是d。當(dāng)4d法與其他檢驗(yàn)法矛盾時(shí),以其他法則為準(zhǔn)。,例 測(cè)定某藥物中鈷的含量如(g/g), 得結(jié)果如下:1.25,1.27,1.31,1.40。試問1.40這個(gè)數(shù)據(jù)是否應(yīng)保留? 解 首先不計(jì)異常值1.40,求得其余數(shù)據(jù)的平均值x和平均偏差d為 異常值與平均值的差的絕對(duì)值為 |1.40一1.28|=0.124 d

11、(0.092) 故1.40這一數(shù)據(jù)應(yīng)舍去。,2. 格魯布斯(Grubbs)法 有一組數(shù)據(jù),從小到大排列為: x1,x2,xn-1,xn 其中x1或xn可能是異常值。 用格魯布斯法判斷時(shí),首先計(jì)算出該組數(shù)據(jù)的平均值及標(biāo)準(zhǔn)偏差,再根據(jù)統(tǒng)計(jì)量T進(jìn)行判斷。 若TTa,n,則異常值應(yīng)舍去,否則應(yīng)保留。,例 前一例中的實(shí)驗(yàn)數(shù)據(jù),用格魯布斯法判斷時(shí),1.40這個(gè)數(shù)據(jù)應(yīng)保留否(置信度95%)? 解 平均值 x=1.31, s=0.066 查表T005,4=1.46,TT005,4,故1.40這個(gè)數(shù)據(jù)應(yīng)該保留。 格魯布斯法優(yōu)點(diǎn),引人了正態(tài)分布中的兩個(gè)最重要的樣本參數(shù)x及s,故方法的準(zhǔn)確性較好。缺點(diǎn)是需要計(jì)算x和

12、s,手續(xù)稍麻煩。,3. Q檢驗(yàn)法 設(shè)一組數(shù)據(jù),從小到大排列為: x1,x2,xn-1,xn 設(shè)x1、xn為異常值,則統(tǒng)計(jì)量Q為: 式中分子為異常值與其相鄰的一個(gè)數(shù)值的差值,分母為整組數(shù)據(jù)的極差。Q值越大,說明xn離群越遠(yuǎn)。Q稱為“舍棄商”。當(dāng)Q計(jì)算Q表時(shí),異常值應(yīng)舍去,否則應(yīng)予保留。,1.25,1.27,1.31,1.40,三種方法比較,4d法在數(shù)理統(tǒng)計(jì)上是不夠嚴(yán)格的,這種方法把可疑值首先排除在外,然后進(jìn)行檢驗(yàn),容易把原來屬于有效的數(shù)據(jù)也舍棄掉,所以此法有一定局限性。 Q檢驗(yàn)法符合數(shù)理統(tǒng)計(jì)原理,但只適合用于一組數(shù)據(jù)中有一個(gè)可疑值的判斷。 Grubbs法將正態(tài)分布中兩個(gè)重要參數(shù)x及S引進(jìn),方法準(zhǔn)

13、確度較好。 三種方法以Grubbs法最合理而普遍適用。,四、常用的檢驗(yàn)方法,1.t-檢驗(yàn)(T-tests ):與均值相聯(lián)系,比較兩個(gè)樣本的均值差異性,要求服從正態(tài)分布或者t分布。 2.單因素方差分析:(One-way analysis of variance)單因素方差檢驗(yàn),用于多個(gè)樣本均數(shù)的顯著性檢驗(yàn)。,1. t檢驗(yàn),由于研究中不可能把總體中所有的樣本都進(jìn)行測(cè)定,比如總體有1000個(gè)個(gè)體,我們可以選擇50個(gè)組成樣本,測(cè)定樣本的均值來反映總體的均值。但是由于取樣的問題,可能抽到一些數(shù)值較大或者較小的個(gè)體,從而使得樣本的均值和總體參數(shù)的均值之間有所不同,那么有一個(gè)問題:這個(gè)樣本參數(shù)均值是否能代表

14、總體均值?均值不等的樣本個(gè)體是否能代表總體呢?另外,兩組樣本參數(shù)的均值是來自相同的總體還是不同的總體?它們之間是否有不同?這就需要進(jìn)行t檢驗(yàn)。,t 檢驗(yàn)的類型,1.單一樣本t檢驗(yàn)(One-Sample T Test):檢驗(yàn)單個(gè)變量的均值是否與給定的標(biāo)準(zhǔn)或者常數(shù)之間是否存在差異。 2.獨(dú)立樣本t檢驗(yàn)(Independent Sample T Test):用于檢驗(yàn)兩組來自獨(dú)立總體的樣本,其獨(dú)立總體的均值是否有差異。 3.配對(duì)樣本t檢驗(yàn)(Paired-Sample T Test): 用于檢驗(yàn)兩個(gè)相關(guān)或配對(duì)的樣本是否來自具有相同均值的總體。,配對(duì)樣本t檢驗(yàn),比如考查同一組人在參加一年的長(zhǎng)跑鍛煉前后的心

15、率是否有顯著差異。這里,每個(gè)人一年前的心率和一年后的心率是相關(guān)的,心率較快的人鍛煉后仍相對(duì)其他人較快。所以,檢驗(yàn)這樣的成對(duì)總體的均值不能使用獨(dú)立樣本t檢驗(yàn)的辦法,因?yàn)楠?dú)立條件不再滿足。要用配對(duì)樣本t檢驗(yàn) 。,配對(duì)樣本t檢驗(yàn),又如想知道飼料中缺乏維生素E對(duì)大鼠肝中維生素A含量有無(wú)影響,實(shí)驗(yàn)選擇8對(duì)16只大鼠,每對(duì)大鼠一只喂給正常飼料,另一只喂給維生素E缺乏飼料??疾檎o暳辖M和維生素E缺乏飼料組的結(jié)果有無(wú)差異時(shí),也需要用配對(duì)樣本t檢驗(yàn) 。,t檢驗(yàn)中的P值,t檢驗(yàn)中的P值就是用于判斷均數(shù)差異存在大小的可能性或者概率。 概率P值在0與1之間,P越接近于1,表明某事件發(fā)生的可能性越大,P越接近于0,表

16、明某事件發(fā)生的可能性越小。習(xí)慣上將P0.05,或P0.01,成為小概率事件,表示某事件發(fā)生的可能性很小。,t 檢驗(yàn)法公式,平均值與標(biāo)準(zhǔn)值的比較 進(jìn)行t檢驗(yàn)時(shí),首先按下式計(jì)算出t值 若t計(jì)算t,f,即P值0.05時(shí)則沒有顯著性差異。 通常以95%的置信度為檢驗(yàn)標(biāo)準(zhǔn),即顯著性水準(zhǔn)為5%。,t檢驗(yàn)的2種方法,1. 雙側(cè)檢驗(yàn) 2. 單側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),雙側(cè)檢驗(yàn):一般不知道數(shù)據(jù)的變化趨勢(shì)時(shí),默認(rèn)為雙側(cè)檢驗(yàn)。 單側(cè)檢驗(yàn):主要關(guān)心帶方向性或趨勢(shì)性的檢驗(yàn)問題。分兩種情況:一種是我們所考察的數(shù)值越大越好。例如某機(jī)構(gòu)購(gòu)買燈泡的使用壽命,輪胎的行駛里程數(shù),等等。另一種是數(shù)值越小越好,例如廢品率、生產(chǎn)成本等

17、等。,雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),若對(duì)同一資料進(jìn)行雙側(cè)檢驗(yàn)也進(jìn)行單側(cè)檢驗(yàn)時(shí),同一資料雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)所得的結(jié)論可能相同也可能不相同。 一般,雙側(cè)檢驗(yàn)顯著,單側(cè)檢驗(yàn)一定顯著;但單側(cè)檢驗(yàn)顯著,雙側(cè)檢驗(yàn)未必顯著。,t檢驗(yàn)常用軟件,1. Excel(打開excel表第5章) 2. SPSS軟件 各舉例分析,2.方差分析,在科學(xué)實(shí)驗(yàn)中常常要探討不同實(shí)驗(yàn)條件或處理方法對(duì)實(shí)驗(yàn)結(jié)果的影響。通常是比較不同實(shí)驗(yàn)條件下樣本均值間的差異。 方差分析是檢驗(yàn)多組樣本均值間的差異是否具有統(tǒng)計(jì)意義的一種方法。例如 醫(yī)學(xué)界研究幾種藥物對(duì)某種疾病的療效; 農(nóng)業(yè)研究土壤、肥料、日照時(shí)間等因素對(duì)某種農(nóng)作物產(chǎn)量的影響 不同飼料對(duì)牲畜體重增長(zhǎng)的效果等 都可以使用方差分析方法去解決。,方差分析的方法很多,本章只介紹單因素方差分析(One way ANOVA)。,單因素方差分析,該法是對(duì)二組以上的均值進(jìn)行比較。如對(duì)照和幾個(gè)實(shí)驗(yàn)組。 檢驗(yàn)由單一因素影響的一個(gè)分析變量由該因素各水平組的均值之間的差異與對(duì)照組相比是否有統(tǒng)計(jì)意義。 并可以進(jìn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論