




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
課程性質(zhì)和教學(xué)要求課程的性質(zhì):
《教育統(tǒng)計(jì)學(xué)》是教育學(xué)與統(tǒng)計(jì)學(xué)交叉結(jié)合的學(xué)科,同時(shí)也是一門應(yīng)用統(tǒng)計(jì)學(xué),是數(shù)理統(tǒng)計(jì)方法在教育領(lǐng)域的具體應(yīng)用。它通過量化的手段來分析、認(rèn)識(shí)教育現(xiàn)象和規(guī)律,是一門重要的工具性學(xué)科。教學(xué)目標(biāo)和要求:
理解《教育統(tǒng)計(jì)學(xué)》的基本概念和原理,掌握從事教育科學(xué)研究所必需的一些統(tǒng)計(jì)方法,能按照要求對(duì)數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)分析處理,形成較強(qiáng)的統(tǒng)計(jì)意識(shí),在今后的實(shí)際研究中具有正確地選擇、運(yùn)用統(tǒng)計(jì)方法解決實(shí)際問題的能力。第一章緒論
教育統(tǒng)計(jì)方法在教育科學(xué)研究中的作用
教育統(tǒng)計(jì)學(xué)的內(nèi)容
教育統(tǒng)計(jì)學(xué)的發(fā)展教育統(tǒng)計(jì)學(xué)中幾個(gè)基礎(chǔ)概念什么是教育統(tǒng)計(jì)學(xué)
教育統(tǒng)計(jì)學(xué)是專門研究如何運(yùn)用統(tǒng)計(jì)學(xué)原理和方法,搜集、整理、分析教育科學(xué)研究中獲得的隨機(jī)性數(shù)據(jù)資料,并根據(jù)這些數(shù)據(jù)資料所傳遞的信息,進(jìn)行科學(xué)推論找出教育活動(dòng)規(guī)律的一門科學(xué)。具體講,就是在教育研究中,通過調(diào)查、實(shí)驗(yàn)、測(cè)量等手段有意獲取一些數(shù)據(jù),并將得到的數(shù)據(jù)按統(tǒng)計(jì)學(xué)原理和步驟加以整理、計(jì)算、繪制圖表、分析、判斷、推理,最后得出結(jié)論的一種研究方法。教育統(tǒng)計(jì)學(xué)的性質(zhì)
教育統(tǒng)計(jì)學(xué)是心理學(xué)與統(tǒng)計(jì)學(xué)交叉結(jié)合的學(xué)科,是數(shù)理統(tǒng)計(jì)方法在教育領(lǐng)域的具體應(yīng)用,屬于應(yīng)用統(tǒng)計(jì)學(xué)的范疇,是應(yīng)用統(tǒng)計(jì)學(xué)的一個(gè)分支。它是教育科學(xué)研究中廣泛應(yīng)用的、也是最基本的一種定量化的研究工具。教育統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)的關(guān)系
數(shù)理統(tǒng)計(jì)學(xué)研究的領(lǐng)域包括怎樣設(shè)計(jì)一個(gè)實(shí)驗(yàn),如何從局部觀測(cè)推論整體情況,如何從特殊情況推論一般規(guī)律,如何對(duì)假設(shè)進(jìn)行推論估計(jì)與檢驗(yàn)等等。教育統(tǒng)計(jì)學(xué)偏重于數(shù)理統(tǒng)計(jì)方法如何在教育科學(xué)研究中的應(yīng)用,因而對(duì)各種統(tǒng)計(jì)方法公式的推導(dǎo)及理論上的證明介紹較少,著重介紹各種統(tǒng)計(jì)方法在不同的教育研究中應(yīng)用的條件和具體方法,及其統(tǒng)計(jì)結(jié)果的解釋。一般講,教育統(tǒng)計(jì)學(xué)介紹的方法,大都是數(shù)理統(tǒng)計(jì)學(xué)已確認(rèn)的,但是,隨著教育科學(xué)研究的發(fā)展與深入,實(shí)踐中會(huì)提出更多的如何處理數(shù)據(jù)的問題,需要教育統(tǒng)計(jì)學(xué)加以研究解決,這又為數(shù)理統(tǒng)計(jì)提供或補(bǔ)充了新的研究?jī)?nèi)容??梢姡瑪?shù)理統(tǒng)計(jì)學(xué)和教育統(tǒng)計(jì)學(xué)二者之間是理論與實(shí)踐的關(guān)系。學(xué)習(xí)教育統(tǒng)計(jì)學(xué)的意義
(1)統(tǒng)計(jì)學(xué)為科學(xué)研究提供了一種科學(xué)方法。(2)教育統(tǒng)計(jì)學(xué)是教育科學(xué)研究定量分析的重要重要工具。(3)廣大教育工作者學(xué)習(xí)教育統(tǒng)計(jì)學(xué)既可以順利地閱讀國(guó)內(nèi)外先進(jìn)的研究成果,又可以提高工作的科學(xué)性和效率,同時(shí)也為學(xué)習(xí)教育測(cè)量打下基礎(chǔ)。教育科學(xué)研究數(shù)據(jù)的特點(diǎn)
(1)教育科學(xué)研究數(shù)據(jù)與結(jié)果多用數(shù)字形式呈現(xiàn);(2)教育科學(xué)研究數(shù)據(jù)具有隨機(jī)性和變異性;(3)教育科學(xué)研究數(shù)據(jù)具有規(guī)律性;(4)教育科學(xué)研究的目的是通過部分?jǐn)?shù)據(jù)來推測(cè)總體特征。總之,在教育科學(xué)實(shí)驗(yàn)或調(diào)查中,所獲得的數(shù)據(jù)都具有變異性與規(guī)律性的特點(diǎn)。
學(xué)習(xí)教育統(tǒng)計(jì)學(xué)要注意的問題
(1)在學(xué)習(xí)教育統(tǒng)計(jì)學(xué)時(shí),必須克服畏難情緒。(2)在學(xué)習(xí)時(shí)要重點(diǎn)掌握各種統(tǒng)計(jì)方法使用的條件。(3)要做一定的練習(xí)。在應(yīng)用教育統(tǒng)計(jì)學(xué)
各種方法時(shí)要切記的要點(diǎn)
(1)克服“統(tǒng)計(jì)無用”與“統(tǒng)計(jì)萬能”的思想,要注意科研道德。(2)正確地選用統(tǒng)計(jì)方法,防止亂用統(tǒng)計(jì)。
思考題
選用統(tǒng)計(jì)方法有哪幾個(gè)步驟?
①要分析一下實(shí)驗(yàn)設(shè)計(jì)是否合理,即所獲得的數(shù)據(jù)是否適合用統(tǒng)計(jì)方法去處理,正確的數(shù)量化是應(yīng)用統(tǒng)計(jì)方法的起步,如果對(duì)數(shù)量化的過程及其意義沒有了解,將一些不著邊際的數(shù)據(jù)加以統(tǒng)計(jì)處理是毫無意義的。②要分析實(shí)驗(yàn)數(shù)據(jù)的類型。不同數(shù)據(jù)類型所使用的統(tǒng)計(jì)方法有很大差別,了解實(shí)驗(yàn)數(shù)據(jù)的類型和水平,對(duì)選用恰當(dāng)?shù)慕y(tǒng)計(jì)方法至關(guān)重要。③要分析數(shù)據(jù)的分布規(guī)律,如總體方差的情況,確定其是否滿足所選用的統(tǒng)計(jì)方法的前提條件。答:教育統(tǒng)計(jì)學(xué)的分類
(1)依研究的問題實(shí)質(zhì)來劃分,教育統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容可劃分為描述一件事物的性質(zhì)、比較兩件事物之間的差異、分析影響事物變化的因素、一件事物兩種不同屬性之間的相互關(guān)系、取樣方法等等。(2)依統(tǒng)計(jì)方法的功能進(jìn)行分類,教育統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容可分為描述統(tǒng)計(jì)、推論統(tǒng)計(jì)和實(shí)驗(yàn)設(shè)計(jì)。描述統(tǒng)計(jì)
主要研究如何整理科學(xué)實(shí)驗(yàn)或調(diào)查得來的大量數(shù)據(jù),描述一組數(shù)據(jù)的全貌,表達(dá)一件事物的性質(zhì)。具體內(nèi)容包括:
(1)數(shù)據(jù)如何分組,如何使用各種統(tǒng)計(jì)圖表描述一組數(shù)據(jù)的分布情況;(2)怎樣計(jì)算一組數(shù)據(jù)的特征值,簡(jiǎn)縮數(shù)據(jù),進(jìn)一步描述一組數(shù)據(jù)的全貌;(3)表示一事物兩種或兩種以上屬性間相互關(guān)系的描述及各種相關(guān)系數(shù)的計(jì)算及應(yīng)用條件,描述數(shù)據(jù)分布特征的峰度及偏度系數(shù)計(jì)算方法等。
推論統(tǒng)計(jì)
主要研究如何通過局部數(shù)據(jù)所提供的信息,推論總體(或稱全局)的情形。具體內(nèi)容包括:
(1)如何對(duì)假設(shè)進(jìn)行檢驗(yàn),即各種各樣的假設(shè)檢驗(yàn),包括大樣本檢驗(yàn)方法(z檢驗(yàn)),小樣本檢驗(yàn)方法(t檢驗(yàn)),各種計(jì)數(shù)資料的假設(shè)檢驗(yàn)的方法(百分?jǐn)?shù)檢驗(yàn)、χ2檢驗(yàn)等),變異數(shù)分析的方法(F檢驗(yàn)),回歸分析方法等等。(2)總體參數(shù)的估計(jì)方法。(3)各種非參數(shù)的統(tǒng)計(jì)方法等。實(shí)驗(yàn)設(shè)計(jì)
主要目的在于研究如何科學(xué)地、經(jīng)濟(jì)地以及更有效地進(jìn)行實(shí)驗(yàn)。具體內(nèi)容包括:在實(shí)驗(yàn)以前對(duì)研究的基本步驟、取樣方法、實(shí)驗(yàn)條件的控制、實(shí)驗(yàn)結(jié)果數(shù)據(jù)的統(tǒng)計(jì)分析方法等作出嚴(yán)格的規(guī)定。
描述統(tǒng)計(jì)、推論統(tǒng)計(jì)和實(shí)驗(yàn)設(shè)計(jì)這三部分統(tǒng)計(jì)內(nèi)容有何關(guān)系?思考題
教育統(tǒng)計(jì)學(xué)的三個(gè)組成部分的內(nèi)容不是截然分開的,而是相互聯(lián)系的。描述統(tǒng)計(jì)是推論統(tǒng)計(jì)的基礎(chǔ),推論統(tǒng)計(jì)離不開描述統(tǒng)計(jì)計(jì)算所獲得的特征值;描述統(tǒng)計(jì)只是對(duì)數(shù)據(jù)進(jìn)行一般的分析歸納,如果不進(jìn)一步應(yīng)用推論統(tǒng)計(jì)作進(jìn)一步的分析,描述統(tǒng)計(jì)的結(jié)果就不會(huì)產(chǎn)生更大的價(jià)值和意義,達(dá)不到統(tǒng)計(jì)分析的最終目的要求。同樣,只有良好的實(shí)驗(yàn)設(shè)計(jì)才能使所獲得的數(shù)據(jù)具有意義,進(jìn)一步的統(tǒng)計(jì)處理才能說明問題。當(dāng)然一個(gè)好的實(shí)驗(yàn)設(shè)計(jì),也必須符合基本的統(tǒng)計(jì)方法的要求,否則,再好的設(shè)計(jì),如果事先沒有確定適當(dāng)?shù)慕y(tǒng)計(jì)方法處理,在處理研究結(jié)果時(shí)可能會(huì)遇到許多麻煩問題。答:教育統(tǒng)計(jì)與心理統(tǒng)計(jì)的異同
相同之處:二者的研究對(duì)象都是人,教育現(xiàn)象在很多情況下要通過人的心理現(xiàn)象去觀察和分析,統(tǒng)計(jì)方法基本相同。不同之處:
①在統(tǒng)計(jì)方法上:在教育方面的研究中,大樣本的統(tǒng)計(jì)方法應(yīng)用較多;而在心理學(xué)上小樣本的方法較多。②在實(shí)驗(yàn)設(shè)計(jì)的水平上:教育實(shí)驗(yàn)中控制因素較難,采用自然實(shí)驗(yàn)、準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)方式較多,對(duì)統(tǒng)計(jì)結(jié)果的解釋需要特別謹(jǐn)慎;而心理學(xué)實(shí)驗(yàn)則在實(shí)驗(yàn)室條件下進(jìn)行較多,對(duì)各種實(shí)驗(yàn)變量的控制相對(duì)容易,統(tǒng)計(jì)處理結(jié)果的解釋也較易進(jìn)行。統(tǒng)計(jì)學(xué)的發(fā)展歷程
(1)最初的統(tǒng)計(jì)是統(tǒng)治者用以治國(guó)的方法,對(duì)于人口、土地、物產(chǎn)、貢賦、士兵與戰(zhàn)車等都需要統(tǒng)計(jì)。(2)隨著科學(xué)的進(jìn)步,在概率論的基礎(chǔ)上逐步形成了推測(cè)性的數(shù)理統(tǒng)計(jì)。(3)數(shù)理統(tǒng)計(jì)的發(fā)展經(jīng)歷了兩個(gè)階段:描述統(tǒng)計(jì)學(xué)與推論統(tǒng)計(jì)學(xué)。描述統(tǒng)計(jì)學(xué)產(chǎn)生于20世紀(jì)20年代之前,以高爾頓和皮爾遜為代表。推論統(tǒng)計(jì)學(xué)產(chǎn)生于20年代之后,以費(fèi)舍為代表。(4)二戰(zhàn)以后,非參數(shù)方法、序列分析、隨機(jī)過程的研究、小樣本分布這些都逐漸被認(rèn)識(shí)和應(yīng)用。而且隨著一元統(tǒng)計(jì)方法的逐步完善與拓寬,多元統(tǒng)計(jì)理論與方法也被應(yīng)用到各種實(shí)際研究中。統(tǒng)計(jì)在教育與心理研究中的應(yīng)用
(1)作為一門應(yīng)用統(tǒng)計(jì)學(xué)分支學(xué)科,教育統(tǒng)計(jì)學(xué)基本上是隨著數(shù)理統(tǒng)計(jì)的發(fā)展而發(fā)展的;同時(shí)心理與教育研究的發(fā)展也不斷充實(shí)著統(tǒng)計(jì)學(xué)的方法。許多現(xiàn)代統(tǒng)計(jì)學(xué)理論最初是來自教育與心理研究的。例如,因子分析源出于心理學(xué)研究。(2)英國(guó)的高爾頓最早將統(tǒng)計(jì)方法應(yīng)用于心理學(xué)研究,首創(chuàng)回歸原理。皮爾遜也將相關(guān)系數(shù)及χ2檢驗(yàn)等應(yīng)用于心理研究中。斯皮爾曼對(duì)心理統(tǒng)計(jì)的發(fā)展做了很多工作,延伸了相關(guān)系數(shù)的概念,導(dǎo)出等級(jí)相關(guān)系數(shù)的計(jì)算方法;提出因子分析的思想,用統(tǒng)計(jì)方法處理心理實(shí)驗(yàn)結(jié)果。(3)貢獻(xiàn)較大的有卡特爾、桑代克、瑟斯頓等人。1904年,桑代克出版《心理與社會(huì)測(cè)量》一書,極力提倡以心理學(xué)與統(tǒng)計(jì)學(xué)為工具而研究教育學(xué),推廣運(yùn)用統(tǒng)計(jì)方法研究心理與教育方面的實(shí)驗(yàn)結(jié)果。20世紀(jì)20年代,瑟斯頓等人對(duì)因素分析在心理學(xué)研究中的廣泛應(yīng)用也作了很大貢獻(xiàn)。統(tǒng)計(jì)在中國(guó)的發(fā)展與應(yīng)用
(1)教育與心理統(tǒng)計(jì)學(xué)在辛亥革命以后傳到我國(guó)。當(dāng)時(shí)教育與心理統(tǒng)計(jì)、教育與心理測(cè)量都作為高等、中等師范院校的必修課程,有一大批專家、學(xué)者從事這方面的研究、講授工作,出版了不少關(guān)于教育與心理統(tǒng)計(jì)方面的譯著、專著。
(2)20世紀(jì)80年代以后,教育與心理心理統(tǒng)計(jì)學(xué)開始復(fù)蘇。在二十多年中,我國(guó)的教育與心理統(tǒng)計(jì)學(xué)科在教學(xué)、研究、培養(yǎng)人才等各方面取得了非常豐碩的成果。(3)目前,教育與心理統(tǒng)計(jì)學(xué)的教學(xué)和研究進(jìn)入穩(wěn)步快速發(fā)展時(shí)期。
數(shù)據(jù)的類型(一)
從數(shù)據(jù)的觀測(cè)方法和來源劃分,研究數(shù)據(jù)可區(qū)分為計(jì)數(shù)數(shù)據(jù)和測(cè)量數(shù)據(jù)兩大類。
計(jì)數(shù)數(shù)據(jù)是指計(jì)算個(gè)數(shù)的數(shù)據(jù),一般屬性的調(diào)查獲得的是此類數(shù)據(jù),它具有獨(dú)立的分類單位,一般都取整數(shù)的形式。測(cè)量數(shù)據(jù)是借助于一定的測(cè)量工具或一定的測(cè)量標(biāo)準(zhǔn)而獲得的數(shù)據(jù)。數(shù)據(jù)的類型(二)
根據(jù)數(shù)據(jù)反映的測(cè)量水平,可把數(shù)據(jù)區(qū)分為稱名數(shù)據(jù)、順序數(shù)據(jù)、等距數(shù)據(jù)和比率數(shù)據(jù)四種類型。稱名數(shù)據(jù)只說明某一事物與其它事物在屬性上的不同或類別上的差異,它具有獨(dú)立的分類單位,其數(shù)值一般都取整數(shù)形式,只計(jì)算個(gè)數(shù),并不說明事物之間差異的大小。順序數(shù)據(jù)是指既無相等單位,也無絕對(duì)零點(diǎn)的數(shù)據(jù),是按事物某種屬性的多少或大小,按次序?qū)⒏鱾€(gè)事物加以排列后獲得的數(shù)據(jù)資料。等距數(shù)據(jù)是具有相等單位,但無絕對(duì)零點(diǎn)的數(shù)據(jù)。比率數(shù)據(jù)既表明量的大小,也有相等單位,同時(shí)還具有絕對(duì)零點(diǎn)的數(shù)據(jù)。數(shù)據(jù)的類型(三)
按照數(shù)據(jù)是否具有連續(xù)性,把數(shù)據(jù)劃分為離散數(shù)據(jù)和連續(xù)數(shù)據(jù)。離散數(shù)據(jù)一般取整數(shù),在兩個(gè)單位之間不能再劃分細(xì)小單位。連續(xù)數(shù)據(jù)的單位可以劃得很細(xì)微,細(xì)微的程度能達(dá)到只可想象而不能看見的程度。
變量、觀測(cè)值、隨機(jī)變量
變量是指教育實(shí)驗(yàn)、觀察、調(diào)查中想要獲得的數(shù)據(jù)。觀測(cè)值是指某一變量的某個(gè)確定的取值。隨機(jī)變量是指在取值之前不能預(yù)料取到什么值的變量。作為連續(xù)隨機(jī)變量,其數(shù)值只是表示連續(xù)變量的中央點(diǎn)值,在數(shù)軸上表示的是一段距離,或一個(gè)區(qū)間。因此,一個(gè)隨機(jī)變量不管寫成整數(shù)或小數(shù),實(shí)際是用一個(gè)單位的中央點(diǎn)表示在它以上和以下各有一段距離。例如:連續(xù)隨機(jī)變量1是表示0.5—1.499…。但在心理統(tǒng)計(jì)中也有例外的情況。如年齡的表示,一般5歲是指5歲開始到5歲11個(gè)月又30天。而作為離散的隨機(jī)變量,其數(shù)值表示的是數(shù)軸上的一個(gè)點(diǎn)值。總體、個(gè)體和樣本總體是指具有某種特征的一類事物的全體。構(gòu)成總體的每個(gè)基本單元稱為個(gè)體。從總體中抽取的一部分個(gè)體,稱為總體的一個(gè)樣本。樣本中包含的個(gè)體數(shù)目稱為樣本容量,一般用n表示。一般情況下,n>30的樣本稱為大樣本;n>30的樣本稱為小樣本。
次數(shù)、頻率與概率
次數(shù)(頻數(shù))
次數(shù)是指某一事件在某一類別中出現(xiàn)的數(shù)目。一般用符號(hào)f表示。頻率(相對(duì)次數(shù))
頻率是指某一事件的次數(shù)被總的事件數(shù)目除。亦即某一數(shù)據(jù)出現(xiàn)的次數(shù)被一組數(shù)據(jù)總個(gè)數(shù)去除。頻率通常用比例或百分?jǐn)?shù)表示。概率(機(jī)率或然率)
概率是指某事件在無限的觀測(cè)中所能預(yù)料的相對(duì)出現(xiàn)的次數(shù)。換一句話說,就是某一事件或某種情況在某一總體中出現(xiàn)的比率。概率常用符號(hào)P表示。統(tǒng)計(jì)量和參數(shù)
統(tǒng)計(jì)量是指樣本的特征值。它是根據(jù)科研實(shí)驗(yàn)所獲得的一組觀測(cè)值計(jì)算出來的一些量數(shù),它可以描述一組數(shù)據(jù)的情況。參數(shù)是指總體的特征值。它是描述一個(gè)總體情況的一些統(tǒng)計(jì)指標(biāo)。思考題統(tǒng)計(jì)量與參數(shù)之間有何區(qū)別和聯(lián)系?
區(qū)別:①參數(shù)是從整個(gè)總體中計(jì)算得到的量數(shù),通常是通過相應(yīng)樣本特征值來預(yù)測(cè)得到;統(tǒng)計(jì)量是從一個(gè)樣本中計(jì)算出來的一些量數(shù),它可以描述一組數(shù)據(jù)的情況。②參數(shù)代表總體的特性,它是一個(gè)常數(shù);統(tǒng)計(jì)量代表樣本的特性,它是一個(gè)變量,隨著樣本的變化而變化。③參數(shù)與統(tǒng)計(jì)量之間最明顯的區(qū)別是參數(shù)常用希臘字母表示,而統(tǒng)計(jì)量常用英文字母表示。聯(lián)系:從數(shù)值計(jì)算上講,當(dāng)總體大小已知并與實(shí)驗(yàn)觀測(cè)的總次數(shù)相同時(shí),統(tǒng)計(jì)量與參數(shù)是同一統(tǒng)計(jì)指標(biāo);當(dāng)總體為無限時(shí),統(tǒng)計(jì)量與總體參數(shù)不同,但統(tǒng)計(jì)量可在某種程度上作為總體參數(shù)的估計(jì)值。通過樣本統(tǒng)計(jì)量,對(duì)總體參數(shù)做出預(yù)測(cè)和估計(jì)。答:第二章統(tǒng)計(jì)圖表
數(shù)據(jù)的初步整理次數(shù)分布表次數(shù)分布圖其他類型的統(tǒng)計(jì)圖表數(shù)據(jù)初步整理的方法
(1)數(shù)據(jù)排序
數(shù)據(jù)排序是指按照某種標(biāo)準(zhǔn),對(duì)收集到的雜亂無章的數(shù)據(jù)按照一定的順序標(biāo)準(zhǔn)進(jìn)行排列。
數(shù)據(jù)排序是整理數(shù)據(jù)最簡(jiǎn)單的方法。(2)統(tǒng)計(jì)分組
統(tǒng)計(jì)分組是指根據(jù)被研究對(duì)象的特征,將所得數(shù)據(jù)劃分到各個(gè)類別中去。
對(duì)研究中所獲得的大量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分組是對(duì)數(shù)據(jù)進(jìn)行整理的重要步驟。統(tǒng)計(jì)分組應(yīng)注意的事項(xiàng)
統(tǒng)計(jì)分組前的準(zhǔn)備
將數(shù)據(jù)進(jìn)行分組前,先要對(duì)觀測(cè)數(shù)據(jù)做進(jìn)一步的核對(duì)和校驗(yàn)。校核數(shù)據(jù)的目的是為了盡可能地消去記錄誤差,以便后續(xù)的統(tǒng)計(jì)分析建立在一個(gè)堅(jiān)實(shí)的基礎(chǔ)上。統(tǒng)計(jì)分組時(shí)應(yīng)注意的問題
①分組要以被研究對(duì)象的本質(zhì)特性為基礎(chǔ);
②分類標(biāo)志要明確,要能包括所有的數(shù)據(jù)。統(tǒng)計(jì)分組標(biāo)志的類型
(1)性質(zhì)類別
主要是根據(jù)事物的屬性不同將被觀測(cè)的事物加以劃分,反映事物在組別、種類上的不同,不說明事物之間的數(shù)量差異。性質(zhì)類別可根據(jù)事物的性質(zhì)及研究的需要分成不同的層次,每個(gè)層次又可分為不同數(shù)量的細(xì)目。(2)數(shù)量類別
這是以數(shù)據(jù)的取值大小為分類標(biāo)志,把數(shù)據(jù)按數(shù)值大小以分組或不分組的形式排出一個(gè)順序來。統(tǒng)計(jì)表
統(tǒng)計(jì)表的作用
統(tǒng)計(jì)表是用來表達(dá)統(tǒng)計(jì)指標(biāo)與被說明的事物數(shù)量關(guān)系的表格。它可以將大量數(shù)據(jù)的分類結(jié)果,清晰、概括、一目了然地表達(dá)出來,明顯地反映出事物的全貌及其蘊(yùn)涵的特性,具有簡(jiǎn)明、清晰、準(zhǔn)確的特點(diǎn),表中的數(shù)據(jù)易于比較分析。統(tǒng)計(jì)表的結(jié)構(gòu)統(tǒng)計(jì)表一般由表號(hào)、名稱、標(biāo)目、數(shù)字、表注等項(xiàng)構(gòu)成。統(tǒng)計(jì)表的編制要求按統(tǒng)計(jì)表的結(jié)構(gòu)逐項(xiàng)說明編制的要求(見教材P27—28)。
統(tǒng)計(jì)表的結(jié)構(gòu)和組成要素圖示80名員工對(duì)主管盡職情況評(píng)定人數(shù)①非常不盡職②不盡職③不置可否④盡職⑤非常盡職93010256總計(jì)80表2-180名員工對(duì)部門主管盡職程度調(diào)查結(jié)果表號(hào)標(biāo)題標(biāo)目表注*注:表中的數(shù)據(jù)來源于例[2-1]標(biāo)目頂線表線數(shù)字底線統(tǒng)計(jì)圖
統(tǒng)計(jì)圖的作用
統(tǒng)計(jì)圖是用來表達(dá)統(tǒng)計(jì)指標(biāo)與被說明的事物之間數(shù)量關(guān)系的圖形。它以直觀形象的形式表達(dá)出事物的全貌及其分布特征,給人簡(jiǎn)明扼要、清晰易懂的印象,便于學(xué)習(xí)與記憶。統(tǒng)計(jì)圖的結(jié)構(gòu)統(tǒng)計(jì)圖由圖號(hào)、圖題、圖目、圖尺、圖形、圖例、圖注等項(xiàng)構(gòu)成。統(tǒng)計(jì)圖的繪制要求按統(tǒng)計(jì)圖的組成部分逐項(xiàng)說明繪制要點(diǎn)(見教材P28—29)。統(tǒng)計(jì)圖結(jié)構(gòu)要素意圖Y軸名稱尺度單位填充圖案輪廓線基線X軸名稱
刻度標(biāo)記圖尺圖號(hào)圖題圖目簡(jiǎn)單次數(shù)分布表
簡(jiǎn)單次數(shù)分布表就是依據(jù)每一個(gè)分?jǐn)?shù)值在一列數(shù)據(jù)中出現(xiàn)的次數(shù)或總計(jì)數(shù)資料編制成的統(tǒng)計(jì)表。在心理與教育研究中,許多態(tài)度、興趣、偏好等測(cè)驗(yàn)或調(diào)查的結(jié)果,都能制作成這種簡(jiǎn)單次數(shù)分布表。分組次數(shù)分布表的概念
當(dāng)數(shù)據(jù)量很大時(shí),應(yīng)該把所有的數(shù)據(jù)先劃分為若干分組區(qū)間,然后將數(shù)據(jù)按其數(shù)值大小劃歸到相應(yīng)的組別內(nèi),分別統(tǒng)計(jì)各個(gè)組別中包括的數(shù)據(jù)個(gè)數(shù),再用列表形式呈現(xiàn)出來,就構(gòu)成了分組次數(shù)分布表。(1)求全距(R):(2)決定組數(shù)(K)與組距(i):決定組距的大小,需要以全距為參考。組數(shù)的多少要根據(jù)數(shù)據(jù)的多少來定。如果數(shù)據(jù)的總體分布為正態(tài),可用經(jīng)驗(yàn)公式:來計(jì)算組數(shù),然后由公式:來確定組距。(3)列出分組區(qū)間:列分組區(qū)間要注意以下幾點(diǎn):①最高組區(qū)間內(nèi)應(yīng)包含最大值的數(shù)據(jù),最低組區(qū)間應(yīng)能含最小值的數(shù)據(jù);②最高組或最低組的下限最好是組距的整數(shù)倍;③各分組區(qū)間一般在縱坐標(biāo)上按順序排列,數(shù)值大的分組區(qū)間排在上面,數(shù)值小的分組區(qū)間排在下面。(4)登記次數(shù):依次將數(shù)據(jù)登記到各個(gè)相應(yīng)的組別內(nèi),一般用劃線記數(shù)或?qū)懻值姆椒?。?)計(jì)算次數(shù):根據(jù)登記的結(jié)果計(jì)算各組的次數(shù),計(jì)算各組次數(shù)的總和即總次數(shù)。(6)抄錄新表:新表包括的欄目有:第一列為分組區(qū)間,第二列為各分組區(qū)間的組中值,第三列為次數(shù)。分組次數(shù)分布表的編制步驟
分組次數(shù)分布表的意義與缺點(diǎn)
分組次數(shù)分布表的意義編制分組次數(shù)分布表,可將一堆雜亂無序的數(shù)據(jù)排列成序。從表中可以發(fā)現(xiàn)各個(gè)數(shù)據(jù)的出現(xiàn)次數(shù)是多少,其分布的狀態(tài)如何。分組次數(shù)分布表的缺點(diǎn)分組次數(shù)分布表也有缺點(diǎn),僅從這張表看,原始數(shù)據(jù)不見了,只見到各分組區(qū)間及各組的次數(shù)。根據(jù)這樣的統(tǒng)計(jì)表提供的數(shù)據(jù)資料計(jì)算得到的平均值,會(huì)與用原始數(shù)據(jù)計(jì)算的值有一定的出入。將分組次數(shù)分布表中各組的實(shí)際次數(shù)轉(zhuǎn)化為相對(duì)次數(shù),即用頻數(shù)比率()或百分比()來表示次數(shù),就可制成相對(duì)次數(shù)分布表。相對(duì)次數(shù)分布表
累加次數(shù)分布表
在一般的分組次數(shù)分布表上,只標(biāo)出各分組區(qū)間的數(shù)據(jù)次數(shù)。如果想知道某個(gè)數(shù)值以下或以上的數(shù)據(jù)的數(shù)目,就要用累加次數(shù)。累加次數(shù)是把各組的次數(shù)由下而上,或由上而下累加在一起。最后一組的累加次數(shù)應(yīng)等于數(shù)據(jù)的總次數(shù)。用累加次數(shù)表示的次數(shù)分布表稱為累加次數(shù)分布表。累加次數(shù)分布表中,累加次數(shù)可用實(shí)際次數(shù),亦可用相對(duì)次數(shù)。累加次數(shù)的計(jì)算方法有兩種:①?gòu)姆植急淼男?shù)值端,逐區(qū)間的進(jìn)行次數(shù)累加,這種累加次數(shù)可回答次數(shù)分布表某一分組區(qū)間上限以下的次數(shù)是多少。②從分布表的大數(shù)端逐區(qū)間的次數(shù)累加,這種累加次數(shù)可回答某一分組區(qū)間下限以上的次數(shù)是多少。雙列次數(shù)分布表
雙列次數(shù)分布表是對(duì)有聯(lián)系的兩列變量用同一表表示其次數(shù)分布。
所謂有聯(lián)系的兩列變量,是指同一組被試中每個(gè)被試兩門學(xué)業(yè)成績(jī)分?jǐn)?shù),或兩種能力分?jǐn)?shù)或兩種心理特點(diǎn)的指標(biāo),或同一組被試在兩種實(shí)驗(yàn)條件下獲得的結(jié)果等。再如,各方面基本相同的兩個(gè)被試進(jìn)行同一測(cè)量所得的結(jié)果也是有聯(lián)系的。如果有多個(gè)這樣的被試,他們的測(cè)試數(shù)據(jù)也構(gòu)成有聯(lián)系的兩列變量。編制雙列次數(shù)分布表,首先按照分組次數(shù)分布表的編制方法,分別列出各變量的分組區(qū)間,將一列變量的分組區(qū)間豎列,將另一變量橫列。豎列的小數(shù)端在下,大數(shù)端在上,橫列的小數(shù)端在左而大數(shù)端在右。登記時(shí),每次同一對(duì)變量同時(shí)登記在相應(yīng)的格內(nèi)。不等距次數(shù)分布表
一般分組次數(shù)分布表都是等距的。但實(shí)際研究中常遇到不等距的情況,如工資級(jí)別,年齡分組等,若按等距分組不能確切地反映實(shí)際情況,這時(shí)可采用不等距分組的方法。這樣的不等距分組的分組次數(shù)分布表就叫做不等距次數(shù)分布表。直方圖
直方圖(等距直方圖)是以矩形的面積表示連續(xù)性隨機(jī)變量次數(shù)分布的圖形。直方圖一般用縱軸表示數(shù)據(jù)的次數(shù)(頻數(shù)),橫軸表示數(shù)據(jù)的等距分組點(diǎn)(即各分組區(qū)間的下限)。在制作直方圖時(shí),以組距為底邊,以分組區(qū)間的精確上下限為底邊二端點(diǎn),以次數(shù)為高畫矩形,各直條矩形之間不留空隙,沒有間隔(參見教材圖2—3)。也可以不畫矩形,只要使直方圖包圍的面積成封閉的圖形即可,這種圖又叫組織圖(參見教材圖2—4)。次數(shù)多邊形圖
次數(shù)多邊形圖是表示連續(xù)性隨機(jī)變量次數(shù)分布的線性圖。
繪制次數(shù)多邊形圖時(shí),橫坐標(biāo)是以各分組區(qū)間組中值表示的連續(xù)變量,縱坐標(biāo)是數(shù)據(jù)的頻數(shù)。以每個(gè)分組區(qū)間的組中值為橫坐標(biāo),以各組的次數(shù)為縱坐標(biāo)標(biāo)點(diǎn),連接各點(diǎn),就成為一條折線(參見教材圖2—5)。多邊形圖與直方圖雖然都是以面積表示表示連續(xù)性數(shù)據(jù)的次數(shù)分布,但次數(shù)多邊形對(duì)次數(shù)的輪廓顯示得更好,組與組之間的次數(shù)過渡是連續(xù)而直接的。如果樣本很大,能描繪出一條分布曲線,還可據(jù)此找到次數(shù)分布的經(jīng)驗(yàn)公式。這樣就能夠?qū)τ诳傮w的理論次數(shù)分布的分析提供很多有用的信息累加次數(shù)分布圖(1)累加直方圖
這種圖的橫坐標(biāo)同直方圖一樣,標(biāo)以分組區(qū)間,縱坐標(biāo)是累加次數(shù),其余步驟同繪制直方圖的要求一樣(參見教材圖2—7)。(2)累加曲線(又稱遞加線)
它的畫法同次數(shù)多邊形基本相同,不同點(diǎn)是橫坐標(biāo)為每分組區(qū)間的精確上限或下限,縱坐標(biāo)是各分組的累加次數(shù),分別標(biāo)出各個(gè)交點(diǎn),連接各交點(diǎn)即可畫成累加曲線。如果有累加直方圖,連接各組矩形的右頂點(diǎn)可畫累加曲線(參見教材圖2—8)。
其他常用的統(tǒng)計(jì)表的類型
(1)簡(jiǎn)單表
只列出名稱、地點(diǎn)時(shí)序或統(tǒng)計(jì)指標(biāo)名稱的統(tǒng)計(jì)表。(2)分組表(單向表)
只有一個(gè)分類標(biāo)志分組的統(tǒng)計(jì)表。(3)復(fù)合表
統(tǒng)計(jì)分組的標(biāo)志有兩個(gè)或兩個(gè)以上的表。其他常用的統(tǒng)計(jì)圖的類型(1)條形圖(直條圖)
條形圖主要用于表示離散型數(shù)據(jù)資料,它是以條形長(zhǎng)短表示各事物間數(shù)量的大小與數(shù)量之間的差異情況。(2)圓形圖
圓形圖主要用于描述間斷性資料,目的為顯示各部分在整體中所占的比重大小,以及各部分之間的比較。圓形圖顯示的資料多以相對(duì)數(shù)(如百分?jǐn)?shù))為主。(3)線形圖
線形圖更多地用于連續(xù)資料,凡欲表示兩個(gè)變量之間的函數(shù)關(guān)系,或描述某種現(xiàn)象在時(shí)間上的發(fā)展趨勢(shì),或一種現(xiàn)象隨另一種現(xiàn)象變化的情形,用線性圖表示是較好的方法。(4)散點(diǎn)圖
散點(diǎn)圖是用相同大小圓點(diǎn)的多少或疏密表示統(tǒng)計(jì)資料數(shù)量的大小,以及變化趨勢(shì)的圖。通常以圓點(diǎn)的分布的形態(tài)表示兩種現(xiàn)象間相關(guān)程度。
直方圖、條形圖、圓形圖、線性圖、散點(diǎn)圖等這些常用的統(tǒng)計(jì)圖,根據(jù)它們表現(xiàn)的作用和內(nèi)容,把它們可分為哪幾類?
思考題根據(jù)它們表現(xiàn)的作用和內(nèi)容,把它們可分為五類。第一種是表現(xiàn)分布的圖,比如直方圖。第二種是表現(xiàn)內(nèi)容的圖,如條形圖和圓形圖。第三種是表現(xiàn)變化的圖,這種圖形的代表是線性圖。第四種是表現(xiàn)比較的圖,這幾種圖形都能采用。第五種是表現(xiàn)相關(guān)的圖,如散點(diǎn)圖。答:第三章集中量數(shù)算術(shù)平均數(shù)中數(shù)眾數(shù)其它集中量數(shù)(加權(quán)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等)集中量數(shù)的概念集中量數(shù)就是對(duì)一組數(shù)據(jù)的集中趨勢(shì)特點(diǎn)進(jìn)行度量和描述的統(tǒng)計(jì)量。它反映了次數(shù)分布中大量數(shù)據(jù)向某方向集中的程度。
常用的集中量數(shù)有算術(shù)平均數(shù)、中數(shù)、眾數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等。
算術(shù)平均數(shù)是所有觀察值的總和除以總頻數(shù)所得之商。用表示。若以X1,X2,···,XN表示變量X的各個(gè)觀察值,N
表示觀察值的個(gè)數(shù),則算術(shù)平均數(shù)可表示為:
算術(shù)平均數(shù)的概念
(1)在一組數(shù)據(jù)中每個(gè)變量與平均數(shù)之差的總和等于0,即。(2)在一組數(shù)據(jù)中,每一個(gè)數(shù)都加上一常數(shù)C,則所得的平均數(shù)為原來的平均數(shù)加常數(shù)C,即。(3)在一組數(shù)據(jù)中,每一個(gè)數(shù)都乘以一常數(shù)C,則所得的平均數(shù)為原來的平均數(shù)乘以常數(shù)C,即。
算術(shù)平均數(shù)的特點(diǎn)(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計(jì)算法(2)數(shù)據(jù)分組后(次數(shù)分布表)計(jì)算法
(式中XC為各區(qū)間的組中值,f為各區(qū)間的次數(shù))
算術(shù)平均數(shù)的計(jì)算方法
算術(shù)平均數(shù)的優(yōu)缺點(diǎn)算術(shù)平均數(shù)具備一個(gè)良好的集中量數(shù)所應(yīng)具備的一些條件:
①反應(yīng)靈敏;②嚴(yán)密確定;③簡(jiǎn)明易懂;④計(jì)算簡(jiǎn)單;⑤適合代數(shù)運(yùn)算;⑥較少受抽樣變動(dòng)的影響。除此之外,算術(shù)平均數(shù)還有以下一些特殊的優(yōu)點(diǎn):
①只知一組觀察值的總和及總頻數(shù)就可以求出算術(shù)平均數(shù);②用加權(quán)法可以求出幾個(gè)平均數(shù)的總平均數(shù);③用樣本數(shù)據(jù)推斷總體集中量數(shù)時(shí),算術(shù)平均數(shù)最接近總體集中量數(shù)的真值,它是總體平均數(shù)的最好估計(jì)值;④在計(jì)算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進(jìn)行統(tǒng)計(jì)推斷時(shí),都要用到它。但是算術(shù)平均數(shù)也有一些缺點(diǎn):
①易受極端數(shù)據(jù)的影響;②若出現(xiàn)模糊不清的數(shù)據(jù)時(shí),無法計(jì)算平均數(shù)。算術(shù)平均數(shù)的意義、適用條件及應(yīng)用原則算術(shù)平均數(shù)的意義
算術(shù)平均數(shù)是應(yīng)用最普遍的集中量數(shù),它是“真值”漸近、最佳的估計(jì)值。算術(shù)平均數(shù)的適用的條件
一組數(shù)據(jù)是比較準(zhǔn)確,可靠又同質(zhì),而且需要每一個(gè)數(shù)據(jù)都加入計(jì)算,同時(shí)還要作進(jìn)一步代數(shù)運(yùn)算時(shí),這時(shí)就需要用算術(shù)平均數(shù)表示其集中趨勢(shì)。計(jì)算和應(yīng)用算術(shù)平均數(shù)的原則
①同質(zhì)性原則;②平均數(shù)與個(gè)體數(shù)值相結(jié)合的原則;③平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合的原則。
中數(shù)是按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),即在這組數(shù)據(jù)中,有一半的數(shù)據(jù)比它大,有一半的數(shù)據(jù)比它小。中數(shù)用Md表示。中數(shù)的概念
(1)一組數(shù)據(jù)中無重復(fù)數(shù)值的情況
指一組數(shù)據(jù)中沒有相同的數(shù),這時(shí)取處于序列中間位置的那個(gè)數(shù)為中數(shù)。如果數(shù)據(jù)個(gè)數(shù)為奇數(shù),則中數(shù)為位置的那個(gè)數(shù);如果數(shù)據(jù)個(gè)數(shù)為偶數(shù),則中數(shù)為居于中間位置兩個(gè)數(shù)的平均數(shù),即第與第位置的兩個(gè)數(shù)據(jù)的平均數(shù)。(2)一組數(shù)據(jù)中有重復(fù)數(shù)值的情況
指一組數(shù)據(jù)中有相同數(shù)值的數(shù)據(jù),這時(shí)計(jì)算中數(shù)的方法基本與無重復(fù)數(shù)值的單列數(shù)據(jù)相同。但根據(jù)重復(fù)數(shù)值數(shù)據(jù)在該組數(shù)據(jù)中所處的位置又細(xì)分為以下兩種情況:①當(dāng)重復(fù)數(shù)值沒有位于數(shù)列中間時(shí),求中數(shù)的方法與無重復(fù)數(shù)據(jù)時(shí)求中數(shù)的方法相同。②當(dāng)重復(fù)數(shù)目位于數(shù)列中間時(shí),需要假設(shè)位于中間的幾個(gè)重復(fù)數(shù)目為連續(xù)數(shù)目,取序列中上下各那一點(diǎn)上的數(shù)值為中數(shù)。未分組數(shù)據(jù)(原始數(shù)據(jù))求中數(shù)的方法
將原始數(shù)據(jù)整理成次數(shù)分布表后,求中數(shù)的原理同重復(fù)數(shù)目求中數(shù)是一樣的,也是取序列中將N平分為兩半的那一點(diǎn)的值作為中數(shù)。
或式中為中數(shù)所在分組區(qū)間的精確下限,為中數(shù)所在分組區(qū)間的精確上限,為該組以下各組的累加次數(shù),為該組以上各組的累加次數(shù),為該組的次數(shù)。數(shù)據(jù)分組后(次數(shù)分布表)求中數(shù)的方法中數(shù)的意義與應(yīng)用
中數(shù)的意義
中數(shù)雖然也具備一個(gè)良好集中量數(shù)所應(yīng)具備的一些條件,如計(jì)算簡(jiǎn)單,嚴(yán)密確定,簡(jiǎn)明易懂;但與算術(shù)平均數(shù)相比是相形見絀的,如反應(yīng)不夠靈敏,受抽樣的影響較大,不適合代數(shù)運(yùn)算等。因此,在一般情況下,中數(shù)不被普遍應(yīng)用,但在一些特殊情況下,它的應(yīng)用受到重視。中數(shù)適用的情況(1)當(dāng)一組觀測(cè)結(jié)果中出現(xiàn)兩極端數(shù)目時(shí);(2)當(dāng)次數(shù)分布的兩端數(shù)據(jù)或個(gè)別數(shù)據(jù)不清楚時(shí);(3)當(dāng)需要快速估計(jì)一組數(shù)據(jù)的代表值時(shí)。
一項(xiàng)研究調(diào)查了19名大學(xué)生,他們的月消費(fèi)(單位:人民幣元)如下:
220,227,230,231,232,232,235,236,
237,239,240,245,246,249,253,258,
260,510,600現(xiàn)欲了解他們的平均月消費(fèi)?思考題由于這19名大學(xué)生的月消費(fèi)中存在極端數(shù)據(jù),算術(shù)平均數(shù)(元)不能很好地反映他們的平均月消費(fèi)(19人中17人月消費(fèi)低于272.63元),應(yīng)求中數(shù):
(元)答:這些大學(xué)生的平均月消費(fèi)是239元。解:
眾數(shù)有理論眾數(shù)和粗略眾數(shù)兩種定義方法。理論眾數(shù)是指與次數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn)。粗略眾數(shù)是指一組數(shù)據(jù)(或次數(shù)分布)中次數(shù)出現(xiàn)最多的那個(gè)數(shù)的數(shù)值。眾數(shù)用表示。眾數(shù)的概念
(1)用觀察法直接尋找粗略眾數(shù)
在一組原始數(shù)據(jù)中,次數(shù)出現(xiàn)最多的那個(gè)數(shù)值就是眾數(shù);在次數(shù)分布表中,次數(shù)最多一組的組中值就是粗略眾數(shù)。(2)用經(jīng)驗(yàn)公式求理論眾數(shù)的近似值①皮爾遜經(jīng)驗(yàn)法(適合正態(tài)分布)②金氏插補(bǔ)法(適合偏態(tài)分布)
其中為含眾數(shù)這一區(qū)間的精確下限,為高于眾數(shù)所在組一個(gè)組距那一分組區(qū)間的次數(shù),為低于眾數(shù)所在組一個(gè)組距那一分組區(qū)間的次數(shù)。眾數(shù)的計(jì)算方法眾數(shù)的意義與應(yīng)用
眾數(shù)的意義
眾數(shù)雖然簡(jiǎn)明易懂,較少受兩極端數(shù)值的影響,但它并不具備一個(gè)良好集中量數(shù)的基本條件。如極不準(zhǔn)確、穩(wěn)定,反應(yīng)不靈敏,不適合代數(shù)運(yùn)算,受抽樣的影響較大等。因此,在一般情況下,眾數(shù)應(yīng)用也不廣泛,但在一些特殊情況下也常有應(yīng)用。
眾數(shù)適用的情況(1)當(dāng)需要快速而粗略地尋求一組數(shù)據(jù)的代表值時(shí);(2)當(dāng)一組數(shù)據(jù)出現(xiàn)不同質(zhì)的情況時(shí);(3)當(dāng)次數(shù)分布中有兩極端的數(shù)目時(shí);(4)當(dāng)粗略估計(jì)次數(shù)分布的形態(tài)時(shí)。
學(xué)校要召開運(yùn)動(dòng)會(huì),決定從高一年級(jí)8個(gè)班中抽調(diào)40名男生組成一個(gè)整齊的彩旗方陣隊(duì),如果從高一(1)班的體檢表中任意抽出10份男生表格,得到10個(gè)男同學(xué)的身高(單位:米)如下:
1.631.601.681.661.66
1.631.751.661.581.65請(qǐng)根據(jù)這10個(gè)身高值提供的信息確定參加方隊(duì)學(xué)生的最佳身高值應(yīng)取多少?并說明理由。思考題
參加方隊(duì)學(xué)生的最佳身高值應(yīng)取1.66。這是因?yàn)閺倪@10個(gè)身高值可以看出,1.66出現(xiàn)的次數(shù)最多,是這組數(shù)的眾數(shù),既然這10個(gè)男生中有3個(gè)身高為1.66米,而一個(gè)班遠(yuǎn)不止10個(gè)男生,那么8個(gè)班的男生中應(yīng)該能選出40名這種身高的人。答:(1)當(dāng)次數(shù)分布呈正態(tài)時(shí):(2)當(dāng)次數(shù)分布呈正偏態(tài)時(shí):且
(3)當(dāng)次數(shù)分布呈負(fù)偏態(tài)時(shí):且
算術(shù)平均數(shù)、中數(shù)、眾數(shù)之間的關(guān)系
加權(quán)平均數(shù)的概念
加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)(或平均數(shù))的平均數(shù),用表示。加權(quán)平均數(shù)的計(jì)算方法
式中為權(quán)數(shù)加權(quán)平均數(shù)的應(yīng)用
當(dāng)測(cè)量所得的數(shù)據(jù),其單位權(quán)重并不相等時(shí),要用加權(quán)平均數(shù)來求平均數(shù)。加權(quán)平均數(shù)
幾何平均數(shù)的概念
幾何平均數(shù)是N個(gè)數(shù)值連乘積的N次方根,用表示。幾何平均數(shù)的計(jì)算方法
幾何平均數(shù)的應(yīng)用
(1)直接應(yīng)用公式計(jì)算幾何平均數(shù)當(dāng)一組實(shí)驗(yàn)數(shù)據(jù)中有少數(shù)數(shù)據(jù)偏大或偏小,數(shù)據(jù)的分布呈偏態(tài)時(shí),要用幾何平均數(shù)作為集中趨勢(shì)的代表。(2)應(yīng)用幾何平均數(shù)的變式計(jì)算當(dāng)一組數(shù)據(jù)彼此間變異較大,幾乎是按一定的比例關(guān)系變化時(shí),要用幾何平均數(shù)計(jì)算平均比率。幾何平均數(shù)
調(diào)和平均數(shù)的概念
調(diào)和平均數(shù)(倒數(shù)平均數(shù))是一組數(shù)據(jù)倒數(shù)的算術(shù)平均數(shù)的倒數(shù),用表示。
調(diào)和平均數(shù)的計(jì)算方法
調(diào)和平均數(shù)的應(yīng)用
調(diào)和平均數(shù)在心理與教育研究方面的應(yīng)用,主要是用以描述學(xué)習(xí)速度方面的問題。調(diào)和平均數(shù)
第四章差異量數(shù)
全距與百分位差平均差、方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的應(yīng)用差異量數(shù)的選用
差異量數(shù)的概念差異量數(shù)就是對(duì)一組數(shù)據(jù)的變異性(離中趨勢(shì))特點(diǎn)進(jìn)行度量和描述的統(tǒng)計(jì)量。它反映了次數(shù)分布中數(shù)據(jù)彼此分散的程度。
常用的差異量數(shù)有全距、四分位差、百分位差、平均差、標(biāo)準(zhǔn)差與方差等等。
為什么要引入差異量數(shù)來描述一組數(shù)據(jù)的特征?
思考題在教育研究中,要全面描述數(shù)據(jù)的特征,不但要了解數(shù)據(jù)的典型情況,而且還要了解特殊情況。這些特殊性常表現(xiàn)為數(shù)據(jù)的變異性。因此,只有集中量數(shù)不可能真實(shí)地反映它們的分布情況。為了全面反映數(shù)據(jù)的總體情況,除了使用集中量數(shù)外,還需要引入差異量數(shù)。答:全距
全距的概念
全距是一組數(shù)據(jù)中最大值與最小值之差。全距用R表示。
全距的計(jì)算方法
原始數(shù)據(jù)的全距是最大值與最小值之差。次數(shù)分布表的全距一般是最大一組與最小一組的組中值之差,或者是最大一組上限與最小一組下限之差
全距的意義與應(yīng)用
全距概念清楚,意義明確,計(jì)算簡(jiǎn)單,但它僅由最大值與最小值而求得,易受兩極端數(shù)值影響。不考慮中間數(shù)值的差異,它反應(yīng)不靈敏,因此,它只是一種低效的差異量數(shù)。它的用處一般只用于研究的預(yù)備階段,用它檢查數(shù)據(jù)的大概散布范圍,以便確定如何進(jìn)行統(tǒng)計(jì)分組。
百分位數(shù)的概念
百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。百分位數(shù)一般用表示。
百分位數(shù)的計(jì)算方法
這里表示百分位數(shù)所在組的精確下限,表示小于的各組次數(shù)的和。
百分位數(shù)
百分等級(jí)的概念
百分等級(jí)是指表示某一分?jǐn)?shù)在整個(gè)分?jǐn)?shù)分布中所處的百分位置。百分等級(jí)用表示。
百分等級(jí)的計(jì)算方法
這里表示該分?jǐn)?shù)所在組的精確下限,表示小于的各組次數(shù)的和。
百分等級(jí)百分位差的概念和計(jì)算
百分位差是指兩個(gè)百分位數(shù)之差。常用的百分位距有兩種:一為第90與第10百分位數(shù)之差,用表示。一為第93與第7百分位數(shù)之差,用表示。百分位差的意義與應(yīng)用
百分位差與全距相比,雖然少受兩極端數(shù)值的影響,但仍然不能很好地反映中間數(shù)據(jù)的散布情況,因此只作為主要差異量的補(bǔ)助量數(shù),在實(shí)踐中很少使用。百分位差
四分位差的概念
四分位差是指在一個(gè)次數(shù)分布中,中間50%的次數(shù)的全距的一半。四分位差用Q表示。
四分位差的計(jì)算方法(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計(jì)算法
其中(第25百分位數(shù))與(第75百分位數(shù))求法可參照原始數(shù)據(jù)中位數(shù)的計(jì)算方法。(2)數(shù)據(jù)分組后(次數(shù)分布表)計(jì)算法
其中這里表示百分位數(shù)所在組的精確下限,表示小于的各組次數(shù)的和,表示百分位數(shù)所在組的次數(shù);四分位差(一)
四分位差(二)四分位差的意義
四分位差簡(jiǎn)明易懂,計(jì)算簡(jiǎn)便,較少受兩極端數(shù)值的影響,比全距可靠得多。但它忽略了左右共50%數(shù)據(jù)的差異,又不適合代數(shù)運(yùn)算,反應(yīng)不夠靈敏,因而也限制了它的應(yīng)用,它通常與中數(shù)聯(lián)系起來共同應(yīng)用。
四分位差適用的情況
有特大或特小兩極端數(shù)值,有個(gè)別數(shù)值不確切、不清楚,以及用等級(jí)表示的數(shù)據(jù)等情況。
動(dòng)差是指力與力點(diǎn)與原點(diǎn)之間距離的乘積。統(tǒng)計(jì)學(xué)用此概念表示次數(shù)分布的離散情況。它把各組次數(shù)當(dāng)做力學(xué)上的力,用數(shù)值(或組中值)與原點(diǎn)之差作為距離來計(jì)算動(dòng)差,并且把以平均數(shù)為原點(diǎn)的動(dòng)差叫做中心動(dòng)差。常見的中心動(dòng)差有:一級(jí)動(dòng)差二級(jí)動(dòng)差(是表示一個(gè)分布中離中趨勢(shì)的指標(biāo))
三級(jí)動(dòng)差(是表示一個(gè)分布中偏斜度或偏態(tài)性的指標(biāo))四級(jí)動(dòng)差
(是表示一個(gè)分布中峰態(tài)性的指標(biāo))動(dòng)差體系
平均差的概念
平均差是指次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對(duì)離差的平均值。平均差用A.D.表示。平均差的計(jì)算方法(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計(jì)算法
(2)數(shù)據(jù)分組后(次數(shù)分布表)計(jì)算法
平均差意義
平均差意義明確,計(jì)算容易,反應(yīng)靈敏,較好地代表了數(shù)據(jù)分布的離散程度。但它計(jì)算要用絕對(duì)值,不利于進(jìn)一步做統(tǒng)計(jì)分析,應(yīng)用受到了限制,屬于一種低效差異量數(shù)。平均差方差是指離均差(即每個(gè)數(shù)據(jù)與該組平均數(shù)之差)平方的算術(shù)平均數(shù)。用表示。標(biāo)準(zhǔn)差是指方差的算術(shù)平方根,用表示。方差與標(biāo)準(zhǔn)差的概念(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計(jì)算法基本公式:變式公式:
(2)數(shù)據(jù)分組后(次數(shù)分布表)計(jì)算法基本公式:變式公式:
或式中(AM為估計(jì)平均數(shù))方差與標(biāo)準(zhǔn)差的計(jì)算方法由于方差、標(biāo)準(zhǔn)具有可加性,在已知幾個(gè)小組的方差或標(biāo)準(zhǔn)差的情況下,可以計(jì)算出幾個(gè)小組聯(lián)合在一起的總的方差或標(biāo)準(zhǔn)差。計(jì)算總方差和總標(biāo)準(zhǔn)差的公式如下:
式中,為總平均數(shù),為各小組的平均數(shù)總標(biāo)準(zhǔn)差的的合成方差與標(biāo)準(zhǔn)差的性質(zhì)(1)每一個(gè)觀察值都加一個(gè)相同常數(shù)C之后,計(jì)算得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差。即如果,則有。(2)每一個(gè)觀察值都乘以一個(gè)相同常數(shù)C,則所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)。即若,則有。(3)每一個(gè)觀察值都乘以一個(gè)相同常數(shù)C(),再加一個(gè)常數(shù)d,所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)。即若(),則有。方差與標(biāo)準(zhǔn)差的意義
方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好的指標(biāo)。它們是描述統(tǒng)計(jì)與統(tǒng)計(jì)推斷分析中最常用的差異量數(shù)。標(biāo)準(zhǔn)差基本具備一個(gè)良好的差異量數(shù)應(yīng)具備的條件:①反應(yīng)靈敏;②嚴(yán)密確定;③容易計(jì)算;④適合代數(shù)運(yùn)算;⑤受抽樣變動(dòng)的影響??;⑥簡(jiǎn)單明了。標(biāo)準(zhǔn)差與其他各種差異量數(shù)相比,具有數(shù)學(xué)上的優(yōu)越性,特別是當(dāng)已知一組數(shù)據(jù)的平均數(shù)與標(biāo)準(zhǔn)差后,就可以知道落在平均數(shù)上下各一個(gè)標(biāo)準(zhǔn)差、兩個(gè)標(biāo)準(zhǔn)差,或三個(gè)標(biāo)準(zhǔn)差范圍之內(nèi)的數(shù)據(jù)所占的百分比。方差與標(biāo)準(zhǔn)差的性質(zhì)和意義思考題
為什么說標(biāo)準(zhǔn)差是重要而完善的差異量?
(1)標(biāo)準(zhǔn)差具有簡(jiǎn)單明了,反映靈敏,嚴(yán)密確定,容易計(jì)算,適合代數(shù)運(yùn)算,受抽樣變動(dòng)的影響較少等優(yōu)點(diǎn)。(2)標(biāo)準(zhǔn)差在避免兩極端數(shù)值影響方面大大超過全距、百分位差和四分位差;在避免絕對(duì)值方面,優(yōu)于平均差;在考慮單位方面,優(yōu)于方差。答差異系數(shù)的概念
差異系數(shù)是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比,用CV表示。其計(jì)算公式如下:差異系數(shù)的應(yīng)用(1)同一團(tuán)體不同觀測(cè)值離散程度的比較(即不同單位資料差異程度的比較);(2)對(duì)于水平相差較大,但進(jìn)行的是一種觀測(cè)的各種團(tuán)體,進(jìn)行觀測(cè)值離散程度的比較(即單位相同而平均數(shù)相差較大的兩組資料差異程度的比較)。在應(yīng)用差異系數(shù)比較相對(duì)差異大小時(shí),應(yīng)注意以下幾點(diǎn):
①測(cè)量的數(shù)據(jù)要保證具有等距尺度;
②觀測(cè)工具應(yīng)具備絕對(duì)零;
③差異系數(shù)只能用于一般的相對(duì)差異量的描述,至今尚無有效的假設(shè)檢驗(yàn)方法。差異系數(shù)
標(biāo)準(zhǔn)分?jǐn)?shù)的概念
標(biāo)準(zhǔn)分?jǐn)?shù)是以標(biāo)準(zhǔn)差為單位表示一個(gè)分?jǐn)?shù)在團(tuán)體中所處位置的相對(duì)位置量數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算方法標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)(1)Z分?jǐn)?shù)無實(shí)際單位,是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的一個(gè)相對(duì)量。(2)一組原始分?jǐn)?shù)轉(zhuǎn)換得到的Z分?jǐn)?shù)可以是正值,也可以是負(fù)值。(3)一組原始分?jǐn)?shù)中,各個(gè)Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1,即。(4)若原始分?jǐn)?shù)呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分?jǐn)?shù)值的均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn)(1)可比性;(2)可加性;(3)明確性;(4)穩(wěn)定性。標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用(1)用于比較分屬性質(zhì)不同的觀測(cè)值在各自數(shù)據(jù)分布中相對(duì)位置的高低;(2)計(jì)算不同質(zhì)的觀測(cè)值的總和或平均值,以表示在團(tuán)體中的相對(duì)位置;
(3)表示標(biāo)準(zhǔn)測(cè)驗(yàn)分?jǐn)?shù)。
標(biāo)準(zhǔn)分?jǐn)?shù)(Z分?jǐn)?shù))
假定甲、乙兩生高考入學(xué)考試成績(jī)?nèi)缦卤硭?,試問根?jù)考試成績(jī)應(yīng)該優(yōu)先錄取哪名考生?思考題考試科目全體考生原始分?jǐn)?shù)平均分?jǐn)?shù)()標(biāo)準(zhǔn)差()甲乙語文政治外語數(shù)學(xué)理化706569507510586885706853728962724087
甲乙兩生高考入學(xué)考試成績(jī)的原始分?jǐn)?shù)與標(biāo)準(zhǔn)分?jǐn)?shù)就原始分?jǐn)?shù)而言,應(yīng)該優(yōu)先錄取乙生(甲生總成績(jī)(348)低于乙生總績(jī)(350)),這一結(jié)論是不科學(xué)的。因?yàn)閱挝徊煌?,不能比較,也不能合并。但把原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)后,就可以合并成總成績(jī)進(jìn)行比較。就標(biāo)準(zhǔn)分?jǐn)?shù)而言,應(yīng)該優(yōu)先錄取甲生(甲生的總成績(jī)(2.5)高于乙生的總成績(jī)(1.505))。解考試科目全體考生原始分?jǐn)?shù)甲乙標(biāo)準(zhǔn)分?jǐn)?shù)甲乙語文政治外語數(shù)學(xué)理化7010655698506758858970626872534072
87
1.5
1.91-0.6-0.125
0.3750.5-1.67-0.375
1.53483502.51.505異常值的取舍(1)數(shù)據(jù)較多的情況在整理數(shù)據(jù)時(shí),常采用三個(gè)標(biāo)準(zhǔn)差法則,取舍數(shù)據(jù),即如果有一個(gè)數(shù)據(jù)的取值落在平均數(shù)加減三個(gè)標(biāo)準(zhǔn)差之外,則在整理數(shù)據(jù)時(shí),可將此數(shù)據(jù)作為異常值加以舍棄。(2)數(shù)據(jù)較少的情況在整理數(shù)據(jù)時(shí),可根據(jù)下表所列的標(biāo)準(zhǔn)差數(shù)的一半(全距與標(biāo)準(zhǔn)差比率一半)乘以標(biāo)準(zhǔn)差,然后再求與平均數(shù)的和、差,并以此二值為界取舍數(shù)據(jù)。
表
全距與標(biāo)準(zhǔn)差的比率隨N變化表
N
510
152040501002004005007001000全距/s2.33.1
3.5
3.74.34.55.05.5
5.96.16.36.5優(yōu)良差異量數(shù)具備的標(biāo)準(zhǔn)
鑒定一個(gè)差異量數(shù),是不是一個(gè)良好的統(tǒng)計(jì)指標(biāo),主要看是否具備以下標(biāo)準(zhǔn):(1)應(yīng)該是根據(jù)客觀數(shù)據(jù)資料獲得的,而不是人為的主觀估計(jì)決定的;(2)應(yīng)該是根據(jù)全部觀測(cè)值計(jì)算得出來的,而不是個(gè)別數(shù)據(jù)計(jì)算的結(jié)果,否則就不能代表全部數(shù)據(jù)的分布特征;(3)應(yīng)當(dāng)簡(jiǎn)明,容易理解,不應(yīng)過于帶有數(shù)學(xué)抽象性質(zhì);(4)計(jì)算應(yīng)該方便、容易、迅速;(5)應(yīng)該最少受到抽樣變動(dòng)的影響(樣本的穩(wěn)定性),在反復(fù)取樣的過程中具有相對(duì)恒常性;(6)應(yīng)該能夠采用代數(shù)方法計(jì)算。各種差異量數(shù)優(yōu)缺點(diǎn)比較
標(biāo)準(zhǔn)差計(jì)算最嚴(yán)密,它根據(jù)全部數(shù)據(jù)求得,考慮到每一個(gè)樣本數(shù)據(jù),測(cè)量具有代表性,適合代數(shù)法處理,受抽樣變動(dòng)的影響較小,反應(yīng)靈敏。缺點(diǎn)是較難理解,運(yùn)算較繁瑣,易受極端值的影響。方差的描述作用不大,但由于它具有可加性,是對(duì)一組數(shù)據(jù)中造成各種變異的總和的測(cè)量,通常采用方差的可加性分解并確定屬于不同來源的變異性,并進(jìn)一步說明各種變異對(duì)總結(jié)果的影響。因此,方差是推論統(tǒng)計(jì)中最常用的統(tǒng)計(jì)量數(shù)。全距計(jì)算簡(jiǎn)便,容易理解,適合所有類型的數(shù)據(jù),概念清楚,意義明確,,但它易受極值影響,測(cè)量也太粗造,只能反映分布兩極端值的差值。不能顯示全部數(shù)據(jù)的差異情況,僅作為輔助量數(shù)使用。平均差容易理解,容易計(jì)算,能說明分布中全部數(shù)值的差異情況,缺點(diǎn)是會(huì)受兩極數(shù)值的影響,但當(dāng)數(shù)據(jù)較多時(shí),這種影響較小,因有絕對(duì)值也不適合代數(shù)方法處理。百分位差意義明確,易計(jì)算,不易受兩極值影響,但不能反映出分布的中間數(shù)值的差異情況,也僅用作補(bǔ)助量數(shù)。四分位差意義明確,計(jì)算方便容易,對(duì)極端值不敏感,較不受極端值影響。當(dāng)組距不確定,其他差異量數(shù)都無法計(jì)算時(shí),可以計(jì)算四分位差。但四分位差無法反映分布中所有數(shù)據(jù)的離散程度,不適合使用代數(shù)方法處理,受抽樣變動(dòng)影響較標(biāo)準(zhǔn)差大。通過比較,可以發(fā)現(xiàn)標(biāo)準(zhǔn)差、方差價(jià)值較大,它們的應(yīng)用也比較廣泛,因此,一般稱標(biāo)準(zhǔn)差、方差為高效差異量。相比較,其化差異量數(shù)缺點(diǎn)比較明顯,應(yīng)用也受到限制,故他們?yōu)榈托Р町惲繑?shù)。
當(dāng)次數(shù)分布的N值相當(dāng)大,分布形式呈正態(tài)分布時(shí),各種差異量數(shù)之間存在著固定的數(shù)量關(guān)系:各種差異量數(shù)之間的關(guān)系
如何選用差異量數(shù)
在選用差異量數(shù)時(shí),可以考慮下面這些因素:(1)當(dāng)樣本是隨機(jī)取樣時(shí),S、Q、R,這幾個(gè)差異量數(shù)的可靠性依次降低;(2)當(dāng)要求計(jì)算要容易、快捷時(shí),R、Q、S
依次變得繁雜;(3)當(dāng)要求統(tǒng)計(jì)量進(jìn)一步使用時(shí),S遠(yuǎn)遠(yuǎn)勝過其他差異量數(shù);(4)在偏態(tài)分布中,Q比S更常用;(5)當(dāng)分布是截尾分布時(shí),只有Q能正確地指出分布的變異性。除此之外,還有一點(diǎn)非常重要,就是在選擇差異量數(shù)時(shí),同時(shí)應(yīng)考慮選用合適的集中量數(shù)。第五章相關(guān)系數(shù)
相關(guān)、相關(guān)系數(shù)與散點(diǎn)圖積差相關(guān)等級(jí)相關(guān)質(zhì)與量相關(guān)品質(zhì)相關(guān)相關(guān)系數(shù)的選用與解釋
什么是相關(guān)
事物之間的相互關(guān)系(1)因果關(guān)系:一種現(xiàn)象是另一種現(xiàn)象的原因,而另一種現(xiàn)象是結(jié)果。(2)共變關(guān)系:表面上看來有聯(lián)系的兩種事物都與第三種現(xiàn)象有關(guān)。這時(shí)兩種事物之間的關(guān)系,便是共變關(guān)系。(3)相關(guān)關(guān)系:兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一定的關(guān)系,但不是前面兩種關(guān)系。不能確定這兩類現(xiàn)象之間哪個(gè)是因,哪個(gè)是果;也有理有認(rèn)為這兩者并不同時(shí)受第三因素的影響,即不存在共變關(guān)系。具有相關(guān)關(guān)系的兩種現(xiàn)象之間的關(guān)系是比較復(fù)雜的,甚至可能包含有暫時(shí)的嘗未認(rèn)識(shí)的因果關(guān)系以及共變關(guān)系在內(nèi)。相關(guān)的類別統(tǒng)計(jì)學(xué)中所講的相關(guān)是指具有相關(guān)關(guān)系的不同現(xiàn)象之間的關(guān)系程度。從變化的方向來看,相關(guān)的情況有以下三種:①正相關(guān):兩列變量的變化方向相同。②負(fù)相關(guān):兩列變量的變化方向相反。③零相關(guān):兩列變量的變化方向無一定規(guī)律。相關(guān)系數(shù)
相關(guān)系數(shù)是兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式,或者說是用來表示相關(guān)關(guān)系強(qiáng)度的指標(biāo)。作為樣本間相互關(guān)系程度的統(tǒng)計(jì)特征數(shù),常用r表示,作為總體參數(shù),一般用ρ表示,并且是指線性相關(guān)而言。相關(guān)系數(shù)的取值介于-1.00至+1.00之間,常用小數(shù)形式表示。它只是一個(gè)比率,不代表相關(guān)的百分?jǐn)?shù),更不是相關(guān)量的相等單位的度量。
如何理解相關(guān)系數(shù)?思考題
相關(guān)系數(shù)是兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式。對(duì)于這一概念,我們可以從以下幾個(gè)方面來理解:(1)相關(guān)系數(shù)的取值在-1.00和+1.00之間;(2)相關(guān)系數(shù)的絕對(duì)值表示兩個(gè)變量之間的相關(guān)強(qiáng)度,絕對(duì)值越接近1表示相關(guān)越強(qiáng),越接近0表示相關(guān)越弱;(3)相關(guān)系數(shù)的正負(fù)號(hào)表示相關(guān)的方向,相關(guān)系數(shù)為正的表示正相關(guān),相關(guān)系數(shù)為負(fù)的表示負(fù)相關(guān);(4)相關(guān)系數(shù)可以比較大小,但不能進(jìn)行加減乘除運(yùn)算。答:
在直角坐標(biāo)系中,以X、Y二列變量中的一列變量(如X變量)為橫坐標(biāo),以另一列變量(如Y變量)為縱坐標(biāo),把每對(duì)數(shù)據(jù)Xi、Yi當(dāng)做同一個(gè)平面上的個(gè)點(diǎn)(Xi、Yi),一一描繪在XOY坐標(biāo)系中,產(chǎn)生的圖形就稱為散點(diǎn)圖。
散點(diǎn)圖通過點(diǎn)的散布形狀和疏密程度來顯示兩個(gè)變量的相關(guān)趨勢(shì)和相關(guān)程度,能夠?qū)υ紨?shù)據(jù)間的關(guān)系做出直觀而有效的預(yù)測(cè)和解釋。不同形狀的散點(diǎn)圖顯示了兩個(gè)變量間不同程度的相關(guān)關(guān)系。如果所有散點(diǎn)分布呈橢圓狀,則說明二變量之間呈線性關(guān)系。在橢圓狀散點(diǎn)圖中,如果橢圓長(zhǎng)軸的傾斜方向左低右高(以軸為基準(zhǔn)),則為正相關(guān),左高右低則為負(fù)相關(guān);如果散點(diǎn)圖呈現(xiàn)圓形,就為零相關(guān)或弱相關(guān)。散點(diǎn)圖
積差相關(guān)的概念當(dāng)兩列變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩列變量之間的相關(guān)稱為積差相關(guān)。
積差相關(guān)的適用資料(1)要求成對(duì)的數(shù)據(jù),即若干個(gè)體中每個(gè)個(gè)體都有兩種不同的觀測(cè)值。(2)計(jì)算相關(guān)的成對(duì)的數(shù)據(jù)的數(shù)目不宜少于30對(duì)。(3)兩列變量各自總體的分布都是正態(tài)分布,至少兩個(gè)變量服從的分布是接近正態(tài)的單峰分布。(4)兩個(gè)相關(guān)的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測(cè)量數(shù)據(jù)。(5)兩列變量之間的關(guān)系應(yīng)是直線性的積差相關(guān)(一)
積差相關(guān)的計(jì)算方法(1)基本公式①運(yùn)用標(biāo)準(zhǔn)差與離均差的計(jì)算公式(,)②運(yùn)用標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算相關(guān)系數(shù)的公式
③原始觀測(cè)值計(jì)算公式
(2)差法公式①
減差法
②加差法
積差相關(guān)(二)
積差相關(guān)的計(jì)算方法(3)相關(guān)表法
式中
相關(guān)系數(shù)的合并
相關(guān)系數(shù)的合并需要將其轉(zhuǎn)換成等距的尺度后再求平均,方有意義。求平均的相關(guān)系數(shù),一般采用Z-r轉(zhuǎn)換法。具體步驟如下:(1)查附表8,先將各樣本的r轉(zhuǎn)換成費(fèi)舍Z分?jǐn)?shù);(2)求每一樣本的Z分?jǐn)?shù)之和;(3)求平均Z分?jǐn)?shù),即();(4)再查附表8,將轉(zhuǎn)換成。積差相關(guān)(三)
斯皮爾曼等級(jí)相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量值以等級(jí)次序排列或以等級(jí)次序表示時(shí),兩個(gè)相應(yīng)總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩個(gè)變量之間的相關(guān)稱為等級(jí)相關(guān)。它適用于只有兩列變量,而且是屬于等級(jí)變量性質(zhì),具有線性關(guān)系的資料,主要用于解決稱名數(shù)據(jù)和順序數(shù)據(jù)的問題。
斯皮爾曼等級(jí)相關(guān)的計(jì)算方法(1)等級(jí)差數(shù)法(N<30)
(式中N為等級(jí)個(gè)數(shù),D指二列成對(duì)變量的等級(jí)差數(shù))(2)等級(jí)序數(shù)法
(式中RX與RY為兩列變量各自排列的等級(jí)序數(shù))(3)有相同等級(jí)時(shí)計(jì)算等級(jí)相關(guān)的方法
式中
斯皮爾曼等級(jí)相關(guān)
肯德爾W系數(shù)的概念與適用資料
當(dāng)多個(gè)(兩個(gè)以上)變量值以等級(jí)次序排列或以等級(jí)次序表示,描述這幾個(gè)變量之間的一致性程度(即相關(guān))的量,稱為肯德爾W系數(shù)。它適用于兩列以上的等級(jí)變量??系聽朩系數(shù)的計(jì)算方法
計(jì)算肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級(jí)評(píng)定的方法,即讓K個(gè)被試(或稱評(píng)價(jià)者)對(duì)N件事物或N件作品進(jìn)行等級(jí)評(píng)定,每個(gè)評(píng)價(jià)者都能對(duì)N件事物(或作品)好壞、優(yōu)劣、喜好、大小、高低等排出一個(gè)等級(jí)順序。因此,最小的等級(jí)序數(shù)為1,最大的為N,這樣,K個(gè)評(píng)價(jià)者便可得到K列從1至N的等級(jí)變量資料,這是一種情況。另一種情況是一個(gè)評(píng)價(jià)者先后K次評(píng)價(jià)N件事物或N件作品,也是采用等級(jí)評(píng)定的方法,這樣也可得到K列從1至N的等級(jí)變量資料。這類K列等級(jí)變量資料綜合起來求相關(guān),可用肯德爾W系數(shù)。①基本公式
式中,Ri
代表評(píng)價(jià)對(duì)象獲得的K個(gè)等級(jí)之和,N代表被等級(jí)評(píng)定的對(duì)象的數(shù)目,K代表等級(jí)評(píng)價(jià)者的數(shù)目。②有相同等級(jí)出現(xiàn)時(shí)計(jì)算公式
(修正公式)
式中,,n為相同等級(jí)的數(shù)目。
肯德爾W系數(shù)(肯德爾和諧系數(shù))
肯德爾U系數(shù)的概念與適用資料
當(dāng)多個(gè)(兩個(gè)以上)變量值以等級(jí)次序排列或以等級(jí)次序表示,描述這幾個(gè)變量之間的一致性程度(即相關(guān))的量,稱為肯德爾U系數(shù)。它適用于對(duì)K個(gè)評(píng)價(jià)者的一致性進(jìn)行統(tǒng)計(jì)分析。它與肯德爾W系數(shù)所處理的問題相同,但所處理的資料的獲得方法不同,計(jì)算的結(jié)果也不一樣??系聽朥系數(shù)的計(jì)算方法
如果有N件事件,由K個(gè)評(píng)價(jià)者對(duì)其優(yōu)劣、大小、高低等單一維度的屬性進(jìn)行評(píng)價(jià),若評(píng)價(jià)者直接使用等級(jí)評(píng)定的方法,則應(yīng)采用前述肯德爾W系數(shù)分析K個(gè)評(píng)價(jià)者是否具有一致性;若評(píng)價(jià)者采用對(duì)偶比較的方法,即將N件事物兩兩配對(duì),可配成對(duì),然后對(duì)每一對(duì)中兩事物進(jìn)行比較,擇優(yōu)選擇,優(yōu)者記1,非優(yōu)者記0,最后整理所有評(píng)價(jià)者的評(píng)價(jià)結(jié)果,這樣便應(yīng)計(jì)算肯德爾U系數(shù)了。
式中N為被評(píng)價(jià)事物的數(shù)目,即等級(jí)數(shù);K為評(píng)價(jià)者的數(shù)目;rij為對(duì)偶比較記錄表中i>j(或i<j)格中的擇優(yōu)分?jǐn)?shù)。肯德爾U系數(shù)(一致性系數(shù))(1)點(diǎn)二列相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量其中一個(gè)是正態(tài)連續(xù)性變量,另一個(gè)是真正的二分變量,這時(shí)表示這兩個(gè)變量之間的相關(guān)稱為點(diǎn)二列相關(guān)。點(diǎn)二列相關(guān)適用的資料是兩列變量中有一列為等距或等比的測(cè)量數(shù)據(jù)而且其總體分布為正態(tài),另一列變量是二分稱名的變量數(shù)據(jù)。(2)點(diǎn)二列相關(guān)的計(jì)算方法點(diǎn)二列相關(guān)
(1)二列相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量都是正態(tài)連續(xù)性變量,其中一個(gè)變量被人為地劃分成二分變量,這時(shí)表示這兩個(gè)變量之間的相關(guān)稱為二列相關(guān)。二列相關(guān)適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,其中一列變量為等距或等比的測(cè)量數(shù)據(jù),另一列變量為人為劃分的二分變量數(shù)據(jù)。(2)二列相關(guān)的計(jì)算方法二列相關(guān)
(1)多系列相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量都是正態(tài)連續(xù)性變量,其中一個(gè)變量按不同質(zhì)被人為地分成多種類別(兩類以上)的正態(tài)名義變量,這時(shí)表示這兩個(gè)變量之間的相關(guān)稱為多系列相關(guān)。多系列相關(guān)適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,其中一列為等距或等比的測(cè)量數(shù)據(jù),另一列被人為地分成多種類別的名義變量數(shù)據(jù)。(2)多系列相關(guān)的計(jì)算方法
多系列相關(guān)
(1)四分相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量都是正態(tài)連續(xù)性變量,且兩者呈直線關(guān)系,但兩者都被人為地劃分成二分變量,表示這兩個(gè)變量之間的相關(guān),稱為四分相關(guān)。四分相關(guān)適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,且每一個(gè)變量都被人為地分成兩種類型的等距或等比的測(cè)量數(shù)據(jù)。(2)四分相關(guān)的計(jì)算方法四分相關(guān)(1)φ相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量都是真正二分變量,表示這兩個(gè)變量之間的相關(guān),稱為相關(guān)。
φ相關(guān)適用的資料是除四分相關(guān)之外的四格表資料。(2)φ相關(guān)的計(jì)算方法①基本公式
②其它公式φ相關(guān)(φ系數(shù))
(1)列聯(lián)表相關(guān)的概念與適用資料
當(dāng)兩個(gè)變量均被分成兩個(gè)以上類別,或其中一個(gè)變量被分成兩個(gè)以上類別,表示這兩個(gè)變量之間的相關(guān),稱為列聯(lián)相關(guān)。列聯(lián)表相關(guān)適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,且至少有一個(gè)變量都被分成兩種以上類型的等距或等比的測(cè)量數(shù)據(jù)。(2)列聯(lián)表相關(guān)的計(jì)算方法①基本公式②其它公式列聯(lián)表相關(guān)
如何選擇合適的相關(guān)系數(shù)選擇計(jì)算相關(guān)系數(shù)的方法主要取決于要處理的數(shù)據(jù)的性質(zhì)類別以及某一相關(guān)系數(shù)需要滿足的假設(shè)條件。具體來說,為了選擇一個(gè)合適的相關(guān)系數(shù)進(jìn)行相關(guān)分析,要分以下幾個(gè)步驟考慮:(1)考慮每種測(cè)量所產(chǎn)生的數(shù)據(jù)屬于什么類別,測(cè)查被試的哪種心理屬性,是分類,還是排序,還是評(píng)定等級(jí)?是否給出確定的分?jǐn)?shù)?(2)要對(duì)第一種測(cè)量數(shù)據(jù)和第二種測(cè)量數(shù)據(jù)的類別做出判斷。是二分?jǐn)?shù)據(jù)、等級(jí)數(shù)據(jù),還是等距數(shù)據(jù)?(3)確定采用哪一種相關(guān)系數(shù)。相關(guān)系數(shù)解釋相關(guān)關(guān)系是一個(gè)指標(biāo)值,它表示兩個(gè)變量之間的關(guān)系程度。相關(guān)系數(shù)不是等距的測(cè)量值,因此在比較相關(guān)程度時(shí),不能用倍數(shù)關(guān)系說明,只能說絕對(duì)值大者比絕對(duì)值小者關(guān)系更密切一些。相關(guān)系數(shù)的大小表明了兩列測(cè)量數(shù)據(jù)相互間的相關(guān)程度。當(dāng)然,當(dāng)兩個(gè)變量之間的關(guān)系受到其它變量的影響時(shí),兩者之間的高強(qiáng)度相關(guān)很可能是一種假象。如果研究表明某一變量確實(shí)對(duì)欲探討的兩個(gè)變量之間存在影響,則可以用協(xié)變量分析方法設(shè)法排除或控制那些變量的影響效應(yīng),找出要研究的變量之間真正的相關(guān)關(guān)系。如果兩變量是線性關(guān)系,則可以用偏相關(guān)和部分相關(guān)進(jìn)行控制,表示這兩個(gè)變量間純凈的相關(guān)度。在純理論研究中,即使是很小的相關(guān),如果在統(tǒng)計(jì)上有顯著性,也能說明心理規(guī)律。另外,需要特別注意這樣一個(gè)事實(shí):證實(shí)兩個(gè)變量之間存在相關(guān)關(guān)系,并不一定說明一個(gè)變量的變化會(huì)引起另一個(gè)變量發(fā)生變化。相關(guān)系數(shù)的特殊用途
相關(guān)系數(shù)在教育科學(xué)與心理科學(xué)研究中,特別是教育與心理測(cè)量、評(píng)價(jià)中,有著重要的特殊用途。它可以用于確定測(cè)驗(yàn)的信度系數(shù)和效度系數(shù),用于對(duì)測(cè)驗(yàn)的項(xiàng)目區(qū)分度進(jìn)行分析。同時(shí),相關(guān)系數(shù)值的大小,因?yàn)椴煌愋偷臏y(cè)驗(yàn),它所表示的價(jià)值和意義也有所不同。第六章概率分布
概率的基本概念正態(tài)分布二項(xiàng)分布樣本分布(1)后驗(yàn)概率(統(tǒng)計(jì)概率)的定義
其中是隨機(jī)事件出現(xiàn)的頻率(2)先驗(yàn)概率(古典概率
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 股東合作協(xié)議及條款詳解
- 2025年長(zhǎng)沙貨車從業(yè)資格證模擬考試
- 3D打印技術(shù)與設(shè)備應(yīng)用指南
- 2025年深圳道路運(yùn)輸從業(yè)資格證考哪些項(xiàng)目
- 個(gè)人挖機(jī)機(jī)械租賃合同5篇
- 安全性評(píng)價(jià)技術(shù)服務(wù)合同
- 2025年寧夏道路貨運(yùn)駕駛員從業(yè)資格證考試題庫(kù)完整
- 建筑工程木工合同
- 辦公信息化解決方案報(bào)告
- 交通意外事故賠償協(xié)議書
- 三年級(jí)語文 溪居即事市賽一等獎(jiǎng)
- 2024年山東化工職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫(kù)含答案解析
- 《新病歷書寫規(guī)范》課件
- 2024年中小學(xué)生守則修訂版
- 博覽會(huì)展位裝修及布展投標(biāo)方案技術(shù)標(biāo)
- 顧客提問的問題100條
- 肝膿腫教學(xué)查房課件
- 跳繩之雙腳跳教案
- 拇外翻護(hù)理課件
- 六年級(jí)英語教學(xué)隨筆5篇
- 讀書分享交流會(huì)《從一到無窮大》課件
評(píng)論
0/150
提交評(píng)論