心理學(xué)考研之心理統(tǒng)計(jì)學(xué)筆記_第1頁(yè)
心理學(xué)考研之心理統(tǒng)計(jì)學(xué)筆記_第2頁(yè)
心理學(xué)考研之心理統(tǒng)計(jì)學(xué)筆記_第3頁(yè)
心理學(xué)考研之心理統(tǒng)計(jì)學(xué)筆記_第4頁(yè)
心理學(xué)考研之心理統(tǒng)計(jì)學(xué)筆記_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、心理統(tǒng)計(jì)學(xué)筆記( 1)基本概念 總體:具有某些共同的、可觀測(cè)特征的一類事物的全體,構(gòu)成總體的每個(gè)基本單元稱為個(gè) 體樣本:由于不能或沒(méi)必要對(duì)整個(gè)總體進(jìn)行研究,我們只能從總體中選擇出一些個(gè)體代表總 體,這些個(gè)體的集合叫樣本 變量:本身是變化的或者對(duì)于不同個(gè)體有不同值得特征或條件 常量:本身不變且對(duì)不同的個(gè)體的值也相同參數(shù):描述總體的數(shù)值,它可以從一次測(cè)量中獲得,也可以從總體的一系列測(cè)量中推論得 到比例:全組中取值為 X的比例,p=f/N插值法:一種求兩個(gè)已知數(shù)值之間中間值的方法,其假設(shè)所求解點(diǎn)附近數(shù)據(jù)呈線性變化 統(tǒng)計(jì)量:描述樣本的數(shù)值,與參數(shù)的獲得方式相同隨機(jī)取樣:從總體抽取樣本的一種策略,要求總

2、體中的每一個(gè)個(gè)體被抽到的機(jī)會(huì)均等 取樣誤差:樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差距偏態(tài)分布:分?jǐn)?shù)堆積在分布的一端,而另一端成為比較尖細(xì)的尾端,其與對(duì)稱分布對(duì)應(yīng) 次數(shù)分布:一批數(shù)據(jù)在某一量度的每一個(gè)類目所出現(xiàn)的次數(shù)情況 離散型變量:由分離的、不可分割的范疇組成,臨近范疇之間沒(méi)有值存在 連續(xù)型變量:在任何兩個(gè)觀測(cè)值之間都存在無(wú)限多個(gè)可能值,它可被分割成無(wú)限多個(gè)組成 部分( 2)學(xué)習(xí)建議 將注意放在概念上,心理統(tǒng)計(jì)應(yīng)該是一門概念性的科學(xué),而非純數(shù)學(xué)。 一定要將統(tǒng)計(jì)方法與心理學(xué)研究的情景結(jié)合起來(lái)學(xué)習(xí)。 弄懂一個(gè)概念再幵始學(xué)習(xí)下一個(gè),心理統(tǒng)計(jì)中的概念應(yīng)用性較差卻是之后做題的基礎(chǔ)。 做題按照推薦格式能避免出

3、錯(cuò)幾率( 3)統(tǒng)計(jì)檢驗(yàn)總表數(shù)據(jù)類單樣本獨(dú)立樣相關(guān)樣多組樣本的比較相關(guān)問(wèn)型問(wèn)題本比較本比較獨(dú)立樣重復(fù)測(cè)題本量等總體單樣本獨(dú)立樣相關(guān)樣獨(dú)立樣重復(fù)測(cè)Pearson距正態(tài)t/z本t/z本t本方差1b、.量方差積差相關(guān)型分布檢驗(yàn)檢驗(yàn)檢驗(yàn)分析分析分布大樣本大樣本大樣本轉(zhuǎn)化為順序型轉(zhuǎn)化為順形態(tài)下的相下的相下的相序型未知應(yīng)的 t/z應(yīng)的 t/z應(yīng)的 t 檢檢驗(yàn)檢驗(yàn)驗(yàn)順序型符號(hào)檢曼- 惠特維爾克克- 瓦氏弗里德Spearman驗(yàn)法尼松單向曼雙向等級(jí)相關(guān)U 檢驗(yàn)T檢驗(yàn)方差分等級(jí)方析差分析命名型2X匹配X 2 獨(dú)立符號(hào)檢X 2 獨(dú)立性檢驗(yàn)X 獨(dú)立度檢驗(yàn)性檢驗(yàn)驗(yàn)法性檢驗(yàn)一、描述統(tǒng)計(jì)描述統(tǒng)計(jì)是指用來(lái)整理、概括、簡(jiǎn)化數(shù)據(jù)

4、的統(tǒng)計(jì)方法,側(cè)重于描述一組數(shù)據(jù)的全貌,表達(dá)一件事物的性質(zhì)。一)統(tǒng)計(jì)圖表統(tǒng)計(jì)表和統(tǒng)計(jì)圖簡(jiǎn)單明確、生動(dòng)直觀地表達(dá)數(shù)量關(guān)系,具有一目了然、整潔美觀、容易理 解等特點(diǎn)。它們是對(duì)數(shù)據(jù)進(jìn)行初步整理,以簡(jiǎn)化的形式加以表現(xiàn)的兩種最簡(jiǎn)單的方式。 在 制定統(tǒng)計(jì)圖表之前,一般首先要對(duì)數(shù)據(jù)進(jìn)行以下兩種初步整理: 數(shù)據(jù)排序:按照某種標(biāo)準(zhǔn),對(duì)收集到的雜亂無(wú)章的數(shù)據(jù)按照一定順序標(biāo)準(zhǔn)進(jìn)行排列 統(tǒng)計(jì)分組:根據(jù)被研究對(duì)象的特征,將所得到數(shù)據(jù)劃分到各個(gè)組別中去1統(tǒng)計(jì)圖統(tǒng)計(jì)圖:用點(diǎn)、線、面的位置、升降或大小來(lái)表達(dá)統(tǒng)計(jì)資料數(shù)量關(guān)系的一種陳列形式組成:坐標(biāo)軸、圖號(hào)、圖題、圖目、圖尺、圖形、圖例、圖注分類:條形圖、圓圖、線性圖、直方圖、散

5、點(diǎn)圖、莖葉圖2 統(tǒng)計(jì)表統(tǒng)計(jì)表:將要統(tǒng)計(jì)分析的事物或指標(biāo)以表格的形式列出來(lái),以代替煩瑣文字描述的一種表現(xiàn)形式組成:隔開線、表號(hào)、名稱、標(biāo)目、數(shù)字、表注分類:簡(jiǎn)單表、分組表、復(fù)合表(二)集中量數(shù)集中量數(shù)又叫集中趨勢(shì),是體現(xiàn)一組數(shù)據(jù)一般水平的統(tǒng)計(jì)量。它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點(diǎn)集中的情況。1 算數(shù)平均數(shù)1)定義 算數(shù)平均數(shù):即所有觀察值的總和與總頻數(shù)之商, 簡(jiǎn)稱為平均數(shù)或均數(shù) 平均數(shù)一般與標(biāo)準(zhǔn)差、方差相結(jié)合使用。(2)特點(diǎn) 在一組數(shù)據(jù)中每個(gè)變量與平均數(shù)之差的總和等于零 在一組數(shù)據(jù)中,每一個(gè)數(shù)都加上一個(gè)常數(shù)C,所得的平均數(shù)為原來(lái)的平均數(shù)加常數(shù)C 在一組數(shù)據(jù)中,每一個(gè)數(shù)都乘以一個(gè)常數(shù)C,所得的平均

6、數(shù)為原來(lái)的平均數(shù)乘以常數(shù)C(3)意義 算數(shù)平均數(shù)是應(yīng)用最普遍的一種集中量數(shù),它在大多情況下是 真值最好的估計(jì)值。( 4)優(yōu)缺點(diǎn) 優(yōu)點(diǎn):反應(yīng)靈敏、計(jì)算嚴(yán)密、計(jì)算簡(jiǎn)單、簡(jiǎn)明易解、適合于進(jìn)一步用代數(shù)方法鹽酸、較少 受抽樣變動(dòng)的影響缺點(diǎn):易受極端數(shù)據(jù)的影響、不能在出現(xiàn)模糊數(shù)據(jù)時(shí)計(jì)算2中數(shù)(1)定義中數(shù):按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),在這組數(shù)據(jù)中,有一半數(shù)據(jù)比 它大,一般數(shù)據(jù)比它小, 等價(jià)于百分位數(shù)是 50 的那個(gè)數(shù)。(2)算法 數(shù)列總個(gè)數(shù)為奇數(shù)時(shí),第 (n+1)/2 個(gè)數(shù)就是中數(shù) 數(shù)列總個(gè)數(shù)為偶數(shù)時(shí),可取位于中間的兩個(gè)數(shù)的平均數(shù)作為中數(shù) 分布中有相等的數(shù)時(shí),將重復(fù)的數(shù)字看成一個(gè)連續(xù)體,

7、利用中間分?jǐn)?shù)的精確上下限使用插值法( 3)優(yōu)缺點(diǎn) 優(yōu)點(diǎn):計(jì)算簡(jiǎn)單、容易理解、不受極端值影響、能在有模糊數(shù)據(jù)情況下使用、可在順序型 數(shù)據(jù)時(shí)使用 缺點(diǎn):代表性低、不夠靈敏、穩(wěn)定性低、需要排序、不能進(jìn)一步做代數(shù)運(yùn)算3眾數(shù)(1)定義 眾數(shù):在次數(shù)分布中出現(xiàn)次數(shù)最多的那個(gè)數(shù)的數(shù)值眾數(shù)可能不只一個(gè)。在正偏態(tài)分布時(shí),平均數(shù)最靠近尾端,中數(shù)位于其與眾數(shù)之間 ( 2)優(yōu)缺點(diǎn)優(yōu)點(diǎn):能在數(shù)據(jù)不同質(zhì)的情況使用,能避免極端值干擾 缺點(diǎn):不穩(wěn)定、代表性差、不夠靈敏、不能做進(jìn)一步的代數(shù)運(yùn)算(三)差異量數(shù)差異量數(shù)就是對(duì)一組數(shù)據(jù)的變異性,即離中趨勢(shì)特點(diǎn)進(jìn)行度量和描述的統(tǒng)計(jì)量,也稱為離 散量數(shù)。1 離差與平均差離差:分布中的某點(diǎn)

8、到均值得距離,其符號(hào)表示了某分屬于均值之間的位置關(guān)系而數(shù)值表 示了它們之間的絕對(duì)距離離差之和始終為零。平均差:次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對(duì)離差的平均值2 方差與標(biāo)準(zhǔn)差和方:每一個(gè)離差值平房求和由于離差正負(fù)值互相抵消無(wú)法代表離中趨勢(shì)我們引入和方的概念1)總體的方差和標(biāo)準(zhǔn)差方差:每個(gè)數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值,即離均差平房后的均數(shù)作為樣本統(tǒng)計(jì)量用符號(hào)S?表示,作為總體參數(shù)用符號(hào) C 2表示,也叫均方。標(biāo)準(zhǔn)差:方差的平方根作為樣本統(tǒng)計(jì)量用符號(hào)S表示,作為總體參數(shù)用符號(hào) C表示。( 2)樣本的方差和標(biāo)準(zhǔn)差 樣本的變異性往往比它來(lái)自的總體的變異性要小。為了校正樣本數(shù)據(jù)帶來(lái)的偏差,在計(jì)算

9、樣本方差時(shí),我們用自由度來(lái)矯正樣本誤差,從而有利于對(duì)總體參數(shù)更好的無(wú)偏差估計(jì)(3)性質(zhì) 每一個(gè)觀測(cè)值都加一個(gè)相同的常數(shù) C之后,計(jì)算得到的標(biāo)準(zhǔn)差等于原來(lái)的標(biāo)準(zhǔn)差 每一個(gè)觀測(cè)值都乘以一個(gè)相同的常數(shù) C,所得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)(4)意義 方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好指標(biāo),它們是統(tǒng)計(jì)描述與統(tǒng)計(jì)推斷分析中最 常用的差異量數(shù), 它們的優(yōu)點(diǎn)有:反應(yīng)靈敏、計(jì)算嚴(yán)謹(jǐn)、計(jì)算容易、適合代數(shù)運(yùn)算、受抽樣變動(dòng)影響小、意義簡(jiǎn)單明了3 變異系數(shù)當(dāng)遇到下列情況時(shí),不能用絕對(duì)差異量來(lái)比較不同樣本的離散程度,而應(yīng)當(dāng)使用相對(duì)差異 量數(shù),最常用的就是差異系數(shù)。 兩個(gè)或兩個(gè)以上樣本所使用的觀測(cè)工具不同,所

10、測(cè)的特質(zhì)相同 兩個(gè)或兩個(gè)以上樣本使用的是同種觀測(cè)工具,所測(cè)的特質(zhì)相同,但樣本間水平差異較大 差異系數(shù):一種最常用的相對(duì)差異量,為標(biāo)準(zhǔn)差對(duì)平均數(shù)的百分比四)相對(duì)量數(shù)1 百分位數(shù)百分位數(shù):在整個(gè)分布中,在某一值之下或等于該值的分?jǐn)?shù)的百分比,所對(duì)應(yīng)的分?jǐn)?shù) 百分位數(shù)和百分等級(jí)是同一操作定義的兩端。當(dāng)我們求累計(jì)次數(shù)占總體的百分比是,所對(duì)應(yīng)的分?jǐn)?shù)和百分比的值分別為百分位數(shù)和百分等級(jí)。2 百分等級(jí)百分等級(jí):常模團(tuán)體中低于該分?jǐn)?shù)的人所占總體的百分比 百分等級(jí)一定要對(duì)應(yīng)分?jǐn)?shù)區(qū)間的精確上限。百分等級(jí)和百分位數(shù)都可以由已知數(shù)據(jù)用差值法求解。3 標(biāo)準(zhǔn)分?jǐn)?shù)(1)定義 標(biāo)準(zhǔn)分?jǐn)?shù):以標(biāo)準(zhǔn)差為單位表示一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處

11、位置的相對(duì)位置量數(shù),也叫 Z 分?jǐn)?shù)離平均數(shù)有多遠(yuǎn),即表示原始分?jǐn)?shù)在平均數(shù)以上或以下幾個(gè)標(biāo)準(zhǔn)差的位置。(2)性質(zhì) Z分?jǐn)?shù)無(wú)實(shí)際單位,是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的一個(gè)相對(duì)量 一組原始分?jǐn)?shù)轉(zhuǎn)換得到的 Z分?jǐn)?shù)可正可負(fù),所有原始分?jǐn)?shù)的 Z分?jǐn)?shù)之和為零 原始數(shù)據(jù)的Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1 若原始分?jǐn)?shù)呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分?jǐn)?shù)均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分(3)優(yōu)點(diǎn) 可比性 不同性質(zhì)的成績(jī),一經(jīng)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù),就可在同一背景下比較 可加性 不同性質(zhì)的原始數(shù)據(jù)具有相同的參照點(diǎn),因此可相加 明確性 知道了標(biāo)準(zhǔn)分?jǐn)?shù),利用分布寒暑表就能知道其百分等級(jí) 穩(wěn)定性 轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)之后,規(guī)定了標(biāo)準(zhǔn)差為1,保證了

12、不同性質(zhì)分?jǐn)?shù)在總分?jǐn)?shù)中權(quán)重一樣(4)應(yīng)用 比較幾個(gè)分屬性質(zhì)不同的觀測(cè)值在各自數(shù)據(jù)分布中相對(duì)位置的高低 計(jì)算不同質(zhì)的觀測(cè)值得總合或平均值,以表示在團(tuán)體中的相對(duì)位置 若標(biāo)準(zhǔn)分?jǐn)?shù)中有小數(shù)、負(fù)數(shù)等不易被人接受的問(wèn)題,可通過(guò)Z=aZ+b的線性公式將其轉(zhuǎn)化成新的分?jǐn)?shù)(如韋氏成人智力量表)(五)相關(guān)量數(shù)由于實(shí)驗(yàn)法適用范圍的限制,有的時(shí)候我們只能對(duì)變量間進(jìn)行相關(guān)研究,也就是看兩者是否有互相跟隨的變化關(guān)系。相關(guān)研究所得到的是一種描述統(tǒng)計(jì),我們僅僅能用其描述兩個(gè) 變量互相跟隨的程度大小, 至于他們之間是否有因果關(guān)系或者是共變關(guān)系則不可妄下定論。 相關(guān)系數(shù):兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式作為樣本的統(tǒng)計(jì)量用r表示,

13、作為總體參數(shù)一般用 p表示。正相關(guān): 兩列變量變動(dòng)方向相同負(fù)相關(guān): 兩列變量中有一列變量變動(dòng)時(shí),另一列變量呈現(xiàn)出與前一列變量方向相反的變動(dòng)零相關(guān): 兩列變量之間沒(méi)有關(guān)系,各自按照自己的規(guī)律或無(wú)規(guī)律變化1 積差相關(guān)也就是 Pearson 相關(guān)。(1)前提 數(shù)據(jù)要成對(duì)出現(xiàn),即若干個(gè)體中每個(gè)個(gè)體都有兩種不同的觀測(cè)值,并且每隊(duì)數(shù)據(jù)與其它對(duì)子相互獨(dú)立 兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài) 兩個(gè)相關(guān)的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測(cè)量數(shù)據(jù) 兩列變量之間的關(guān)系應(yīng)是直線性的(2)公式r也就等于X和Y共同變化的程度除以 X和Y各自變化的程度。2 等級(jí)相關(guān)也就是Spearman相關(guān)( 1)適用范圍 當(dāng)

14、研究考察的變量為順序型數(shù)據(jù)時(shí),若原始數(shù)據(jù)為等比貨等距,則先轉(zhuǎn)化為順序型數(shù)據(jù) 當(dāng)研究考察的變量為非線性數(shù)據(jù)時(shí)(2)公式將原始數(shù)據(jù)轉(zhuǎn)化為順序型數(shù)據(jù),仍然用 Pearson 相關(guān)公式計(jì)算即可。3 肯德爾等級(jí)相關(guān)( 1)肯德爾 W 系數(shù)也叫肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級(jí)評(píng)定法,即讓K個(gè)被試對(duì)N件實(shí)物進(jìn)行等級(jí)評(píng)定。 其原理是評(píng)價(jià)者評(píng)價(jià)的一致性除以最大變異可能性。R代表評(píng)價(jià)對(duì)象獲得的 K個(gè)等級(jí)之和N代表等級(jí)評(píng)定的對(duì)象的樹木K代表等級(jí)評(píng)定者的數(shù)目(2)肯德爾U系數(shù)#N件事物兩兩配對(duì)其與肯德爾 W系數(shù)所處理的問(wèn)題相同,但評(píng)價(jià)者采用對(duì)偶比較法,即將 分別進(jìn)行比較r j為對(duì)偶比較記錄表中ij格中的

15、擇優(yōu)分?jǐn)?shù)4 .點(diǎn)二列相關(guān)與二列相關(guān)(1) 點(diǎn)二列相關(guān)適用于一列數(shù)據(jù)為等距正態(tài)變量,另一列為離散型二分變量。Xp是與二分稱名變量的一個(gè)值對(duì)應(yīng)的連續(xù)變量的平均數(shù)Xq是與二分稱名變量的另一個(gè)值對(duì)應(yīng)的連續(xù)變量的平均數(shù)p與q是二分稱名變量?jī)蓚€(gè)值各自所占的比率St是連續(xù)變量的標(biāo)準(zhǔn)差(2) 二列相關(guān)適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類。 y為標(biāo)準(zhǔn)正態(tài)曲線中p值對(duì)應(yīng)的高度,查正態(tài)分布表能得到5 .相關(guān)適用于兩個(gè)變量都是只有兩個(gè)點(diǎn)值或只表示某些質(zhì)的屬性。其中a、b、c、d分別為四格表中左上、右上、左下、右下的數(shù)據(jù)二、推斷統(tǒng)計(jì)推論統(tǒng)計(jì)就是指運(yùn)用一系列的數(shù)學(xué)方法,將從樣本數(shù)據(jù)中獲得的結(jié)果推

16、廣到樣本所在的總 體。進(jìn)行推論統(tǒng)計(jì)的關(guān)鍵在于所抽取的樣本要能夠盡量接近所要研究的總體。(一)推斷統(tǒng)計(jì)的數(shù)學(xué)基礎(chǔ)1概率概率:表明隨即時(shí)間出現(xiàn)可能性大小的客觀指標(biāo)概率的定義包含以下兩種,當(dāng)觀測(cè)次數(shù)夠多時(shí)他們是相等的。后驗(yàn)概率:對(duì)隨機(jī)事件進(jìn)行n次觀察,某一事件 A出現(xiàn)的次數(shù)m與觀測(cè)次數(shù)n的比值在 n 趨近無(wú)窮時(shí)所穩(wěn)定在的常數(shù) p先驗(yàn)概率 :在滿足試驗(yàn)可能結(jié)果數(shù)有限且每一種結(jié)果出現(xiàn)的可能性相等的條件下,隨機(jī)事件包含的結(jié)果數(shù)除以結(jié)果總數(shù)2 正態(tài)分布當(dāng)樣本量足夠大時(shí),我們會(huì)發(fā)現(xiàn)生活中許多變量的分布都近似于正態(tài)曲線,因此有“上帝偏愛(ài)正態(tài)分布”一說(shuō)。(1)特點(diǎn) 正態(tài)曲線的形狀就像一口掛鐘,呈對(duì)稱分布,其均值、

17、中數(shù)、眾數(shù)實(shí)際上對(duì)應(yīng)于同一個(gè)數(shù)值 大部分的原始分?jǐn)?shù)都集中分布在均值附近,極端值相對(duì)而言比較少 曲線兩端向靠近橫軸處不斷延伸,但始終不會(huì)與橫軸向交 正態(tài)分布曲線轉(zhuǎn)化為 z 分?jǐn)?shù)后人以 z 分?jǐn)?shù)與零點(diǎn)對(duì)應(yīng)曲線下面積固定(2)用法 依據(jù) Z 分?jǐn)?shù)求概率,即已知標(biāo)準(zhǔn)分?jǐn)?shù)求面積 從概率求 Z 分?jǐn)?shù),即從面積求標(biāo)準(zhǔn)分?jǐn)?shù)值 已知概率或 Z 值,求概率密度,即正態(tài)曲線的高3 .二項(xiàng)分布二項(xiàng)分布:對(duì)于一個(gè)事件有兩種可能A和B,但我們對(duì)這一事件觀察 n次,事件A發(fā)生的總次數(shù)的概率分布就是二項(xiàng)分布二項(xiàng)分布的均值為=pn方差公式為二$ = npq標(biāo)準(zhǔn)差的公式為;:-npq4 .抽樣原理與抽樣方法(1 )抽樣原理抽樣的

18、基本原則是隨機(jī)性原則,所謂隨機(jī)性原則,是指在進(jìn)行抽樣時(shí),總體中每一個(gè)個(gè)體 是否被抽選的概率完全均等。由于隨機(jī)抽樣使每個(gè)個(gè)體有同等機(jī)會(huì)被抽取,因而有相當(dāng)大 的可能使樣本保持和總體有相同的結(jié)構(gòu),或者說(shuō),具有最大的可能使總體的某些特征在樣 本中得以發(fā)現(xiàn),從而保證由樣本推論總體。(2)抽樣方法 簡(jiǎn)單隨機(jī)取樣法 系統(tǒng)隨機(jī)取樣法 分層隨機(jī)取樣法 多段隨機(jī)取樣法5 .抽樣分布樣本分布:樣本統(tǒng)計(jì)量的分布,是統(tǒng)計(jì)推論的重要依據(jù)(1)正態(tài)分布及漸近正態(tài)分布樣本統(tǒng)計(jì)量為正態(tài)分布或者接近正態(tài)分布的情況都可根據(jù)正態(tài)分布的概率進(jìn)行統(tǒng)計(jì)推論。 總體分為正態(tài)或接近正態(tài),方差已知,樣本平均數(shù)和方差的分布為正態(tài)分布 樣本平均數(shù)分

19、布的平均數(shù)和方差與母體的平均數(shù)和方差有如下關(guān)系: 樣本的方差及標(biāo)準(zhǔn)差的分布也漸趨于正態(tài)分布,其分布的平均數(shù)與標(biāo)準(zhǔn)差和總體有如下 關(guān)系:(2)t分布t分布是一種與方差無(wú)關(guān)而與自由度有關(guān)的分布,很類似正態(tài)分布,我們可以將正態(tài)分布看作t分布當(dāng)自由度為正無(wú)窮時(shí)的特例??傮w分布為正態(tài),方差未知時(shí),樣本平均數(shù)的分布為t分布:2(3) x分布x 2分布的構(gòu)造是從一個(gè)服從正態(tài)分布的總體中每次抽去n個(gè)隨機(jī)變量,計(jì)算其平方和之后標(biāo)準(zhǔn)化的一個(gè)分布。 分布曲線下的面積都是1,但伴隨著n取值的不同,自由度改變,曲 線分布形狀不同,而當(dāng)自由度趨近于正無(wú)窮時(shí) X彳分布即為正態(tài)分布,因此其于t分布一樣 都是一族分布,而正態(tài)分

20、布都是其中的特例。(4) F分布2如果有兩個(gè)正態(tài)分布的總體,我們從其中各自取出兩個(gè)樣本,各自計(jì)算出x ,貝y:更多情況下,我們所計(jì)算的 F兩樣本取自相同總體,此時(shí)可將上式化簡(jiǎn)為:(二) 參數(shù)估計(jì)當(dāng)在研究中從樣本獲得一組數(shù)據(jù)后,如何通過(guò)這組信息,對(duì)總體特征進(jìn)行估計(jì),也就是如何從局部結(jié)果推論總體的情況,稱為總體參數(shù)估計(jì)??傮w參數(shù)估計(jì)問(wèn)題可以分為點(diǎn)估計(jì)與區(qū)間估計(jì)。i 點(diǎn)估計(jì)、區(qū)間估計(jì)與標(biāo)準(zhǔn)誤良好估計(jì)量的標(biāo)準(zhǔn)無(wú)偏性 用多個(gè)樣本的統(tǒng)計(jì)量估計(jì)總體參數(shù)的估計(jì)值,其偏差的平均數(shù)為零 有效性 當(dāng)總體參數(shù)的無(wú)偏估計(jì)不止一個(gè)統(tǒng)計(jì)量時(shí),無(wú)偏估計(jì)變異小者有效性高,變 異大者有效性低,即方差越小越好 一致性 當(dāng)樣本容量無(wú)

21、限增大時(shí),估計(jì)值應(yīng)能夠越來(lái)越接近它所估計(jì)的總體參數(shù) 充分性 樣本的統(tǒng)計(jì)量是否充分地反映了全部 n 個(gè)數(shù)據(jù)所反映總體的信息 點(diǎn)估計(jì):用樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù),因?yàn)闃颖窘y(tǒng)計(jì)量為數(shù)軸上某一點(diǎn)值,估計(jì)結(jié)果也 以一個(gè)點(diǎn)的數(shù)值表示 區(qū)間估計(jì):根據(jù)估計(jì)量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍,這個(gè)區(qū)間就叫做 置信區(qū)間 ,相應(yīng)的概率成為 置信度,這兩個(gè)量是共通變化的, 置信區(qū)間越大,置信度越高;區(qū)間估計(jì)是用數(shù)軸上的一段距離表示未知參數(shù)可能落入的范圍及落入該范圍的 概率。標(biāo)準(zhǔn)誤:樣本平均數(shù)分布的標(biāo)準(zhǔn)差 總體方差未知時(shí)用估算的總體方差計(jì)算標(biāo)準(zhǔn)誤。2 總體平均數(shù)的估計(jì)當(dāng)總體方差未知時(shí),則使用 t 分布對(duì)應(yīng)置信度

22、3 標(biāo)準(zhǔn)差與方差的區(qū)間估計(jì)( 1)標(biāo)準(zhǔn)差的區(qū)間估計(jì)( 2)方差的區(qū)間估計(jì)(三)假設(shè)檢驗(yàn)可以說(shuō),每一個(gè)實(shí)驗(yàn)的存在,僅僅是為了給事實(shí)一個(gè)反駁虛無(wú)假設(shè)的機(jī)會(huì)。1 假設(shè)檢驗(yàn)的原理假設(shè)檢驗(yàn):統(tǒng)計(jì)學(xué)中的一種推論過(guò)程,通過(guò)樣本統(tǒng)計(jì)量得出的差異作為一般性結(jié)論,判斷 總體參數(shù)之間是否存在差異假設(shè)檢驗(yàn)的實(shí)質(zhì)是對(duì)可置信性的評(píng)價(jià),是對(duì)一個(gè)不確定問(wèn)題的決策過(guò)程,其結(jié) 果在一定概率上正確的,而不是全部。( 1)兩類假設(shè)對(duì)于任何一種研究而言,其結(jié)果無(wú)外乎有兩種可能 , 即是否符合我們預(yù)期。 一般來(lái)說(shuō)證偽 件事情比證實(shí)一件事容易,在行為科學(xué)的研究中,由于我們無(wú)法了解總體中除樣本以外的 個(gè)體情況,因此嘗試拒絕虛無(wú)假設(shè)的方法優(yōu)于

23、證明備擇假設(shè)。備則假設(shè):因變量的變化、差異卻是是由于自變量的作用往往是我們對(duì)研究結(jié)果的預(yù)期,用 H1 表示。虛無(wú)假設(shè):實(shí)際上什么也沒(méi)有發(fā)生,我們所預(yù)計(jì)的改變、差異、處理效果都不存在觀察到的差異只是隨機(jī)誤差在起作用,用 H0 表示。( 2)小概率原理小概率原理:小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的至于什么就算小概率事件,那就是我們?cè)谟?jì)算前明確的決策標(biāo)準(zhǔn),也就是顯著性水平a在檢驗(yàn)過(guò)程中,我們假設(shè)虛無(wú)假設(shè)是真實(shí)的,同時(shí)計(jì)算出觀測(cè)到的差異完全是由于隨機(jī)誤 差所致的概率。之后將其與我們實(shí)現(xiàn)界定好的顯著性水平比較,從而考慮是否依據(jù)小概率 原理來(lái)拒絕虛無(wú)假設(shè)。( 3)兩類錯(cuò)誤(本部分內(nèi)容請(qǐng)參照實(shí)心信號(hào)檢

24、測(cè)論對(duì)照來(lái)看。一一MJ注)I型錯(cuò)誤:當(dāng)虛無(wú)假設(shè)正確時(shí),我們拒絕了它所犯的錯(cuò)誤,也叫a錯(cuò)誤研究者得出了處理有效果的結(jié)論,而實(shí)際上并沒(méi)有效果,即所謂“無(wú)中生有”U型錯(cuò)誤:當(dāng)虛無(wú)假設(shè)是錯(cuò)誤的時(shí)候,我們沒(méi)有拒絕所犯的錯(cuò)誤,也叫B錯(cuò)誤假設(shè)檢驗(yàn)未能偵查到實(shí)際存在的處理效應(yīng),即所謂“失之交臂”兩類檢驗(yàn)的關(guān)系 a + 3不一定等于1 在其他條件不變的情況下,a與(3不可能同時(shí)減小或增大(4) 檢驗(yàn)的方向性單側(cè)檢驗(yàn):強(qiáng)調(diào)某一方向的檢驗(yàn),顯著性的百分等級(jí)為a雙側(cè)檢驗(yàn):只強(qiáng)調(diào)差異不強(qiáng)調(diào)方向性的檢驗(yàn),顯著性百分等級(jí)為a /2對(duì)于同樣的顯著性標(biāo)準(zhǔn),在某一方向上,單側(cè)檢驗(yàn)的臨界區(qū)域要大于雙側(cè)檢驗(yàn),因此如果差異發(fā)生在該方向

25、,單側(cè)檢驗(yàn)犯 3錯(cuò)誤的概率較小,我們也說(shuō)它的檢驗(yàn)效力更高。(5) 假設(shè)檢驗(yàn)的步驟 根據(jù)問(wèn)題要求,提出虛無(wú)假設(shè)和備擇假設(shè) 選擇適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量 確定檢驗(yàn)的方向性并規(guī)定顯著性水平 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值 將統(tǒng)計(jì)量的值與臨界值對(duì)比做出決策2 樣本與總體平均數(shù)差異的檢驗(yàn)(1) 總體正態(tài)分布且方差已知 乙與其中二匚;%和二0分別為總體的平均數(shù)和方差(2) 總體正態(tài)分布而方差未知tobs=F其中SX煜而S二層S為用樣本和方估算出的總體方差3 兩樣本平均數(shù)差異的檢驗(yàn)Zobs obsnJ2這是兩樣本平均數(shù)檢驗(yàn)的通用公式,所不同的僅在于標(biāo)準(zhǔn)誤的計(jì)算 DX(1)總體方差已知獨(dú)立樣本相關(guān)樣本CDX其中r為兩組變量之間的

26、相關(guān)系數(shù)(2)總體方差未知獨(dú)立樣本(方差差異不顯著時(shí))相關(guān)樣本a.相關(guān)系數(shù)未知:CDX其中d為每一對(duì)對(duì)應(yīng)數(shù)據(jù)之差n -1s2 s2 -2rsiS2b.相關(guān)系數(shù)已知:DX4 .方差齊性檢驗(yàn)(1)樣本方差與總體方差當(dāng)從正態(tài)分布的總體中隨機(jī)抽取容量為n的樣本時(shí),其樣本方差與總體方差比值服從 分布:22二耳由自由度df =n-1查x 2表,依據(jù)顯著性水平判斷-0(2)兩個(gè)樣本方差之間 獨(dú)立樣本2F二字其中當(dāng)兩樣本自由度相差不大時(shí)可用 Sn代替Sn-is小查表時(shí) df| = m 1,df2 二 n2 -1相關(guān)樣本2 2t 二Sl _S2其中 df 二 n 一24s2 1 -r2V25 相關(guān)系數(shù)的顯著性檢

27、驗(yàn) 積差相關(guān)a. 當(dāng)p =0時(shí):t =r 其中df = n 一2-r21 n 一2b. 當(dāng)pH 0時(shí):先通過(guò)查表將r和p轉(zhuǎn)化為費(fèi)舍乙和乙然后進(jìn)行Z檢驗(yàn) 等級(jí)相關(guān)和肯德爾W系數(shù)在總體相關(guān)系數(shù)為零時(shí):查各自的相關(guān)系數(shù)表,判定樣本相關(guān)顯著(四) 方差分析1 方差分析的原理與基本過(guò)程(1) 方差分析的概念方差分析的目的是推斷多組資料的總體均數(shù)是否相同,也即檢驗(yàn)多組數(shù)據(jù)之間的均數(shù)差異是否有統(tǒng)計(jì)意義。當(dāng)我們用多個(gè) t檢驗(yàn)來(lái)完成這一過(guò)程時(shí),相當(dāng)于從 t分布中隨機(jī)抽取多 個(gè)t值,這樣落在臨界范圍之外的可能大大增加,從而增加了 I型錯(cuò)誤的概率。我們可以 把方差分析看作t檢驗(yàn)的增強(qiáng)版。(2) 方差的可分解性方差分

28、析依據(jù)的基本原理就是方差的可加性原則。作為一種統(tǒng)計(jì)方法,方差分析把實(shí)驗(yàn)數(shù) 據(jù)的總變異分解為若干個(gè)不同來(lái)源的分量。數(shù)據(jù)的變異由兩部分組成: 組內(nèi)變異:由于實(shí)驗(yàn)中一些希望加以控制的非實(shí)驗(yàn)因素和一些未被有效控制的未知因素造 成的變異,如個(gè)體差異、隨機(jī)誤差組內(nèi)變異是具體某一個(gè)處理水平之內(nèi)的,因此在對(duì)總體變異進(jìn)行估計(jì)的時(shí)候不 涉及研究的處理效應(yīng)。組間差異:不僅包括組內(nèi)變異的誤差因素,還包括了是不同組所接受的實(shí)驗(yàn)處理不同造成 的影響如果研究數(shù)據(jù)的總變異是由處理效應(yīng)造成的,那么組間變異在總變異中應(yīng)該占 較大比例。MSb表示組間方差,MS = SSb, dfB = k-1,k表示實(shí)驗(yàn)條件的個(gè)數(shù)dfBMSw表示

29、組內(nèi)方差,MSw二魚,dfw二k n-1 , n表示每種實(shí)驗(yàn)條件中的被試個(gè)數(shù) dfw(3)方差分析的基本假定 樣本必須來(lái)自正態(tài)分布的總體 每次觀察得到的幾組數(shù)據(jù)必須彼此獨(dú)立 各實(shí)驗(yàn)處理內(nèi)的方差應(yīng)彼此無(wú)顯著差異為了滿足這一假定,我們可采用最大F比率法Fmax二車,求出各樣本中方差最大值與最Smin小值的比,通過(guò)查表判斷。(4)方差分析的基本步驟I求平方和 總平方和是所有觀測(cè)值與總平均數(shù)的離差的平方總和SSr =無(wú)X2 -(G張)其中G表示所有數(shù)據(jù)的總合,N表示總共的數(shù)據(jù)個(gè)數(shù) 組間平方和是每組的平均數(shù)與總平均數(shù)的離差的平方再與該組數(shù)據(jù)個(gè)數(shù)的乘積的總和SSb =送嚴(yán)(X -G 2卜送憑-G%,G為數(shù)

30、據(jù)總均值,Ti為每組數(shù)據(jù)和,ni為該組數(shù)據(jù)個(gè)數(shù) 組內(nèi)平方和是各被試的數(shù)值與組平均數(shù)之間的離差的平方總和(注:SSt =SSb - SSW推薦用于檢驗(yàn)之前的計(jì)算,而不是被當(dāng)作快捷計(jì)算的方式) n計(jì)算自由度川計(jì)算均方IV計(jì)算F值V查F值表進(jìn)行F檢驗(yàn)并做出判斷W陳列方差分析表2 .完全隨機(jī)設(shè)計(jì)的方差分析r片陳述假設(shè)確定顯著水平確定檢驗(yàn)自由度f(wàn)片1確定F臨界值計(jì)算F觀察值比較F值得出結(jié)論JLjJ3 隨機(jī)區(qū)組設(shè)計(jì)的方差分析隨機(jī)區(qū)組設(shè)計(jì)中同質(zhì)被試參加所有水平下測(cè)試,因此,組間變異不包括個(gè)體差異的影響。 而每一個(gè)水平之內(nèi)仍然是由不同被試共同完成的,于是我們?nèi)匀粚⒖傮w變異分為組間變異和組內(nèi)變異,但需要進(jìn)一步將

31、組內(nèi)變異分為被試間變異和誤差引起的變異。這樣,我們就可以在 F檢驗(yàn)時(shí),將被試間變異從組內(nèi)變異中去除,使得檢驗(yàn)結(jié)果更靈敏。個(gè)體誤差用SSr表示,而隨機(jī)誤差用SSe表示,它們的和等于組內(nèi)差異 sswMSb 廿宀SSE hFB 其中 MSee 而 SSe -SSw -SSr ; dfE=ik1 n1MSedfE2SSf,& R)G乂其中瓦R為同一區(qū)組的數(shù)據(jù)之和,或者同一被試在不同處理下的乘積k4 k/N的和讓我們回憶一下兩個(gè)相關(guān)樣本平均數(shù)假設(shè)檢驗(yàn),可以發(fā)現(xiàn)那里出現(xiàn)的情況和這里的多樣本 方差分析相仿。也就是說(shuō),對(duì)于同樣的實(shí)驗(yàn)數(shù)據(jù),當(dāng)我們把它看作是由獨(dú)立樣本得出或相 關(guān)樣本得出時(shí),就要采用不同的檢驗(yàn)方法

32、,從而有可能得出不同的結(jié)論。在假定為相關(guān)樣 本的數(shù)據(jù)得出的顯著性差異如果換作背景是獨(dú)立樣本就可能只能接受虛無(wú)假設(shè)。這實(shí)際上 是因?yàn)橄嚓P(guān)情況下樣本之間差異的減小使得對(duì)應(yīng)檢驗(yàn)要使用的統(tǒng)計(jì)量變大,檢驗(yàn)也就更加 靈敏了。4 .兩因素方差分析在兩因素實(shí)驗(yàn)設(shè)計(jì)中,研究者同時(shí)用兩種影響因素作為自變量研究它們對(duì)某一因變量的影 響,其實(shí)驗(yàn)結(jié)果比單因素設(shè)計(jì)更實(shí)際。(1) 交互作用與主效應(yīng)主效應(yīng):某個(gè)自變量的不同水平對(duì)因變量所造成的影響的差異交互作用:一個(gè)因素對(duì)因變量的影響因另一個(gè)因素的不同水平而不同如果兩個(gè)因素彼此獨(dú)立,即不管其中一個(gè)因素處于哪個(gè)水平,另一個(gè)因素的不 同水平均值間的差異都保持一致,則不會(huì)產(chǎn)生交互作

33、用。(2) 統(tǒng)計(jì)原理為了看清各因素獨(dú)立作用和交互作用的影響,我們進(jìn)一步將組間差異分解: 其中SSa與SSb分別表示a因素與b因素的組間平方和,SSa b表示交互作用的平方和dfa =a -1 ; dfb =b -1 ; dfa b 二 a T b -1 ; dfw 二 N - a b(3)F的計(jì)算(這里討論獨(dú)立樣本)FMSa其中MSa =SSa這里的SSa是假定全體數(shù)據(jù)只根據(jù) a因素分為兩組所計(jì)算的組間差 MSwdfa異耳二軀 其中MSb二里這里的SSb也同樣為假設(shè)只根據(jù)b因素分組所計(jì)算的組間差異MSwdfb卩玄匕二巴墜其中MSab這里的SSab為總體組間差異減去SSa和SS)得到MSwdfa

34、縛5 .事后檢驗(yàn)由方差分析只能得到顯著差異的結(jié)果,事后檢驗(yàn)使我們能夠比較各組,發(fā)現(xiàn)差異具體產(chǎn)生 在什么地方。事后檢驗(yàn)采用成對(duì)比較的方式,每次比較兩個(gè)組的差異。這里我們只介紹常 用的紅絲帶檢驗(yàn)而不是過(guò)氣的內(nèi)褲?rùn)z驗(yàn)。HSD檢驗(yàn)法I把要比較的各個(gè)平均數(shù)從小到大作等級(jí)排列n處理?xiàng)l件的數(shù)目k,自由度dfE查表得到相應(yīng)顯著性的q值川計(jì)算作為臨界值的HSD二q. MSn (當(dāng)為隨機(jī)區(qū)組時(shí)用MSe代替MSw)IV把要比較的兩個(gè)平均數(shù)的差與臨界值比較,若超過(guò)則認(rèn)為差異顯著(五)回歸分析1 .一元線性回歸分析(1)基本概念回歸分析:通過(guò)大量的觀測(cè)發(fā)現(xiàn)變量之間存在的統(tǒng)計(jì)規(guī)律性,并用一定的數(shù)學(xué)模型表示變量相關(guān)關(guān)系的方法只有一個(gè)自變量并且統(tǒng)計(jì)量成大體一次函數(shù)的線性關(guān)系的回歸分析叫一元線性回歸分析。在一元線性回歸中,我們用 Y=a bX作為回歸方程,代表 X與Y的線性關(guān)系其中:a表示該直線在 丫軸的截距b表示該直線的斜率也就是Y的變化率X為自變量,通常是研究者事先選定的數(shù)值Y為對(duì)應(yīng)于X對(duì)變量丫的估計(jì)值(2)最小二乘法所謂最小二乘法,就是如果散點(diǎn)圖中每一點(diǎn)沿Y軸方向到直線的距離的平方和最小,則認(rèn)為這條直線的代表性最好,即使用其作為回歸方程。 這樣我們使得 總誤差Y-Y

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論