(李金昌)統(tǒng)計學(第四版)復習資料_第1頁
(李金昌)統(tǒng)計學(第四版)復習資料_第2頁
(李金昌)統(tǒng)計學(第四版)復習資料_第3頁
(李金昌)統(tǒng)計學(第四版)復習資料_第4頁
(李金昌)統(tǒng)計學(第四版)復習資料_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、此為整本書的復習資料,若應對期末考試,則不再考試范圍內(nèi)的請自動忽略。第一章:總論統(tǒng)計含義:統(tǒng)計數(shù)據(jù)、統(tǒng)計活動、統(tǒng)計學統(tǒng)計學:關(guān)于如何搜集、整理和分析統(tǒng)計數(shù)據(jù)的科學. 古典統(tǒng)計學時期 國勢學派-德國 政治算術(shù)學派英國 統(tǒng)計學發(fā)展歷程 近代統(tǒng)計學時期 社會統(tǒng)計學派德國 數(shù)理統(tǒng)計學派-比利時 現(xiàn)代統(tǒng)計學時期:推斷統(tǒng)計統(tǒng)計學研究對象:現(xiàn)象的數(shù)量方面-統(tǒng)計數(shù)據(jù) 定性數(shù)據(jù) 定類數(shù)據(jù) 計量尺度 定序數(shù)據(jù) 定量數(shù)據(jù) 定距數(shù)據(jù)統(tǒng)計數(shù)據(jù) 定比數(shù)據(jù) 表現(xiàn)形式:絕對數(shù)、相對數(shù)、平均數(shù) 來源:觀測數(shù)據(jù)、實驗數(shù)據(jù) 加工程度:原始數(shù)據(jù)、次級數(shù)據(jù) 時空狀態(tài):時序數(shù)據(jù)、截面數(shù)據(jù)總體:統(tǒng)計研究的客觀對象全體,也稱母體。特征:大量

2、性、同質(zhì)性、差異性 個體數(shù)量:有限/無限總體 存在形態(tài):具體/形象總體總體分類: 個體計數(shù):可計數(shù)/不可計數(shù)總體 人為判定個體:自然/人為總體個體:組成總體的個別事物,也稱總體單位.總體與個體關(guān)系:1??傮w隨個體數(shù)量可變大變??; 2.研究目的不同,總體中個體可改變; 3.研究范圍不同,總體和個體角色可變換。樣本:從總體中抽取一部分個體所組成的集合,也稱字樣。其不具唯一性,除非其實總體本身。樣本數(shù):總體中最多可抽取的不同樣本數(shù)量.樣本與總體關(guān)系:1??傮w是研究對象,樣本是觀測對象,樣本是總體的代表和縮影; 2.樣本用來推斷總體:觀測樣本的目的是對總體數(shù)量特征作出判斷。 3??傮w和樣本角色可改變標

3、志:描述或體現(xiàn)個體特征的名稱,標志在每個不同個體的結(jié)果為標志變形 表示方式 品質(zhì)標志:表明個體屬性特征 數(shù)量標志:表明個體數(shù)量特征 表現(xiàn)結(jié)果是否相同 不變標志:每個個體上表現(xiàn)完全相同分類 可變標志:每個個體上表現(xiàn)不同 表現(xiàn)個體直接程度 直接標志(第一標志):直接表明個體屬性或數(shù)量特征 間接標志(第二標志):兩個或兩個以上標志計算后(通常對比)變量:狹義:可變的數(shù)量標志;變量是可變數(shù)量標志的抽象化;變量的具體數(shù)值變量值(標志值)。 廣義:可變標志(可變數(shù)量/品質(zhì)標志)。 定性變量 定類變量 定序變量 定量變量 定距變量變量分類 定比變量 所受影響因素 確定性變量 隨機性變量 是否連續(xù) 離散型變量

4、(只能取整) 連續(xù)性變量(隨意?。┙y(tǒng)計指標:簡稱指標,是反映現(xiàn)象總體數(shù)量特征的概念及其數(shù)值。 組成:統(tǒng)計指標由指標名稱和指標數(shù)值兩個基本部分組成。指標名稱反映所研究現(xiàn)象的實際內(nèi)容,是對現(xiàn)象本質(zhì)特征的一種概括; 指標數(shù)值時所研究現(xiàn)象實際內(nèi)容的數(shù)量表現(xiàn),是對總體本質(zhì)特征的量的規(guī)定性,是對個體特征綜合和計算的結(jié)果。統(tǒng)計指標和標志的聯(lián)系和區(qū)別:區(qū)別:1.說明對象不同:指標說明總體的特征;標志說明個體的特征; 2。表現(xiàn)形式不同:指標用數(shù)值體現(xiàn);標志既有文字又有數(shù)值。聯(lián)系:1。標志是計算統(tǒng)計指標的依據(jù),即統(tǒng)計指標數(shù)值是根據(jù)個體的標志表現(xiàn)綜合而來的; 2。由于總體和個體的確定是相對的,可以換位,因而指標和標

5、志的確定也是相對的. 計算范圍 總體指標 樣本指標 反應現(xiàn)象不同 總體標志總量 數(shù)量指標 總體容量指標 反映現(xiàn)象內(nèi)容不同 反應時間狀況 時期指標 時點指標 質(zhì)量指標 相對指標 平均指標 反映現(xiàn)象時間狀態(tài) 靜態(tài)指標 動態(tài)指標第二章:統(tǒng)計數(shù)據(jù)的收集、整理與顯示統(tǒng)計數(shù)據(jù)收集:按照統(tǒng)計研究目的和任務(wù),運用各種科學有效的方式和方法,有針對地收集反映客觀現(xiàn)實的統(tǒng)計數(shù)據(jù)的活動過程,是整個統(tǒng)計活動的基礎(chǔ)階段,通常也稱統(tǒng)計調(diào)查階段。 基本要求:準確性(核心)、及時性(信息價值體現(xiàn))、完整性(分析需要)統(tǒng)計數(shù)據(jù)收集方式:普查、抽樣調(diào)查、重點調(diào)查及間接的統(tǒng)計調(diào)查統(tǒng)計推算普查:根據(jù)特定的統(tǒng)計目的而專門組織的一次性的全

6、面調(diào)查,用以手機所研究現(xiàn)象總體的全面資料(總體中所有個體都是觀測單位) 分類:1.專門建立普查機構(gòu),配備人員,如我國人口普查;2.利用觀測的原始記錄是記錄和核算資料,發(fā)表,由觀測單位填報。如物資庫存普查。特點:一般全國范圍,涉及面廣、工作量大、需要大量物力人力和財力。抽樣調(diào)查:一種非全面調(diào)查,從總體中抽取樣本,以樣本推斷總體。根據(jù)抽取樣本方式的不同,分為概率抽樣和非概率抽樣。特點:經(jīng)濟節(jié)省、時效性高、準確度高、靈活方便 概率抽樣從抽樣方法上看分為重復抽樣和不重復抽樣;從抽樣組織形式上看,分為簡單隨機抽樣、分層抽樣、等距抽樣、整群抽樣和多階段抽樣 非概率抽樣分為任意抽樣、典型抽樣、定額抽樣、和流

7、動總體抽樣幾種。數(shù)據(jù)收集誤差:觀測性誤差和代表性誤差。 觀測性誤差:也叫登記性誤差或調(diào)查性誤差,事調(diào)查工作的各個環(huán)節(jié)因工作粗心或被觀測者不愿很好配合而造成的所收集數(shù)據(jù)與實際情況不符的去查,包括計量錯誤、記錄錯誤、計算錯誤、抄寫錯誤、匯總錯誤、計算機輸入誤差等各種人為因素干擾的誤差。在全面調(diào)查和非全面調(diào)查中都會產(chǎn)生,調(diào)查范圍越廣、觀測個體越多,產(chǎn)生誤差可能性越大。是一種非一致性誤差。 代表性誤差:是在抽樣調(diào)查中,由于樣本不能完全代表總體而產(chǎn)生的估計結(jié)果與總體真實數(shù)量特征不符的誤差。分為系統(tǒng)代表性誤差和偶然性代表性誤差。 系統(tǒng)代表性誤差:由于抽樣框(用于抽取樣本的名錄)不完善、抽樣時違反隨機原則、

8、被調(diào)查者誤會等因素引起的誤差,等距抽樣也會有這種誤差。是難以計算和控制的。 偶然性代表性誤差:也叫抽樣誤差或偶然性誤差,是由于抽樣的隨機性引起的樣本機構(gòu)與總體結(jié)構(gòu)不完全相符,從而產(chǎn)生的估計結(jié)果與總體真值不一致的誤差,這種誤差在隨機抽樣不可避免,但可以計算和控制。統(tǒng)計分組:根據(jù)據(jù)統(tǒng)計研究的目的和事物本身的特點。選擇一定的標志(一個或多個),將研究現(xiàn)象總體劃分為若干性質(zhì)不同的組或類的一種攻擊研究方法. 性質(zhì):1。兼有分與合的雙重功能,是分與合的對立統(tǒng)一;2必須遵循“窮盡原則”和“互斥原則”,即現(xiàn)象總體中的任何一個個體都必須而且只能歸屬于某一個組,不能出現(xiàn)遺漏或重復出選的情況;3其目的是在同質(zhì)性的基

9、礎(chǔ)上研究總體的內(nèi)在差異性,即盡量體現(xiàn)出分組標志的組間差異而縮小其組內(nèi)差異;4其在體現(xiàn)分組標志的組間差異的同時,可能掩蓋了其他標志的組間差異,任何統(tǒng)計分組的意義都有一定的限定性。 分類:分組標志多少:簡單分組:只按一個標志分組 復合分組:按兩個或兩個以上標志進行層疊式分組,先按第一個標志分組,再按第二個兩個標志進行復合分組時,還可以用交叉式,形成交叉分組表. 分組標志性質(zhì):品質(zhì)分組,即屬性分組,總體按一個或多個品質(zhì)標志分組,分組標志一經(jīng)確定,各組名稱、界限和組數(shù)也就隨之確定. 數(shù)量分組,即變量分組,總體按一個或多個數(shù)量標志分組。是反映總體內(nèi)部數(shù)量差異的重要方法;難點是合理確定組間數(shù)量界限和分組數(shù)

10、,其結(jié)果形成變量數(shù)列。分布數(shù)列:在統(tǒng)計分組的基礎(chǔ)上,將總體中的所有個體按組歸類排列,并計算出各組的個體數(shù),就形成頻數(shù)分布。分配在各組的個體數(shù),稱為頻數(shù)或次數(shù),各組頻數(shù)或次數(shù)之和稱為總頻數(shù)或總次數(shù),各組頻數(shù)于總頻數(shù)之比稱為頻率。將各組的頻數(shù)或頻率按分組的一定順序加以排列,就形成分布數(shù)列.分布數(shù)列有兩個構(gòu)成要素:統(tǒng)計分組所形成的各個組和各組的聘書或頻率。 分類:按分組標志的性質(zhì)不同,分為品質(zhì)標志的品質(zhì)分布數(shù)列和按數(shù)量標志分組的變量分布數(shù)列。變量數(shù)列又分為單項式數(shù)列(一個變量值表示一個組)和組距式數(shù)列(一個變量區(qū)間表示一個組的變量數(shù)列). 頻數(shù)密度是頻數(shù)與組距之比,頻率密度是頻率與組距之比,各組的頻

11、數(shù)密度或頻率密度可以進行比較.注意:1。最小組的下限應略低于總體的最小變量值,最大組的上限應略大于總體的最大變量值;2。連續(xù)型變量的各組組限必須重疊,采用“上限不在內(nèi)”原則;3。開口組:最小組只有上限,最大組只有下限;開口組一般按相鄰組的組距加以確定,進而確定上下限。4.組中值,代表各組變量值的一般水平的數(shù)值,是各組上限與下限的簡單算術(shù)平均數(shù)。第三章:變量分布特征的描述變量分布特征的描述:1。變量分布的集中趨勢,反映變量分布中各變量值向中心值靠攏或聚集的程度;2。變量分布的離中趨勢,反映變量分布中變量值遠離中心值的程度;3。變量分布的形狀,反映變量分布的偏斜程度和尖陡程度.平均指標:將變量的各

12、變量值差異抽象化,以反映變量值一般水平或平均水平的指標,即反映變量分布中心值或代表值的指標。平均指標的拘役表現(xiàn)為平均數(shù),平均數(shù)因計算方法不同分為數(shù)值平均數(shù)和位置平均數(shù)。 作用:1。反映變量分布的一般水平,幫助人們對研究現(xiàn)象的一般數(shù)量特征有一個可觀的認識; 2。利用平均指標可以對不同空間的發(fā)展水平進行比較,消除因總體規(guī)模不同而不能直接比較的因素,以反映他們之間總體水平上能夠存在的差距,進而分析產(chǎn)生差距的原因。 3.利用平均指標可以對某一現(xiàn)象總體在不同時間上的發(fā)展水平進行比較,以說明這種現(xiàn)象發(fā)展變化的趨勢或規(guī)律性。 4.利用平均指標可以分析現(xiàn)象之間的依存關(guān)系或進行數(shù)量上的推算 5。平均指標可以作為

13、研究和評價事物的一種數(shù)量標準或參考。算術(shù)平均數(shù):也稱均值,是變量的所有取值的總和除以變量值個數(shù)的結(jié)果。 簡單算術(shù)平均數(shù):根據(jù)未分組數(shù)據(jù)計算的,直接將變量的每一個變量值相加,除以變量值的個數(shù)。x=x1+x2+xnn=i=1nXi(可簡記為x=xin) 加權(quán)算術(shù)平均數(shù):根據(jù)變量數(shù)列,即以各組變量值(或組中值)乘以相應的頻數(shù)求出各組標志總量,加總各組標志總量得出總體標志總量,再用總體標志總量除以總頻數(shù)。x=x1f1+xkfkf1+fk=i=1kXifii=1kfi(可簡記為x=Xififi)算術(shù)平均數(shù)的數(shù)學性質(zhì):1.各變量值與算術(shù)平均數(shù)的離差之和等于零,即Xi-x=0(對于簡單算術(shù)平均數(shù))或xi-f

14、i=0(對于加權(quán)算術(shù)平均數(shù));2。各變量值與算術(shù)平均數(shù)的離差平方和為最小值,即Xi-x2=最小值或Xi-x2Xi-x02,只有當x=x0時,等號成立。算術(shù)平均數(shù)優(yōu)缺點: 優(yōu):1??梢岳盟阈g(shù)平均數(shù)來推算總體標志總量,算術(shù)平均數(shù)與變量值之乘積等于總體標志總量(變量值總和);2.由算術(shù)平均數(shù)的數(shù)學性質(zhì)知,算術(shù)平均數(shù)在數(shù)理上具有無偏性與有效性(方差最小性);3。其具有良好的代數(shù)運算功能 局限性:1。算術(shù)平均數(shù)易受特殊值(特大或特小值)影響; 2。根據(jù)組距數(shù)列計算算術(shù)平均數(shù)時,由于組中值具有假定性而使得計算結(jié)果只是一個近似值,尤其是當組距數(shù)列存在開口組時,算術(shù)平均數(shù)的準確性會更差。調(diào)和平均數(shù):是平均數(shù)

15、的一種,是變量值的倒數(shù)的算術(shù)平均數(shù).分為簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。 簡單調(diào)和平均數(shù):當各組的標志總量相等時,所計算的調(diào)和平均數(shù)稱為簡單調(diào)和平均數(shù);設(shè)總體分為k組,每個組的標志總量都為km。H=kmmx1+mXk=ki=1k1Xi(可簡記為H=k1xi) 加權(quán)調(diào)和平均數(shù):當各組標志總量不相等時,所計算的調(diào)和平均數(shù)要以各組的標志總量為權(quán)數(shù),其結(jié)果為加權(quán)調(diào)和平均數(shù)。H=m1+mkm1x1+mkxk=i=1kmii=1kmixi(可簡記為H=mimixi)簡單和加權(quán)調(diào)和平均數(shù)的聯(lián)系和區(qū)別:區(qū)別在于計算過程中應用的數(shù)據(jù)條件的不同前者以各組頻數(shù)為權(quán)數(shù),后者以各組標志總量為權(quán)數(shù),但它們都符合總體標志總

16、量與總體總頻數(shù)的對比關(guān)系,事實上,兩者是可以相互變通的。對于同一現(xiàn)象,無論用加權(quán)或是簡單調(diào)和平均數(shù),計算結(jié)果是相等的,無非是因數(shù)據(jù)條件不同采用了不同的計算形式。由相對數(shù)或平均數(shù)計算平均數(shù) 不論是用加權(quán)算術(shù)平均數(shù)公式還是加權(quán)調(diào)和平均數(shù),都要從相對數(shù)或平均數(shù)指標本身的經(jīng)濟含義出發(fā)來計算,這是一個很重要的原則。幾何平均數(shù):是計算平均比率或平均速度常用的一種方法。分為簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)。 簡單幾何平均數(shù):就是變量的n個變量值連乘積的n次方根。G=nx1.x2xn=nk=1nAk(可簡記為G=nxi) 加權(quán)調(diào)和平均數(shù):當計算幾何平均數(shù)的各種變量值出現(xiàn)的次數(shù)不等,即數(shù)據(jù)經(jīng)過了統(tǒng)計分組時,則應采

17、用加權(quán)幾何平均數(shù)。G=i=1kfix1f1xkfk=i=1kfii=1kXifi(可簡記為G=i=1kfiXif)算術(shù)、調(diào)和、幾何平均數(shù)的數(shù)學關(guān)系:單從數(shù)學意義上說三者大小關(guān)系為:H=G=x位置平均數(shù) 中位數(shù):變量的所有變量值按定徐尺度排序后,處于中間位置的變量值,由于處于中間位置,可以用來代表變量值的一般水平,可以預測定量變量的集中趨勢,也可測定定序變量的集中趨勢,但不適用于定類變量。 中位數(shù)確定:1。根據(jù)未經(jīng)分組的原始數(shù)據(jù)來確定 x(n+12), n為奇數(shù) me= 12 x(n2)+x(n+12) ,n為偶數(shù) 2.根據(jù)變量分布數(shù)列來確定 按組距數(shù)列來計算中位數(shù),首先要計算各組的累計頻數(shù),然

18、后找出中位數(shù)所在的位置,即累計次數(shù)大于或等于f2的組,(嚴格上講是f+12,簡化起見取f2). 下限公式:me=L+fi2-SMe-1fmed(L為中位數(shù)所在組的下限,fme為中位數(shù)所在組的頻數(shù),sMe-1為向上累計至中位數(shù)所在組下一組止的累計頻數(shù),d為中位數(shù)所在組的組距。) 上限公式: me=U-fi2-sme+1fmed U位中位數(shù)所在組的上限,sme+1為向下累計之中位數(shù)所在組上一組的累計頻數(shù). 中位數(shù)優(yōu)缺點: 優(yōu):1.作為一種位置平均數(shù),概念比較清晰; 2。不受變量數(shù)列中特殊值的影響; 3.組距數(shù)出現(xiàn)開口組時,對中位數(shù)無影響 4.當某些變量不能表現(xiàn)為數(shù)值但可以定序時,不能計算數(shù)值平均數(shù)

19、而可以確定中位數(shù). 局限性:1.不能像算術(shù)平均數(shù)那樣進行代數(shù)運算; 2。除了變量數(shù)列的中間部分數(shù)值外,其他數(shù)值的變化都不對中位數(shù)產(chǎn)生影響,因此中位數(shù)的靈敏度較低。分位數(shù):以四分位數(shù)為例,分為第一、第二和第三四分位數(shù),分別為QL,QM,QU。位置分別為:n+14,2(n+1)4,3(n+1)4.具體計算方法可參考中位數(shù)的計算方法.眾數(shù):是變量數(shù)列中出現(xiàn)次數(shù)最多、頻率最高的變量值。 眾數(shù)的確定:1。根據(jù)單項式數(shù)列確定眾數(shù)直接找出頻數(shù)最多或出現(xiàn)頻率最高的變量值即可。 2.根據(jù)組距式數(shù)列來確定眾數(shù),先要找出頻數(shù)最多的一組作為眾數(shù)組,然后運用下列公式來確定眾數(shù):下限公式:m0=L+11+2d 式中1為眾

20、數(shù)組頻數(shù)與上一組從左往右頻數(shù)之差,2為眾數(shù)組頻數(shù)與下一組頻數(shù)之差,L d含義與中位數(shù)公式中一樣。上限公式:m0=U-21+2dU位眾數(shù)組的上限眾數(shù)特點:1. 不受數(shù)列中特殊值的影響,表示某些現(xiàn)象的一般水平會具有較好的代表性;2. 具有較廣的應用面,可用于測定任何變量的集中趨勢;3. 眾數(shù)只有在總頻數(shù)充分多且某一組的頻數(shù)明顯高于其他組時才有意義,若各組的頻數(shù)相差不多,則不能確定頻數(shù);4. 有時一個數(shù)列會有兩個組的頻數(shù)明顯最多,這就會有兩個眾數(shù),該數(shù)列屬于雙眾數(shù)數(shù)列.中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系:1. 在變量分布完全對稱(正態(tài)分布)時,中位數(shù)、眾數(shù)和算術(shù)平均數(shù)三者完全相同,即x=me=m02.

21、在變量分布不對稱(偏態(tài)分布)時,中位數(shù)、眾數(shù)和算術(shù)平均數(shù)三者之間存在著差異.當算術(shù)平均數(shù)受極大值一端影響較大時,變量分布向右偏(右邊更低),三者關(guān)系為m0mex;當算術(shù)平均數(shù)受極小值一端影響較大時,變量分布向左偏(左邊更低),三者關(guān)系為xme3時,變量分布的峰度為尖頂峰度。更進一步,當K值接近于1。8時,變量分布曲線就趨向于一條水平線,表示各組分配的頻數(shù)接近于相同。當K小于1。8時,則變量分布曲線為“U”形曲線,表示變量分布的頻數(shù)分配是“中間少,兩頭多。第七章 相關(guān)回歸分析現(xiàn)象之間的數(shù)量關(guān)系,大致可以分為兩種不同的類型:函數(shù)關(guān)系和統(tǒng)計相關(guān)關(guān)系。函數(shù)關(guān)系指現(xiàn)象之間的確定性的數(shù)量依存關(guān)系。(兩個變

22、量x與y之間的函數(shù)關(guān)系一般可以表示為y=f(x)).相關(guān)關(guān)系:也稱統(tǒng)計相關(guān),是指現(xiàn)象之間存在的非確定性的數(shù)量依存關(guān)系。數(shù)學一般形式:y=f(x)+a,其中a為隨機誤差。值得注意的是,相關(guān)關(guān)系不能通過個別現(xiàn)象體現(xiàn)出其關(guān)系的規(guī)律性,必須在大量現(xiàn)象中才能得到體現(xiàn)。相關(guān)關(guān)系分類:1. 按照相關(guān)關(guān)系涉及的因素(變量)的多少,可分為單相關(guān)和復相關(guān);2. 按照相關(guān)關(guān)系的表現(xiàn)形式不同,可分為線性相關(guān)于非線性相關(guān)。對于一元相關(guān),即為直線相關(guān)和曲線相關(guān);3. 對于單相關(guān),按照現(xiàn)象數(shù)量變化的方向不同,可分為正相關(guān)和負相關(guān)4. 按照相關(guān)程度不同,可以分為完全相關(guān)、不完全相關(guān)和無相關(guān)。相關(guān)分析:廣義上講,對兩個或兩個以

23、上現(xiàn)象之間數(shù)量上的不確定性依存關(guān)系進行的統(tǒng)計分析,即為相關(guān)分析。 內(nèi)容:1. 判斷確定現(xiàn)象之間有無關(guān)系以及相關(guān)關(guān)系的具體表現(xiàn)形式;2. 確定相關(guān)關(guān)系的密切程度;3. 檢驗現(xiàn)象統(tǒng)計相關(guān)的顯著性,包括檢驗相關(guān)關(guān)系的存在性、檢驗相關(guān)關(guān)系強度是否達到一定水平,檢驗兩對現(xiàn)象相關(guān)程度的差異性,估計相關(guān)系數(shù)的取值.相關(guān)關(guān)系的測度: 一:相關(guān)關(guān)系的一般判斷1. 定性分析:根據(jù)一定的經(jīng)濟理論和實踐經(jīng)驗的總結(jié),對社會經(jīng)濟現(xiàn)象進行科學的定性分析,以判斷它們之間是否具有相關(guān)關(guān)系以及相關(guān)關(guān)系的類型。2. 相關(guān)表和相關(guān)圖:簡單相關(guān)表:利用未分組的原始資料,將兩個現(xiàn)象的變量值一一對應地填列在同一張表格上,這就叫簡單相關(guān)表,

24、適用于資料的項數(shù)較少的情況.分組相關(guān)表:1. 單變量分組表:只對自變量進行分組,因變量不分組,只是計算出其次數(shù)和平均數(shù),這種表成為單變量分組表.可以使原始資料大大簡化,在原始資料較多的情況下,使用單變量分組表能更清晰地反映現(xiàn)象間的相互依存關(guān)系,找出變量間數(shù)據(jù)變動的規(guī)律性。2. 雙分組變量表:將自變量和因變量都進行分組制成的表稱為雙變量分組表.適用于大量復雜數(shù)據(jù)的處理和分析。相關(guān)系數(shù)的測定: 直線相關(guān)系數(shù)的計算:對于定距尺度的連續(xù)變量x和y,測定它們之間的線性相關(guān)關(guān)系最常用的方法是采用皮爾遜相關(guān)系數(shù)。根據(jù)資料情況不同,有不同的計算形式。其中的積差法是最基本表達式。1. 積差法:r=sxy2sxs

25、y其中r為直線相關(guān)系數(shù),sx是變量數(shù)列x的標準差, sy是變量數(shù)列y的標準差, sxy2是變量數(shù)列x和y的協(xié)方差。sxy2=(x-x)(y-y)n-12. 積差法在計算過程中要使用兩個數(shù)列的平均數(shù),當平均數(shù)的小數(shù)位很多或除不盡時,計算會比較繁雜且影響最終結(jié)果的精確性。因此常常采用其簡捷公式:r=nxy-xyny2-(y)2nx2-(x)23. 利用分組資料計算相關(guān)系數(shù)(1) 根據(jù)單變量分組表計算相關(guān)系數(shù),可以在簡單相關(guān)的基本公式上,以每組的次數(shù)作為權(quán)數(shù)進行加權(quán)計算,公式如下:r=x-xy-yf(y-y)2f(x-x)2f(2) 根據(jù)雙變量分組表,也能計算相關(guān)系數(shù),但一般很少采用。計算公式為:r

26、=(x-x)(y-y)fxy(y-y)2fy(x-x)2fxfxy是x與y交叉組的次數(shù).直線相關(guān)系數(shù)的統(tǒng)計檢驗:檢驗的內(nèi)容包括兩個部分,一是總體線性相關(guān)的存在性檢驗,即檢驗總體線性相關(guān)系數(shù)是否為零;二是總體線性相關(guān)差異性檢驗,檢驗某一總體線性相關(guān)程度是否等于(或者單側(cè)檢驗大于或小于)某一特定值,以及檢驗兩個相關(guān)系數(shù)是否來自同一相關(guān)總體。 設(shè)隨機變量(X,Y)服從正態(tài)分布??傮w相關(guān)系數(shù)記為P,則對于由樣本資料(xi,yi)(i=1,2,,n)計算的皮爾遜相關(guān)系數(shù)r,需要檢驗一下原假設(shè)和備擇假設(shè): Ho:p=0 H1:p0在H0成立情況下,有以下t統(tǒng)計量:t=rn-21-r2t(n-2)在給定顯著性水平下,當tt2(n2),即表示總體線性相關(guān)系數(shù)顯著不等于零,即線性相關(guān)關(guān)系(在一定程度上)是存在的。皮爾遜直線相關(guān)系數(shù)r的取值含義:(1) r的取值有一定范圍,在1和+1之間,即1=r0表示正相關(guān);r0表示負相關(guān)。(3) 相關(guān)程度的大小要看相關(guān)系數(shù)絕對值的大小。即r越接近1,表示密切程度越強;|r越接近于0,表示相關(guān)密切程度越弱;(4) 為了使判斷有一定的標準,一般將相關(guān)程度設(shè)為以下幾個不同的等級:r0.3為無相關(guān),0。3=r=0.8為低度相關(guān),0。51,則在遞增部分找,如果結(jié)果1,則在遞減部分找。然后在年分數(shù)n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論