第二章 地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)_第1頁
第二章 地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)_第2頁
第二章 地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)_第3頁
第二章 地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)_第4頁
第二章 地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)第二章地理系統(tǒng)與地理數(shù)據(jù)系統(tǒng)第一節(jié)第一節(jié) 地理系統(tǒng)的基本概念地理系統(tǒng)的基本概念第二節(jié)第二節(jié) 地理數(shù)據(jù)系統(tǒng)地理數(shù)據(jù)系統(tǒng)第三節(jié)第三節(jié) 地理數(shù)據(jù)的分布地理數(shù)據(jù)的分布 第一節(jié)第一節(jié) 地理系統(tǒng)的基本概念地理系統(tǒng)的基本概念系統(tǒng)的概念系統(tǒng)的概念系統(tǒng)的分類系統(tǒng)的分類地理區(qū)域系統(tǒng)及其特點地理區(qū)域系統(tǒng)及其特點一一 系統(tǒng)的概念系統(tǒng)的概念(一)系統(tǒng)的產(chǎn)生(一)系統(tǒng)的產(chǎn)生 20世紀20年代 奧地利生物學(xué)家路馮貝塔朗菲提出 (二)系統(tǒng)的概念(二)系統(tǒng)的概念1.1.貝塔朗菲的界定:貝塔朗菲的界定: 處于一定的相互作用關(guān)系中并與環(huán)境發(fā)生關(guān)系的的各組成部分(系統(tǒng))的整體。2.2.流行概念:流行概念:

2、 由相互作用和相互依賴的若干組成部分結(jié)合而成的具有特定功能的整體。(三)地理系統(tǒng)(三)地理系統(tǒng) 地理系統(tǒng)是地球表面的巖石圈、水圈、大氣圈、生物圈和人類活動相互作用的物質(zhì)、能量和信息運動系統(tǒng)。 二二 系統(tǒng)的分類系統(tǒng)的分類(一)自然系統(tǒng)和人工系統(tǒng)(一)自然系統(tǒng)和人工系統(tǒng) 自然系統(tǒng)是由自然物組成的自然形成的系統(tǒng)。 人工生態(tài)系統(tǒng)是由人類創(chuàng)造、建立的系統(tǒng)。(二)實體系統(tǒng)和概念系統(tǒng)(二)實體系統(tǒng)和概念系統(tǒng) 實體系統(tǒng)是以物質(zhì)實體為構(gòu)成要素組成的系統(tǒng)。 概念系統(tǒng)是由概念、原理、原則、方法、制度、程序等概念性的非物質(zhì)實體所構(gòu)成的系統(tǒng)。(三)動態(tài)系統(tǒng)和靜態(tài)系統(tǒng)(三)動態(tài)系統(tǒng)和靜態(tài)系統(tǒng) 動態(tài)系統(tǒng)是指系統(tǒng)狀態(tài)隨時間會

3、發(fā)生變化的系統(tǒng) 靜態(tài)系統(tǒng)的狀態(tài)則不隨時間而變化,是動態(tài)系統(tǒng)處于穩(wěn)定時的一種極限狀態(tài)(四)全球系統(tǒng)與區(qū)域系統(tǒng)(四)全球系統(tǒng)與區(qū)域系統(tǒng) 全球系統(tǒng)是指由整個地球構(gòu)成的一個整體,由于研究常集中于地球表層,也成為地球表層系統(tǒng)。 區(qū)域系統(tǒng)是指組成一個國家或地區(qū)的要素或組成部分構(gòu)成的整體,可一被認為是地球表層系統(tǒng)的一個子系統(tǒng)。三三 地理區(qū)域系統(tǒng)及其特點地理區(qū)域系統(tǒng)及其特點(一)地理區(qū)域系統(tǒng)的概念(一)地理區(qū)域系統(tǒng)的概念 地理區(qū)域系統(tǒng)是指特定區(qū)域范圍內(nèi)由若干子區(qū)域和部門組成的,包括人口、人才、經(jīng)濟、生態(tài)、資源、能源、交通、教育、衛(wèi)生、管理和信息等各個方面的復(fù)雜的多層次的開放性動態(tài)系統(tǒng)。(二)地理區(qū)域系統(tǒng)的特點

4、(二)地理區(qū)域系統(tǒng)的特點 1.系統(tǒng)性、整體性、綜合性 2.區(qū)域性、開放性、層次性 3.隨機性、動態(tài)性 第二節(jié)第二節(jié) 地理數(shù)據(jù)系統(tǒng)地理數(shù)據(jù)系統(tǒng)地理數(shù)據(jù)的定義地理數(shù)據(jù)的定義地理數(shù)據(jù)類型地理數(shù)據(jù)類型地理數(shù)據(jù)的基本特征地理數(shù)據(jù)的基本特征地理數(shù)據(jù)的變換地理數(shù)據(jù)的變換一一 地理數(shù)據(jù)的定義地理數(shù)據(jù)的定義 所謂地理數(shù)據(jù),就是用一定的測度方式描述和衡量地理對象的有關(guān)量化標志。二二 地理數(shù)據(jù)的類型(兩大基本類型)地理數(shù)據(jù)的類型(兩大基本類型)(一)空間數(shù)據(jù)(一)空間數(shù)據(jù) 1.1.空間數(shù)據(jù)的定義空間數(shù)據(jù)的定義 是指主要用于描述地理實體、地理要素、地理現(xiàn)象、地理事件及地理過程產(chǎn)生、存在和發(fā)展的地理位置、區(qū)域范圍及空間

5、聯(lián)系。坐標,是描述空間數(shù)據(jù)的基本手段,一般用經(jīng)緯度坐標或公里網(wǎng)來表示。經(jīng)度緯度濟南117.3136.67青島120.3636.09淄博118.0636.00棗莊117.5734.84東營118.0737.42煙臺121.3536.54濰坊119.1136.70濟寧116.3935.40泰安117.1336.18威海122.1237.47日照119.5435.39萊蕪117.6736.20臨沂118.3435.05德州116.3037.44聊城115.9836.44濱州118.0337.37菏澤115.4735.252.2.空間數(shù)據(jù)的表達空間數(shù)據(jù)的表達 一般,空間數(shù)據(jù)用來可表達點、線、面三種幾何

6、實體以及描述它們之間空間聯(lián)系的拓撲關(guān)系。(1 1)點:)點:由一個獨立的坐標點(x,y)定位,是空間上不可再分的幾何實體。它可以表示精確的地理位置點,也可以是一些地理實體的抽象, 例如,道路的交叉點、河流的交匯點、小比例尺地圖上的城市,村鎮(zhèn) (2 2)線:)線:由若干個(至少兩個,理論上是無窮個)坐標點(xi,yi)(i =1,2,)定義,有一定的長度和走向,表示線狀地物或點實體之間的聯(lián)系。 例如,交通線、河流及各種地理區(qū)域的界線等(3 3)面:)面:它表示在空間上連續(xù)分布的地理景觀或區(qū)域。 例如,土壤或植被的分布區(qū)、居住區(qū)、行政區(qū)等(4 4)點、線、面之間的拓撲關(guān)系。 點點面面線線網(wǎng)絡(luò)網(wǎng)絡(luò)地

7、帶地帶地域類型地域類型網(wǎng)絡(luò)(由點和線組合形成)、地域類型(由點和面網(wǎng)絡(luò)(由點和線組合形成)、地域類型(由點和面組合形成)地帶(點、線和面組合形成)組合形成)地帶(點、線和面組合形成)(二)屬性數(shù)據(jù)(二)屬性數(shù)據(jù)1.1.屬性數(shù)據(jù)的定義屬性數(shù)據(jù)的定義 是指主要用于描述地理實體、地理要素、地理現(xiàn)象、地理事件及地理過程的屬性特征的數(shù)據(jù)。2.2.屬性數(shù)據(jù)的分類屬性數(shù)據(jù)的分類 (1)數(shù)量標志數(shù)據(jù)數(shù)量標志數(shù)據(jù):描述地理對象數(shù)量屬性特征的數(shù)據(jù)。 間隔尺度(間隔尺度(interval scaleinterval scale)數(shù)據(jù))數(shù)據(jù) 間隔尺度數(shù)據(jù),是以有量綱有量綱的數(shù)據(jù)形式表示測度對象在某種單位(量綱)下的絕

8、對量。例如,以毫米為量綱表示某地的降水量,以某種貨幣量綱表示某地區(qū)的GDP等 1995 1996 1997 1998 1999 2000 濟南 481.52 611.88 731.73 802.16 881.32 952.18 青島 642.03 710.20 797.70 888.39 992.83 1150.07 淄博 404.54 469.00 498.80 522.21 568.00 642.20 棗莊 169.59 205.09 214.12 210.32 227.13 248.81 東營 229.26 259.07 300.18 310.69 330.84 465.11 煙臺 57

9、5.70 650.31 725.00 740.00 800.66 879.59 濰坊 530.00 630.00 718.00 608.00 647.30 714.56 濟寧 368.18 432.19 480.57 495.51 528.71 578.44 泰安 205.15 260.38 313.52 322.10 356.30 396.40 威海 336.72 407.12 477.59 470.00 500.80 560.89 日照 114.45 138.32 157.13 175.02 185.62 209.51 萊蕪 64.55 75.4 84.02 93.27 99.1 110.

10、4 臨沂 311.8 372.5 417.40 458.8 501.59 554.6 德州 184.39 223.35 267.87 285.40 312.00 360.30 聊城 164.45 198.02 217.67 235.39 253.65 280.83 濱州 151.83 184.33 206.20 223.11 238.12 270.02 菏澤 168.52 198.30 202.45 180.40 189.94 208.59 9500年山東省各地區(qū)的GDP (單位:人民幣)比例尺度(比例尺度(ratio scaleratio scale)數(shù)據(jù))數(shù)據(jù)。 比例尺度數(shù)據(jù),是以無量綱無

11、量綱的數(shù)據(jù)形式表示測度對象的相對量。 這種數(shù)據(jù)要求事先規(guī)定一個基點,然后將其他同類數(shù)據(jù)與基點數(shù)據(jù)相比較,換算為基點數(shù)據(jù)的比例。因此,這類數(shù)據(jù)常又被稱為指數(shù)或比例數(shù)。例如,耕地復(fù)種指數(shù),工業(yè)發(fā)展指數(shù)、農(nóng)用發(fā)展指數(shù)、GDP發(fā)展指數(shù)等注:耕地復(fù)種指數(shù)是指播種面積與耕地總面積之比 規(guī)定1996年農(nóng)業(yè)產(chǎn)值為基數(shù)100 (2)品質(zhì)標志數(shù)據(jù)品質(zhì)標志數(shù)據(jù):描述地理對象品質(zhì)屬性特征的數(shù)據(jù)。 有序(有序(ordinalordinal)數(shù)據(jù))數(shù)據(jù)。 有序數(shù)據(jù),是指測度標準不連續(xù),只表示其順序關(guān)系的數(shù)據(jù),又稱等級尺度數(shù)據(jù)。 這種數(shù)據(jù)并不表示量的多少,而只是給出一個等級或次序。 例如,1,2,3等分別表示某地區(qū)GDP的

12、排位次序等城市名稱城市名稱位次位次旅游收入( 億元)旅游收入( 億元)青島青島1 1207.56207.56濟南濟南2 294.194.1煙臺煙臺3 39393威海威海4 471.471.4濟寧濟寧5 562.6962.69臨沂臨沂6 66060淄博淄博7 747.547.5泰安泰安8 846.746.7濰坊濰坊9 942.842.8日照日照101026.9926.99棗莊棗莊111120.9620.96聊城聊城12122020濱州濱州131312.7312.73東營東營14149.19.1德州德州15158.58.5菏澤菏澤16168.458.45萊蕪萊蕪17175.65.62004年山東省

13、各地區(qū)的旅游收入位次排名年山東省各地區(qū)的旅游收入位次排名 二元數(shù)據(jù)二元數(shù)據(jù) 二元數(shù)據(jù),即表示地理事物、地理現(xiàn)象或地理事件的是非判斷問題的數(shù)據(jù)。比如,0、1。 例如,在人口統(tǒng)計中,用1表示“男性”,用0表示“女性”;在一個交通網(wǎng)絡(luò)中,兩兩組合考慮結(jié)點之間有無聯(lián)線情況,1表示“兩結(jié)點間存在聯(lián)線”,0表示“兩結(jié)點不存在聯(lián)線”等名義尺度(名義尺度(nominal scalenominal scale)數(shù)據(jù))數(shù)據(jù) 名義尺度數(shù)據(jù),即用于表示地理實體、地理要素、地理現(xiàn)象或地理事件的狀態(tài)類型的數(shù)據(jù)。 例如,在土地利用現(xiàn)狀調(diào)查中,用15表示“菜地”,13表示“水澆地”,14表示“旱地”,21表示“果園”,31表

14、示“林地”等。三三 地理數(shù)據(jù)的基本特征地理數(shù)據(jù)的基本特征 1.1.數(shù)理化、形式化與邏輯化數(shù)理化、形式化與邏輯化 2.2.不確定性不確定性 (1)地理系統(tǒng)的復(fù)雜性 (2)數(shù)據(jù)誤差 3.3.多種時空尺度多種時空尺度 (1)空間尺度地理區(qū)域 (2)時間尺度地理過程 4.4.多維性多維性 空間、屬性、時間四四 地理數(shù)據(jù)的變換地理數(shù)據(jù)的變換(一)定性數(shù)據(jù)轉(zhuǎn)換成定量數(shù)據(jù)(一)定性數(shù)據(jù)轉(zhuǎn)換成定量數(shù)據(jù) 1.1.有序數(shù)據(jù)轉(zhuǎn)換有序數(shù)據(jù)轉(zhuǎn)換 測度標準不是用連續(xù)的量,而是表示其次序或等級關(guān)系的數(shù)據(jù),可以轉(zhuǎn)換成定量數(shù)據(jù) 2.2.二元數(shù)據(jù)轉(zhuǎn)換二元數(shù)據(jù)轉(zhuǎn)換 即0、1轉(zhuǎn)換,(二)數(shù)據(jù)本身轉(zhuǎn)換(二)數(shù)據(jù)本身轉(zhuǎn)換 1.1.概念概

15、念 將原始數(shù)據(jù)的每個數(shù)值通過某種特定的運算把它們變成一個新值,而且數(shù)據(jù)數(shù)值的變化不依賴于數(shù)據(jù)集合中其它數(shù)據(jù)的變化。 2.2.數(shù)據(jù)轉(zhuǎn)換的方法數(shù)據(jù)轉(zhuǎn)換的方法對數(shù)變換開方變換取倒數(shù)變換概率變換模數(shù)變換(三)地理數(shù)據(jù)的標準化(三)地理數(shù)據(jù)的標準化 1.1.概念概念 數(shù)據(jù)的標準化是指為了減少原始數(shù)據(jù)的變幅及消除其量綱的影響而對原始數(shù)據(jù)進行處理的方法。 2.2.與地理數(shù)據(jù)變換的區(qū)別與地理數(shù)據(jù)變換的區(qū)別 地理數(shù)據(jù)變換的過程中與矩陣中的其它數(shù)值沒有發(fā)生聯(lián)系。而地理數(shù)據(jù)標準化處理則發(fā)生聯(lián)系。 (min)(max)(min)jjjijijxxxxx3.3.數(shù)據(jù)標準化的主要方法數(shù)據(jù)標準化的主要方法1)極差標準化:又

16、稱“極差正規(guī)化”是指系列中的任一變量xij與其列中的最小值xj(min)之差和第j列中的最大值xj(max)與最小值xj(min)之差的比值。 3. 3.數(shù)據(jù)標準化的主要方法數(shù)據(jù)標準化的主要方法 2)標準差標準化:是指系列中的任一變量xij與其列中的均值xj之差,再除以其標準差(sj)。jjijijsxxx 3. 3.數(shù)據(jù)標準化的主要方法數(shù)據(jù)標準化的主要方法 3) 極大值標準化:是指系列中的任一變量xij與其列中的最大值xj(max)之比。(max)jijijxxx 3. 3.數(shù)據(jù)標準化的主要方法數(shù)據(jù)標準化的主要方法 4)極小值標準化:是指系列中的任一變量xij與其列中的最小值xj(min)之

17、比。(min)jijijxxx 第三節(jié)第三節(jié) 地理數(shù)據(jù)分布特征地理數(shù)據(jù)分布特征地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的統(tǒng)計整理地理數(shù)據(jù)的統(tǒng)計整理地理數(shù)據(jù)的分布特征地理數(shù)據(jù)的分布特征一一 地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的采集與處理1.來自觀測、測量部門的有關(guān)專業(yè)數(shù)據(jù)。來自觀測、測量部門的有關(guān)專業(yè)數(shù)據(jù)。例如:水文觀測站、氣象觀測站、環(huán)境監(jiān)測部門例如:水文觀測站、氣象觀測站、環(huán)境監(jiān)測部門2.來自統(tǒng)計年鑒、統(tǒng)計公報中的有關(guān)自然資源及來自統(tǒng)計年鑒、統(tǒng)計公報中的有關(guān)自然資源及社會經(jīng)濟發(fā)展數(shù)據(jù)。社會經(jīng)濟發(fā)展數(shù)據(jù)。3.來自有關(guān)單位或個人的不定期的典型調(diào)查數(shù)據(jù)、來自有關(guān)單位或個人的不定期的典型調(diào)查數(shù)據(jù)、

18、抽樣調(diào)查數(shù)據(jù)。抽樣調(diào)查數(shù)據(jù)。(一)地理數(shù)據(jù)的渠道來源(一)地理數(shù)據(jù)的渠道來源4.來自政府公報、政府文件中的有關(guān)數(shù)據(jù)。來自政府公報、政府文件中的有關(guān)數(shù)據(jù)。5.來自檔案、圖書等文獻資料中的有關(guān)數(shù)據(jù)。來自檔案、圖書等文獻資料中的有關(guān)數(shù)據(jù)。6.來自互聯(lián)網(wǎng)(來自互聯(lián)網(wǎng)(Internet)的有關(guān)共享數(shù)據(jù)。)的有關(guān)共享數(shù)據(jù)。7.地圖圖件。地形圖、影像地圖、專題地圖地圖圖件。地形圖、影像地圖、專題地圖8.遙感數(shù)據(jù)。各種航空遙感數(shù)據(jù)和衛(wèi)星遙感數(shù)據(jù)遙感數(shù)據(jù)。各種航空遙感數(shù)據(jù)和衛(wèi)星遙感數(shù)據(jù)相關(guān)數(shù)據(jù)網(wǎng)站:(二)采集地理數(shù)據(jù)過程中需要注意的問題(二)采集地理數(shù)據(jù)過程中需要注意的問題 1.數(shù)據(jù)的完備性和可靠性。數(shù)據(jù)的完備

19、性和可靠性。 2.在數(shù)據(jù)采集過程中,最大限度地減小數(shù)據(jù)的在數(shù)據(jù)采集過程中,最大限度地減小數(shù)據(jù)的誤差。誤差。 3.在數(shù)據(jù)采集完畢后,進行檢驗,辨別真?zhèn)?,在?shù)據(jù)采集完畢后,進行檢驗,辨別真?zhèn)危ㄟ^數(shù)據(jù)篩選,去粗取精、去偽存真。通過數(shù)據(jù)篩選,去粗取精、去偽存真。(三)地理數(shù)據(jù)處理 地理數(shù)據(jù)處理,是所有地理問題研究的核心環(huán)節(jié)。地理數(shù)據(jù)處理,是所有地理問題研究的核心環(huán)節(jié)。 從理論上講,在地理學(xué)中,數(shù)學(xué)方法的運用主要有兩從理論上講,在地理學(xué)中,數(shù)學(xué)方法的運用主要有兩個目的:個目的:(1)運用數(shù)學(xué)語言對地理問題的描述,建立)運用數(shù)學(xué)語言對地理問題的描述,建立地理數(shù)學(xué)模型地理數(shù)學(xué)模型,從更高、更深層次上從更高

20、、更深層次上揭示地理問題的機理揭示地理問題的機理;(2)運用有關(guān)數(shù)學(xué)方法,通過定量化的)運用有關(guān)數(shù)學(xué)方法,通過定量化的計算和分析計算和分析,對地,對地理數(shù)據(jù)進行處理,從而理數(shù)據(jù)進行處理,從而揭示有關(guān)地理現(xiàn)象的內(nèi)在規(guī)律揭示有關(guān)地理現(xiàn)象的內(nèi)在規(guī)律。 因此,從一定意義上來說,地理數(shù)據(jù)處理也是計量地理因此,從一定意義上來說,地理數(shù)據(jù)處理也是計量地理學(xué)的任務(wù)之一。學(xué)的任務(wù)之一。 地理信息系統(tǒng)的核心功能是地理數(shù)據(jù)處理,它地理信息系統(tǒng)的核心功能是地理數(shù)據(jù)處理,它實現(xiàn)了實現(xiàn)了空間數(shù)據(jù)空間數(shù)據(jù)與與屬性數(shù)據(jù)屬性數(shù)據(jù)的完美結(jié)合的完美結(jié)合。數(shù)學(xué)方數(shù)學(xué)方法確實是其強有力的支撐法確實是其強有力的支撐。 地理計算學(xué)(地理計

21、算學(xué)(GeocomputationGeocomputation)的實質(zhì)是借助)的實質(zhì)是借助于現(xiàn)代化的于現(xiàn)代化的計算理論、計算方法和計算技術(shù)計算理論、計算方法和計算技術(shù),通,通過對過對“整體整體”和和“大容量大容量”的地理數(shù)據(jù)進行處理,的地理數(shù)據(jù)進行處理,揭示復(fù)雜地理系統(tǒng)的運行機制,探索和尋求新的揭示復(fù)雜地理系統(tǒng)的運行機制,探索和尋求新的地理系統(tǒng)理論。地理系統(tǒng)理論。 統(tǒng)計分組統(tǒng)計分組是將預(yù)處理過的數(shù)據(jù)按照某種特征或標是將預(yù)處理過的數(shù)據(jù)按照某種特征或標準分成不同的組別。準分成不同的組別。 統(tǒng)計分組標志統(tǒng)計分組標志:分組時所依據(jù)的特征或標準,有品質(zhì)標志品質(zhì)標志和數(shù)量標志數(shù)量標志。 頻數(shù)分布表頻數(shù)分布

22、表:對分組后的數(shù)據(jù),計算各組中數(shù)據(jù)對分組后的數(shù)據(jù),計算各組中數(shù)據(jù)出現(xiàn)的次數(shù)或頻數(shù)所形成的匯總表。出現(xiàn)的次數(shù)或頻數(shù)所形成的匯總表。 預(yù)處理數(shù)據(jù)分組計算頻數(shù)描述統(tǒng)計 二二 地理數(shù)據(jù)的統(tǒng)計整理(地理數(shù)據(jù)的統(tǒng)計整理(數(shù)據(jù)分組與頻數(shù)分布)數(shù)據(jù)分組與頻數(shù)分布) 頻數(shù)分布頻數(shù)分布或次數(shù)分布(次數(shù)分布(Frequency distribution):全部數(shù)據(jù)按其分組標志在全部數(shù)據(jù)按其分組標志在各組內(nèi)的分布狀況。各組內(nèi)的分布狀況。 分布在各組內(nèi)的數(shù)據(jù)個數(shù)稱為頻數(shù)頻數(shù)或次數(shù)。次數(shù)。相對頻數(shù)相對頻數(shù)(Relative frequency)/頻率頻率/比比重:重:各組頻數(shù)與全部頻數(shù)之和的比重。 概念:概念:頻數(shù)頻數(shù)/

23、次數(shù)分布;相對頻數(shù)次數(shù)分布;相對頻數(shù) (一)品質(zhì)數(shù)據(jù)的分組與頻數(shù)分布(一)品質(zhì)數(shù)據(jù)的分組與頻數(shù)分布Table, Data from a sample of 50 computer purchases(11/15,1994)IBMIBMPackard BellCompaqIBMPackard BellGateway200Packard BellCompaqCompaqGateway200Packard BellIBMAppleCompaqIBMPackard BellAppleAppleCompaqGateway2000CompaqPackard BellCompaqCompaqApplePac

24、kard BellPackard BellAppleIBMIBMAppleAppleGateway2000Packard BellAppleAppleIBMAppleIBMPackard BellAppleCompaqAppleCompaqPackard BellGateway200CompaqAppleCompaq 例例 :50個計算機購買者所購買的不同品牌的機型數(shù)據(jù)個計算機購買者所購買的不同品牌的機型數(shù)據(jù) Table, Frequency Distribution/Relative and Percentage Frequency of Computer Purchases Company

25、 Frequency Relative Frequency Percentage Frequency Apple 13 0.26 26 Compaq 12 0.24 24 Gateway2000 5 0.10 10 IBM 9 0.18 18 Packard Bell 11 0.22 22 Total 50 1.00 100分組與求頻數(shù)分組與求頻數(shù) :分組計頻分組計頻基本步驟基本步驟: 確定組數(shù)確定組數(shù) 確定組距確定組距(按組)整理成分布頻數(shù)表整理成分布頻數(shù)表 例:例:一會計事務(wù)所對其20家客戶(clients)年底帳目輯核(audits)時間(天)統(tǒng)計如下表: (二)數(shù)值數(shù)據(jù)的分組與頻數(shù)分布

26、(二)數(shù)值數(shù)據(jù)的分組與頻數(shù)分布 可先先將數(shù)據(jù)進行排序排序,然后后根據(jù)需要分組分組; 對較少的數(shù)據(jù)也可不排序直接根據(jù)需要分組。Table Year-End Audit Times(in days) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13 第一步第一步,確定組數(shù)確定組數(shù)(Number of classes)。組數(shù)的確定一般視數(shù)據(jù)本身的特點及數(shù)據(jù)的多少而定。21010loglog1NK 經(jīng)驗上經(jīng)驗上以520之間為好,尤其注意不要確定太多的組數(shù),使得每組包含的數(shù)據(jù)太少。 實際分組實際分組時常按斯特格斯(Sturges)提出

27、的經(jīng)驗公式來確定組數(shù)K:其中N為數(shù)據(jù)的個數(shù)(總體單位數(shù)或樣本數(shù)),一般對結(jié)果取整數(shù)。 上例中:上例中:K=1+lg20/lg2=1+4.32=5.32 5NKlg32. 31或查下表: 第二步第二步,確定組距確定組距:組距是一個組的上限與組距是一個組的上限與下限之差下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定: 組距組距=(最大值(最大值 - 最小值)最小值)/組數(shù)組數(shù) 上例中,組距上例中,組距=(33-12)/5=4.2,可取整數(shù),可取整數(shù)5為最為最后選定的組距。后選定的組距。 第三步,確定各組組限并據(jù)此計算組中值、整第三步,確定各組組限并據(jù)此計算組中值、整理頻數(shù)分布表。理頻數(shù)

28、分布表。 第一組下限:數(shù)據(jù)最小值第一組下限:數(shù)據(jù)最小值1/2的組距的組距 第一組上限:下限組距第一組上限:下限組距 其他組依此類推。其他組依此類推。組中值(下限上限)組中值(下限上限)/2 上例是離散型數(shù)據(jù)(天),采用組限間斷方法,因此可得頻數(shù)分布表如下:Audit Frequency Relative Percent Time(days) Frequency Frequency 1015 4 0.20 20 1520 8 0.40 40 2025 5 0.25 25 2530 2 0.10 10 3035 1 0.05 5 Total 20 1.00 100 1、分組所遵循的主要原則主要原則

29、是“不重不漏不重不漏” 。因此, 最低組限最低組限 數(shù)據(jù)的最小值, 最大組限最大組限 數(shù)據(jù)的最大值; 另外另外,數(shù)據(jù)在每組中的歸屬習(xí)慣上采用“上組限上組限不在內(nèi)不在內(nèi)”。 注意:注意: 2、對離散型數(shù)據(jù)離散型數(shù)據(jù),可采用相鄰兩組組限間斷的辦可采用相鄰兩組組限間斷的辦法解決法解決“不重不重”的問題的問題(如610,1115,1620等); 對連續(xù)型數(shù)據(jù)連續(xù)型數(shù)據(jù),往往采用相鄰兩組組限重疊,往往采用相鄰兩組組限重疊,根據(jù)根據(jù)“上限不在內(nèi)原則上限不在內(nèi)原則”解決解決“不重不重”問題問題(如5,10),10,15),15,20)等)。 上例是離散型數(shù)據(jù)(天),采用組限間斷方法修正,因此可得頻數(shù)分布表如

30、下:Audit Frequency Relative Percent Time(days) Frequency Frequency 1014 4 0.20 20 1519 8 0.40 40 2024 5 0.25 25 2529 2 0.10 10 3034 1 0.05 5 Total 20 1.00 100例子:黃土高原西部地區(qū)某山區(qū)縣的人工造林地調(diào)查數(shù)據(jù)第四步,作頻數(shù)(率)分布圖第四步,作頻數(shù)(率)分布圖某車間某車間50名工人日加工零件頻數(shù)名工人日加工零件頻數(shù)(率)(率)分布分布圖圖頻數(shù)分布圖0246810121416107112117122127132137(個)頻數(shù)05101520

31、2530頻率()累積頻數(shù)(率)圖05101520253035404550107112117122127132137(個)頻數(shù)0102030405060708090100頻率()某車間某車間50名工人日加工零件頻數(shù)名工人日加工零件頻數(shù)(率)(率)分布分布圖圖050100150200250300350(0,1(1,2(2,3(3,4(4,5(5,6(6,7(7,8(8,9(9,10(10,11)黃土高原西部地區(qū)某山區(qū)縣的人工造林地調(diào)查數(shù)據(jù)的頻數(shù)黃土高原西部地區(qū)某山區(qū)縣的人工造林地調(diào)查數(shù)據(jù)的頻數(shù)分布的直方圖分布的直方圖 將上圖各組的頻數(shù)分布從組中值位置用折線連接起來,得到頻數(shù)分布的曲線圖: 0501

32、001502002503003500.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5練習(xí):上海市年降水量統(tǒng)計051015202530709.2828.2947.21066.21185.21304.21423.21542.21661.2系列1三三 數(shù)據(jù)分布特征的描述數(shù)據(jù)分布特征的描述 對統(tǒng)計數(shù)據(jù)進行排序、分組、整理,是對數(shù)據(jù)的分布特征進行描述的一個基本方面,為進一步掌握數(shù)據(jù)分布特征及其變化規(guī)律,以進行深入的分析,還需找出反映數(shù)據(jù)分布特征的各個代表值。 統(tǒng)計學(xué)中刻劃刻劃數(shù)據(jù)分布特征數(shù)據(jù)分布特征的最主要的代表有的最主要的代表有二二:數(shù)據(jù)分布的集中趨勢集中趨勢與數(shù)

33、據(jù)分布的離散程度。離散程度。排序分組整理表述統(tǒng)計數(shù)據(jù)尋找尋找反映數(shù)據(jù)分布特征的代表值:集中趨勢集中趨勢;離散趨勢離散趨勢1 1、平均數(shù)、平均數(shù)反映反映同質(zhì)總體同質(zhì)總體和和樣本數(shù)值樣本數(shù)值的平均的平均水平和一個數(shù)列的數(shù)值的水平和一個數(shù)列的數(shù)值的“集中趨勢集中趨勢”算算術(shù)術(shù)平平均均數(shù)數(shù)未分組數(shù)據(jù)未分組數(shù)據(jù)nxxxxnxnnii).(1211分組數(shù)據(jù)分組數(shù)據(jù)inniniifxfxfxfxfnx/ ).(122111_(一)分布集中趨勢的測度(一)分布集中趨勢的測度(1) 集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中

34、心值。簡單均值(算例)原始數(shù)據(jù):105913685 . 868613951066543211XXXXXXNXXNii加權(quán)均值(算例)(個)2.12350616011KiiKiiiFFXX注意:注意: 均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,從而使均值代表某組統(tǒng)計數(shù)據(jù)的從而使均值代表某組統(tǒng)計數(shù)據(jù)的“平均水平平均水平”時失時失去意義,這時往往用去意義,這時往往用“剔除極端值剔除極端值”的方法加以修的方法加以修正。正。 算術(shù)均值算術(shù)均值具有如下性質(zhì)性質(zhì):(1)各變量值與其均值的離差和為零:01NiiXX(2)各變量值與其均值的離差平方和最?。簃in21Ni

35、iXX(2 2)幾何平均數(shù))幾何平均數(shù)定義:定義:N N個觀測數(shù)的連乘積再開個觀測數(shù)的連乘積再開N N次方所得的方根數(shù)次方所得的方根數(shù)地理意義:常用于研究某一地理要素的平均發(fā)展平均發(fā)展速度和平均增長速度(尤其是經(jīng)濟發(fā)展速度)速度和平均增長速度(尤其是經(jīng)濟發(fā)展速度)平均發(fā)展速度表明社會經(jīng)濟現(xiàn)象在一個較長時間內(nèi)的平均平均發(fā)展速度表明社會經(jīng)濟現(xiàn)象在一個較長時間內(nèi)的平均發(fā)展水平發(fā)展水平 平均增長速度表明社會經(jīng)濟現(xiàn)象在一個較長時間內(nèi)的平均增長速度表明社會經(jīng)濟現(xiàn)象在一個較長時間內(nèi)的遞增速度遞增速度 nnigxxxxxx.321長江三角洲地區(qū)長江三角洲地區(qū)GDPGDP增長速度與全國對比增長速度與全國對比02

36、46810121416濟南青島淄博棗莊東營煙臺濰坊濟寧泰安威海日照萊蕪臨沂德州聊城濱州菏澤全省增長速度 1997 199720012001年山東省各地市年山東省各地市GDPGDP年均增長速度年均增長速度計算方法:計算方法:對上述公式兩邊取對數(shù)對上述公式兩邊取對數(shù)niigxnx1ln1ln式中:式中:為幾何平均數(shù),為幾何平均數(shù),x xi i為各變量值,為各變量值,n n為變量個數(shù)為變量個數(shù) 也可以直接用下式進行計算,最常用的一種計算公式也可以直接用下式進行計算,最常用的一種計算公式nngxxx0 式中式中x x0 0為基年(或基期)數(shù)據(jù),為基年(或基期)數(shù)據(jù),x xn n為最后一年數(shù)據(jù),為最后一

37、年數(shù)據(jù),n n為為間隔年數(shù)(不包括基年)。間隔年數(shù)(不包括基年)。幾何平均數(shù)幾何平均數(shù)(算例算例) 下表為山東省下表為山東省1991199119951995年的人口數(shù),試求其人年的人口數(shù),試求其人口平均增長速度,并預(yù)測山東省口平均增長速度,并預(yù)測山東省20102010年的人口數(shù)。年的人口數(shù)。時間時間 19911992199319941995人 口人 口( (萬人萬人) )85348580862086538701 下面介紹用計算器計算增長率的方法下面介紹用計算器計算增長率的方法(1 1)用末年數(shù)值除基年數(shù)值,得到一個數(shù)值)用末年數(shù)值除基年數(shù)值,得到一個數(shù)值(2 2)然后按)然后按2ndf2ndf

38、(3 3)然后按)然后按y yx x(4 4)然后按相隔的年份,得到一個數(shù)值,用這個數(shù))然后按相隔的年份,得到一個數(shù)值,用這個數(shù)值減去值減去1 1,再乘上,再乘上100100就是所求的平均增長率。就是所求的平均增長率。用用ExcelExcel計算增長率方法介紹計算增長率方法介紹2 2、中位數(shù)、中位數(shù)中位數(shù):中位數(shù):中位數(shù)也稱中央值,它是中位數(shù)也稱中央值,它是地理數(shù)據(jù)按大小順地理數(shù)據(jù)按大小順序排列,序排列,位居中間的那個數(shù)值。在累積頻率圖上,累積頻率位居中間的那個數(shù)值。在累積頻率圖上,累積頻率為為50%50%所對應(yīng)的特征值即是中位數(shù)。所對應(yīng)的特征值即是中位數(shù)。 計算公式:計算公式:當(dāng)樣本為奇數(shù)時

39、當(dāng)樣本為奇數(shù)時:21nexM當(dāng)樣本為偶數(shù)時:當(dāng)樣本為偶數(shù)時:)(21212nnexxM(1) 對于未分組的地理數(shù)據(jù):樣本數(shù)對于未分組的地理數(shù)據(jù):樣本數(shù)n為奇數(shù)時,中位數(shù)是為奇數(shù)時,中位數(shù)是位置排在第位置排在第(n+1)/2位的數(shù)據(jù);樣本數(shù)位的數(shù)據(jù);樣本數(shù)n為偶數(shù)時,中位數(shù)是為偶數(shù)時,中位數(shù)是排在中間位置的兩個數(shù)據(jù)的平均值。排在中間位置的兩個數(shù)據(jù)的平均值。(2 2)分組的地理數(shù)據(jù):中位數(shù)的計算方法)分組的地理數(shù)據(jù):中位數(shù)的計算方法: :確定中位數(shù)確定中位數(shù)所在的組位置所在的組位置, ,按下述公式按下述公式計算中位數(shù)計算中位數(shù) mmniiefSfdLM1121或或mmniiefSfdUM1121M

40、e代表中位數(shù);代表中位數(shù);L為中位數(shù)所在組的下限值;為中位數(shù)所在組的下限值;U為中位數(shù)所在組的上限值;為中位數(shù)所在組的上限值;fm為中位數(shù)所在組的頻數(shù);為中位數(shù)所在組的頻數(shù);Sm-1為中位數(shù)所在組以下的累計頻數(shù);為中位數(shù)所在組以下的累計頻數(shù);Sm+1為中位數(shù)所在組以上的累計頻數(shù);為中位數(shù)所在組以上的累計頻數(shù);d為中位數(shù)所在組的組距。為中位數(shù)所在組的組距。3.3.眾數(shù):眾數(shù):一個地理數(shù)據(jù)中出現(xiàn)頻數(shù)(次數(shù))最多的數(shù)一個地理數(shù)據(jù)中出現(xiàn)頻數(shù)(次數(shù))最多的數(shù) 。在頻數(shù)分布曲線上的位置居在頻數(shù)分布曲線上的位置居最高點最高點 (1 1)未分組的地理數(shù)據(jù),可以根據(jù)每一個數(shù))未分組的地理數(shù)據(jù),可以根據(jù)每一個數(shù)據(jù)

41、出現(xiàn)的頻數(shù)大小直接確定眾數(shù)。據(jù)出現(xiàn)的頻數(shù)大小直接確定眾數(shù)。 (2 2)對于已經(jīng)分組的地理數(shù)據(jù),中位數(shù)的計算步)對于已經(jīng)分組的地理數(shù)據(jù),中位數(shù)的計算步驟如下:確定頻數(shù)最多的組為眾數(shù)所在組。驟如下:確定頻數(shù)最多的組為眾數(shù)所在組。 按以下公式計算眾數(shù)按以下公式計算眾數(shù)2110dLM2120dUM或或(2.4.6)M0代表眾數(shù);代表眾數(shù);L為眾數(shù)所在組的下限值;為眾數(shù)所在組的下限值;U為眾數(shù)所在組的上限值;為眾數(shù)所在組的上限值;1為眾數(shù)組頻數(shù)與下一組頻數(shù)之差;為眾數(shù)組頻數(shù)與下一組頻數(shù)之差;2為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;d為眾數(shù)所在組的組距。為眾數(shù)所在組的組距。fm為某數(shù)

42、值出現(xiàn)次數(shù)(頻數(shù))最多的組(第m組)的頻數(shù); fm-1與fm+1分別為第m-1組與m+1組的頻數(shù)。dffffffLMmmmmmmo)()(111dffffffUMmmmmmmo)()(111 例如例如在前面購買五類不同品牌 計算機的統(tǒng)計中,曾得到如右表所示 的頻數(shù)分布表。 注意:注意: 1、如果某組統(tǒng)計數(shù)據(jù)中沒有哪個數(shù)值出現(xiàn)較多的頻率(次數(shù)),則可認為該組數(shù)無眾數(shù)無眾數(shù);如果有多個數(shù)據(jù)出現(xiàn)的次數(shù)(頻率)較多,則認為有多個眾數(shù)有多個眾數(shù)。 在有多個眾數(shù)的情況下,則對眾數(shù)的關(guān)注度下降,因為多眾數(shù)對描述數(shù)據(jù)位置無多大幫助。 2、對描述品質(zhì)數(shù)據(jù)的分布特征的“位置”測度只能用眾數(shù)。Company Fre

43、quency Apple 13 Compaq 12Gateway2000 5 IBM 9Packard Bell 11 顯然,眾數(shù),即個人購買最多的機算機品牌是Apple。在這類數(shù)據(jù)中,在這類數(shù)據(jù)中,“均值均值”與與“中位數(shù)中位數(shù)”是沒有任何意是沒有任何意義的。義的?!氨姅?shù)眾數(shù)”提供了頻數(shù)最高的個提供了頻數(shù)最高的個人電腦購買品牌。人電腦購買品牌。例例1:表表1給出了某農(nóng)場各農(nóng)田地塊的面積,試計算給出了某農(nóng)場各農(nóng)田地塊的面積,試計算其平均值、中位數(shù)和眾數(shù)。其平均值、中位數(shù)和眾數(shù)。表表1 1 某農(nóng)場各農(nóng)田地塊的面積某農(nóng)場各農(nóng)田地塊的面積 應(yīng)按照未分組數(shù)據(jù)計算其平均值、中位數(shù)和應(yīng)按照未分組數(shù)據(jù)計算其

44、平均值、中位數(shù)和眾數(shù),計算結(jié)果見上表最后三列。眾數(shù),計算結(jié)果見上表最后三列。 例例2:表:表2給出了中國西部地區(qū)某城市給出了中國西部地區(qū)某城市2000年家庭月收年家庭月收入的抽樣調(diào)查結(jié)果,試計算其平均值、中位數(shù)和眾數(shù)。入的抽樣調(diào)查結(jié)果,試計算其平均值、中位數(shù)和眾數(shù)。表表2 2 中國西部地區(qū)某城市中國西部地區(qū)某城市2000年家庭月收入的抽樣年家庭月收入的抽樣調(diào)查結(jié)果調(diào)查結(jié)果 解題步驟解題步驟: : (1)用公式用公式(2.4.22.4.2)計算平均數(shù)計算平均數(shù) (2)計算中位數(shù)。先確定中位數(shù)所在組的位置,再計算中位數(shù)。先確定中位數(shù)所在組的位置,再按照分組中位數(shù)計算公式計算中位數(shù)按照分組中位數(shù)計算

45、公式計算中位數(shù) Me =3 588.46(元)(元)x=3 899.06(元)(元) (3)計算眾數(shù),先確定眾數(shù)所在組,再按照分組計算眾數(shù),先確定眾數(shù)所在組,再按照分組眾數(shù)計算公式計算眾數(shù)。眾數(shù)計算公式計算眾數(shù)。 顯然,眾數(shù)所在組應(yīng)該在第二組。顯然,眾數(shù)所在組應(yīng)該在第二組。 眾數(shù)眾數(shù)M0 =3 476.19 (元)。(元)。 1、如果數(shù)據(jù)具有單一眾數(shù),且分布是對稱的,則眾數(shù)Mo、中位數(shù)Me 與均值 相等,即 ;XMMeooeMMXoeMMXX)(31XMXMOe4、中位數(shù)、眾數(shù)與算術(shù)平均數(shù)的關(guān)系、中位數(shù)、眾數(shù)與算術(shù)平均數(shù)的關(guān)系 3、在偏斜度適度的情況下,不論是左偏還是右偏,中位數(shù)與算術(shù)平均數(shù)之

46、差約等于眾數(shù)與算術(shù)平均數(shù)之差的1/3,即有如下經(jīng)驗公式: 當(dāng)分布右偏時(說明存在極端大的值) 2、對于非對稱分布, 當(dāng)分布左偏時(說明存在極端小的值)眾數(shù)、中位數(shù)和均值都是對數(shù)據(jù)集中趨勢的測度。眾數(shù)、中位數(shù)和均值都是對數(shù)據(jù)集中趨勢的測度。 1、均值、均值由全部數(shù)據(jù)計算,包含了全部數(shù)據(jù)的信息,具有良好的數(shù)學(xué)性質(zhì),當(dāng)數(shù)據(jù)接近對稱分布時,具有較好的代表性;但對于偏態(tài)分布,其代表性較差。 2、中位數(shù)、中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響,對于偏態(tài)分布的數(shù)據(jù),其代表性要比均值好。 3、眾數(shù)、眾數(shù)是一組數(shù)據(jù)分布的峰值,是一種位置的代表,當(dāng)數(shù)據(jù)的分布具有明顯的集中趨勢時,尤其對于偏態(tài)分布

47、,眾數(shù)的代表性比均值好。 4、對接近正態(tài)的分布數(shù)據(jù),常用均值均值描述數(shù)據(jù)的集中趨勢;對偏態(tài)分布,常用眾數(shù)眾數(shù)或中位數(shù)中位數(shù)描述數(shù)據(jù)的集中趨勢。 眾數(shù)、中位數(shù)和均值的應(yīng)用場合眾數(shù)、中位數(shù)和均值的應(yīng)用場合 對數(shù)據(jù)分布特征的另一個測度指標是數(shù)據(jù)分布離散程度數(shù)據(jù)分布離散程度。它反映各數(shù)據(jù)遠離其中心值的程度,因此,也稱離中趨勢離中趨勢。 集中趨勢集中趨勢反映的是各變量值向其中心值聚集的程度, 離中趨勢離中趨勢反映各變量值之間的差異狀況。 注意:注意: 集中趨勢集中趨勢的測度值概括地反映了數(shù)據(jù)的一般水平,它對該組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平離散水平。 數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組

48、數(shù)據(jù)的代表性就越差。(二)分布離散程度的測度(二)分布離散程度的測度1 1、絕對離散度、絕對離散度極差極差、離差、離差平方和、方差和標準差等,離差、離差平方和、方差和標準差等,是地理數(shù)據(jù)分布規(guī)律指標中較為重要的指標。是地理數(shù)據(jù)分布規(guī)律指標中較為重要的指標。(1)極差極差是最簡單的測度離中趨勢(分散程度)的指標,也稱全距全距,是一組數(shù)據(jù)最大值與最小值之差一組數(shù)據(jù)最大值與最小值之差: 對于組距分組數(shù)據(jù),極差可近似地表示為: R=最高組上限 - 最低組下限 注意:注意: 1、極差易受極端值的影響; 2、由于極差只利用了數(shù)據(jù)兩端的信息,沒有反映中間數(shù)據(jù)的分散狀況,因而不能準確描述數(shù)據(jù)的分散程度。(2

49、2)離差)離差離差又稱真差,離差又稱真差,它是指每一個地理數(shù)據(jù)與平均值的差,它代表著每一個地理數(shù)據(jù)與平均值的離散程度。 xxdii 對于兩個要素:均值可能相同,但是其離差對于兩個要素:均值可能相同,但是其離差可能有很大區(qū)別,它能反映出要素分配的差異可能有很大區(qū)別,它能反映出要素分配的差異例如:遼寧的朝陽和寧夏的固原兩地區(qū)例如:遼寧的朝陽和寧夏的固原兩地區(qū) 年份 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 平均降水量 朝陽 年降水 離 差 412.0 -62.9 633.7 158.8 608.0 133.1 606.3 131.4 520

50、.5 45.6 436.2 -38.7 402.7 -72.2 371.0 -103 698.2 217.9 526.3 51.4 474.9 固原 年降水 離 差 733.4 257.6 412.5 -52.3 373.4 -101.4 766.4 291.6 475.9 1.1 619.2 144.4 515.6 40.8 501.1 26.3 352.6 -122.2 434.2 -40.6 474.8 (3 3)離差平方和)離差平方和 各數(shù)據(jù)離差平方后再相加,它從總體上衡量一組各數(shù)據(jù)離差平方后再相加,它從總體上衡量一組地理數(shù)據(jù)與平均值的離散程度。地理數(shù)據(jù)與平均值的離散程度。 一是為了消

51、除正負號的影響;一是為了消除正負號的影響; 二是把離差平方后求和,可使離散程度二是把離差平方后求和,可使離散程度更清楚。更清楚。 2112)(xxdniinii(4 4)方差(均方差)方差(均方差) 各離差平方和除以其數(shù)據(jù)的個數(shù)各離差平方和除以其數(shù)據(jù)的個數(shù) 總體方差的計算公式為:總體方差的計算公式為:nuxnii/)(212樣本方差的計算公式為:樣本方差的計算公式為:) 1/()(212nxxsnii用用ExcelExcel計算方差:計算方差:VAR和和VARP函數(shù)函數(shù)64152561)(2nxxSi例:在上述例:在上述5個班組平均人員的例中,個班組平均人員的例中,若視若視5個班為樣本,則個班

52、為樣本,則2 .515256)(2NXXi若視若視5個班為總體,則個班為總體,則樣本方差自由度(degree of freedom)是指當(dāng)以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中是指當(dāng)以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中獨立或能自由變化的數(shù)據(jù)的個數(shù)稱為該統(tǒng)計量的自由獨立或能自由變化的數(shù)據(jù)的個數(shù)稱為該統(tǒng)計量的自由度。度。 從方差和標準差的公式我們可以看出總體的方差和標從方差和標準差的公式我們可以看出總體的方差和標準差是由各數(shù)據(jù)與總體平均數(shù)的差值求出來的,因此準差是由各數(shù)據(jù)與總體平均數(shù)的差值求出來的,因此必須將平均值固定后才可以求總體的方差。因此,由必須將平均值固定后才可以求總體的方差。因此,

53、由于平均值被固定,它就不能獨立自由變化,也就是方于平均值被固定,它就不能獨立自由變化,也就是方差和標準差受到總體平均數(shù)的限制,少了一個自由變差和標準差受到總體平均數(shù)的限制,少了一個自由變化的機會,因此要從化的機會,因此要從n里減掉一個。里減掉一個。 例如,樣本有例如,樣本有3個數(shù)值,即個數(shù)值,即x1=2,x2=4,x3=9,則,則 x = 5。當(dāng)。當(dāng) x = 5 確定后,確定后,x1,x2和和x3有兩個數(shù)據(jù)可以自由有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如取值,另一個則不能自由取值,比如x1=6,x2=7,那,那么么x3則必然取則必然取2,而不能取其他值,而不能取其他值樣本的標準差:樣

54、本的標準差:) 1/()(21nxxsnii用用ExcelExcel計算標準差:計算標準差:STDEV和和STDEVP函數(shù)函數(shù)(5 5)標準差)標準差 方差開方以后所得的數(shù)值,即方差方差開方以后所得的數(shù)值,即方差的平方根的平方根總體的標準差:總體的標準差:nuxnii/)(2122SS 在五個班級規(guī)模的例中五個班級規(guī)模的例中: 若視5個班為總體,則標準差為7.15, 若視5個班為樣本,則標準差為8。注意:注意: 1、由于方差方差計算中使用了平方運算,因此方差的單位也是平方,如上述班級規(guī)模例中方差為64(學(xué)生)2,其具體意義不明確具體意義不明確。因此方差只有在方差只有在比較不同組數(shù)據(jù)的離散程度時

55、才有數(shù)量大小上的比較不同組數(shù)據(jù)的離散程度時才有數(shù)量大小上的意義意義。 2、標準差、標準差是對方差的開方運算,因此,其其單位與原始數(shù)據(jù)的單位一致單位與原始數(shù)據(jù)的單位一致,它與均值及其他用同一單位測度的數(shù)據(jù)相比較也容易一些。(標準差就是指數(shù)據(jù)標準差就是指數(shù)據(jù)“離散程度的測度值離散程度的測度值”距距“均值均值”的距離的距離)。2.2.相對離散度相對離散度 變異系數(shù)(離差系數(shù)或變差系數(shù))變異系數(shù)(離差系數(shù)或變差系數(shù)) :標準差與均值的比值,它表示了地理:標準差與均值的比值,它表示了地理數(shù)據(jù)的相對變化(波動)程度。數(shù)據(jù)的相對變化(波動)程度。%1001)(1%10012nxxxxSCniiv注意:注意: 1、對不同組數(shù)據(jù)、對不同組數(shù)據(jù),其離散程度既受其數(shù)據(jù)本身的水平的影響,也受數(shù)據(jù)計量單位的影響,因此對不同(性質(zhì))組別的數(shù)據(jù),不好用離差離差或標準差標準差來比較它們的離散程度離散程度; 2、由于離散系數(shù)離散系數(shù)消除了來自這兩方面的影響,因此可以用它進行不同數(shù)據(jù)組的比較。例如:例如:對于表對于表1 1中的數(shù)據(jù),分別計算極差、離差、中的數(shù)據(jù),分別計算極差、離差、離差平方和、方差、標準差、標準差的無偏估離差平方和、方差、標準差、標準差的無偏估計,以及變異系數(shù)。計,以及變異系數(shù)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論