版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章第二章 描述性統(tǒng)計(jì)描述性統(tǒng)計(jì)描述描述性統(tǒng)計(jì)性統(tǒng)計(jì)(descriptive statistics)是一套用)是一套用來(lái)整理和來(lái)整理和慨括數(shù)據(jù)慨括數(shù)據(jù)的方法,的方法,它可以很快地顯示它可以很快地顯示出數(shù)據(jù)的基本傾向性,揭示你在什么地方值得出數(shù)據(jù)的基本傾向性,揭示你在什么地方值得使用統(tǒng)計(jì)推斷的方法去更詳細(xì)地考察數(shù)據(jù)。使用統(tǒng)計(jì)推斷的方法去更詳細(xì)地考察數(shù)據(jù)??傮w與樣本 總體(population):研究的全部對(duì)象。分為無(wú)限總體(infinite population)和有限總體(finite population)。 個(gè)體(individual):構(gòu)成總體的每個(gè)成員。 樣本(sample):總體的
2、一部分。 樣本的含量(sample size):樣本內(nèi)包含的個(gè)體數(shù)目。抽樣 抽樣(sample):從總體中獲得樣本的過(guò)程。 目的:通過(guò)對(duì)樣本的研究推斷其總體 隨機(jī)抽樣(random sample) 抽簽、抓鬮等。使用隨機(jī)數(shù)字表。 放回式抽樣(sampling with replacement) 非放回式抽樣(sampling without replacement)42.1 數(shù)據(jù)預(yù)處理的原因 正確性(Correctness) 一致性(Consistency) 完整性(Completeness) 可靠性(Reliability) 數(shù)據(jù)質(zhì)量的含義數(shù)據(jù)質(zhì)量的含義 現(xiàn)實(shí)世界的數(shù)據(jù) 不完整的 缺少屬性值
3、或某些感興趣的屬性,或僅包含聚集數(shù)據(jù)。 含噪聲的 包含錯(cuò)誤或存在偏離期望的離群值。 不一致的 采用的編碼或表示不同,如屬性名稱不同 冗余的 如屬性之間可以相互導(dǎo)出6數(shù)據(jù)錯(cuò)誤的不可避免性 數(shù)據(jù)輸入和獲得過(guò)程數(shù)據(jù)錯(cuò)誤 數(shù)據(jù)集成所表現(xiàn)出來(lái)的錯(cuò)誤 數(shù)據(jù)傳輸過(guò)程所引入的錯(cuò)誤 據(jù)統(tǒng)計(jì)有錯(cuò)誤的數(shù)據(jù)占總數(shù)據(jù)的5%左右Redmen,Orr98數(shù)據(jù)錯(cuò)誤的危害性 高昂的操作費(fèi)用 糟糕的決策制定 組織的不信任 分散管理的注意力8數(shù)據(jù)預(yù)處理的形式 數(shù)據(jù)清理 補(bǔ)充缺失數(shù)據(jù)、平滑噪聲數(shù)據(jù)、識(shí)別或刪除離群點(diǎn),解決不一致 數(shù)據(jù)集成 集成多個(gè)數(shù)據(jù)庫(kù)、數(shù)據(jù)立方或文件 數(shù)據(jù)變換 規(guī)范化和聚集 數(shù)據(jù)歸約 簡(jiǎn)化數(shù)據(jù)、但產(chǎn)生同樣或相似的結(jié)
4、果數(shù)據(jù)預(yù)處理的形式小結(jié) 現(xiàn)實(shí)世界的數(shù)據(jù)一般是臟的、不完整的和不一致的。 數(shù)據(jù)預(yù)處理技術(shù)可以改進(jìn)數(shù)據(jù)的質(zhì)量,從而有助于提高其后的挖掘過(guò)程的精度和性能。 高質(zhì)量的決策必然依賴于高質(zhì)量的數(shù)據(jù),因此數(shù)據(jù)預(yù)處理是知識(shí)發(fā)現(xiàn)過(guò)程的重要步驟。 檢測(cè)異常數(shù)據(jù)、盡早地調(diào)整數(shù)據(jù)并歸約待分析的數(shù)據(jù),將在決策過(guò)程中得到高回報(bào)。2.2 描述性數(shù)據(jù)匯總 獲得數(shù)據(jù)的總體印象對(duì)于成功的數(shù)據(jù)預(yù)處理是至關(guān)重要的。 描述性數(shù)據(jù)匯總技術(shù)可以用來(lái)識(shí)別數(shù)據(jù)的典型性質(zhì),突顯哪些數(shù)據(jù)值應(yīng)當(dāng)視為噪聲或離群點(diǎn)。 動(dòng)機(jī):更好的理解數(shù)據(jù)。 主要內(nèi)容:度量數(shù)據(jù)的中心趨勢(shì)和離散程度、描述數(shù)據(jù)匯總的圖形顯示。描述性統(tǒng)計(jì)數(shù)值指標(biāo)包括: (1)集中位置的指標(biāo),
5、用以描述觀察值的平均水平。 如算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、百分位數(shù)等。 (2)資料變異的指標(biāo),用以描述觀察值間參差不齊的程度,即離散度或稱變異度。 如全距、標(biāo)準(zhǔn)差、方差、變異系數(shù)、四分位數(shù)間距等。數(shù)據(jù)類型及頻數(shù)(率)分布 連續(xù)型數(shù)據(jù)(continuous data):又稱度量數(shù)據(jù)(measurement data) 離散型數(shù)據(jù)(discrete data):又稱為計(jì)數(shù)數(shù)據(jù)(count data) 變量的方法(method of variable):對(duì)連續(xù)型數(shù)據(jù)進(jìn)行分析的方法。 屬性的方法(method of attribute):對(duì)離散型數(shù)據(jù)進(jìn)行分析的方法。頻數(shù)(率)表和頻數(shù)(率)圖離散
6、型數(shù)據(jù)組值(class value):一般用組值編制頻數(shù)(率)表(frequency table)。柱形圖(column diagram):一般用柱形圖繪制頻數(shù)(率)圖。連續(xù)型數(shù)據(jù)組限(class limit):一般用組限編制頻數(shù)(率)表。直方圖(histogram)、多邊形圖(polygon)和累積頻數(shù)圖(cumulative frequency graph):一般用直方圖、多邊形圖和累積頻數(shù)圖繪制頻數(shù)(率)圖。組界(class boundary):中值(midvalue):每一組的兩個(gè)組限的平均值。頻數(shù)分布(frequency distribution)(百分率分布 percentage
7、distribution)把頻數(shù)或頻率按順序排列起來(lái)。 第一節(jié)第一節(jié) 概述概述 描述性統(tǒng)計(jì)的表、圖形式包括: (1) 頻數(shù)分布表 (2) 條形圖、直方圖、莖葉圖、盒形圖設(shè)原始觀察值共n例,為X1 ,X2 ,, Xn 。 和(SUM):X X1X2Xn 。 平方和, SS(SUM OF SQUARE): X2 X12X22Xn2 平方和又記為USS(UNCORRECTED SUM OF SQUARE) 離均差平方和,記為CSS(CORRECTED SUM OF SQUARE): 2)(xx2)(xx2)(xx2)(xx2)(xx21)(xx 22)(xx 2)(xxn 2)(xx21)(xx 2
8、2)(xx 2)(xxn 第二節(jié)第二節(jié) 頻數(shù)分布表頻數(shù)分布表頻數(shù)表的編制頻數(shù)表的編制 編制步驟: 1. 1. 求極差(即全距)求極差(即全距)R R; 2. 2. 確定組數(shù)確定組數(shù)n n、組距、組距i i,并寫(xiě)出組段;,并寫(xiě)出組段; 3. 3. 列表劃記。列表劃記。某市1995年110名7歲男童的身高資料(cm)114.4119.2124.7125.0115.0112.8120.2110.2120.9120.1125.5120.3122.3118.2116.7121.7116.8121.6115.2122.0121.7118.8121.8124.5121.7122.7116.3124.0119
9、.0124.5121.8124.9130.0123.5128.1119.7126.1131.3123.8114.7122.2122.8128.6122.0132.5122.0123.5116.3126.1119.2126.4118.4121.0119.1116.9131.1120.4115.2118.0122.4114.3116.9126.4114.2127.2118.3127.8123.0117.4123.2119.9122.1120.4124.8122.1114.4120.5115.0122.8116.8125.8120.1124.8122.7119.4128.2124.1127.2120
10、.0122.7118.3127.1122.5116.3125.1124.4112.3121.3127.0113.5118.8127.6125.2121.5122.5129.1122.6134.5118.3132.8 本例資料,最大值為本例資料,最大值為134.5cm134.5cm,最小值為,最小值為110.2cm110.2cm,故極差故極差 R=134.5-110.2=24.3cmR=134.5-110.2=24.3cm 組數(shù)不宜太多,也不宜太少。一般根據(jù)樣本量的多組數(shù)不宜太多,也不宜太少。一般根據(jù)樣本量的多少分成少分成8-158-15組。組。 本例假設(shè)分成本例假設(shè)分成1010組。組。 理論上
11、組距等于極差除以組數(shù)。但不拘泥于計(jì)算理論上組距等于極差除以組數(shù)。但不拘泥于計(jì)算結(jié)果,而常常取一個(gè)比較好處理的數(shù)。組距可以相結(jié)果,而常常取一個(gè)比較好處理的數(shù)。組距可以相等,也可以不等。等,也可以不等。 本例,組距本例,組距=24.3/10=2.43=24.3/10=2.43,我們?nèi)?,我們?nèi)?cm2cm。 組段:上限、下限組段:上限、下限 列表劃記列表劃記某市1995年110名7歲男童身高的頻數(shù)分布表身高組段頻數(shù)頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)110 1 0.91 1 0.91112 3 2.73 4 3.64114 9 8.18 13 11.82116 9 8.18 22 20.00118
12、15 13.64 37 33.64120 18 16.36 55 50.00122 21 19.09 76 69.09124 14 12.73 90 81.82126 10 9.09100 90.91128 4 3.64104 94.55130 3 2.73107 97.27132 2 1.82109 99.09134136 1 0.91110100.00合計(jì)110100.00 頻數(shù)表的用途頻數(shù)表的用途 根據(jù)頻數(shù)表,進(jìn)而可以繪制頻數(shù)圖。根據(jù)頻數(shù)表,進(jìn)而可以繪制頻數(shù)圖。揭示資料的分布特征和分布類型;揭示資料的分布特征和分布類型; 資料的分布范圍、峰(單峰或多峰)和離資料的分布范圍、峰(單峰或多峰
13、)和離散情況。散情況。 對(duì)于單峰分布資料,對(duì)于單峰分布資料, 對(duì)稱分布,其中一種特殊的分布叫做正態(tài)分布;對(duì)稱分布,其中一種特殊的分布叫做正態(tài)分布; 非對(duì)稱分布,又稱偏態(tài)分布。非對(duì)稱分布,又稱偏態(tài)分布。便于發(fā)現(xiàn)可疑值;便于發(fā)現(xiàn)可疑值;便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。第三節(jié) 集中位置的度量 一、算術(shù)平均數(shù)一、算術(shù)平均數(shù)(Arithmetic Mean) 簡(jiǎn)稱為均數(shù)(Mean),總體均數(shù)用希臘字母表示,樣本均數(shù)用 表示。 x=nxxxn+L21=鍈 nx/ = = 適用于服從正態(tài)分布的資料。 nxnxxxxn+L21x一、算術(shù)平均數(shù)一、算術(shù)平均數(shù)f=120ffxx
14、/一、算術(shù)平均數(shù)一、算術(shù)平均數(shù) x為每個(gè)組段的組中值,f為相應(yīng)組段的頻數(shù)。 原理:將落在某一組段內(nèi)的觀察值都視為 組中值。 本例: =(4.04+4.25+5.83)/120 =595.8/120=4.965 如用原始觀察值計(jì)算有 =(5.195+5.070+5.010)/120 =4.959xxxx二、幾何均數(shù)二、幾何均數(shù)(Geometric Mean) 幾何均數(shù)用G表示, 為觀察值的總乘積開(kāi)n 次方根,有nnnxxxxG/121)(L常用對(duì)數(shù)計(jì)算,公式如下: LogG=logX/n 再查反對(duì)數(shù)得出G。列成頻數(shù)表時(shí)計(jì)算公式如下: LogG=flogX/f 適用條件:1.成倍數(shù)關(guān)系的資料。 2
15、.明顯正偏態(tài)分布的資料。二、幾何均數(shù)二、幾何均數(shù)(Geometric Mean)二、幾何均數(shù)二、幾何均數(shù)(Geometric Mean) 例例3.3 6例鉤端螺旋體病人的潛伏期分別為7, 10, 12, 14, 18, 20天, 求其平均潛伏期。 解:解: 或者lgG=(lg7+lg10+lg20)/6=1.1045 查反對(duì)數(shù)得G=12.7(天) 7 .12201814121076G71220181412107.6G二、幾何均數(shù)二、幾何均數(shù)(Geometric Mean) 當(dāng)為滴度資料時(shí),如5名學(xué)齡兒童的麻疹血凝抑制抗體滴度為1:25, 1:50, 1:50, 1:100, 1:100, 可先
16、取其倒數(shù),25, 50, 50, 100, 100,再求取幾何均數(shù)為57.43, 則平均抗體滴度為1:57。 三中位數(shù)三中位數(shù)(Median) 中位數(shù)用M表示,它將總體或樣本的全部觀察 值分成兩部分,每部分各有50%個(gè)觀察值。 計(jì)算方法為:先將原始觀察值按由小到大順序排列后,位次處于中間的那個(gè)觀察值為中位數(shù)。觀察值數(shù)為奇數(shù)時(shí),處于中間的那個(gè)數(shù)為中位數(shù)。偶數(shù)時(shí)處于中間的兩個(gè)數(shù)的均數(shù)為中位數(shù)。 三中位數(shù)三中位數(shù)(Median) 如求數(shù)列7, 10, 12, 14, 18, 20的中位數(shù)。n=6,為偶數(shù),取中間兩個(gè)數(shù)的平均數(shù),則 M=(12+14)/2=13(天) 如求數(shù)列7, 10, 12, 14
17、, 15,18, 20的中位數(shù)。n=7, 為奇數(shù),取中間那個(gè)數(shù)為中位數(shù)。則 M=14(天)三中位數(shù)三中位數(shù)(Median) 適用于表示任何分布資料的平均水平。但常用于非正態(tài)分布資料。由于中位數(shù)不受個(gè)別特大,特小數(shù)值的影響, 因此它比均數(shù)穩(wěn)健,常用于資料分布不明,或明顯偏態(tài),或分布的一端無(wú)確定值的情況。四眾數(shù)四眾數(shù)(Mode) 頻數(shù)最大的變量值稱為眾數(shù)。列成頻數(shù)表的資料,頻數(shù)最大的組段的組中值為眾數(shù)。 集中趨勢(shì)的測(cè)度五百分位數(shù)五百分位數(shù)(Percentile) 第X百分位數(shù)以Px表示,它將總體或樣本的全部觀察值分成二個(gè)部分,其中有x%個(gè)觀察值小于Px, (100-x)%個(gè)觀察值大于Px。 用途:
18、1.描述一組資料在各個(gè)百分位置上的水平,用一組百分位數(shù)如P5,P25, P50, P75, P95,可以描述總體或樣本的分布特征,如集中位置、變異度等。百分位數(shù)70%下側(cè)30%上側(cè)第70個(gè)百分位數(shù)值四分之一分位數(shù)=25%四分之二分位數(shù)=50%五百分位數(shù)五百分位數(shù)(Percentile) 2.確定醫(yī)學(xué)正常值范圍。 P25稱為第1四分位數(shù);記為Q1。 P50稱為第2四分位數(shù);記為Q2,就是中位數(shù)M P75稱為第3四分位數(shù);記為Q3。 計(jì)算百分位數(shù)時(shí),特別是靠近兩端的百分位數(shù)時(shí),要求例數(shù)足夠大,大于100例。 五百分位數(shù)五百分位數(shù)(Percentile)例:例:用直接法計(jì)算例3.2資料共120例的第
19、5百分位數(shù), 用頻數(shù)表法計(jì)算第95百分位數(shù), 解解:將原始觀察值由小到大排列,得3.980, 4.065, 4.070, 4.070, 4.2150, 4.250, 4.260, 4.290, 5.850, 5.875 先確定第x百分位數(shù)在第幾位。用公式:(n+1)x%五百分位數(shù)五百分位數(shù)(Percentile)本例(120+1)5%=6.05,第5百分位數(shù)在第6.05位,即第6到第7位之間。簡(jiǎn)單的算法是取第6和第7位數(shù)的平均值,P5=(4.250+4.260)/2=4.255 (1012/L)。五百分位數(shù)五百分位數(shù)(Percentile) 頻數(shù)分布表計(jì)算百分位數(shù): 組限 頻數(shù)f 累計(jì)頻數(shù) 3
20、.9 4 4 4.1 5 9 4.3 8 17 4.5 12 29 4.7 19 48 4.9 21 69 5.1 31 100 5.3 8 108 5.5 9 117 5.75.9 3 120 五百分位數(shù)五百分位數(shù)(Percentile) 計(jì)算P951.列出頻數(shù)分布表,計(jì)算累計(jì)頻數(shù)。2.計(jì)算nx%,12095%=1143.對(duì)照累計(jì)頻數(shù)欄與nx%確定PX應(yīng)落在哪一個(gè)組段中。114將在組限為5.5的組中,該組段下限為L(zhǎng),組距為i,頻數(shù)為f,上一組累積頻數(shù)為f l 。PX=L+ i(nx%-f l)/f , P95=5.5+0.2(114-108)/9=5.633 (1012/L)第三節(jié)第三節(jié) 離
21、散程度的指標(biāo)離散程度的指標(biāo)1.全距全距(Range)是最大與最小觀察值之差。全距計(jì)算方便,但僅利用最大與最小二個(gè)數(shù)據(jù)來(lái)代表全部數(shù)據(jù)的離散程度,信息利用差。全距受特大與特小值影響大,不穩(wěn)定。 2.四分位數(shù)間距四分位數(shù)間距(Interquartile Range) 第三節(jié)第三節(jié) 離散程度的指標(biāo)離散程度的指標(biāo)四分位數(shù)間距是第3四分位數(shù)與第1四分位數(shù)之差,即P75-P25。四分位數(shù)間距受特大值或特小值影響小,較穩(wěn)定。中位數(shù)和四分位數(shù)間距相結(jié)合常用于表示非正態(tài)分布資料的平均水平和離散程度。第三節(jié)第三節(jié) 離散程度的指標(biāo)離散程度的指標(biāo)3.標(biāo)準(zhǔn)差與方差標(biāo)準(zhǔn)差與方差(Standard Deviation and
22、 Variance) 總體的標(biāo)準(zhǔn)差,方差符號(hào)為,2,樣本的標(biāo)準(zhǔn)差,方差符號(hào)為S,S2。 1)(2nxxSnxxxx/)()(222第三節(jié)第三節(jié) 離散程度的指標(biāo)離散程度的指標(biāo)當(dāng)為頻數(shù)表資料時(shí),公式如下:1)(2fxxfS 方差S2是標(biāo)準(zhǔn)差S的平方值。標(biāo)準(zhǔn)差(或方差)越大,表示觀察值的分布越分散,反之,標(biāo)準(zhǔn)差(或方差)越小,表示觀察值的分布越集中。實(shí)際應(yīng)用時(shí)常以均數(shù)標(biāo)準(zhǔn)差的寫(xiě)法綜合觀察值的集中和離散特征。 第三節(jié)第三節(jié) 離散程度的指標(biāo)離散程度的指標(biāo)4.變異系數(shù)變異系數(shù)(Coefficient of Variation)簡(jiǎn)記為CV,它是標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表達(dá)。100/xSCV由于CV無(wú)量度單
23、位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標(biāo)或者平均水平相差懸殊的指標(biāo)的變異程度。 第三節(jié)第三節(jié) 離散程度的指標(biāo)離散程度的指標(biāo)表3.3 160名20歲男青年身高(cm)、 體重(Kg)的均數(shù)與標(biāo)準(zhǔn)差 均數(shù) 標(biāo)準(zhǔn)差 變異系數(shù) 身高 166.06 4.95 2.98% 體重 53.72 4.46 8.30% 算得變異系數(shù)后,可以認(rèn)為體重的變異程度比身高大。 偏態(tài)系數(shù)偏態(tài)系數(shù)(skewness):評(píng)價(jià)正態(tài)分布對(duì)稱性的指標(biāo)。 對(duì)稱:skewness=0; 正偏態(tài):skewness0;個(gè)別數(shù)據(jù)特別大。 負(fù)偏態(tài):skewness0;個(gè)別數(shù)據(jù)特別小。 峰態(tài)系數(shù)(峰態(tài)系數(shù)(kur
24、tosis):評(píng)價(jià)正態(tài)分布正態(tài)峰的指標(biāo)。 正態(tài)峰:kurtosis=0; 尖峭峰:kurtosis0; 平闊峰:kurtosis0;第四節(jié)第四節(jié) 統(tǒng)計(jì)表與統(tǒng)計(jì)圖統(tǒng)計(jì)表與統(tǒng)計(jì)圖 統(tǒng)計(jì)圖表都是將已整理好的資料用簡(jiǎn)明的統(tǒng)計(jì)圖表都是將已整理好的資料用簡(jiǎn)明的格式或圖形表達(dá)出來(lái),因此是表達(dá)和分析統(tǒng)計(jì)格式或圖形表達(dá)出來(lái),因此是表達(dá)和分析統(tǒng)計(jì)資料的重要工具。資料的重要工具。 統(tǒng)計(jì)表可以代替冗長(zhǎng)的文字?jǐn)⑹?,便于?jì)統(tǒng)計(jì)表可以代替冗長(zhǎng)的文字?jǐn)⑹觯阌谟?jì)算、分析和對(duì)比。統(tǒng)計(jì)圖則具有問(wèn)題突出,簡(jiǎn)算、分析和對(duì)比。統(tǒng)計(jì)圖則具有問(wèn)題突出,簡(jiǎn)單明了,形象化等優(yōu)點(diǎn),能使人一目了然。單明了,形象化等優(yōu)點(diǎn),能使人一目了然。 但統(tǒng)計(jì)表
25、不形象,統(tǒng)計(jì)圖對(duì)數(shù)字的反映不但統(tǒng)計(jì)表不形象,統(tǒng)計(jì)圖對(duì)數(shù)字的反映不精確。因此在實(shí)際工作中,往往同時(shí)使用統(tǒng)計(jì)精確。因此在實(shí)際工作中,往往同時(shí)使用統(tǒng)計(jì)表和統(tǒng)計(jì)圖。表和統(tǒng)計(jì)圖。統(tǒng)計(jì)表統(tǒng)計(jì)表 統(tǒng)計(jì)表(統(tǒng)計(jì)表(statistical table)是以表格的)是以表格的形式,表達(dá)被研究對(duì)象的特征、內(nèi)部構(gòu)成形式,表達(dá)被研究對(duì)象的特征、內(nèi)部構(gòu)成及研究項(xiàng)目分組之間的數(shù)量關(guān)系。及研究項(xiàng)目分組之間的數(shù)量關(guān)系。統(tǒng)計(jì)表的結(jié)構(gòu)統(tǒng)計(jì)表的結(jié)構(gòu)從外形看從外形看標(biāo)題:標(biāo)題: 說(shuō)明表的名稱說(shuō)明表的名稱橫標(biāo)目:說(shuō)明各橫行數(shù)字的涵義橫標(biāo)目:說(shuō)明各橫行數(shù)字的涵義縱標(biāo)目:說(shuō)明各縱欄數(shù)字的涵義縱標(biāo)目:說(shuō)明各縱欄數(shù)字的涵義總標(biāo)目總標(biāo)目表表1 1
26、 某年某地消費(fèi)者對(duì)有機(jī)食品的態(tài)度某年某地消費(fèi)者對(duì)有機(jī)食品的態(tài)度性別性別對(duì)有機(jī)食品的態(tài)度對(duì)有機(jī)食品的態(tài)度合計(jì)合計(jì)喜歡()喜歡()不喜歡()不喜歡()男男30(20.0)120(80.0)150女女80(40.0)120(60.0)200合計(jì)合計(jì)110(31.4)240(68.6)350從內(nèi)容看從內(nèi)容看主語(yǔ):指研究的對(duì)象,通常列在表的左側(cè)主語(yǔ):指研究的對(duì)象,通常列在表的左側(cè)謂語(yǔ):說(shuō)明主語(yǔ)的各項(xiàng)指標(biāo),通常列在表謂語(yǔ):說(shuō)明主語(yǔ)的各項(xiàng)指標(biāo),通常列在表的右側(cè)的右側(cè) 主語(yǔ)和謂語(yǔ)連起來(lái)能讀成一句完整而通順主語(yǔ)和謂語(yǔ)連起來(lái)能讀成一句完整而通順的話。的話。 統(tǒng)計(jì)表的種類統(tǒng)計(jì)表的種類簡(jiǎn)單表簡(jiǎn)單表:按一個(gè)研究特征:按
27、一個(gè)研究特征/標(biāo)志標(biāo)志/標(biāo)識(shí)分組標(biāo)識(shí)分組復(fù)合復(fù)合/ /組合表組合表:按二個(gè)或二個(gè)以上研究特:按二個(gè)或二個(gè)以上研究特征征/標(biāo)志標(biāo)志/標(biāo)識(shí)分組標(biāo)識(shí)分組表表 某大學(xué)某年的學(xué)生分布某大學(xué)某年的學(xué)生分布學(xué)院學(xué)院專業(yè)專業(yè)年級(jí)年級(jí)合計(jì)合計(jì)一一二二三三四四Aa1a2小計(jì)小計(jì)Bb1b2b3小計(jì)小計(jì)合計(jì)合計(jì) 繪制統(tǒng)計(jì)表的原則繪制統(tǒng)計(jì)表的原則重點(diǎn)突出,簡(jiǎn)單明了重點(diǎn)突出,簡(jiǎn)單明了主謂分明,層次清楚主謂分明,層次清楚 繪制統(tǒng)計(jì)表的要求繪制統(tǒng)計(jì)表的要求標(biāo)題標(biāo)題標(biāo)目標(biāo)目線條線條數(shù)字?jǐn)?shù)字備注備注統(tǒng)計(jì)圖統(tǒng)計(jì)圖 統(tǒng)計(jì)圖(統(tǒng)計(jì)圖(statistical graph)是用點(diǎn)的位)是用點(diǎn)的位置、線段的升降、直條的長(zhǎng)短或者面積的大置、線
28、段的升降、直條的長(zhǎng)短或者面積的大小等形式來(lái)表達(dá)統(tǒng)計(jì)資料之間的數(shù)量關(guān)系。小等形式來(lái)表達(dá)統(tǒng)計(jì)資料之間的數(shù)量關(guān)系。 統(tǒng)計(jì)圖形象、直觀,便于對(duì)比分析,但統(tǒng)計(jì)圖形象、直觀,便于對(duì)比分析,但對(duì)數(shù)量的表達(dá)比較粗糙,不夠精確。對(duì)數(shù)量的表達(dá)比較粗糙,不夠精確。 繪圖的基本要求繪圖的基本要求根據(jù)資料的性質(zhì)和分析目的,正確選擇根據(jù)資料的性質(zhì)和分析目的,正確選擇合適的圖形;合適的圖形;每圖應(yīng)有標(biāo)題;每圖應(yīng)有標(biāo)題;直角坐標(biāo)系中繪圖時(shí),縱橫軸都應(yīng)有標(biāo)直角坐標(biāo)系中繪圖時(shí),縱橫軸都應(yīng)有標(biāo)目,并注明單位;縱:橫一般以目,并注明單位;縱:橫一般以5:7為為宜;縱軸尺度一般應(yīng)從宜;縱軸尺度一般應(yīng)從“0”開(kāi)始。開(kāi)始。比較不同對(duì)象時(shí),
29、用不同的線條或顏色比較不同對(duì)象時(shí),用不同的線條或顏色表示,并要附圖例說(shuō)明。圖例寫(xiě)在圖的表示,并要附圖例說(shuō)明。圖例寫(xiě)在圖的下面或圖的右上角。下面或圖的右上角。 幾種常用的統(tǒng)計(jì)圖幾種常用的統(tǒng)計(jì)圖直條圖直條圖(bar graph) 直條圖用等寬直條的長(zhǎng)短來(lái)表示相互獨(dú)直條圖用等寬直條的長(zhǎng)短來(lái)表示相互獨(dú)立的各指標(biāo)的數(shù)值大小。立的各指標(biāo)的數(shù)值大小。 適用于相互獨(dú)立的、無(wú)連續(xù)關(guān)系的間斷適用于相互獨(dú)立的、無(wú)連續(xù)關(guān)系的間斷性資料的比較。性資料的比較。 種類:?jiǎn)问街睏l圖和復(fù)式直條圖種類:?jiǎn)问街睏l圖和復(fù)式直條圖2005年某食品企業(yè)的產(chǎn)量(噸)020406080100120A產(chǎn)品B產(chǎn)品C產(chǎn)品2005年與2006年某食
30、品企業(yè)產(chǎn)量(噸)對(duì)比2005年與2006年某食品企業(yè)產(chǎn)量(噸)對(duì)比020406080100120140160A產(chǎn)品B產(chǎn)品C產(chǎn)品2005年2006年直條圖的繪制要點(diǎn)直條圖的繪制要點(diǎn)縱軸應(yīng)從縱軸應(yīng)從“0”開(kāi)始,中間不能折斷,否開(kāi)始,中間不能折斷,否則不能正確反映比較指標(biāo)之間的相對(duì)比則不能正確反映比較指標(biāo)之間的相對(duì)比例;例;各直條的寬度應(yīng)當(dāng)相等。單式直條圖直各直條的寬度應(yīng)當(dāng)相等。單式直條圖直條之間要有間隔,間隔以直條的寬度或條之間要有間隔,間隔以直條的寬度或直條寬度的一半為宜。復(fù)式直條圖同一直條寬度的一半為宜。復(fù)式直條圖同一指標(biāo)之間不要有間隔;指標(biāo)之間不要有間隔;復(fù)式直條圖中不同系列之間要用不同的復(fù)
31、式直條圖中不同系列之間要用不同的圖案或顏色相區(qū)別,并用圖例說(shuō)明;圖案或顏色相區(qū)別,并用圖例說(shuō)明;直條按某一系列中的長(zhǎng)短順序從大到小直條按某一系列中的長(zhǎng)短順序從大到小或者從小到大排列,以便比較。或者從小到大排列,以便比較。圓圖和百分條圖圓圖和百分條圖 都適用于構(gòu)成比資料。都適用于構(gòu)成比資料。圓圖圓圖(pie graph):又稱餅圖):又稱餅圖 以圓面積為以圓面積為100,圓內(nèi)各扇形面積為各,圓內(nèi)各扇形面積為各部分所占的百分比,用來(lái)表示全體中各部分所占的百分比,用來(lái)表示全體中各部分的構(gòu)成。部分的構(gòu)成。2005年某食品企業(yè)產(chǎn)品產(chǎn)量構(gòu)成2005年某食品企業(yè)產(chǎn)品產(chǎn)量構(gòu)成43.48%34.78%21.74
32、%A產(chǎn)品B產(chǎn)品C產(chǎn)品繪制圓圖的要點(diǎn)繪制圓圖的要點(diǎn):v每每3.60為為1;v從相當(dāng)于時(shí)鐘從相當(dāng)于時(shí)鐘12點(diǎn)或者點(diǎn)或者9點(diǎn)的位置開(kāi)始順點(diǎn)的位置開(kāi)始順時(shí)針?lè)较蚶L圖;時(shí)針?lè)较蚶L圖;v各部分用不同的圖案或者顏色表示,或各部分用不同的圖案或者顏色表示,或在圖上標(biāo)出各部分的百分比和名稱,或在圖上標(biāo)出各部分的百分比和名稱,或以圖例說(shuō)明;以圖例說(shuō)明;v同一組資料,按百分比大小順序排列;同一組資料,按百分比大小順序排列;v比較不同組資料,畫(huà)兩個(gè)或多個(gè)等圓,比較不同組資料,畫(huà)兩個(gè)或多個(gè)等圓,在每一個(gè)圓的下面注明組別,按固定順在每一個(gè)圓的下面注明組別,按固定順序排列各組成部分,用相同的圖例。序排列各組成部分,用相同的
33、圖例。百分條圖百分條圖(percent bar graph) 以一個(gè)直條的面積為以一個(gè)直條的面積為100表示事物的全部,表示事物的全部,以各段的面積表示各部分所占的百分比。以各段的面積表示各部分所占的百分比。2005年某食品企業(yè)產(chǎn)品產(chǎn)量構(gòu)成2005年某食品企業(yè)產(chǎn)品產(chǎn)量構(gòu)成43.48%34.78%21.74%0%20%40%60%80%100%1A產(chǎn)品B產(chǎn)品C產(chǎn)品2005年和2006年某食品企業(yè)產(chǎn)品產(chǎn)量構(gòu)成2005年和2006年某食品企業(yè)產(chǎn)品產(chǎn)量構(gòu)成43.48%32.43%34.78%40.54%21.74%27.03%0%20%40%60%80%100%12A產(chǎn)品B產(chǎn)品C產(chǎn)品繪制百分條圖的要點(diǎn)
34、繪制百分條圖的要點(diǎn):v一定要有標(biāo)尺,畫(huà)在圖的上方或下方,一定要有標(biāo)尺,畫(huà)在圖的上方或下方,起始的位置與總長(zhǎng)度和百分條圖一致,起始的位置與總長(zhǎng)度和百分條圖一致,并和百分條圖平行。全長(zhǎng)為并和百分條圖平行。全長(zhǎng)為100,不能,不能帶箭頭;帶箭頭;v按各部分所占百分比的大小順序排列,按各部分所占百分比的大小順序排列,并標(biāo)出具體的百分比;并標(biāo)出具體的百分比;v要有圖例說(shuō)明;要有圖例說(shuō)明;v多組資料比較時(shí),畫(huà)幾個(gè)平行且相等長(zhǎng)多組資料比較時(shí),畫(huà)幾個(gè)平行且相等長(zhǎng)寬的百分條圖,按一固定的順序排列,寬的百分條圖,按一固定的順序排列,使用相同的圖例。使用相同的圖例。普通線圖和半對(duì)數(shù)線圖普通線圖和半對(duì)數(shù)線圖 用線段的上升和下降來(lái)表示某事物在時(shí)間上的發(fā)展變用線段的上升和下降來(lái)表示某事物在時(shí)間上的發(fā)展變化或者某現(xiàn)象隨另一現(xiàn)象變遷的情況?;蛘吣超F(xiàn)象隨另一現(xiàn)象變遷的情況。 適用于連續(xù)性資料。適用于連續(xù)性資料。普通線圖普通線圖:縱橫坐標(biāo)軸均為算術(shù)尺度:縱橫坐標(biāo)軸均為算術(shù)尺度 反映的是絕對(duì)速度反映的是絕對(duì)速度v縱軸可以不從縱軸可以不從“0”開(kāi)始,但看圖時(shí)一定要注意縱軸的開(kāi)始,但看圖時(shí)一定要注意縱軸的起點(diǎn);起點(diǎn);v數(shù)據(jù)點(diǎn)畫(huà)在組段中間,相鄰的點(diǎn)用直線連接。無(wú)數(shù)據(jù)數(shù)據(jù)點(diǎn)畫(huà)在組段中間,相鄰的點(diǎn)用直線連接。無(wú)數(shù)據(jù)的組段用虛線連接。不能任意外延。的組段用虛線連接。不能任意外延。v不要在一張圖上
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025飲食類銷售代理合同書(shū)范本
- 2025合同模板國(guó)際民間貿(mào)易合同范本
- 綜合實(shí)踐活動(dòng)在小學(xué)體育教育中的應(yīng)用探索
- 未來(lái)工作方式下的小微企業(yè)園區(qū)規(guī)劃設(shè)計(jì)
- 老年慢性腎病的綜合管理與層次化服務(wù)模式探索
- 二零二五年度存量房買(mǎi)賣(mài)服務(wù)居間合同(含獨(dú)家代理)3篇
- 2025年太陽(yáng)能設(shè)備運(yùn)輸保險(xiǎn)合同
- 2025年粵教滬科版高二歷史上冊(cè)階段測(cè)試試卷含答案
- 2025年浙教版九年級(jí)歷史上冊(cè)階段測(cè)試試卷含答案
- 2025年蘇教版必修3歷史上冊(cè)階段測(cè)試試卷
- 河南省濮陽(yáng)市2024-2025學(xué)年高一上學(xué)期1月期末考試語(yǔ)文試題(含答案)
- 割接方案的要點(diǎn)、難點(diǎn)及采取的相應(yīng)措施
- 2025年副護(hù)士長(zhǎng)競(jìng)聘演講稿(3篇)
- 2024年08月北京中信銀行北京分行社會(huì)招考(826)筆試歷年參考題庫(kù)附帶答案詳解
- 原發(fā)性腎病綜合征護(hù)理
- (一模)株洲市2025屆高三教學(xué)質(zhì)量統(tǒng)一檢測(cè) 英語(yǔ)試卷
- 基礎(chǔ)護(hù)理學(xué)導(dǎo)尿操作
- DB11∕T 1028-2021 民用建筑節(jié)能門(mén)窗工程技術(shù)標(biāo)準(zhǔn)
- (初級(jí))航空油料計(jì)量統(tǒng)計(jì)員技能鑒定理論考試題庫(kù)(含答案)
- 執(zhí)業(yè)藥師勞動(dòng)合同范本
- 2024年高考英語(yǔ)復(fù)習(xí)(新高考專用)完形填空之詞匯復(fù)現(xiàn)
評(píng)論
0/150
提交評(píng)論