第一節(jié) 數據的分類和整理_第1頁
第一節(jié) 數據的分類和整理_第2頁
第一節(jié) 數據的分類和整理_第3頁
第一節(jié) 數據的分類和整理_第4頁
第一節(jié) 數據的分類和整理_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章數據的整理與統(tǒng)計描述第二章數據的整理與統(tǒng)計描述第一節(jié)數據分類和整理第一節(jié)數據分類和整理第二節(jié)數據分布的統(tǒng)計特征描述第二節(jié)數據分布的統(tǒng)計特征描述第三節(jié)統(tǒng)計圖表第三節(jié)統(tǒng)計圖表數據數據也稱資料,是對客觀現(xiàn)象計量的結果。也稱資料,是對客觀現(xiàn)象計量的結果。一、數據的分類一、數據的分類 統(tǒng)計數據統(tǒng)計數據是利用統(tǒng)計方法進行分析的基礎,是利用統(tǒng)計方法進行分析的基礎,不同的統(tǒng)計數據應采用不同的統(tǒng)計分析方法。不同的統(tǒng)計數據應采用不同的統(tǒng)計分析方法。第一節(jié)數據分類和整理第一節(jié)數據分類和整理定類數據定類數據定序定序數據數據離散離散數據數據連續(xù)連續(xù)數據數據數據數據類型類型定性定性數據數據定量定量數據數據( (例例

2、: :性別、民族性別、民族) )( (例例: :產品等級產品等級) )( (例例: :家庭人口家庭人口) )( (例例: :體重、溫度體重、溫度) )1 1、數據的類型、數據的類型定性數據定性數據 定性數據定性數據也稱品質數據,是觀察或實驗也稱品質數據,是觀察或實驗結果不可以用數值大小表示只能用文字描述結果不可以用數值大小表示只能用文字描述的數據資料,一般不帶有度量衡單位。的數據資料,一般不帶有度量衡單位。特點:特點:每個觀察結果或實驗結果之間沒有量的每個觀察結果或實驗結果之間沒有量的大小區(qū)別,表現(xiàn)為互不相容的類別或屬性。大小區(qū)別,表現(xiàn)為互不相容的類別或屬性。 根據觀察結果是否有等級或順序,將

3、定性根據觀察結果是否有等級或順序,將定性數據分為數據分為定類數據定類數據和和定序數據定序數據兩類。兩類。 定類數據也稱名義數據、計數數據:是對事物按照定類數據也稱名義數據、計數數據:是對事物按照其屬性進行分類或分組的計量結果,其數據表現(xiàn)為其屬性進行分類或分組的計量結果,其數據表現(xiàn)為文字文字型型的的無序無序類別,可以進行每一類別出現(xiàn)頻數的計算,沒類別,可以進行每一類別出現(xiàn)頻數的計算,沒有等級之分,也不能進行加減乘除的數學運算。有等級之分,也不能進行加減乘除的數學運算。(1)(1)定類數據定類數據 例如一個學校的學生按性別分為男、女兩類,或按例如一個學校的學生按性別分為男、女兩類,或按民族分為漢族

4、和少數民族兩類。這種分類把所考察的民族分為漢族和少數民族兩類。這種分類把所考察的個體(學生)劃分為不同的類型,但各類型之間是平個體(學生)劃分為不同的類型,但各類型之間是平行的關系,不能區(qū)分優(yōu)劣或大小。行的關系,不能區(qū)分優(yōu)劣或大小。 定序數據也稱有序數據或等級數據。同樣是按定序數據也稱有序數據或等級數據。同樣是按事物屬性進行分類或分組,但事物屬性進行分類或分組,但可排序可排序。即定序測度不。即定序測度不僅可以劃分類型,而且還可以確定這些類別的優(yōu)劣或僅可以劃分類型,而且還可以確定這些類別的優(yōu)劣或順序。即其數據表現(xiàn)為順序。即其數據表現(xiàn)為有序有序類別,可以進行類別的頻類別,可以進行類別的頻數計算和排

5、序,同樣不能進行加減乘除的數學運算。數計算和排序,同樣不能進行加減乘除的數學運算。 例如可以把企業(yè)信譽分為好、較好、一般和較例如可以把企業(yè)信譽分為好、較好、一般和較差四個類別;把某種藥物的療效分為無效、有效、差四個類別;把某種藥物的療效分為無效、有效、顯效、痊愈等。顯然這些類別具有等級差異,但不顯效、痊愈等。顯然這些類別具有等級差異,但不能具體測定等級之間差異的大小。能具體測定等級之間差異的大小。(2)(2)定序數據定序數據定量數據定量數據 定量數據定量數據,也稱數值數據或計量數據,也稱數值數據或計量數據,是觀察或實驗結果可以用數值大小表示的是觀察或實驗結果可以用數值大小表示的數據資料,一般帶

6、有度量衡單位。數據資料,一般帶有度量衡單位。特點:特點:每個觀察值或實驗值之間有量的大小的每個觀察值或實驗值之間有量的大小的區(qū)別,即可進行頻數計算和排序,又可進行加區(qū)別,即可進行頻數計算和排序,又可進行加減乘除的數學運算。減乘除的數學運算。 例如,收入就有實際的例如,收入就有實際的0作為起點,作為起點,0表示表示沒有收入。假如甲收入沒有收入。假如甲收入600元,乙收入元,乙收入300元,元,可以說甲比乙多收入可以說甲比乙多收入300元,也可以說甲收入元,也可以說甲收入是乙的兩倍。因此,定量測度可以進行加、減、是乙的兩倍。因此,定量測度可以進行加、減、乘、除運算。乘、除運算。 根據數據的分布情況

7、,將定量數據分為根據數據的分布情況,將定量數據分為離散型數據離散型數據和和連續(xù)型數據連續(xù)型數據兩類。兩類。三種數據的比較三種數據的比較計量測度計量測度數學特性數學特性定類數據定類數據定序數據定序數據定量數據定量數據分類分類排序排序間距間距比值比值注:定量數據與定性數據可相互轉換。注:定量數據與定性數據可相互轉換。3、兩類數據的轉換、兩類數據的轉換(1)定量數據的定性化轉換)定量數據的定性化轉換(2)定性數據的數量化轉換)定性數據的數量化轉換例如,作為定量數據的成年男子的血清膽固例如,作為定量數據的成年男子的血清膽固醇值,按是否小于醇值,按是否小于6(mmol/L)劃分成血脂)劃分成血脂正常和異

8、常兩類,就轉化為定性數據。正常和異常兩類,就轉化為定性數據。(1)定量數據的定性化轉換)定量數據的定性化轉換例如,例如,“1”表示表示“非常同意非常同意”,“2”表示表示“同同意意”, “3”表示表示“保持中立保持中立”,“4”表示表示“不同不同意意”, “5”表示表示“非常不同意非常不同意”。 又如,用又如,用“1”表示表示“男性男性”,“0”表示表示“女女性性”。(2)定性數據的數量化轉換)定性數據的數量化轉換變量變量用以說明現(xiàn)象的某種用以說明現(xiàn)象的某種屬性屬性或或特征特征。變變 量量特點:特點:是從一次觀察到下一次觀察會呈現(xiàn)出是從一次觀察到下一次觀察會呈現(xiàn)出差別或變化,變量的具體取值稱為

9、變量值。差別或變化,變量的具體取值稱為變量值。比如,商品銷售額可以是比如,商品銷售額可以是20萬元、萬元、30萬元、萬元、50萬元、萬元、這些數字就是變量值。這些數字就是變量值。如如“商品銷售額商品銷售額”、“受教育程度受教育程度”、“產品的質量等級產品的質量等級”等都是變量。等都是變量。2 2、變量及其類型、變量及其類型定類變量定類變量定序變量定序變量離散變量離散變量連續(xù)變量連續(xù)變量變量類型變量類型定性變量定性變量定量變量定量變量(數值變量)(數值變量)( (例例: :性別、民族性別、民族) )( (例例: :產品等級產品等級) )( (例例: :家庭人口家庭人口) )( (例例: :體重、

10、溫度體重、溫度) )二、數據資料的統(tǒng)計整理二、數據資料的統(tǒng)計整理 統(tǒng)計工作一般分為統(tǒng)計工作一般分為統(tǒng)計設計統(tǒng)計設計、收集資料收集資料、整理資料整理資料和和分析資料分析資料四個階段,其中數據資料四個階段,其中數據資料的統(tǒng)計整理就是根據統(tǒng)計研究的任務,對搜集的統(tǒng)計整理就是根據統(tǒng)計研究的任務,對搜集到的數據資料進行科學的匯總和處理,使數據到的數據資料進行科學的匯總和處理,使數據資料系統(tǒng)化,以反映研究總體的特征、規(guī)律和資料系統(tǒng)化,以反映研究總體的特征、規(guī)律和趨勢。趨勢。數據資料整理和圖示通常包括下列數據資料整理和圖示通常包括下列步驟步驟:(1)對數據資料進行審核和訂正;)對數據資料進行審核和訂正;(2

11、)對數據資料進行統(tǒng)計分組(分類);)對數據資料進行統(tǒng)計分組(分類);(3)進行統(tǒng)計匯總,計算各組頻數,編制頻數分布表;)進行統(tǒng)計匯總,計算各組頻數,編制頻數分布表;(4)給出統(tǒng)計圖表或報告。)給出統(tǒng)計圖表或報告。 注:注: 在對數據進行統(tǒng)計整理時,應根據不同的數在對數據進行統(tǒng)計整理時,應根據不同的數據類型進行處理,對定性數據(定類數據和定序數據)據類型進行處理,對定性數據(定類數據和定序數據)主要作分類整理,對定量數據(數值數據)主要作分主要作分類整理,對定量數據(數值數據)主要作分組整理。組整理。頻數:頻數:統(tǒng)計分組中落在各組(或類別)中的統(tǒng)計分組中落在各組(或類別)中的數據個數。數據個數。

12、頻率:頻率:各組(或類別)的數據個數占數據總各組(或類別)的數據個數占數據總個數的比例值。個數的比例值。頻數分布表:頻數分布表:各組觀察值(或類別)及其各組觀察值(或類別)及其相應的頻數(或頻率)用表格形式按順序相應的頻數(或頻率)用表格形式按順序全部列出來。全部列出來。概概 念:念:累積頻數累積頻數指把各類別的頻數逐項累加。指把各類別的頻數逐項累加。累累積積頻率頻率指指把各類別的頻率逐項累加。把各類別的頻率逐項累加。例例 為研究廣告市場的狀況,一家廣告公司為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取人就廣告問題做了郵寄在某城市隨機抽取人就廣告問題做了郵寄問卷調查,其中的一個問題是:問卷

13、調查,其中的一個問題是:“您比較關心下您比較關心下列哪一類廣告?列哪一類廣告?” 商品廣告商品廣告 服務廣告服務廣告 金融廣告金融廣告 房地產廣告房地產廣告 招生招聘廣告招生招聘廣告 其他廣告其他廣告1、定性數據的整理和圖示廣告類型廣告類型人數(人)人數(人) 比例比例頻率頻率(%) 商品廣告商品廣告 112 112 0.560 56.0 56.0 服務廣告服務廣告 51 51 0.255 25.5 25.5 金融廣告金融廣告 9 9 0.045 4.5 4.5 房地產廣告房地產廣告 16 16 0.080 8.0 8.0 招生招聘廣告招生招聘廣告 10 10 0.050 5.0 5.0 其他

14、廣告其他廣告 2 2 0.010 1.0 1.0 合計合計 200 200 1.0001.000 100.0 100.0 某城市居民關注廣告類型的頻某城市居民關注廣告類型的頻數分布數分布某城市居民關注不同類型廣告的人數分布(條形圖)某城市居民關注不同類型廣告的人數分布(條形圖)頻數(人)頻數(人)條形圖條形圖是用寬度相同的條形高度或長短來表是用寬度相同的條形高度或長短來表示各類別頻數或頻率的圖形。示各類別頻數或頻率的圖形。圓形圖圓形圖是用圓形及圓內扇形的面積來表示各是用圓形及圓內扇形的面積來表示各類別類別頻率頻率的圖形。的圖形。某城市居民關注不同類型廣告的人數的構成(餅圖)某城市居民關注不同類

15、型廣告的人數的構成(餅圖)2、定量數據的整理和圖示、定量數據的整理和圖示分組方法分組方法單變量值分組單變量值分組組距分組組距分組等距分組等距分組異距分組異距分組數據的分組數據的分組單變量值分組單變量值分組、適用于離散變量且變量值較少、適用于離散變量且變量值較少、把每一變量值作為一組、把每一變量值作為一組例例 某生產車間名工人日加工零件某生產車間名工人日加工零件數(單位:個)如下。試采用單變量值對數數(單位:個)如下。試采用單變量值對數據進行分組。據進行分組。117117122122124124129129139139107107117117130130122122125125108108131

16、131125125117117122122133133126126122122118118108108110110118118123123126126133133134134127127123123118118112112112112134134127127123123119119113113120120123123127127135135137137114114120120128128124124115115139139128128124124121121零件數零件數(個)(個)頻數頻數(人)(人)零件數零件數(個)(個)頻數頻數(人)(人)零件數零件數(個)(個)頻數頻數(人)(人)107

17、1071 11191191 11281282 21081082 21201202 21291291 11101101 11211211 11301301 11121122 21221224 41311311 11131131 11231234 41331332 21141 11241243 31341342 21151 11251252 21351351 11171173 31261262 21371371 11181183 31271273 31391392 2某車間名工人日加工零件數分組表某車間名工人日加工零件數分組表適用連續(xù)變量或離散變量且變量值較多。適用連續(xù)變量或離散變量且變量值較多。

18、把一個區(qū)間作為一組,區(qū)間長度可以相等把一個區(qū)間作為一組,區(qū)間長度可以相等 也可以不相等。也可以不相等。分組時應分組時應“不重不漏不重不漏”。組距分組組距分組按數據的個數按數據的個數及數據本身的特點及數據本身的特點選擇組數選擇組數,通常當數據個數小于通常當數據個數小于50時,可分為時,可分為5-6組;當數據個數為組;當數據個數為100左右時,可分為左右時,可分為6-10組;當數據個數超組;當數據個數超過過500時,可分為時,可分為10-15組。組。組距分組步組距分組步驟:驟:確定組確定組數數也可按也可按Sturges經驗公式確定組數經驗公式確定組數:ln1ln2nK 例如,當例如,當n=90時,

19、組數時,組數849. 72ln90ln1K數據的最大值與最小值之差稱為數據的最大值與最小值之差稱為極差極差,用,用表示,即表示,即 最大值最小值最大值最小值確定各組的組距與組限確定各組的組距與組限KRd各組取相同的組距。組中值各組取相同的組距。組中值2上限下限由組數和極差就可確定組距由組數和極差就可確定組距,即即把數據歸組后得頻數分布表把數據歸組后得頻數分布表. .歸組歸組按零件數分組(個)按零件數分組(個)頻數(人)頻數(人)頻率(頻率(%)1051103 3 6 6 1101155 5 10 10 1151208 8 16 16 12012514 14 28 28 12513010 10 20 20 1301356 6 12 12 1351404 4 8 8 合計合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論