已閱讀5頁,還剩80頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第 3 章 數(shù)據(jù)的整理與顯示,第一節(jié) 統(tǒng)計整理概述 第二節(jié) 統(tǒng)計分組 第三節(jié) 次數(shù)分布 第四節(jié) 統(tǒng)計表,第一節(jié) 統(tǒng)計整理概述,一、統(tǒng)計整理的概念和意義 1.概念 統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的和任務,對統(tǒng)計調查階段所搜集到的大量原始資料進行加工匯總,使其系統(tǒng)化、條理化、科學化,以得出反映事物總體綜合特征的資料的工作過程。,2.意義: (1)統(tǒng)計整理是統(tǒng)計工作中一個十分重要的中間環(huán)節(jié),它既是統(tǒng)計調查階段的繼續(xù),又是統(tǒng)計分析階段的前提和基礎。 (2)統(tǒng)計整理實現(xiàn)了從個別單位的標志值向說明總體數(shù)量特征的指標值的過渡,是對社會經(jīng)濟現(xiàn)象從感性認識上升到理性認識的過渡階段。,(一)統(tǒng)計整理的原則: 要抓住最基本最能說明問題本質特征的統(tǒng)計分組和統(tǒng)計指標,對統(tǒng)計資料進行加工整理。,二、統(tǒng)計整理的原則和步驟(內容),(二)統(tǒng)計整理的步驟(內容) 1.設計和編制統(tǒng)計整理方案 2.對原始資料進行審核 3.按要求進行分組或分類,編制分配數(shù)列 4.根據(jù)分組分類情況進行匯總(現(xiàn)在主要采用電腦匯總)和計算,得出各項指標值。 5.編制統(tǒng)計表,用統(tǒng)計表體現(xiàn)分組、匯總的結果 6.做好統(tǒng)計資料的匯編和積累,三、統(tǒng)計整理中的常用術語,1、 準確性與精確性 準確性(accuracy)也叫準確度,指觀測值與其真值的接近程度。 設某一試驗指標或性狀的真值為,觀測值為 x,若 x與相差的絕對值|x|越小, 則觀測值x的準確性越高; 反之則低。,精確性(precision)也叫精確度,指同一試驗指標或性狀的重復觀測值彼此接近的程度。 若觀測值彼此接近,即任意二個觀測值xi 、xj 相差的絕對值|xi xj |越小,則觀測值精確性越高;反之則低。準確性、精確性的意義見圖2-1。,圖2-1 準確性與精確性的關系示意圖,2、隨機誤差與系統(tǒng)誤差,隨機誤差:是由于許多無法控制的內在和外在的偶然因素所造成的差異。 隨機誤差帶有偶然性質,在試驗中,即使十分小心的進行試驗操作也難以消除。 隨機誤差不可避免,但可減少。 隨機誤差影響試驗的精確性。,系統(tǒng)誤差 :是由于試驗對象相差較大,測量的儀器不準 、標準試劑未經(jīng)校正等所引起差異。 系統(tǒng)誤差可以通過改進方法、正確試驗設計來避免、消除。系統(tǒng)誤差影響試驗的準確性。 統(tǒng)計上的試驗誤差是指隨機誤差。這種誤差愈小,試驗的精確性愈高。,第二節(jié) 統(tǒng)計分組,一、統(tǒng)計分組的概念 統(tǒng)計分組是根據(jù)統(tǒng)計研究的任務和目的,將總體按照一個或幾個標志劃分為若干個性質不同又有聯(lián)系的部分。,例1:某班學生(20人)總體按性別標志分組情況,例2:,二、統(tǒng)計分組的意義和作用 統(tǒng)計分組是基本的統(tǒng)計方法之一,通過分組把總體中具有不同性質的單位分開,把性質相同的單位合在一起,保持組內資料的同質性和組間資料的差異性,正確地反映出統(tǒng)計總體的本質特征,以便進一步運用各種統(tǒng)計方法,研究現(xiàn)象的數(shù)量表現(xiàn)和數(shù)量特征。,統(tǒng)計分組法在統(tǒng)計認識中的作用是多方面的,主要有以下三方面: 1.劃分事物的類型:不同類型的事物有不同的特點、性質和規(guī)律,只有通過科學的分組才能達到對不同類事物和總體的認識。,2.揭示現(xiàn)象內部結構:一是從靜態(tài)上來看,各組占總體比重大小的不同,對總體的影響也不同,比重相對大的決定著總體的性質或結構類型;二是從動態(tài)上來看,觀察各組比重的變化過程能更加深刻的認識現(xiàn)象和事物發(fā)展的規(guī)律和趨勢。,3.分析現(xiàn)象之間的依存關系:不同現(xiàn)象之間的依存關系是一種比較緊密的聯(lián)系,而統(tǒng)計分組法是分析研究此種關系最基本的一種方法。具體運用時關鍵是要分清影響因素(自變量)和結果因素(因變量),三、統(tǒng)計分組的種類 統(tǒng)計分組可以按照不同的標準進行分類,一般有以下幾種分類: 1.按分組標志的性質劃分:統(tǒng)計分組分為品質分組和數(shù)量分組。品質分組是按品質標志進行的分組。變量分組是按數(shù)量標志的分組。,2.按分組標志的多少劃分:統(tǒng)計分組分為簡單分組和復合分組。簡單分組是對研究的總體僅按一個標志進行的分組;復合分組是對研究的同一總體選擇兩個或兩個以上標志層疊起來進行的分組。,四、分組體系 1.概念:統(tǒng)計分組體系是指在統(tǒng)計整理中,為研究現(xiàn)象總體的情況而運用多個分組標志對總體進行分組,從而形成一系列相互聯(lián)系、相互補充的分組體系。,2.分類:平行分組體系和復合分組體系。 平行分組體系就是對同一總體進行若干次簡單分組。 復合分組體系就是對某一總體進行某種復合分組。,根據(jù)統(tǒng)計研究的目的,在對研究對象進行分析的基礎上,抓住具有本質性的區(qū)別及反映現(xiàn)象內在聯(lián)系的標志來作為分組的標志。 分組標志的選擇是分組的關鍵。在統(tǒng)計整理中,選擇什么樣的標志就會形成什么樣的分組體系。且分組標志一經(jīng)確定,就突出了總體在此標志下的性質差異,而掩蓋了總體在其他標志下的差異,五、分組標志的選擇,例: 欲了解我校的師資梯隊和水平情況,就應該選取職稱標志和年齡標志進行分組。 若想了解我校學生的來源情況,就應該選取籍貫標志進行分組。,1.按品質標志分組: (1)涵義:以品質標志為分組標志,并在品質標志的變異范圍內劃定各組界限。,六、統(tǒng)計分組的方法,2.按數(shù)量標志進行的分組(變量分組法): (1)涵義:以數(shù)量標志為分組標志,并在數(shù)量標志的變異范圍內劃定各組界限。 (2)數(shù)量標志分組的關鍵是要掌握決定事物質的差異的數(shù)量界限。,(3)主要的分法:單項式分組和組距式分組。 單項式分組。單項式分組是對于變量值較少的離散型變量而言的,在此情況下,可將每一個變量值作為一組按順序排列分組。,例如: 按人口數(shù)對某地居民戶進行分組,組距式分組。組距式分組是對于連續(xù)型變量和變量值較多的離散型變量而言,將整個變量值依次劃分為幾個區(qū)間,一個區(qū)間內的所有變量值作為一組。如次數(shù)分布表。,第三節(jié) 次 數(shù) 分 布,一、次數(shù)分布及次數(shù)的概念 1.次數(shù)分布是在統(tǒng)計分組的基礎上,將總體的所有單位,按組歸并排列,從而形成總體中的各個單位在各組間的分布。又稱為分配數(shù)列。 2.分布在各組的個體單位數(shù)叫次數(shù)。次數(shù)可以用絕對數(shù)表示,即頻數(shù);也可以用結構相對數(shù)表示,即頻率或比率或比重。,二、 數(shù)據(jù)資料的整理方法 -次數(shù)分布表,當觀測值較多(n30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。,1.連續(xù)性資料(計量資料)的整理 連續(xù)性資料的整理,需要先確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測值計數(shù)歸組。 【例】 為了分析某生產(chǎn)廠的罐頭質量,現(xiàn)隨機抽取100聽罐頭樣品,分別稱取其凈重,數(shù)據(jù)資料見下表。,表 100聽罐頭樣品的凈重 g,1.1、求全距 R 全距是數(shù)據(jù)資料中的最大值與最小值之差,又稱為極差(range),用R表示。即 R=Max(xi)-Min(xi) xi為觀測值 本例 Max=358.2 Min=331.2 R= 358.2 - 331.2 =27.0,1.2、確定組數(shù) k 組數(shù)的多少視樣本含量及資料的變動范圍大小而定,一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當,不宜過多,亦不宜過少。一般組數(shù)的確定,可參考下表。,本例中,n100,初步確定組數(shù)為9組。,樣本含量與組數(shù),3、確定組距 i 每一組中的最大值與最小值之差稱為組距(Class interval),記為 i。分組時一般要求各組的組距相等。 組距(i)全距R組數(shù)k 本例 i279=3,各組的最大值與最小值稱為組限。最小值稱為下限, 最大值稱為上限。每一組的中點值稱為組中值,它是該組的代表值。組中值與組限、組距的關系如下: 組中值(組下限組上限)/2組下限1/ 2組距組上限1/2組距,4、確定組限及組中值,組距確定后, 首先要選定第一組的組中值。在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。 注意:最末一組的上限應大于資料中的最大值。,分組結束后,將資料中的每一觀測值逐一歸組,統(tǒng)計每組內所包含的觀測值個數(shù),制作次數(shù)分布表。,5、制作次數(shù)分布表,100聽罐頭凈重的次數(shù)分布,表 100盒鮮棗每盒檢出不合格棗數(shù),以100盒鮮棗每盒檢出不合格棗數(shù)為例,說明間斷性資料的整理。,3.3 間斷性資料(計數(shù)資料)的整理,100盒鮮棗每盒檢出不合格棗數(shù)次數(shù)分布表,3.4質量性狀資料資料的整理 對于質量性狀資料 、 半定量(等級)資料,可按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。,二、 數(shù)據(jù)資料的整理方法 _次數(shù)分布圖,統(tǒng)計圖繪制的基本要求,1、標題簡明扼要,列于圖的下方。 2、縱、橫兩軸應有刻度,注明單位。 3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大; 圖形長寬比例約5:4或6:5。 4、圖中需用不同顏色或線條代表不同處理、樣品等時,應有圖例說明。,數(shù)值型數(shù)據(jù)的圖示,分組數(shù)據(jù)直方圖,分組數(shù)據(jù)的圖示 (直方圖的繪制),某電腦公司銷售量分布的直方圖,我一眼就看出來了,銷售量在170180之間的天數(shù)最多!,分類數(shù)據(jù)的圖示條形圖 (bar Chart),用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形 有單式條形圖、復式條形圖等形式 繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(column chart),分類數(shù)據(jù)的圖示條形圖 (例題分析),分類數(shù)據(jù)的圖示條形圖 (例題分析),分類數(shù)據(jù)的圖示對比條形圖 (side-by-side bar chart ),分類變量在不同時間或不同空間上有多個取值 對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢,分類數(shù)據(jù)的圖示對比條形圖 (例題分析),直方圖與條形圖的區(qū)別,條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的 直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義 直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列 條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù),數(shù)值型數(shù)據(jù)的圖示,STATISTICA,未分組數(shù)據(jù)莖葉圖和箱線圖,未分組數(shù)據(jù)莖葉圖 (stem-and-leaf display),用于顯示未分組的原始數(shù)據(jù)的分布 由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的 以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉 樹葉上只保留一位數(shù)字 5. 莖葉圖類似于橫置的直方圖,但又有區(qū)別 直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息,未分組數(shù)據(jù)莖葉圖 (例題分析),未分組數(shù)據(jù)莖葉圖 (擴展的莖葉圖),未分組數(shù)據(jù)箱線圖 (box plot),用于顯示未分組的原始數(shù)據(jù)的分布 箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成 其繪制方法是: 首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me 和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接 該箱線圖也稱為Median/Quart./Range箱線圖,未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖 (箱線圖的構成),中位數(shù),4,6,8,10,12,Median/Quart./Range箱線圖,未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖 (例題分析),分布的形狀與箱線圖,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析),【例】 從某大學經(jīng)濟管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,所得結果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析),8門課程考試成績的箱線圖,11名學生8門課程考試成績的箱線圖,Min-Max,25%-75%,Median value,45,55,65,75,85,95,105,學生1,學生2,學生3,學生4,學生5,學生6,學生7,學生8,學生9,學生10,學生11,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析),數(shù)值型數(shù)據(jù)的圖示,時間序列數(shù)據(jù)折線圖,時間序列數(shù)據(jù)折線圖 (line plot), 繪制折線圖時應注意以下幾點 時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸 圖形的長寬比例要適當,其長寬比例大致為10:7 一般情況下,縱軸數(shù)據(jù)下端應從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷,時間序列數(shù)據(jù)線圖 (例題分析),【例】我國19902006年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試繪制線圖,時間序列,時間序列數(shù)據(jù)線圖 (例題分析),數(shù)值型數(shù)據(jù)的圖示,多變量數(shù)據(jù)的圖示 散點圖、氣泡圖、雷達圖,兩個變量間的關系二維散點圖 (2D Scatterplots),展示兩個變量之間的關系 用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi ,yi)在坐標系中用一個點表示,n組數(shù)據(jù)在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數(shù)據(jù)圖,兩變量,兩個變量間的關系二維散點圖 (2D Scatterplots),三個變量間的關系氣泡圖 (bubble chart),顯示三個變量之間的關系 圖中數(shù)據(jù)點的大小依賴于第三個變量,也稱為蜘蛛圖(spider chart) 顯示多個變量的圖示方法 在顯示或對比各變量的數(shù)值總和時十分有用 假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比 可用于研究多個樣本之間的相似程度,多變量數(shù)據(jù)雷達圖 (radar chart),多變量數(shù)據(jù)雷達圖 (例題分析),【例】2006年我國城鄉(xiāng)居民家庭平均每人各項生活消費支出構成數(shù)據(jù)如表。試繪制雷達圖,多變量數(shù)據(jù)雷達圖 (例題分析),分類數(shù)據(jù)的圖示餅圖 (pie Chart),也稱圓形圖,是用圓形及圓內扇形的面積來表示數(shù)值大小的圖形 主要用于表示總體或樣本中各組成部分所占的比例,對于研究結構性問題十分有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年山西衛(wèi)生健康職業(yè)學院單招職業(yè)技能測試題庫帶答案解析
- 2024年湖南水利水電職業(yè)技術學院單招職業(yè)技能測試題庫標準卷
- 2024年山東文化產(chǎn)業(yè)職業(yè)學院單招職業(yè)技能測試題庫及解析答案
- 2024年事業(yè)單位教師招聘言語理解與表達題庫含答案2
- 20170828日語入門課件
- 2024至2030年中國鍋爐清洗脫脂劑數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國液晶顯示變送器全套散件數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國彩灰大理石數(shù)據(jù)監(jiān)測研究報告
- 2024年中國齒形汽車V帶市場調查研究報告
- 2024年08月寧夏2024年中國銀行寧夏區(qū)分行校園招考筆試歷年參考題庫附帶答案詳解
- 物業(yè)項目移交清單表
- 2024-2030年中國核醫(yī)學行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- VTE評分量表解讀 課件2024.8
- 手術室安全核查制度及流程課件
- 2024-2025學年高中英語選擇性必修 第二冊北師大版(2019)教學設計合集
- 高標準農(nóng)田跟蹤審計、工程中間計量、變更價格調整及竣工結算審核項目 投標方案(技術方案)
- 感恩節(jié)英文課件
- 慈溪市2024-2025學年四上數(shù)學期末教學質量檢測模擬試題含解析
- 人教版小學一年級語文上冊全冊試卷全套含答案
- 2025年高考化學二、三輪復習策略講座
- 2024-2025學年哈爾濱市平房區(qū)四上數(shù)學期末調研試題含解析
評論
0/150
提交評論