網(wǎng)?;A(chǔ)班講義_第1頁
網(wǎng)校基礎(chǔ)班講義_第2頁
網(wǎng)校基礎(chǔ)班講義_第3頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二十四章 描述統(tǒng)計本章考情本章重點:測度數(shù)據(jù)集中趨勢的統(tǒng)計量:均值、中位數(shù)和眾數(shù)。測度數(shù)據(jù)離散程度的統(tǒng)計量:方差、標準差和離散系數(shù)。測度數(shù)據(jù)分布偏態(tài)的統(tǒng)計量:偏態(tài)系數(shù)、標準分數(shù)。測度變量相關(guān)關(guān)系的統(tǒng)計量:散點圖、相關(guān)系數(shù)。知識點一:集中趨勢的測度1.均值。平均數(shù),就是數(shù)據(jù)組中所有數(shù)值的總和除以該組數(shù)值的個數(shù)。均值是集中趨勢最主要的測度值,它是一組數(shù)據(jù)的重心所在,解釋了一組數(shù)據(jù)的平均水平?!臼纠磕呈圬浶〗M 5 名營業(yè)員,元旦一天的銷售額分別為 520 元、600 元、480 元、750 元和 500元,求該日平均銷售額。平均銷售額(520600480750500)5570(元)【注意 1】均

2、值主要適用于數(shù)值型數(shù)據(jù),但不適用于分類和順序數(shù)據(jù)?!咀⒁?2】均值容易受到值的影響,對數(shù)據(jù)組的代表性減弱。值會使得均值向極大值或極小值方向傾斜,使得均值需要全部信息避不開值!2.中位數(shù)。把一組數(shù)據(jù)按從小到大或從大到小的順序進行排列,位置居中的數(shù)值叫做中位數(shù),用Me 表示:【注意 1】中位數(shù)是一個位置代表值,主要用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù)?!咀⒁?2】中位數(shù)的優(yōu)點:不受值的影響,性強,尤其適用于偏斜分布的數(shù)值型數(shù)據(jù)。不需要全部信息能避開值!3.眾數(shù):指一組數(shù)據(jù)中出現(xiàn)次數(shù)(頻數(shù))最多的變量值。不適用于定量數(shù)據(jù)?!咀⒁狻窟m用于描述分類數(shù)據(jù)和順序數(shù)據(jù)的集中趨勢。在定量數(shù)據(jù)中,可能出現(xiàn)

3、多眾數(shù)和無眾數(shù)的情況,因此眾數(shù)不適于描述定量數(shù)據(jù)的集中位置。不需要全部信息能避開總結(jié):值!指標適用特點均值定量變量利用全部信息,受值影響明顯值,則代表性差中位數(shù)順序變量定量變量不受值影響適用于分布不對稱的數(shù)據(jù)年份單選題多選題合計2018 年3 題 3 分1 題 2 分5 分2017 年3 題 3 分1 題 2 分5 分2016 年2 題 2 分2 題 4 分6 分【例題單選題】(2018 年)下列統(tǒng)計量中,適用于描述分類數(shù)據(jù)和順序數(shù)據(jù)集中趨勢的是( )A.眾數(shù) B.均值C.標準分數(shù)D.中位數(shù)正確A本題考查眾數(shù)。眾數(shù)適用于描述分類數(shù)據(jù)和順序數(shù)據(jù)的集中趨勢?!纠}單選題】(2017 年)2016

4、年某企業(yè)下轄 8 個的銷售額分別為 10000 萬元、3600萬元、800 萬元、1000 萬元、600 萬元、3000 萬元、2800 萬元、2200 萬元,這組數(shù)據(jù)中的中位數(shù)是(萬元。A.2200 B.2800 C.2500D.3000正確C本題考查中位數(shù)的計算。(28002200)/22500?!纠}單選題】在對數(shù)據(jù)集中趨勢的測度中,適用于偏斜分布的數(shù)值型數(shù)據(jù)的是( )。A.中位數(shù) B.均值 C.標準差 D.方差正確A本題考查中位數(shù)。中位數(shù)主要適用于順序數(shù)據(jù),也適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù),中位數(shù)不受值的影響,性強,尤其適用于收入這類偏斜分布的數(shù)值型數(shù)據(jù)。知識點二:離散程度的測度

5、(一)方差和標準差離散程度:反映的是數(shù)據(jù)之間的差異程度。集中趨勢的測度值對一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差;離散程度越小,其代表性就越好。1.方差方差:數(shù)據(jù)組中各數(shù)值與其均值離差平方的平均數(shù)。方差越小,說明數(shù)據(jù)值與均值的平均距離越小,均值的代表性越好??傮w方差公式:沒有充分利用全部信息,穩(wěn)定性優(yōu)于眾數(shù),差于均值眾數(shù)分類變量順序變量沒有充分利用全部信息,不受值影響適用于分布明顯呈偏態(tài)的數(shù)據(jù)可能不唯一【示例】某售貨小組 5 名營業(yè)員,元旦一天的銷售額分別為 520 元、600 元、480 元、750 元和 500元,平均銷售

6、額為 570 元,計算日銷售額的樣本方差。(520570)2(600570)2(480570)2(750570)2(500570)2(51)12200(元 2)2.標準差(1)標準差:方差的平方根?!臼纠? 名營業(yè)員元旦當天的銷售額的標準差(2)標準差與方差只適用于數(shù)值型數(shù)據(jù),它們對值很敏感。(二)離散系數(shù)1.離散系數(shù):變異系數(shù)或標準差系數(shù)。標準差與均值的比值:適用:不同類別數(shù)據(jù)離散程度的比較?!咀⒁狻繕藴什畹拇笮〔粌H與數(shù)據(jù)的測度有關(guān),也與觀測值的均值大小有關(guān),不能直接用標準差比較不同變量的離散程度。離散系數(shù)消除了測度和觀測值水平不同的影響,因而可以直接用來比較變量的離散程度?!臼纠磕硨W校

7、學生的平均為 20 歲,標準差為 3 歲;該校教師的平均的離散程度。為 38 歲,標準差為3 歲。比較該校學生和教師正確教師學生學生的離散程度更大。的離散系數(shù)3/200.15的離散系數(shù)3/380.0789【例題多選題】(2017 年)下列統(tǒng)計量中,適用于測度數(shù)據(jù)離散程度的有( )。A.眾數(shù) B.方差 C.中位數(shù) D.標準差E.均值正確BD本題考查測度數(shù)據(jù)離散程度的指標。選項 ACE 屬于測度集中趨勢的指標?!纠}多選題】(2015 年)下列統(tǒng)計量中,容易受A.均值 B.方差 C.眾數(shù) D.中位數(shù)E.標準差值影響的有( )。正確ABE本題考查集中趨勢和離散程度的測度指標。均值、方差、標準差容易受

8、值的影響【例題單選題】(2015 年)根據(jù) 2014 年某城市金融業(yè)和制造業(yè)各 1000 人的年薪樣本數(shù)據(jù)來比較這兩個行業(yè)從業(yè) A.標準分數(shù) B.相關(guān)系數(shù) C.變異系數(shù)D.偏態(tài)系數(shù)年薪的離散程度,應(yīng)采用的統(tǒng)計量是( )。正確C本題考查離散系數(shù)。離散系數(shù)也稱為變異系數(shù)或標準差系數(shù),即標準差與均值的比值,主要用于不同類別數(shù)據(jù)離散程度的比較。知識點三:分布形態(tài)的測度(一)偏態(tài)系數(shù)(SK):偏度:指數(shù)據(jù)分布的偏斜方向和程度,描述的是數(shù)據(jù)分布對稱程度。(單選)偏態(tài)系數(shù):測度數(shù)據(jù)分布偏度的指標。取決于離差三次方的平均數(shù)與標準差三次方的比值。3.應(yīng)用:偏態(tài)系數(shù)的絕對值越大,數(shù)據(jù)分布偏斜程度越大。SK0:數(shù)據(jù)

9、分布是對稱的;SK0:數(shù)據(jù)分布右偏;00.5(輕度)0.51(中度)大于 1(嚴重)(3)SK0:數(shù)據(jù)分布;00.5(輕度)0.51(中度)大于1(嚴重)【例題多選題】(2018 年)在描述統(tǒng)計中,測度的數(shù)據(jù)分布特征主要包括( )。A.對稱程度 B.離散程度 C.相關(guān)性 D.集中趨勢E.偏斜方向正確ABDE本題考查描述統(tǒng)計。在描述統(tǒng)計中,可以通過統(tǒng)計量描述數(shù)據(jù)的分布特征。對于數(shù)據(jù)分布特征的測度主要分為三個方面:一是分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或的程度;二是分布的離散程度,反映各數(shù)據(jù)之間的差異程度,也能反映中心值對數(shù)據(jù)的代表程度;三是分布的偏態(tài),反映數(shù)據(jù)分布的不對稱性。對于兩個定量變

10、量之間的相關(guān)分析,經(jīng)常采用的描述方法是散點圖和相關(guān)系數(shù)統(tǒng)計量?!纠}多選題】(2015 年)某企業(yè)員工年收入數(shù)據(jù)分布的偏態(tài)系數(shù)為 3.0,則該組數(shù)據(jù)的分布形態(tài)為( )。A.右偏 B.C.嚴重偏斜 D.輕度偏斜E.中度偏斜正確AC本題考查偏態(tài)系數(shù)。偏態(tài)系數(shù)為 0,說明數(shù)據(jù)的分布是對稱的。為正,說明分布是右偏的:取值在 00.5 之間說明輕度右偏;取值在 0.51 之間,說明中度右偏;取值大于 1 說明嚴重右偏。為負,說明分布為:取值在 00.5 之間,說明輕度;取值在0.51 之間說明中度;取值小于1,說明嚴重。本題中,偏態(tài)系數(shù)為 3,說明嚴重右偏。【例題多選題】(2016 年)在某上,商品甲得

11、到 6 個評價得分,分別是 1、4、4、5、55;商品乙得到 5 個評分,分別是 3、3、3、4、4。關(guān)于這兩組數(shù)據(jù)的說法,正確的有( )。A.商品甲的評分中位數(shù)高于商品乙 B.商品甲的評分均值低于商品乙 C.商品甲的評分眾數(shù)高于商品乙D.商品甲的評分分布離散程度大于商品乙E.商品甲的評分分布是的正確ACDE本題考查集中趨勢、離散程度的測度。商品甲:評分中位數(shù)(45)/24.5,眾數(shù)5,均值(144555)/64,方差(14)2(44)2(44)2(54)2(54)2(54)2/52.4,標準差1.55,離散系數(shù)1.55/40.3875。商品乙:評分中位數(shù)3,眾數(shù)3,均值3.4,標準差0.55

12、,離散系數(shù)0.55/3.40.16由于商品甲離差三次方,即(14)3(44)3(44)3(54)3(54)3(54)324,根據(jù)公式可知偏態(tài)系數(shù)為負,說明數(shù)據(jù)分布。(二)標準分數(shù)標準分數(shù)(Z 分數(shù)):統(tǒng)計學上常用的一種標準化方法。標準分數(shù)可以給出數(shù)值距離均值的相對 位置,用于比較不同分布的變量值。公式:標準分數(shù) Z(數(shù)值均值)標準差結(jié)果:標準分數(shù) Z 越大越好?!咀⒁狻哭D(zhuǎn)變后的標準分數(shù)并沒有改變數(shù)值在原分布中的位置,也沒有改變數(shù)據(jù)原分布的偏態(tài),但是標準分數(shù)的平均數(shù)為 0,標準差為 1?!臼纠?1】考核 A 中員工得分 80 分,均值 80 分,標準差為 20 分,在考核 B 中員工得分 70

13、分,均值 60 分,標準差為 5 分。80 分的Z 分數(shù)(8080)20070 分的Z 分數(shù)(7060)52【說明】70 分在考核 B 中的相對高于 80 分在考核 A 中的相對。【示例 2】某班期末。語文全班平均成績 73 分,標準差 7 分,甲得了 78 分;數(shù)學全班平均成績 80 分,標準差 6.5 分,甲得了 83 分。甲哪一門成績更優(yōu)秀?因為兩科分布(均值、標準差)不同,不能用原始數(shù)據(jù)直接比較,需要轉(zhuǎn)換成標準分數(shù),然后比較。Z(語文)(7873)70.71 Z(數(shù)學)(8380)6.50.64【說明】甲的語文成績更優(yōu)秀。4.實際應(yīng)用:當數(shù)據(jù)服從對稱的準差之內(nèi)的數(shù)據(jù)項所占比例。分布時,

14、可以運用經(jīng)驗法則來判斷與均值的距離在特定倍數(shù)標約有 68%的數(shù)據(jù)與平均數(shù)的距離在 1 個標準差之內(nèi),標準分數(shù)在1,1范圍內(nèi);約有 95%的數(shù)據(jù)與平均數(shù)的距離在 2 個標準差之內(nèi),標準分數(shù)在2,2范圍內(nèi);約有 99%的數(shù)據(jù)與平均數(shù)的距離在 3 個標準差之內(nèi),標準分數(shù)在3,3范圍內(nèi)?!臼纠空Z文全班平均成績 73 分,標準差 7 分:則 68%的同學得分在 66 和 80 之間;則 95%的同學得分在 59 和 87 之間;則 99%的同學得分在 52 和94 之間?!纠}單選題】(2018 年)某公司員工年度業(yè)績考核中,全體員工考核成績的均值為 80,方差為 25。某員工在這次業(yè)績考核中成績?yōu)?

15、85,則該員工考核成績的標準分數(shù)為( )。A.3.4B.0.2C.1.0D.17.0正確C本題考查分布形態(tài)的測度。標準分數(shù)可以給出數(shù)值距離均值的相對位置,計算方法是用數(shù)值減去均值所得的差除以標準差,標準分數(shù)(8580)/51?!纠}單選題】(2017 年)根據(jù)經(jīng)驗法則,當數(shù)據(jù)服從對稱的個標準差之內(nèi)的數(shù)據(jù)項所占比例約為( )。A.99% B.68% C.95%D.100%分布時,與平均數(shù)的距離在 3正確A本題考查分布形態(tài)的測度。約有 99%的數(shù)據(jù)與平均數(shù)的距離在 3 個標準差之內(nèi),標準分數(shù)在3,3范圍內(nèi)?!纠}多選題】(2016 年)某企業(yè)客戶滿意度數(shù)據(jù)服從對稱的5。根據(jù)經(jīng)驗法則,關(guān)于該企業(yè)客戶

16、滿意度的說法,正確的有( )。約有 68%的客戶滿意度在70,80范圍內(nèi)約有 68%的客戶滿意度在75,85范圍內(nèi)約有 95%的客戶滿意度在75,95范圍內(nèi)約有 95%的客戶滿意度在65,85范圍內(nèi)約有 99%的客戶滿意度在60,90范圍內(nèi)分布,均值為 75,標準差為正確ADE本題考查標準分數(shù)。經(jīng)驗法則表明:約有 68%的數(shù)據(jù)與平均數(shù)的距離在 1 個標準差之內(nèi),約有 95%的數(shù)據(jù)與平均數(shù)的距離在 2 個標準差之內(nèi),約有 99%的數(shù)據(jù)與平均數(shù)的距離在 3 個標準差之內(nèi)。知識點四:變量間的相關(guān)分析(一)相關(guān)關(guān)系分類按相關(guān)的程度:完全相關(guān)、不完全相關(guān)和不相關(guān)。按相關(guān)的方向:正相關(guān)和負相關(guān)。按相關(guān)的形

17、式:線性相關(guān)和非線性相關(guān)?!咀⒁狻肯嚓P(guān)關(guān)系并不等同于因果關(guān)系。(二)兩變量的散點圖:兩個變量間的關(guān)系可以用散點圖來展示。觀測點分布無規(guī)律:不相關(guān)。觀測點分布密集在一條線周圍:線性相關(guān)。(1)正相關(guān):直線向右上傾斜(2)負相關(guān):直線向右下傾斜3.觀測點呈現(xiàn)曲線模式:兩個變量非線性相關(guān)。(三)相關(guān)系數(shù)的定義和計算Pearson 相關(guān)系數(shù):度量的是兩個變量之間的線性相關(guān)關(guān)系。Pearson 相關(guān)系數(shù)的取值范圍:1r1。(1)0r1:變量 X 和 Y 之間存在正線性相關(guān)關(guān)系;1r0:變量 X 和 Y 之間存在負線性相關(guān)關(guān)系;r1:變量 X 和 Y 之間為完全正線性相關(guān),即變量 Y 的取值完全依賴于變量

18、 X;r1:變量 X 和 Y 之間為完全負線性相關(guān),即變量Y 的取值完全依賴于變量 X?!咀⒁狻縋earson 相關(guān)系數(shù)只適用于線性相關(guān)關(guān)系的判斷。因此r0 只表示兩個變量之間不存在 線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如它們之間可能存在非線性相關(guān)關(guān)系。3.相關(guān)程度:【例題單選題】(2018 年)兩個變量之間完全相關(guān)是指( )。兩個變量之間的數(shù)值變化大致呈現(xiàn)為線性關(guān)系一個變量的取值完全由另一個變量的取值變化來確定 C.兩個變量之間存在因果關(guān)系D.兩個變量的取值變化互不影響正確B本題考查變量間的相關(guān)關(guān)系。當一個變量的取值變化完全由另一個變量的取值變化所確定時,稱這兩個變量間的關(guān)系為完全相關(guān)?!纠}單選題】(2017 年)下列圖形中,適用于描述兩大定量變量間相關(guān)關(guān)系的是( )。A.散點圖 B.圓形圖 C.條形圖D.直方圖正確A本題考查散點圖。兩個變量間的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論