版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2023-11-16
數(shù)據(jù)收集收集數(shù)據(jù)時(shí)需考慮的問題是:
相關(guān)總體數(shù)據(jù)來源提問調(diào)查中的偏差數(shù)據(jù)的類型2023-11-16相關(guān)總體總體是我們要調(diào)查或統(tǒng)計(jì)的某一現(xiàn)象的全部數(shù)據(jù)的集合。要明確向什麼總體收集數(shù)據(jù),因?yàn)閿?shù)據(jù)收集是花錢花時(shí)間有代價(jià)的。數(shù)據(jù)的一種描述性的定義為:可以由它作出推斷的已知事情或事物。數(shù)據(jù)有各種不同的表達(dá)形式對決策者而言,數(shù)據(jù)的品質(zhì)是一個(gè)最大的問題。2023-11-16數(shù)據(jù)來源數(shù)據(jù)可分為兩大來源:原始數(shù)據(jù)和二手?jǐn)?shù)據(jù)原始數(shù)據(jù)是直接向調(diào)查對象收集的數(shù)據(jù)。其特點(diǎn)是為指定目的而收集。二手?jǐn)?shù)據(jù)是收集已經(jīng)加工、整理過的數(shù)據(jù)。二手?jǐn)?shù)據(jù)大部分來自官方統(tǒng)計(jì),如年鑒、月度統(tǒng)計(jì)報(bào)表、財(cái)經(jīng)統(tǒng)計(jì)、經(jīng)濟(jì)趨勢等。2023-11-16數(shù)據(jù)來源數(shù)據(jù)獲取的途徑:調(diào)查、試驗(yàn)和模擬調(diào)查:只觀察、記錄或度量,但不對現(xiàn)場行為加以幹預(yù),是被動(dòng)的數(shù)據(jù)搜集方式。試驗(yàn):能主動(dòng)產(chǎn)生數(shù)據(jù),是有計(jì)畫、有選擇地對受試對象施加影響,來觀察受試對象的反應(yīng)。模擬:依據(jù)一定的基本數(shù)據(jù)使用電腦產(chǎn)生大量的隨機(jī)數(shù)據(jù),來模仿隨機(jī)現(xiàn)象,幫助進(jìn)行決策。2023-11-16數(shù)據(jù)來源原始數(shù)據(jù)得到的方法有:自填式、採訪法、直接觀察法和行政數(shù)據(jù)的調(diào)查等。數(shù)據(jù)收集的類型:普查和抽樣調(diào)查
普查是根據(jù)統(tǒng)計(jì)任務(wù)的特定目的而專門組織的一次性全面調(diào)查,一般局限於較小的總體。抽樣調(diào)查有隨機(jī)抽樣和非隨機(jī)抽樣隨機(jī)抽樣:總體中每個(gè)單位都有相同的概率或機(jī)會被選中。幾種重要的隨機(jī)抽樣有:簡單隨機(jī)抽樣、分層隨機(jī)抽樣、等距隨機(jī)抽樣和整群隨機(jī)抽樣等。
2023-11-16數(shù)據(jù)來源非隨機(jī)抽樣:抽樣時(shí)不遵循隨機(jī)原則,而是按照研究人員主觀判斷或僅按方便原則抽選樣本。非隨機(jī)抽樣技術(shù)主要有:方便抽樣、判斷抽樣、配額抽樣和雪球抽樣等。
配額(比例)抽樣:是非隨機(jī)抽樣中最流行的一種,配額抽樣類似於隨機(jī)抽樣中的分層抽樣,首先將總體中的所有單位按一定的標(biāo)誌分為若干類(組),然後在每個(gè)類(組)中用方便抽樣或判斷抽樣選取樣本單位。
2023-11-16數(shù)據(jù)來源例2(見P3)如某商場希望根據(jù)年齡和性別來調(diào)查對營業(yè)時(shí)間的意見,計(jì)畫調(diào)查周邊地區(qū)的1000個(gè)人。已知年齡和性別分佈如下:年齡(歲)比例(%)15-201620-302630-5030﹥5028性別比例(%)男51女492023-11-16數(shù)據(jù)來源若準(zhǔn)備抽1000人,則配額抽樣方案為:年齡(歲)男性女性15-20827820-3013312730-50153147﹥501431372023-11-16提問認(rèn)定調(diào)查總體及決定用問卷方式以得到所需資訊後,下一步是確定問什麼,如何問。一.問卷設(shè)計(jì)問卷調(diào)查一般是抽樣調(diào)查中常用的首選方式問卷設(shè)計(jì)是根據(jù)調(diào)查目的和要求,將所需要調(diào)查的問題具體化,使研究者能順利地獲取必要的資訊資料,以便於統(tǒng)計(jì)分析的一種手段2023-11-16提問1.問卷的一般結(jié)構(gòu)問卷的標(biāo)題問卷說明被訪者的基本情況調(diào)查的主題內(nèi)容編碼作業(yè)證明的記載2023-11-16提問2.問卷結(jié)構(gòu)特點(diǎn)問答由一個(gè)問題順勢轉(zhuǎn)入下一個(gè)問題;由一個(gè)主題轉(zhuǎn)到另一個(gè)主題。不要有跳躍而導(dǎo)致回答的無方向性。建議:從一般問題到特殊問題。2023-11-16提問“南方週末中國內(nèi)地人物創(chuàng)富榜”讀者調(diào)查問卷1.您對中國的民營企業(yè)家的總體評價(jià)是
A.正面評價(jià)B.負(fù)面評價(jià)C.感受不大2.如果您的評價(jià)是正面的,主要原因是
A.民營企業(yè)為從業(yè)者提供了工作機(jī)會和報(bào)酬
B.民營企業(yè)對國家經(jīng)濟(jì)發(fā)展的貢獻(xiàn)大
C.民營企業(yè)對社會責(zé)任有所擔(dān)當(dāng),扮演了企業(yè)公民的角色
D.其他2023-11-16提問3.如果您的評價(jià)是負(fù)面的,主要原因是
A.民營企業(yè)獲取財(cái)富方法的正當(dāng)性存在疑問
B.民營企業(yè)支配財(cái)富方面存在問題
C.民營企業(yè)沒有積極承擔(dān)社會責(zé)任
D.其他4.您感受過民營企業(yè)對社會(包括您本人)的貢獻(xiàn)嗎?
A.是B.否5.您是通過什麼途徑感受到民營企業(yè)對社會貢獻(xiàn)的?
A.本人直接受益B.大眾傳媒
C.周圍人口碑相傳D.其他2023-11-16提問蓋洛普組織總結(jié)提問的目的有如下5種:(1)找出回答者是否覺察到這一結(jié)果;(2)獲得關(guān)於結(jié)果的一般感覺;(3)獲得該結(jié)果指定部分的答案;(4)獲得反映回答者觀點(diǎn)的理由;(5)找出持有這些觀點(diǎn)的強(qiáng)烈程度;2023-11-16提問例:1.你是否知道合肥和徐州之間要修條高速公路的計(jì)畫?知道/不知道2.你是否同意合肥和徐州之間修條高速公路?強(qiáng)烈同意、同意、無所謂、不同意、強(qiáng)烈不同意3.你認(rèn)為高速公路會對當(dāng)?shù)丨h(huán)境產(chǎn)生影響嗎?有/沒有
4.如果反對,那你反對的理由是:
(a)已經(jīng)有一條可用的主幹道
(b)合肥和徐州之間運(yùn)量不足
(c)高速公路會損壞美麗的鄉(xiāng)村風(fēng)景
(d)道路會破壞歷史文物
(e)其他,請指定……
2023-11-16提問5..你準(zhǔn)備用下列哪一種行動(dòng)來支持你的觀點(diǎn)?
(a)給地區(qū)人大代表寫信
(b)給新聞單位寫信
(c)在政府召開的公眾聽證會上發(fā)言
(d)在網(wǎng)上發(fā)表呼籲文章進(jìn)行調(diào)查
(e)其他,請指定……2023-11-16提問二.提問的方式有開放式和預(yù)設(shè)答案提問(封閉式提問)開放式提問是指所提出的問答題並不列出所有可能的答案,而是由被訪者自由做答的問答題。預(yù)設(shè)答案提問是指已經(jīng)事先設(shè)計(jì)了各種可能的答案的問答題,被訪者只要或只能從中選定一個(gè)或幾個(gè)現(xiàn)成答案的提問方式。2023-11-16提問三.提問的措辭提問的措辭在誘導(dǎo)出有代表性回答中是非常重要的。一個(gè)有偏差的或誘導(dǎo)性提問將偏離給定的回答。在問卷設(shè)計(jì)中發(fā)現(xiàn)的偏差主要有:(1)把兩個(gè)或兩個(gè)以上問題表達(dá)為一個(gè);(2)問題中含有含糊或不熟悉的單詞;(3)用軟化難度或方向的詞開始的提問;(4)包含條件或假設(shè)條款;(5)包含對回答者一個(gè)或多個(gè)指令的提問;2023-11-16調(diào)查中的偏差調(diào)查的偏差來自許多方面,分為兩類:抽樣誤差和非抽樣誤差非抽樣誤差的來源:涵蓋誤差、計(jì)量誤差、處理誤差和無反應(yīng)誤差1.涵蓋誤差:指由於在抽樣框或樣本中出現(xiàn)了涵蓋不全、過度涵蓋、重複以及錯(cuò)誤的分類而導(dǎo)致估計(jì)的偏倚。2.計(jì)量誤差:指對一個(gè)問題所做的記錄與它的真值不同,可能是由於被調(diào)查者和調(diào)查者對問題的誤解、收集數(shù)據(jù)方式不同或測量工具而造成的。3.處理誤差:可能發(fā)生在數(shù)據(jù)編碼、數(shù)據(jù)錄入、審核及插補(bǔ)等步驟中。2023-11-16調(diào)查中的偏差4.無反應(yīng)誤差在抽樣調(diào)查中,我們希望能取得所要求的全部樣本單位的數(shù)據(jù)或特徵記錄,但在實(shí)踐中,常有部分單位的調(diào)查結(jié)果會因多種原因而出現(xiàn)空缺,即常稱的無反應(yīng)現(xiàn)象。調(diào)查中無反應(yīng)的原因(1)調(diào)查對象聯(lián)絡(luò)不上,已經(jīng)搬走(2)被調(diào)查者不能勝任或無能力(3)調(diào)查期間人不在(4)拒絕合作(5)丟失調(diào)查表2023-11-16調(diào)查中的偏差案例LiteraryDigest雜誌自第一次世界大戰(zhàn)以來一直進(jìn)行總統(tǒng)預(yù)測,而且每次都預(yù)測準(zhǔn)了。1936年美國總統(tǒng)選舉前,LiteraryDigest雜誌發(fā)出了1000萬張調(diào)查問卷?;厥盏?40萬張,預(yù)測共和黨候選人蘭登(London)和民主黨候選人羅斯福(Roosevelt)的得票比例是57:43,預(yù)測是根據(jù)240萬張的民意調(diào)查回單作出的。但實(shí)際選舉結(jié)果是羅斯福贏得了這場選舉,他與蘭登得票比例是62:38。2023-11-16調(diào)查中的偏差分析出現(xiàn)預(yù)測錯(cuò)誤的原因:第一.選取樣本的方式不是隨機(jī)的,它主要是從電話號碼簿和各種俱樂部會員名冊上去選取的,這些人大多是有錢人,他們支持共和黨候選人蘭登;第二.有760萬張問卷無反應(yīng),在沒有寄回的人中支持共和黨和支持民主黨人的比例一般與寄回來的240萬答卷中的支持比例不一樣,例如該雜誌向芝加哥地區(qū)三分之一的登記選民發(fā)了調(diào)查問卷,有20%的被詢問者作了回答,其中一半以上支持蘭登,但實(shí)際選舉的結(jié)果是在芝加哥地區(qū)是2:1有利於羅斯福。2023-11-16調(diào)查中的偏差案例在1936年美國總統(tǒng)選舉的預(yù)測中,美國輿論統(tǒng)計(jì)學(xué)家蓋洛普獲得成功。他所領(lǐng)導(dǎo)的研究所等三家民意測驗(yàn)機(jī)構(gòu),只調(diào)查了比《文學(xué)文摘》少得多的選民,預(yù)測候選人羅斯福的投票率為54%。其抽樣方法是他在從事新聞工作中發(fā)展起來的,採用派調(diào)查員親自訪問調(diào)查,事先將各個(gè)地區(qū)不同類型與不同人數(shù)的對象定額分配給每一個(gè)調(diào)查員,然後分頭在全國範(fàn)圍內(nèi)進(jìn)行。他為了取得良好的測定效果,按照以接近數(shù)字的準(zhǔn)確程度算出來的比例,從特定的各種類別的人中,選出三千個(gè)樣本代表全國各個(gè)階層人口的特徵。2023-11-16調(diào)查中的偏差由於無反應(yīng)(等於改變了原先隨機(jī)抽取的樣本)而造成的偏差叫“無反應(yīng)偏差”。在調(diào)查中我們要儘量減少這種偏差。為解決無反應(yīng)問題,常用的處理方法有:多次調(diào)查對調(diào)查結(jié)果進(jìn)行估算在無回答者中抽取隨機(jī)子樣本調(diào)查波利茲方案:是一種對於獲得有回答的概率之間的差別,並相應(yīng)地對其加權(quán)的方法。對無回答者的替代2023-11-16數(shù)據(jù)的類型例有一批旅遊者從北京出發(fā),分別到普陀、喀什、三亞和漠河,給這四個(gè)城市編號,分別為1、2、3、4。當(dāng)旅遊結(jié)束時(shí),請每位旅遊者回答下列問卷:1.您去了哪個(gè)城市?
A.普陀B.喀什C.三亞D.漠河2.與以往旅遊活動(dòng)總的感覺相比,您認(rèn)為此次旅遊
A.很滿意B.較為滿意C.一般D.不滿意E.很不滿意3.您在此地時(shí)的最高氣溫是
度。4.您此行的全部支出是
元。2023-11-16數(shù)據(jù)的類型根據(jù)數(shù)據(jù)的來源,可以把數(shù)據(jù)分成:定性數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)
1.定性數(shù)據(jù)(分類、定類或名義數(shù)據(jù))將數(shù)字作為現(xiàn)象總體中不同類別或不同組別的代碼。這是最低層次的尺度。
2.定序數(shù)據(jù)(有序數(shù)據(jù))按照特徵等級進(jìn)行排序,數(shù)據(jù)之間有大小之分,但沒有大多少的概念。
2023-11-16數(shù)據(jù)的類型3.定距數(shù)據(jù)(間隔數(shù)據(jù))不僅可以用數(shù)值表示現(xiàn)象類(組)別的不同和順序大小的差異,而且可以用確切的數(shù)值反映現(xiàn)象之間在量方面的差別。4.定比數(shù)據(jù)(比例數(shù)據(jù))不僅有確定的間距,而且有自然確定絕對的零點(diǎn)。四種數(shù)據(jù)的描述功能是依次增大的,相應(yīng)地,它們的可計(jì)算性也是依次增大的。2023-11-16第一節(jié)列表表示一.處理的步驟
1.首先把數(shù)據(jù)按從小到大的順序排列起來。當(dāng)數(shù)據(jù)太多時(shí),可以用莖葉法排隊(duì)
2.確定數(shù)據(jù)的最大值和最小值,求出極差。
3.確定組數(shù)和組距。
4.確定組限和組中值。
5.分別計(jì)算各組區(qū)間內(nèi)的頻數(shù)及頻率。
6.列出頻數(shù)和頻率分佈表。2023-11-16第一節(jié)列表表示例1(P8)觀察每10分鐘進(jìn)入某超市的人數(shù),144個(gè)數(shù)據(jù)如下:
23,23,35,7,29,3,15,20,30,18,23,32,34,40,17,25,30,33,51,37,43,52,67,34,20,26,46,68,79,82,57,61,96,75,59,64,77,99,87,48,58,95,96,68,46,73,57,39,45,28,24,35,43,25,27,30,42,30,22,18,21,26,21,8,19,15,24,12,8,8,6,8,20,8,25,29,26,36,26,28,36,22,41,37,30,50,28,35,24,36,50,44,48,38,47,55,30,44,50,40,47,83,75,64,66,75,83,90,87,59,63,78,75,86,86,77,64,70,65,69,56,55,42,47,33,36,34,29,33,25,16,30,22,18,9,14,16,20,26,10,
18,9,7,8,2023-11-16第一節(jié)列表表示枝葉圖枝葉頻數(shù)07388868899781215878952684608132339035068457216140596682849520631350240374950066705680364302540368653214874072717512798700509651367814846345911795735585701082733766796956052023-11-16第一節(jié)列表表示進(jìn)入超市人數(shù)Stem-and-LeafPlotFrequencyStem&Leaf1.000.311.000.677888888993.001.02410.001.556678888916.002.000001122233344416.002.555566666788899914.003.0000000233344411.003.555666677899.004.0012233448.004.566777884.005.00128.005.556778995.006.134446.006.5678892.007.038.007.555577893.008.2334.008.66771.009.04.009.5669Stemwidth:10.00Eachleaf:1case(s)2023-11-16第一節(jié)列表表示列出頻數(shù)和頻率分佈表組組頻數(shù)組頻率【0,10)120.083333【10,20)130.090278【20,30)310.215278【30,40)250.173611【40,50)170.118056【50,60)130.090278【60,70)110.076389【70,80)100.069444【80,90)70.048611【90,100)50.034722合計(jì)1441.0000002023-11-16第一節(jié)列表表示2023-11-16第一節(jié)列表表示貨物年底價(jià)值的頻數(shù)(頻率)分佈表價(jià)值(元)組頻數(shù)組頻率【80,85)10.017【85,90)40.066【90,95)30.050【95,100)60.100【100,105)70.117【105,110)100.167【110,115)140.233【115,120)70.117【120,125)40.066【125,130)20.033【130,135)10.017【135,140)00.000【140,145)10.017合計(jì)601.0002023-11-16第一節(jié)列表表示貨物年底價(jià)值的頻數(shù)(頻率)分佈表價(jià)值(元)組頻數(shù)組頻率【80,90)50.083【90,100)90.150【100,110)170.284【110,120)210.350【120,130)60.099【130,140)10.017【140,150)10.017合計(jì)601.0002023-11-16第一節(jié)列表表示交叉分組列表是一種可以同時(shí)用於匯總兩個(gè)變數(shù)的數(shù)據(jù)的方法例2調(diào)查華聯(lián)超市購物目的和購物人群之間的關(guān)係,數(shù)據(jù)如下:居住區(qū)域購物目的中市區(qū)東市區(qū)西市區(qū)其他總計(jì)百貨類304903020570紡織類1501803520385食品類6756223515985其他52003560總計(jì)8607503009020002023-11-16第一節(jié)列表表示二.累計(jì)頻數(shù)和累計(jì)頻率例:某城鎮(zhèn)居民家庭人均收入分配資料如下:
年人均收入水準(zhǔn)分組家庭數(shù)百分比(%)累計(jì)家庭數(shù)百分比(%)收入數(shù)百分比(%)累計(jì)收入數(shù)百分比(%)最低收入戶10104.344.34低收入戶10205.7910.13中等偏下收入戶204014.4524.58中等收入戶206018.2542.83中等偏上收入戶208022.8765.70高收入戶109014.2979.99最高收入戶1010020.01100.00合計(jì)100-100.00-2023-11-16第一節(jié)列表表示2023-11-16第一節(jié)列表表示三.頻數(shù)分佈的類型鐘型分佈:對稱分佈、正偏分佈和負(fù)偏分佈單峰分佈、雙峰分佈尖峰態(tài)分佈、平峰態(tài)分佈U型分佈J型分佈:正J型分佈和反J型分佈2023-11-16第二節(jié)圖示法作為統(tǒng)計(jì)描述的重要方法之一,統(tǒng)計(jì)圖是傳達(dá)數(shù)據(jù)資訊最有效的方式。統(tǒng)計(jì)圖以其簡單、直觀的優(yōu)點(diǎn)備受青睞。它通過點(diǎn)的位置、線段升降、直條的長短或面積大小來表現(xiàn)事物的數(shù)量關(guān)係,使用統(tǒng)計(jì)圖代替冗長的文字?jǐn)⑹?,可以大大提升統(tǒng)計(jì)報(bào)告的可讀性,達(dá)到賞心悅目、事半功倍的效果。2023-11-16第二節(jié)圖示法常用的統(tǒng)計(jì)圖有:條形圖(BarChart)線圖(LineChart)餅分圖(PieChart)直方圖(Histogram)箱式圖(Boxplot)高低圖(High-Low)散點(diǎn)圖(ScatterPlot)
序列圖(Sequence)等等
2023-11-16第二節(jié)圖示法一.條形圖條形圖是最初級類型的統(tǒng)計(jì)圖,常用於描述離散型數(shù)據(jù)的情況,它是用寬度相等而高度為頻數(shù)(率)的線段或狹條形表示的。例某市2004年人才求職人員學(xué)歷分佈資料如下:
編號學(xué)歷人數(shù)1博士802碩士5603本科28004大專22005中專13006其他7802023-11-16第二節(jié)圖示法2023-11-16第二節(jié)圖示法二.線圖2023-11-16第二節(jié)圖示法三.餅分圖
當(dāng)數(shù)據(jù)是分類數(shù)據(jù)時(shí),餅分圖是有用的。餅分圖常常用來表示各成分在總體中所占的百分比。只適用於單選問題。例4(P11)決定某產(chǎn)品價(jià)格的因素很多,它們在總價(jià)格中所占百分比如下表所示:因素原材料工資利潤稅收其他總計(jì)百分比552510821002023-11-16第二節(jié)圖示法2023-11-16第二節(jié)圖示法四.直方圖
頻數(shù)(率)圖:以每組的上下限為底,以組頻數(shù)(率)為高作矩形所構(gòu)成的圖形。直方圖:以每組的上下限為底,以頻率/底寬為高所構(gòu)成的圖形為直方圖。直方圖中矩形的面積之和為1。注意:頻率(數(shù))圖和直方圖是不同的;在相等分組的情況下,它們的圖形是一樣的;在不等分組的情況下,它們的圖形是不一樣的。2023-11-16第二節(jié)圖示法由例1作的頻數(shù)圖:2023-11-16第二節(jié)圖示法由例5(60處地點(diǎn)100元價(jià)值貨物的年底價(jià)值)作直方圖2023-11-16第二節(jié)圖示法例4(P12)44個(gè)消費(fèi)者在某商店購買食品金額如下:購物款(元)人數(shù)頻率≤520.0455(5,10】60.1364(10,15】80.1818(15,20】120.2727(20,30】100.2273(30,40】40.0909﹥4020.0455合計(jì)441.00002023-11-16第二節(jié)圖示法由例4作的頻率圖和直方圖2023-11-16第二節(jié)圖示法五.箱式圖箱式圖顯示數(shù)據(jù)的分佈。例:組成住宅房地產(chǎn)樣本的25種銷售價(jià)格(百美元)為:6605951060500630899129574982084371095072057576010907706821016650425367148094511202023-11-16第二節(jié)圖示法2023-11-16第二節(jié)圖示法六.高-低圖
股票、商品、貨幣及其他市場數(shù)據(jù)每週、每日、甚至每時(shí)的波動(dòng)都相當(dāng)大,為了圖示長期變動(dòng)趨勢,同時(shí)又能知道短期的變化,必須採用相應(yīng)的專用圖形工具來分析。高-低圖就是為此而設(shè)計(jì)的。2023-11-16第二節(jié)圖示法例:長虹在2004年9月13—24日兩周間的股價(jià)資料如下:日期最高價(jià)最低價(jià)收盤價(jià)135.655.455.54145.735.545.65156.005.625.96166.105.966.04176.185.896.18206.356.136.34216.356.146.16226.276.006.06236.185.956.16246.306.066.062023-11-16第二節(jié)圖示法2023-11-16第二節(jié)圖示法七.散點(diǎn)圖例:觀察家庭月收入與月支出之間的關(guān)係,隨機(jī)抽取10個(gè)家庭作調(diào)查得如下數(shù)據(jù):收入(x)支出(y)收入(x)支出(y)6005401500890450450100080070060090075085075075066012508503604202023-11-16第二節(jié)圖示法2023-11-16第二節(jié)圖示法2023-11-16第二節(jié)圖示法八.序列圖時(shí)間序列圖的繪製是以橫軸代表時(shí)間,以縱軸代表所研究的數(shù)據(jù)記錄。例6(P15)一個(gè)發(fā)展中國家的經(jīng)濟(jì)活力有如下的15年記錄:年活力年活力1538532549513551050455114855412436531340753143815352023-11-16
描述性統(tǒng)計(jì)量描述性統(tǒng)計(jì)量主要包括分佈的集中程度、分佈的離散程度和分佈的偏斜度刻畫數(shù)據(jù)集中程度或平均水準(zhǔn)—平均指標(biāo)刻畫相對於其均值的離散(或波動(dòng))程度—變異指標(biāo)刻畫兩組數(shù)據(jù)(總體)間相互關(guān)係—相關(guān)指標(biāo)(後述)刻畫數(shù)據(jù)分佈的形態(tài)—偏度和峰度係數(shù)2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量平均指標(biāo)是對頻數(shù)(頻率)分佈資料的集中狀況、集中程度和平均水準(zhǔn)的綜合測度,是進(jìn)一步統(tǒng)計(jì)分析的重要依據(jù)。集中程度的測定方法有:算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、眾數(shù)、中位數(shù)、分位數(shù)等。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量依據(jù)各種統(tǒng)計(jì)指標(biāo)的具體代表意義和計(jì)算方式的不同,可以將其歸納為數(shù)值平均數(shù)和位置平均數(shù)兩大類。數(shù)值平均數(shù)就是對所有各項(xiàng)數(shù)據(jù)計(jì)算的平均數(shù)。因此它能夠概括反映所有各項(xiàng)數(shù)據(jù)的平均水準(zhǔn)。常用的數(shù)值平均數(shù)有算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量位置平均數(shù)是根據(jù)數(shù)據(jù)集中處於特殊位置的個(gè)別單位或部分單位的數(shù)據(jù)來確定的代表值,因此數(shù)據(jù)集中某些數(shù)據(jù)的變動(dòng),不一定會影響到位置平均數(shù)的水準(zhǔn),儘管如此,位置平均數(shù)對於整個(gè)數(shù)據(jù)集仍具有非常直觀的代表性。常用的位置平均數(shù)有眾數(shù)、中位數(shù)和其他分位數(shù)等。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量一、算術(shù)平均數(shù)(均值)、中位數(shù)和眾數(shù)(一)算術(shù)平均數(shù)(均值)(Mean)(Average)
在刻畫數(shù)據(jù)的“平均”特性的特徵值中,最普遍最常用的是算術(shù)平均數(shù),在統(tǒng)計(jì)上稱為均值。均值的計(jì)算:
2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量未列表數(shù)據(jù):例某公司9名部門經(jīng)理的月收入(單位:元)為:2500,3000,2650,2900,3430,3310,2900,2875,2760。求月收入的樣本均值、中位數(shù)和眾數(shù)。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量列表(不分組)數(shù)據(jù)例10(P18)下表為英國1999年某地第一季度雇員失去工作天數(shù)統(tǒng)計(jì)天數(shù)(x)雇員數(shù)(f)xf累計(jì)頻數(shù)(F)0410041014304308402290580113031805401310411044014205201001440合計(jì)14402090-2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量列表分組數(shù)據(jù)例11(P19)某食品店中顧客購買食品消費(fèi)情況統(tǒng)計(jì):消費(fèi)額(元)人數(shù)(f)組中值(x)xf≤522.55(5,10]67.545(10,15]812.5100(15,20]1217.5210(20,30]1025250(30,40]435140>4024590合計(jì)44-8402023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量如果數(shù)據(jù)的不同類型對均值的貢獻(xiàn)不同,那麼在計(jì)算平均數(shù)時(shí)就應(yīng)對每一種類型的數(shù)據(jù)賦予與其重要性成比例的權(quán)重,這樣計(jì)算的平均數(shù)稱為加權(quán)平均數(shù)。一般,若且,則
稱為“權(quán)”。
加權(quán)平均定義公式為:2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量例15(P21)3個(gè)銷售科的人員預(yù)測明年對本廠產(chǎn)品需求量,三人經(jīng)驗(yàn)不一樣,因此預(yù)測量不一樣,經(jīng)驗(yàn)豐富的在預(yù)測量中占的份額大一點(diǎn),設(shè)三人權(quán)的比例為4:2:1,預(yù)測量分別為900,1000,1200,求平均預(yù)測量。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量例16(P21)關(guān)於工人月薪的調(diào)查見下表每月收入分類平均工人數(shù)≤40028010(400,500】46028(500,600】55042(600,700】67050﹥70085020合計(jì)1502023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量均值的特點(diǎn)(1)適合代數(shù)方法的演算,應(yīng)用廣泛,能獲得更多的資訊,具備優(yōu)良的數(shù)學(xué)性質(zhì)。(2)易受極端值的影響。當(dāng)數(shù)據(jù)的分佈比較有規(guī)則時(shí),即不存在極端值,數(shù)據(jù)對中心的偏離程度和偏斜程度都不大的情況下,用均值代表分佈的中心比較好。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量(二)中位數(shù)(Median)1.概念:表示一組數(shù)據(jù)按照大小的順序排列時(shí)中間位置的數(shù)值。2.中位數(shù)的確定(1)由不列表數(shù)據(jù)確定中位數(shù)先將數(shù)據(jù)按從小到大的順序重排,
2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量(2)由列表(不分組)數(shù)據(jù)確定中位數(shù)舉例見P18的例10(3)由組距式分組數(shù)據(jù)確定中位數(shù)先根據(jù)累計(jì)次數(shù)確定中位數(shù)所在的組,再利用計(jì)算公式求出中位數(shù)的近似值。計(jì)算公式為:
m=I+i(n/2-F)/f(下限公式)其中:I表示中位數(shù)所在區(qū)間的下限值
i表示中位數(shù)所在區(qū)間的組距
F表示到中位數(shù)所在區(qū)間之前的累計(jì)頻數(shù)
f表示中位數(shù)所在區(qū)間的組頻數(shù)
2023-11-16
第一節(jié)刻畫數(shù)據(jù)集中程度的特征量例12(P19)60處地點(diǎn)100元價(jià)值貨物的年底價(jià)值列表數(shù)據(jù)位置參數(shù)的計(jì)算。
年底價(jià)值地點(diǎn)數(shù)(f)累計(jì)頻數(shù)[8085)11[8590)45[9095)38[95100)614[100105)721[105110)1031[110115)1445[115120)752[120125)456[125130)258[130135)159[135140)059[140145)1602023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量3.中位數(shù)的特點(diǎn):(1)不受極端值的影響。(2)具有計(jì)算簡便,意義明顯的優(yōu)點(diǎn)。其適用的數(shù)據(jù)類型比數(shù)值平均數(shù)的範(fàn)圍寬。(3)沒有利用數(shù)據(jù)中的所有資訊。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量(三)眾數(shù)(Mode)1.概念:眾數(shù)是數(shù)據(jù)集中出現(xiàn)次數(shù)最多或最常見的數(shù)值。2.眾數(shù)的確定(1)對於未列表的數(shù)據(jù)和列表(不分組)的數(shù)據(jù),可直接觀察來確定。
2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量例下表是關(guān)於交通事故的統(tǒng)計(jì)資料,忽略交通事故的等級,事故的頻數(shù)統(tǒng)計(jì)如下:事故次數(shù)0123≥4天數(shù)352212023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量(2)對於列表分組的數(shù)據(jù),首先要確定眾數(shù)所在的組,然後通過公式計(jì)算眾數(shù)的近似值。計(jì)算公式為:(下限公式)
mo=I+i(fm-fm-1)/(2fm-fm+1-fm-1)
其中:I表示眾數(shù)所在區(qū)間的下限值
i表示眾數(shù)所在區(qū)間的組距
fm表示眾數(shù)所在區(qū)間的組頻數(shù)
fm+1表示眾數(shù)所在區(qū)間的後一個(gè)區(qū)間的組頻數(shù)
fm-1表示眾數(shù)所在區(qū)間的前一個(gè)區(qū)間的組頻數(shù)舉例見P19的例122023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量3.眾數(shù)的特點(diǎn)
(1)眾數(shù)不受極端值的影響。適用於各種類型的數(shù)據(jù)。(2)當(dāng)頻數(shù)分佈無明顯集中趨勢時(shí),不存在眾數(shù)。(3)只利用數(shù)據(jù)集中很少的資訊。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量二.其他平均數(shù)(一)幾何平均數(shù)(GeometricMean)幾何平均數(shù)是n個(gè)數(shù)據(jù)乘積的n次方根。適用於計(jì)算現(xiàn)象的平均比率或平均速度,或具有幾何級數(shù)關(guān)係的一組數(shù)據(jù)的平均數(shù)。例我國1998—2002年我國鋼鐵產(chǎn)量的發(fā)展速度(以上年為基期)分別為:106.1%、107.5%、103.4%、108%和120.3%,求平均發(fā)展速度。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量(二)調(diào)和平均數(shù)(HarmonicMean)調(diào)和平均數(shù)是一組數(shù)據(jù)倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。適用於計(jì)算對比數(shù)值的平均數(shù)。2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量(三)分位數(shù)分位數(shù)就是根據(jù)變數(shù)值由小到大的順利排列分割成若干等分,其分界位置上的各個(gè)數(shù)值實(shí)際上是一種分割值。在統(tǒng)計(jì)分析中,把中位數(shù)、四分位數(shù)、十分位數(shù)和百分位數(shù)等統(tǒng)稱為分位數(shù)。四分位數(shù)(quartile)是能夠?qū)?shù)據(jù)集按數(shù)據(jù)大小等分為四部分的三個(gè)數(shù)據(jù),分別記為Q1、Q2、Q3。Q1:從最小值開始位於第(n+1)/4數(shù)據(jù)處的那個(gè)數(shù)據(jù)稱為1/4分位數(shù)或下四分位數(shù)Q2:中位數(shù)Q3:從最小值開始位於第3(n+1)/4數(shù)據(jù)處的那個(gè)數(shù)據(jù)稱為3/4分位數(shù)或上四分位數(shù)2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量由未列表數(shù)據(jù)或列表(不分)組數(shù)據(jù)計(jì)算四分位數(shù),首先要求求出它們所在的位置點(diǎn),然後根據(jù)位置點(diǎn)確定四分位數(shù)。例某單位12個(gè)部門的費(fèi)用月支出如下:4138,2894,5154,4006,3285,3985,5007,5248,4862,7500,6124,7003。試確定四分位數(shù)。按支出的昇冪排列如下:2894,3285,3985,4006,4138,4862,5007,5154,5248,6124,7003,75002023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量由列表分組數(shù)據(jù)計(jì)算四分位數(shù):首先要確定四分位數(shù)所在的位置點(diǎn),然後運(yùn)用計(jì)算公式得出。分位值=I+i(O-F)/f
其中:I:分位數(shù)所在組的組下限
O:分位數(shù)次序值
F:到分位數(shù)所在組之前的累計(jì)頻數(shù)
f:分位數(shù)所在組的組頻數(shù)
i:分位數(shù)所在組的組距2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量例23(P24)某食品店中顧客購買食品消費(fèi)情況統(tǒng)計(jì):消費(fèi)額(元)人數(shù)(f)累計(jì)人數(shù)≤522(5,10]68(10,15]816(15,20]1228(20,30]1038(30,40]442≥40244合計(jì)442023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量例24(P25)英國某一地區(qū)財(cái)產(chǎn)分佈情況如下:財(cái)富(英鎊)人數(shù)(人)累積人數(shù)(人)01500015000[0,1000)310018100[1000,5000)
230020400[5000,10000)
230022700[10000,25000)
160024300[25000,50000)
100025300[50000,100000)
80026100[100000,250000)
30026400[250000,500000)
17026570[500000,1000000)
8026650超過100000005026700合計(jì)26700-2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量三.各種平均數(shù)之間的關(guān)係不同的平均數(shù)適用於研究不同的問題,各種平均數(shù)都具有自己的含義、特點(diǎn)和應(yīng)用場合。如算術(shù)平均數(shù)適用於正態(tài)分佈的資料,中位數(shù)則適用於所有分佈類型的資料,幾何平均數(shù)適用於對數(shù)正態(tài)分佈。1.算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的關(guān)係根據(jù)同一組數(shù)據(jù)計(jì)算的結(jié)果是:算術(shù)平均數(shù)≥幾何平均數(shù)≥調(diào)和平均數(shù)2023-11-16第一節(jié)刻畫數(shù)據(jù)集中程度的特徵量2.算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的關(guān)係若根據(jù)光滑的頻數(shù)曲線來解釋這三種測度,可以說均值是變數(shù)分佈的平衡點(diǎn)或重心;中位數(shù)把這個(gè)分佈正好劃分兩半;眾數(shù)正好在分佈頂端出現(xiàn)。在頻數(shù)分佈完全對稱的情況下,均值=中位數(shù)=眾數(shù)在頻數(shù)分佈正偏時(shí),眾數(shù)<中位數(shù)<均值在頻數(shù)分佈負(fù)偏時(shí),均值<中位數(shù)<眾數(shù)2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量變異指標(biāo)又稱為變動(dòng)度,是描述統(tǒng)計(jì)數(shù)據(jù)差異程度或離散程度的指標(biāo)。變異指標(biāo)的作用:1.變異指標(biāo)是衡量平均指標(biāo)代表性的尺度。2.變異指標(biāo)是反映活動(dòng)過程均衡性和穩(wěn)定性的重要指標(biāo)。3.變異指標(biāo)還可以研究頻數(shù)分佈偏離正態(tài)的情況。2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量一.方差(Varance)和標(biāo)準(zhǔn)差(StandardDeviation)(一)方差方差是每個(gè)變數(shù)與其算術(shù)平均數(shù)之間差的平方的算術(shù)平均數(shù)。設(shè)從某個(gè)總體中抽取的數(shù)據(jù)為,則樣本方差為:設(shè)該總體的全部數(shù)據(jù)就是,則總體方差為:2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量(二)標(biāo)準(zhǔn)差設(shè)從某個(gè)總體中抽取的數(shù)據(jù)為,則樣本標(biāo)準(zhǔn)差為:設(shè)該總體的全部數(shù)據(jù)就是則總體標(biāo)準(zhǔn)差為:
2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量1.不列表的數(shù)據(jù)樣本標(biāo)準(zhǔn)差的計(jì)算公式為:2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量2.列表(不分組)和列表分組數(shù)據(jù):2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量例.某食品店中顧客購買食品消費(fèi)情況統(tǒng)計(jì):消費(fèi)額(元)人數(shù)(f)組中值≤522.5550.4562(5,10]67.5805.9686(10,15]812.5347.4248(15,20]1217.530.3372(20,30]1025349.281(30,40]4351012.512≥402451342.656合計(jì)44-4438.6362023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量標(biāo)準(zhǔn)差是測定數(shù)據(jù)離散程度的最常用的方法。標(biāo)準(zhǔn)差廣泛應(yīng)用於相關(guān)與回歸分析、抽樣推斷、統(tǒng)計(jì)預(yù)測等各方面。例1950—1999年的50年裏美國三種投資年獲利的平均數(shù)和標(biāo)準(zhǔn)差資料如下:投資平均獲利(%)標(biāo)準(zhǔn)差(%)短期國庫券5.342.96長期國庫券6.1210.73股票14.6216.322023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量二.離差的其他測定方法(一)極差(全距)把數(shù)據(jù)x1,x2,…xn
按從小到大的次序重排為x(1),x(2)
,…x(n),稱R=x(n)-x(1)為極差。極差是關(guān)於數(shù)據(jù)離散程度表達(dá)的一個(gè)很粗糙的量,僅僅取決於兩個(gè)極端值的水準(zhǔn),不能反映其間的變數(shù)分佈情況,受極端值的影響過於顯著,不符合穩(wěn)健性和耐抗性的要求。極差有許多特殊的應(yīng)用,如品質(zhì)控制圖中的極差圖,提供證券市場行情等。2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量(二)四分位差分位差是對極差指標(biāo)的一種改進(jìn),或者說,就是從總體數(shù)據(jù)中剔除了一部分極端值之後重新計(jì)算的類似極差的指標(biāo)。分位差有分位數(shù)偏差和分位數(shù)極差。常用的分位差有四分位差、八分位差、十分位差、十六分位差、三十二分位差及百分位差等。四分位極差=四分位偏差=2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量(三)變異係數(shù)(離散係數(shù))變異係數(shù)是變異指標(biāo)與算術(shù)平均數(shù)之比的相對指標(biāo)。常用的有標(biāo)準(zhǔn)差係數(shù)。變異係數(shù)的值越大,說明數(shù)據(jù)集中相對於均值的變化就越大。2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量三.Z分?jǐn)?shù)和五數(shù)概括法(一)Z分?jǐn)?shù)(標(biāo)準(zhǔn)化的數(shù)值)利用平均數(shù)和標(biāo)準(zhǔn)差,可以知道任何數(shù)據(jù)值的相對位置。數(shù)據(jù)值位於數(shù)據(jù)集平均值之上或之下的以標(biāo)準(zhǔn)差為計(jì)量單位的距離稱為這個(gè)數(shù)據(jù)值的Z分?jǐn)?shù)。2023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量(二)五數(shù)概括法一個(gè)分佈的五數(shù)綜合,從小到大,包括:最小值、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)及最大值。這五個(gè)數(shù)對於分佈的中心和離度,提供了大致完整的描述,可以做數(shù)據(jù)的探索性研究。例:組成住宅房地產(chǎn)樣本的25種銷售價(jià)格(百美元)為:6605951060500630899129574982084371095072057576010907706821016650425367148094511202023-11-16第二節(jié)刻畫數(shù)據(jù)離散程度的特徵量箱式圖(盒形圖)2023-11-16第三節(jié)分佈的偏度和峰度指標(biāo)相對於集中趨勢和離散程度而言,偏度和峰度主要不是從數(shù)值水準(zhǔn)的角度考察分佈的代表值或變異程度,而是從整個(gè)分佈圖形的形狀來考慮的,所刻畫的是“分佈的形態(tài)特徵”。偏度係數(shù)和峰度係數(shù)反映了數(shù)據(jù)偏離正態(tài)分佈的程度。2023-11-16第三節(jié)分佈的偏度和峰度指標(biāo)分佈的“偏度”(skewness)是指分佈不對稱的方向和程度。
2023-11-16第三節(jié)分佈的偏度和峰度指標(biāo)例25(P27)調(diào)查1000人收入(元)資料如下:月收入人數(shù)組中值(稅前收入)稅後收入頻率<300
502002000.05[300,500)
3504004000.35[500,700)
2006006000.20[700,900)
1508008000.15[900,1100)
10010009900.10[1100,1300)
80120011800.08[1300,2000)
50165015650.05[2000,5000)
10350030950.01≥5000
10650053600.01合計(jì)1000--1.002023-11-16第一節(jié)統(tǒng)計(jì)指數(shù)的概念一.指數(shù)的概念統(tǒng)計(jì)指數(shù)其涵義有廣義和狹義之分:廣義指數(shù)是表明現(xiàn)象總體數(shù)量變動(dòng)程度的相對數(shù);一切通過比較計(jì)算的相對數(shù),從廣義上講均可稱為指數(shù);狹義指數(shù)是描述多種現(xiàn)象綜合變動(dòng)(隨時(shí)間綜合變動(dòng))的相對數(shù)。2023-11-16第一節(jié)統(tǒng)計(jì)指數(shù)的概念例1(P30).某商品在最近4年中的價(jià)格如下:年價(jià)格第1年0.50第2年0.70第3年0.82第4年0.962023-11-16第一節(jié)統(tǒng)計(jì)指數(shù)的概念二.基期的選擇指數(shù)的基期是作為比較起點(diǎn)的所屬時(shí)期,選擇基期應(yīng)注意下列要求:1.基期的選擇取決於指數(shù)編制的目的和要求。2.基期的選擇在研究現(xiàn)象變動(dòng)的長期趨勢和規(guī)律時(shí),要以社會經(jīng)濟(jì)較穩(wěn)定的時(shí)期作為基期。3.基期的選擇要考慮到市場的波動(dòng)程度。2023-11-16第一節(jié)統(tǒng)計(jì)指數(shù)的概念三.指數(shù)的換算例:年舊指數(shù)新指數(shù)
1100(83.33)
2112(93.33)
31201004(129.6)
1085(135.6)
1136(146.4)
1222023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造指數(shù)編制中的一些問題:代表品的選擇代表地區(qū)和企業(yè)(市場)的選擇基期的選擇權(quán)數(shù)的選擇計(jì)算公式的選擇2023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造統(tǒng)計(jì)指數(shù)理論主要是總指數(shù)的編制方法??傊笖?shù)的編制方法:綜合指數(shù)法和平均數(shù)指數(shù)法一.總指數(shù)的綜合形式——綜合指數(shù)法(一)編制原理綜合指數(shù)是通過對兩個(gè)不同時(shí)期範(fàn)圍相同的複雜現(xiàn)象總體總量指標(biāo)對比形成的指數(shù)。其計(jì)算特點(diǎn)是先綜合後對比。1.確定同度量因素與指數(shù)化指標(biāo);2.採用假定的方法,固定同度量因素的時(shí)期;3.將兩個(gè)不同時(shí)期的可同度量總量指標(biāo)進(jìn)行對比;
2023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造(二)總指數(shù)的各種綜合形式1.簡單綜合法例4(P33)一個(gè)有代表性個(gè)人一周內(nèi)飲料消費(fèi)如下:飲料0期1期價(jià)格(元)數(shù)量(杯)價(jià)格(元)數(shù)量(杯)茶0.2150.312咖啡0.931.23軟飲料3.013.232023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造2.加權(quán)綜合法(1)基期加權(quán)綜合法—拉氏(Laspeyre)指數(shù)
基期加權(quán)綜合法就是把同度量因素固定在基期水準(zhǔn)上來編制指數(shù)的方法。舉例見例4。2023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造(2)報(bào)告期加權(quán)綜合法—帕氏(Paasche)指數(shù)報(bào)告期加權(quán)綜合法就是把同度量因素固定在報(bào)告期水準(zhǔn)上來編制指數(shù)的方法。舉例見例4。2023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造二.總指數(shù)的平均形式——平均數(shù)指數(shù)(一)編制原理平均數(shù)指數(shù)是個(gè)體指數(shù)的平均數(shù),以個(gè)體指數(shù)為基礎(chǔ),通過對個(gè)體指數(shù)加權(quán)平均計(jì)算的一種總指數(shù)。常用的基本形式有算術(shù)平均數(shù)指數(shù)和調(diào)和平均數(shù)指數(shù)。其計(jì)算特點(diǎn)是:先對比後平均先計(jì)算各個(gè)專案的個(gè)體指數(shù),再以個(gè)體指數(shù)為變數(shù),給出一定的權(quán)數(shù),加權(quán)平均求得。2023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造(二)總指數(shù)的各種平均形式1.簡單平均法舉例見例4
2023-11-16第二節(jié)統(tǒng)計(jì)指數(shù)的構(gòu)造2.加權(quán)平均法平均指數(shù)的常見型式有算術(shù)平均指數(shù),權(quán)數(shù)有變形權(quán)數(shù)和固定權(quán)數(shù)。變形權(quán)數(shù):一般是與所要編制的指數(shù)密切關(guān)聯(lián)的價(jià)值總量,即pQ。2023-11-16第二節(jié)指數(shù)的構(gòu)造例4:飲料wP1/p0P2/p0wP1/p0wP2/p0茶3.01.502.004.506.00咖啡2.71.331.563.594.21軟飲料3.01.071.103.213.30合計(jì)8.711.3013.512023-11-16119第一節(jié)隨機(jī)事件及其運(yùn)算確定性現(xiàn)象(服從特定的因果規(guī)律,從一定的條件出發(fā),一定可以推出某一結(jié)果的現(xiàn)象)和隨機(jī)性現(xiàn)象(在一定條件下,並不總是出現(xiàn)相同結(jié)果的現(xiàn)象)隨機(jī)現(xiàn)象是概率論和數(shù)理統(tǒng)計(jì)的研究對象。隨機(jī)現(xiàn)象有其偶然性的一面,也有其必然性的一面,這種必然性表現(xiàn)在大量重複試驗(yàn)或觀察中呈現(xiàn)出的固有規(guī)律性,稱為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性,而概率論正是研究隨機(jī)現(xiàn)象統(tǒng)計(jì)規(guī)律性的一門學(xué)科。2023-11-16120第一節(jié)隨機(jī)事件及其運(yùn)算一.隨機(jī)試驗(yàn)與隨機(jī)事件樣本空間:隨機(jī)現(xiàn)象所有基本結(jié)果的全體。樣本空間可以由有限個(gè)(至少兩個(gè))基本結(jié)果組成,也可由無限個(gè)基本結(jié)果組成。ΩΩΩA2023-11-16121第一節(jié)隨機(jī)事件及其運(yùn)算隨機(jī)試驗(yàn):對隨機(jī)現(xiàn)象的觀察或某種實(shí)現(xiàn)。概率論裏所研究的試驗(yàn)或觀察有下列特點(diǎn):(1)在相同條件下實(shí)驗(yàn)可以重複進(jìn)行;(2)試驗(yàn)可能的結(jié)果具有多種可能性,而且在試驗(yàn)前可以明確試驗(yàn)的所有可能結(jié)果;(3)每次試驗(yàn)前均無法確定該次試驗(yàn)將出現(xiàn)何種結(jié)果。2023-11-16122第一節(jié)隨機(jī)事件及其運(yùn)算隨機(jī)事件(簡稱事件):在隨機(jī)試驗(yàn)中,對一次試驗(yàn)可能出現(xiàn)也可能不出現(xiàn),而在大量重複試驗(yàn)中具有某種規(guī)律性的事件稱為隨機(jī)事件。基本事件:隨機(jī)試驗(yàn)中可能出現(xiàn)的每個(gè)結(jié)果。特別地,在隨機(jī)試驗(yàn)中必定發(fā)生的事件稱為必然事件;一定不發(fā)生的事件稱為不可能事件。2023-11-16123第一節(jié)隨機(jī)事件及其運(yùn)算二.事件間的關(guān)係和事件的運(yùn)算事件間的關(guān)係及其運(yùn)算可以用集合論的知識來解釋,與集合論中集合之間的關(guān)係和運(yùn)算是一致的。(一)事件間的關(guān)係1.事件的包含和相等若事件A發(fā)生蘊(yùn)涵B發(fā)生,則稱事件B包含A,或A被包含在B中,記為。若事件A包含B,事件B也包含A,則稱事件A與B相等,記為A=B。2023-11-16124第一節(jié)隨機(jī)事件及其運(yùn)算2.事件的互不相容在同一試驗(yàn)裏,若兩個(gè)事件A和B沒有相同的基本結(jié)果,則稱事件A與B互不相容,或稱互斥?;臼录g是互不相容的。兩個(gè)事件的互不相容性可以推廣到多個(gè)事件間的互不相容性:設(shè)在同一試驗(yàn)裏有n個(gè)事件A1、A2,…An,若其中任意兩個(gè)事件都是互不相容的,則稱這n個(gè)事件互不相容。2023-11-16125第一節(jié)隨機(jī)事件及其運(yùn)算(二)事件的運(yùn)算事件的基本運(yùn)算有四種:對立、並、交和差。1.對立事件事件“非A”稱為A的對立事件(或逆事件),由樣本空間中所有不屬於A的樣本點(diǎn)組成的集合。特別地,必然事件和不可能事件互為對立事件。2023-11-16126第一節(jié)隨機(jī)事件及其運(yùn)算2.事件的並(和)事件A、B中至少有一個(gè)發(fā)生(由事件A與B中所有基本結(jié)果)組成的一個(gè)新事件。記為A∪B。A∪B=A+B←→A發(fā)生或B發(fā)生
←→A與B至少有一個(gè)發(fā)生可推廣到多個(gè)事件:n個(gè)事件A1,A2,…An中至少有一個(gè)發(fā)生,稱為n個(gè)事件的並,記為A1∪
A2∪
…
∪
An。2023-11-16127第一節(jié)隨機(jī)事件及其運(yùn)算3.事件的交(或積)由事件A和B同時(shí)發(fā)生這一事件(由公共的基本結(jié)果組成的一個(gè)新事件),稱為事件的交。記為A∩B或AB。A∩B或AB←→A發(fā)生且B發(fā)生
←→A與B同時(shí)發(fā)生
←→A與B都發(fā)生可推廣到多個(gè)事件:n個(gè)事件A1,A2,…An同時(shí)發(fā)生,稱為n個(gè)事件的交,記為A1∩
A2∩
…
∩
An。2023-11-16128第一節(jié)隨機(jī)事件及其運(yùn)算完備事件組(群)設(shè)一組事件A1,A2,…An
,若AiAj=?
,i≠j,且A1∪A2∪…∪An=Ω,則稱A1,A2,…An
為隨機(jī)試驗(yàn)Ω的一個(gè)完備事件群。2023-11-16129第一節(jié)隨機(jī)事件及其運(yùn)算4.事件A與B的差是由在事件A中而不在事件B中的基本結(jié)果組成的一個(gè)新事件,記為A-B。A-B←→A發(fā)生但B不發(fā)生5.迪莫根對偶法則可推廣到多個(gè)事件:
2023-11-16130第二節(jié)概率的定義概率是隨機(jī)事件發(fā)生可能性大小的數(shù)字度量,取值在0和1之間。一.概率的古典定義(古典概率)古典概率是在經(jīng)驗(yàn)事實(shí)的基礎(chǔ)上對被考察事件發(fā)生可能性進(jìn)行符合邏輯分析後得出該事件的概率。其基本思想是:設(shè)樣本空間滿足如下條件:(1)樣本空間中只有有限個(gè)基本事件;(2)每個(gè)基本事件發(fā)生的概率相同,即等可能性;(3)假如被考察的事件A含有K個(gè)基本事件,則:
P(A)=M/N=A中含基本事件的個(gè)數(shù)/樣本空間中基本事件總數(shù)2023-11-16131第二節(jié)概率的定義例2.(P43)袋中有7個(gè)紅球3個(gè)白球,從中任取2球,問2球全是紅球的概率。例3(P43)30人中至少有2人生日相同的概率有多大?2023-11-16132第二節(jié)概率的定義二.概率的頻率定義頻率方法是在大量重複試驗(yàn)中用頻率去獲得概率近似值的一個(gè)方法,也是最常用、最基本的獲得頻率的方法。揭示隨機(jī)事件一個(gè)極其重要的特徵——頻率的穩(wěn)定性。定義:在不變的條件下,獨(dú)立重複做同一隨機(jī)試驗(yàn)n次,事件A發(fā)生nA次,nA/n為事件A發(fā)生的頻率,當(dāng)n→∞時(shí),nA/n會在某一常數(shù)P附近波動(dòng),則P稱為事件A的頻率。2023-11-16133第二節(jié)概率的定義頻率方法的基本思想:1.與考察事件A有關(guān)的隨機(jī)現(xiàn)象是允許進(jìn)行大量重複試驗(yàn)的;2.假如在n次重複試驗(yàn)中,事件A發(fā)生nA次,則事件A發(fā)生的頻率為nA/n;3.頻率nA/n依賴於重複次數(shù)n。2023-11-16134第二節(jié)概率的定義三.概率的主觀定義(主觀概率)主觀概率是是人們根據(jù)經(jīng)驗(yàn)對該事件發(fā)生可能性所給出的個(gè)人信念。主觀概率的基本特點(diǎn)是:
1.不可重複性。需要做出主觀概率判斷的事件都是不可重複的。
2.主觀性。面對同一事件,不同的當(dāng)事人可能會提出不同的概率值。2023-11-16135第二節(jié)概率的定義四.概率的公理化定義在一個(gè)隨機(jī)現(xiàn)象中,用來表示任一個(gè)隨機(jī)事件A發(fā)生可能性大小的實(shí)數(shù)(即比率)稱為該事件的概率,記為P(A)並規(guī)定:(1)非負(fù)性公理:0≤P(A)≤1(2)正則性公理:必然事件的概率為1(3)可加性公理:若A與B互不相容,則有
P(A∪B)=P(A)+P(B)2023-11-16136第二節(jié)概率的定義利用概率的三條公理,可推出概率的幾條性質(zhì):(1)若A1,A2,…,為兩兩互不相容,則有P(A1∪A2∪…
)=P(A1
)+P(A2
)+…(2)不可能事件的概率為0。(3)(廣義加法法則)對任意兩個(gè)事件A與
B,有P(A∪B)=P(A)+P(B)-P(AB)2023-11-16137第二節(jié)概率的定義例:一批產(chǎn)品共100件,其中有5件不合格品,現(xiàn)從中隨機(jī)抽出10件,其中最多有2件不合格品的概率是多少?例:擲兩個(gè)骰子,至少有一顆骰子的點(diǎn)數(shù)大於3的概率是多少?2023-11-16138
第三節(jié)事件的獨(dú)立性定義:對任意兩個(gè)事件A與B,若有P(AB)=P(A)(B),則稱事件A與B相互獨(dú)立,簡稱A與B獨(dú)立。
A與B獨(dú)立如果事件A1,A2,,An中任一部分(一個(gè)或幾個(gè))的發(fā)生與否與另一部分(一個(gè)或幾個(gè))發(fā)生與否無關(guān),則稱事件A1,A2,,An相互獨(dú)立。由此可推知
,
2023-11-16139第三節(jié)事件的獨(dú)立性例4(P44).A、B、C三人獨(dú)立地破譯密碼,每人能破譯密碼的概率分別為1/3、1/4、1/5。問密碼能被破譯的概率有多大?例:某航空公司上午10時(shí)左右從北京飛往上海、廣州、瀋陽各有一個(gè)航班,記A、B、C為如下三個(gè)事件:A=“飛往上海的航班滿座”;B=“飛往廣州的航班滿座”;C=“飛往瀋陽的航班滿座”假設(shè)這三個(gè)事件相互獨(dú)立,且P(A)=0.9,P(B)=0.8,P(C)=0.6,現(xiàn)求如下幾個(gè)事件的概率:(1)三個(gè)航班都滿座的概率;(2)僅有一個(gè)航班是滿座的概率。2023-11-16140第四節(jié)非獨(dú)立事件與運(yùn)算一.條件概率
一般地說,條件概率就是在附加某些條件之下所計(jì)算的概率。無條件概率和條件概率定義:設(shè)A與B是基本空間中的兩個(gè)事件,且P(B)﹥0,在事件B已發(fā)生的條件下,事件A的條件概率P(A∣B)為:P(A∣B)=P(AB)/P(B)2023-11-16141第四節(jié)非獨(dú)立事件與運(yùn)算條件概率:(1)圖解(2)條件概率也是概率,滿足概率公理化定義中的各條。(3)條件概率公式的應(yīng)用(乘法法則)
P(AB)=P(B)P(A∣B)(P(B)﹥0)
P(AB)=P(A)P(B∣A)(P(A)﹥0)2023-11-16142第四節(jié)非獨(dú)立事件與運(yùn)算例:擲兩顆均勻骰子,已知第一顆擲出6點(diǎn)(記為事件B),問“擲出點(diǎn)數(shù)之和不小於10”這一事件A的條件概率是多少?例:10個(gè)產(chǎn)品中有3個(gè)次品,依次抽取,問第一次抽到次品,第二次還抽出次品的概率是多少?2023-11-16143第四節(jié)非獨(dú)立事件與運(yùn)算二.乘法定理(概率的乘法公式)定理:對任意兩個(gè)事件A與B,有P(AB)=P(B)
P(A∣B)=P(A)P(B∣A),其中第一等式成立要求P(B)﹥0,第二個(gè)等式成立要求P(A)﹥0。設(shè)事件A與B獨(dú)立,且P(B)﹥0,則P(A∣B)=P(A),反之亦然。這個(gè)性質(zhì)表明,若兩事件獨(dú)立,則其條件概率就等於其概率,這裏事件B的發(fā)生對事件A是否發(fā)生沒有任何影響。2023-11-16144第四節(jié)非獨(dú)立事件與運(yùn)算可把乘法公式推廣到計(jì)算n個(gè)事件同時(shí)發(fā)生的概率上一般乘法公式:對任意n個(gè)事件A1,A2,…,An,有P(A1A2…An
)=P(A1
)P(A2∣A1)P(A3∣A1A2)…P(An∣A1A2…An-1)2023-11-16145第四節(jié)非獨(dú)立事件與運(yùn)算例5(P45).一個(gè)人打電話定座,但忘了最後一位號碼,問他三次打通電話的概率是多少?例:10個(gè)考簽中有4個(gè)難簽,3個(gè)人參加抽籤(不放回),甲先、乙次、丙最後,求甲、乙、丙都抽到難簽的概率。2023-11-16146第四節(jié)非獨(dú)立事件與運(yùn)算有時(shí)也可以用簡單的樹狀圖來解概率問題。例6(P45)概率樹.一產(chǎn)品以30%,20%和50%的比例銷往A,B,C三個(gè)地方,以X和Y分別表示暢銷和滯銷。設(shè)各地暢銷的概率為0.6,滯銷的概率為0.4。則可以用如下的圖形表示。這個(gè)圖形稱為概率樹。其中AX表示產(chǎn)品在A地暢銷,其餘可類推。各地暢銷的概率都是0.6說明暢銷與否與銷地?zé)o關(guān)。
2023-11-16147第四節(jié)非獨(dú)立事件與運(yùn)算例7(P46)設(shè)一產(chǎn)品以40%,40%和20%的比例銷往A,B,C三個(gè)地方,在A地暢銷的概率為0.5,在B地暢銷的概率為0.7,在C地暢銷的概率為0.3。則這種場合下的概率樹如下圖所示。由於各地的暢銷概率不同,因此0.5是產(chǎn)品在A地暢銷的條件概率(其餘類推)。2023-11-16148第四節(jié)非獨(dú)立事件與運(yùn)算三.全概率公式全概率公式和貝葉斯公式主要用來計(jì)算比較複雜事件的概率,它們實(shí)質(zhì)上是加法公式和乘法公式的綜合運(yùn)用和推廣。全概率公式:設(shè)B1,B2,,Bn為樣本空間的一個(gè)分割,A為這個(gè)樣本空間中的一個(gè)事件,則事件A的概率為:
P(A)=∑P(Bi)P(A∣Bi)該公式運(yùn)用的關(guān)鍵是在於尋找一個(gè)合適的分割,使諸概率P(Bi)和諸條件概率P(A∣Bi)容易找到。2023-11-16149第四節(jié)非獨(dú)立事件與運(yùn)算例8(P46)甲、乙、丙三家工廠向同一家工廠提供相同的配套零件,所占百分比分別為50%,25%和25%。甲、乙、丙三家工廠的次品率分別為2%,2%和4%?,F(xiàn)從這些零件中任取一個(gè),問取到次品的概率。例9(P46)一家人去野營,在回家的路上發(fā)現(xiàn)同去的狗不見了,於是派小孩回去找狗。根據(jù)狗的習(xí)性,它在原地啃骨頭的概率為50%,跑到附近樹林中以及跑回家的概率各有25%。如果狗在原地啃骨頭,小孩能找到狗的概率有90%,如果狗跑到野營附近的樹林中去了,小孩有50%的可能性找到狗,如果狗跑回家,則小孩找不到狗。求小孩能找到狗的概率。2023-11-16150第四節(jié)非獨(dú)立事件與運(yùn)算四.貝葉斯公式設(shè)事件B1,B2,…,Bn是基本空間的一個(gè)分割,且它們各自的概率P(B1),P(B2),…P(Bn)皆已知且為正,又設(shè)A是基本空間的一個(gè)事件,P(A)﹥0,且在諸Bi給定下事件A的條件概率P(A∣B1
),P(A∣B2
),…
,P(A∣Bn
)可通過試驗(yàn)等手段獲得,則在A給定下,事件的條件概率為:P(Bi∣A)=P(A∣Bi)P(Bi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 戶外廣告合同樣本格式模板
- 房屋買賣代理合同范文
- 2024年購買香蕉的買賣合同范本
- 2024年居間公司股份轉(zhuǎn)讓合同
- 專項(xiàng)法律服務(wù)2024年
- 貨物運(yùn)輸合同范本匯編
- 2024版合作經(jīng)營協(xié)議書參考樣本
- 攝影展覽合作契約范本
- 廣告效果監(jiān)測與分析合同
- 通訊設(shè)備采購合同
- 小學(xué)數(shù)學(xué)西南師大六年級上冊二圓《圓》PPT
- 建設(shè)工程安全隱患排查表
- 山西省太原市2023屆高三上學(xué)期期中數(shù)學(xué)試題
- 英文工作證明Letter-of-Employment-(模版)
- 壓力式泡沫比例混合裝置安裝使用說明書
- 高中政治課程標(biāo)準(zhǔn)解讀 匯報(bào)課件
- 整改措施及落實(shí)情況反饋表
- 基肥一生物菌肥田間肥效試驗(yàn)專題方案
- 輟學(xué)學(xué)生勸返記錄表
- 丑小鴨-完整版PPT
- 成本法與剩余法計(jì)算公式深入探析
評論
0/150
提交評論