統(tǒng)計學(xué) 課件匯 傅毅 1導(dǎo)論 -6.2.3.1.3 正態(tài)總體、總體方差未知但相等_第1頁
統(tǒng)計學(xué) 課件匯 傅毅 1導(dǎo)論 -6.2.3.1.3 正態(tài)總體、總體方差未知但相等_第2頁
統(tǒng)計學(xué) 課件匯 傅毅 1導(dǎo)論 -6.2.3.1.3 正態(tài)總體、總體方差未知但相等_第3頁
統(tǒng)計學(xué) 課件匯 傅毅 1導(dǎo)論 -6.2.3.1.3 正態(tài)總體、總體方差未知但相等_第4頁
統(tǒng)計學(xué) 課件匯 傅毅 1導(dǎo)論 -6.2.3.1.3 正態(tài)總體、總體方差未知但相等_第5頁
已閱讀5頁,還剩243頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1章導(dǎo)論課程類別:專業(yè)必修課授課對象:經(jīng)管類本科生11.大數(shù)據(jù)時代大數(shù)據(jù):Volume:海量數(shù)據(jù)規(guī)模Velocity:高速處理能力Variety:數(shù)據(jù)的多樣性Value:潛在價值Veracity:數(shù)據(jù)的質(zhì)量2大數(shù)據(jù)時代為什么需要統(tǒng)計學(xué)?(開放問題)2.統(tǒng)計學(xué)的概念統(tǒng)計學(xué)是通過搜索、整理、分析、描述數(shù)據(jù)等手段,以達到推斷所測對象的本質(zhì),甚至預(yù)測對象未來的一門綜合性科學(xué)。3數(shù)據(jù)是事實或觀察的結(jié)果,是對客觀事物的邏輯歸納,是用于表示客觀事物的未經(jīng)加工的原始素材。2.統(tǒng)計學(xué)的概念古代:結(jié)繩記事、強國十三數(shù)……現(xiàn)代:數(shù)字基建、數(shù)字經(jīng)濟……4你能講講我國在數(shù)字化領(lǐng)域取得了哪些成就嗎?3.統(tǒng)計學(xué)的應(yīng)用5軍事:戰(zhàn)斗機的裝甲安裝在哪里?3.統(tǒng)計學(xué)的應(yīng)用6文學(xué):《紅樓夢》的作者有幾位?3.統(tǒng)計學(xué)的應(yīng)用7城市治理:如何讓信息預(yù)警跑在市民報修之前?3.統(tǒng)計學(xué)的應(yīng)用8金融:如何識別車險欺詐?3.統(tǒng)計學(xué)的應(yīng)用9討論:統(tǒng)計學(xué)在制造、零售、金融、體育、健康中有哪些應(yīng)用?選講(補充)10統(tǒng)計學(xué)中的似是而非4.統(tǒng)計學(xué)教學(xué)內(nèi)容11統(tǒng)計學(xué)的教學(xué)內(nèi)容主要包括導(dǎo)論、數(shù)據(jù)類型與數(shù)據(jù)收集、數(shù)據(jù)可視化、數(shù)據(jù)的概括性度量、統(tǒng)計量及其抽樣分布、參數(shù)估計、假設(shè)檢驗、分類數(shù)據(jù)分析、方差分析和一元線性回歸,共十個部分。內(nèi)容涵蓋了數(shù)據(jù)收集、整理和分析的各個環(huán)節(jié)。4.統(tǒng)計學(xué)教學(xué)內(nèi)容12本課程的核心內(nèi)容是兩個部分,即描述性統(tǒng)計和推斷統(tǒng)計。5.思考與練習(xí)思考:統(tǒng)計學(xué)和我們自己的專業(yè)有什么關(guān)系,能夠如何支撐該專業(yè)的研究?請用文獻舉例。13第2章數(shù)據(jù)類型和數(shù)據(jù)收集課程類別:專業(yè)必修課授課對象:經(jīng)管類本科生142.1數(shù)據(jù)的分類2.2數(shù)據(jù)的收集2.1統(tǒng)計數(shù)據(jù)的類型15根據(jù)所采用的計量尺度不同,可分為分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)根據(jù)統(tǒng)計數(shù)據(jù)的收集方法不同,可分為觀測數(shù)據(jù)和試驗數(shù)據(jù)根據(jù)被描述的現(xiàn)象與時間的關(guān)系劃分,可分為截面數(shù)據(jù)、時間序列數(shù)據(jù)2.1.1分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)16性別變量的具體表現(xiàn)“男性”或者“女性”行業(yè)可分為金融、制造、教育等分類數(shù)據(jù)是只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對事物進行分類的結(jié)果,是分類變量的具體表現(xiàn),數(shù)據(jù)表現(xiàn)為類別,是用文字來表達的。各類之間的順序是可以改變的,因此這種數(shù)據(jù)也叫無序分類數(shù)據(jù),它是數(shù)據(jù)中最粗略、計量層次最低的數(shù)據(jù)。2.1.1分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)17順序數(shù)據(jù)是只能歸于某一有序類別的非數(shù)字型數(shù)據(jù),是順序變量的具體表現(xiàn),數(shù)據(jù)表現(xiàn)為有順序的類別。業(yè)主對住房的滿意度可以分為很滿意、滿意、一般、不滿意、很不滿意五個等級某銀行會員卡的等級有銀卡、金卡、鉆石卡三個等級由于客觀現(xiàn)象的不同類別間存在順序性差異,用順序數(shù)據(jù)在對現(xiàn)象進行分析時其順序是不能隨意排列的,因此這種數(shù)據(jù)也叫有序分類數(shù)據(jù)。2.1.1分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)18數(shù)值型數(shù)據(jù)是一種不僅能反映事物所屬的類別和順序,還能反映事物類別或者順序之間數(shù)量差距,有的數(shù)據(jù)可以通過對比計算來體現(xiàn)數(shù)據(jù)的相對程度,其結(jié)果表現(xiàn)為具體的數(shù)值。某地區(qū)企業(yè)的產(chǎn)值、利潤、固定資產(chǎn)、職工人數(shù)、勞動生產(chǎn)率、資金周轉(zhuǎn)率等2.1.2觀測數(shù)據(jù)和試驗數(shù)據(jù)19通過調(diào)查、觀察和觀測等手段收集的數(shù)據(jù)稱為觀測數(shù)據(jù)。在微信朋友圈發(fā)布一項問卷,獲得500份有效問卷,就可以獲得多項觀測數(shù)據(jù)在某個高峰時段,記錄某個路段汽車行駛通過的時間,就可以獲得一組行車時間的觀測數(shù)據(jù)問卷序號性別學(xué)歷工齡(年)月薪(元)...題項k1女本科107500

*2男碩士69000

*.....................3500男高中307800

*2.1.2觀測數(shù)據(jù)和試驗數(shù)據(jù)20通過試驗手段獲得的數(shù)據(jù)稱為試驗數(shù)據(jù).試驗數(shù)據(jù)是研究人員在試驗中控制試驗單位(人、目標(biāo)或事件)而收集到的數(shù)據(jù)。樣本序號喝減肥茶前體重(公斤)喝減肥茶后體重(公斤)1807026860.........207558配對樣本配對試驗中對試驗對象進行前測與后測,獲取前后兩組數(shù)據(jù),并研究兩組有無顯著性的差異。2.1.2觀測數(shù)據(jù)和試驗數(shù)據(jù)21試驗數(shù)據(jù)與觀測數(shù)據(jù)的區(qū)別在于:(1)觀測數(shù)據(jù)是指通過直接調(diào)查或觀測收集的數(shù)據(jù),社會經(jīng)濟領(lǐng)域的統(tǒng)計數(shù)據(jù)基本上是觀測數(shù)據(jù).觀測數(shù)據(jù)是為了從收集得到的樣本中得出有關(guān)總體的一些結(jié)論。(2)試驗數(shù)據(jù)是通過對試驗對象、試驗環(huán)境及試驗過程進行有效控制而獲得的統(tǒng)計數(shù)據(jù)。這些數(shù)據(jù)主要用于考察變量之間的因果關(guān)系。2.1.3截面數(shù)據(jù)、時間序列數(shù)據(jù)和面板數(shù)據(jù)22截面數(shù)據(jù)是指某一總體中的不同個體在相同或近似相同時間上的數(shù)據(jù)表現(xiàn),它反映的是在相同時間上同類現(xiàn)象的數(shù)量特征在不同空間狀態(tài)的差異情況。時間序列數(shù)據(jù)是指將同一總體在不同時間上的某一變量數(shù)值,按照時間的先后順序排列而形成的數(shù)據(jù)序列。面板數(shù)據(jù)是指總體中的不同個體在不同時間上的數(shù)據(jù)表現(xiàn),是時間序列數(shù)據(jù)與截面數(shù)據(jù)的結(jié)合。公司名稱年份凈利率現(xiàn)金比率資產(chǎn)負債率...總資產(chǎn)增長率公司1201225.12%0.1580.54%...25.62%公司2201218.43%0.1384.36%...20.18%.....................公司60201230.26%0.1481.78%...26.12%公司1201326.47%0.1683.15%...23.77%公司2201318.91%0.1482.36%...19.76%.....................公司60201329.12%0.1382.65%...24.12%.....................公司1202124.52%0.1484.59%...2.75%公司2202116.11%0.1383.56%...2.05%.....................公司60202120.53%0.1482.83%...3.01%2.2統(tǒng)計數(shù)據(jù)的收集23統(tǒng)計數(shù)據(jù)的收集,就是根據(jù)統(tǒng)計研究的目的和要求,運用各種科學(xué)有效的方式和方法,有組織有計劃地向所研究的總體各單位收集統(tǒng)計數(shù)據(jù)的過程。2.2.1數(shù)據(jù)的來源24數(shù)據(jù)的主要來源包括直接來源和間接來源。統(tǒng)計數(shù)據(jù)的直接來源是指數(shù)據(jù)來源于直接的調(diào)查和科學(xué)試驗,這種數(shù)據(jù)稱為一手?jǐn)?shù)據(jù);統(tǒng)計數(shù)據(jù)的間接來源是指數(shù)據(jù)來源于別人通過調(diào)查或試驗,并已經(jīng)整理過或者已經(jīng)發(fā)表的數(shù)據(jù),這種數(shù)據(jù)稱為二手?jǐn)?shù)據(jù)。2.2.1數(shù)據(jù)的來源25一手?jǐn)?shù)據(jù)亦稱原始數(shù)據(jù),是指在自然的未被控制的條件下通過觀察、觀測、調(diào)查或試驗等手段,直接向總體各單位收集的統(tǒng)計數(shù)據(jù)。特點:一手?jǐn)?shù)據(jù)可以回答二手?jǐn)?shù)據(jù)不能回答的具體問題;一手?jǐn)?shù)據(jù)的收集更加及時和可信,因為研究人員知道它的來源;一手?jǐn)?shù)據(jù)是直接針對個體單位進行收集的,往往是保密的,不易公開;一手?jǐn)?shù)據(jù)調(diào)查耗時較長,調(diào)研成本比較高。2.2.1數(shù)據(jù)的來源26一手?jǐn)?shù)據(jù)亦稱原始數(shù)據(jù),是指在自然的未被控制的條件下通過觀察、觀測、調(diào)查或試驗等手段,直接向總體各單位收集的統(tǒng)計數(shù)據(jù)。特點:一手?jǐn)?shù)據(jù)可以回答二手?jǐn)?shù)據(jù)不能回答的具體問題;一手?jǐn)?shù)據(jù)的收集更加及時和可信,因為研究人員知道它的來源;一手?jǐn)?shù)據(jù)是直接針對個體單位進行收集的,往往是保密的,不易公開;一手?jǐn)?shù)據(jù)調(diào)查耗時較長,調(diào)研成本比較高。2.2.1數(shù)據(jù)的來源27二手?jǐn)?shù)據(jù)亦稱間接數(shù)據(jù),即來源于各種出版物和各級政府統(tǒng)計網(wǎng)站所公布的統(tǒng)計公報、統(tǒng)計分析報告和各類統(tǒng)計數(shù)據(jù)庫。特點:二手?jǐn)?shù)據(jù)有助于迅速解決調(diào)研人員面臨的問題,可以節(jié)省時間、降低成本;二手?jǐn)?shù)據(jù)不能給出詳細的信息來源,所以可靠性比較低;使用二手?jǐn)?shù)據(jù)前需要了解二手?jǐn)?shù)據(jù)收集的背景,對二手?jǐn)?shù)據(jù)進行甄別。2.2.2數(shù)據(jù)收集的方法28統(tǒng)計數(shù)據(jù)收集方法是指獲取統(tǒng)計數(shù)據(jù)的渠道或途徑。從數(shù)據(jù)的來源可看,常用的方法有直接觀測法、試驗法、調(diào)查法、數(shù)據(jù)庫、互聯(lián)網(wǎng)等。一手?jǐn)?shù)據(jù)的收集方法直接觀測法指的是針對研究目的,對被調(diào)查對象進行直接觀測,從而獲得所需要的數(shù)據(jù);試驗法就是通過在一定條件下的規(guī)模試驗,通過試驗結(jié)果得到我們想要的數(shù)據(jù);調(diào)查法通過對調(diào)查對象的各方面進行調(diào)查而獲取數(shù)據(jù)。在調(diào)查中,可以通過面訪、電話訪問、自填式問卷等方式收集調(diào)查數(shù)據(jù)。2.2.2數(shù)據(jù)收集的方法29二手?jǐn)?shù)據(jù)的收集方法數(shù)據(jù)庫:數(shù)據(jù)庫是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的倉庫,是一個長期存儲在計算機內(nèi)的、有組織的、可共享的、統(tǒng)一管理的大量數(shù)據(jù)的集合。社會公開出版物:社會公開出版物是指經(jīng)國家審定的出版單位出版、能向社會公開發(fā)行的出版物?;ヂ?lián)網(wǎng)調(diào)查:互聯(lián)網(wǎng)調(diào)查就是利用搜索引擎等功能,從互聯(lián)網(wǎng)收集想要的數(shù)據(jù)資料,或者在一些門戶網(wǎng)站中直接下載相關(guān)的數(shù)據(jù)。2.2.3數(shù)據(jù)收集的方式30統(tǒng)計數(shù)據(jù)收集的方式是指獲取統(tǒng)計數(shù)據(jù)的組織形式。抽樣的方式可以分為兩大類:隨機抽樣和非隨機抽樣。隨機抽樣也稱為概率抽樣,是指按照隨機原則從總體中抽取樣本單位。特點:按照隨機原則抽選樣本單位。對部分單位調(diào)查的目的是為了推斷總體指標(biāo)。抽樣誤差可以事先計算并加以控制。2.2.3數(shù)據(jù)收集的方式31非隨機抽樣也稱非概率抽樣,是指抽樣樣本的時候不按照隨機原則,而是按照研究人員的專業(yè)知識、經(jīng)驗、態(tài)度或其它條件來抽取樣本的抽樣方式。非隨機抽樣適用場合:嚴(yán)格的概率抽樣幾乎無法進行;調(diào)查目的僅是對問題的初步探索或提出假設(shè);調(diào)查對象不確定或根本無法確定;總體各單位間離散程度不大,且調(diào)查人員有豐富的調(diào)查經(jīng)驗。32謝謝第2章數(shù)據(jù)類型和數(shù)據(jù)收集課程類別:專業(yè)必修課授課對象:經(jīng)管類本科生332.3抽樣技術(shù)-概率抽樣為什么“大數(shù)據(jù)”也會跑偏?《文學(xué)摘要》在1936年之前連續(xù)五屆準(zhǔn)確地預(yù)測了美國總統(tǒng)大選.1936年,以電話簿上的地址和汽車車主的登記資料地址發(fā)放1000萬份問卷,回收237萬份.調(diào)查結(jié)果:認為蘭登獲勝.結(jié)局:羅斯福以62%對38%的巨大優(yōu)勢獲勝,連任總統(tǒng).富蘭克林·羅斯福艾爾弗·蘭登《文學(xué)摘要》1936年的美國大選預(yù)測34概率抽樣(probabilitysampling)特點:按一定的概率以隨機原則抽取樣本.每個單位被抽中的概率是已知的,或是可以計算的.作用:可以計算估計量誤差,能夠用于對總體參數(shù)進行估計.

概率抽樣也稱隨機抽樣樣本總體推斷概率抽樣抽樣框:企業(yè)名錄、學(xué)生名單等

35簡單隨機抽樣(simplerandomsampling)局限性抽出單位分散,實施調(diào)查困難.

123465789367總體樣本優(yōu)點(1)簡單、直觀.(2)抽取概率相等,估計方便.36問題1某高校有在校生25000人,其中女生23000人,男生2000人.某機構(gòu)為了解該校學(xué)生的網(wǎng)購消費水平和消費偏好,要從該校學(xué)生中抽取1%的學(xué)生進行調(diào)查.你認為應(yīng)當(dāng)怎樣抽取樣本?(1)不同性別的網(wǎng)購消費水平和偏好可能存在明顯差異.(2)兩個類別的人數(shù)相差較大,需要考慮各自的情況.樣本量樣本中的男生2500可以用簡單隨機抽樣?37問題1某高校有在校生25000人,其中女生23000人,男生2000人,抽取1%樣本.男生2000人女生23000人總體男生20人女生230人樣本男女生各抽取1%38分層抽樣(stratifiedsampling)將抽樣單位劃分為不同的層.從不同的層中獨立、隨機地抽取樣本.567911108121059總體樣本21343412優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,提高估計精度.可對總體參數(shù)進行估計,也可對各層的目標(biāo)量進行估計.局限性抽出單位分散,調(diào)查困難.適用情形:總體在“層”間差異較大,“層”內(nèi)差異較小.39問題2問題分析:(1)班級之間差異較小,專業(yè)背景相似.(2)班級內(nèi)部差異較大,男女生消費水平和消費偏好可能存在較大差異.某高校商學(xué)院有在校生5000人,共50個班級,每個班男女生共100人.某機構(gòu)為了解該學(xué)院學(xué)生的網(wǎng)購消費水平和消費偏好,要從該學(xué)院學(xué)生中抽取10%的學(xué)生進行調(diào)查.你認為應(yīng)當(dāng)怎樣抽取樣本?40問題2班級1總體班級2班級3······班級49班級50班級40班級13班級18班級46班級6樣本某高校商學(xué)院有在校生5000人,共50個班級,每個班男女生共100人.某機構(gòu)為了解該學(xué)院學(xué)生的網(wǎng)購消費水平和消費偏好,要從該學(xué)院學(xué)生中抽取10%的學(xué)生進行調(diào)查.你認為應(yīng)當(dāng)怎樣抽取樣本?41整群抽樣(clustersampling)將總體中若干個單位合并為群,直接抽取群.對群中的所有單位全部實施調(diào)查.5679111081211910總體樣本21341256優(yōu)點只要群的抽樣框,簡化工作量.調(diào)查的地點相對集中.局限性抽樣誤差較大適用情形:總體在“群”間差異較小,“群”內(nèi)差異較大42系統(tǒng)抽樣(systematicsampling)

567911108126總體樣本2134210

43系統(tǒng)抽樣的理解

123456789101112理解1:將總體均分為若干個層,每個層中隨機抽取1個單位(分層抽樣)群1群2群3群4123456789101112理解2:抽樣框轉(zhuǎn)換為二維表,隨機抽取1列(整群抽樣)44系統(tǒng)抽樣的理解優(yōu)點(1)簡便.

(2)一般情況下在總體中分布均勻,抽樣誤差小于簡單隨機抽樣.局限性(1)總體中觀察單位按順序有周期趨勢時,可能產(chǎn)生明顯的系統(tǒng)誤差.(2)抽出單位分散,實施調(diào)查困難.學(xué)號成績k2k3k4kr45總結(jié)簡單隨機抽樣分層抽樣系統(tǒng)抽樣整群抽樣各層中簡單隨機抽樣簡單隨機抽樣群特例等分后簡單隨機抽樣特例適用情形互補46思考與練習(xí)思考:為什么2016年美國大選的該民調(diào)結(jié)果與實際結(jié)果相反?可能的原因有哪些?練習(xí):見課程的網(wǎng)絡(luò)平臺.47第2章數(shù)據(jù)類型和數(shù)據(jù)收集課程類別:專業(yè)必修課授課對象:經(jīng)管類本科生482.3抽樣技術(shù)非概率抽樣2.3.2非概率抽樣技術(shù)49非概率抽樣又叫非隨機抽樣常用的非隨機抽樣技術(shù)主要有方便抽樣、判斷抽樣、自愿樣本、配額抽樣和滾雪球抽樣。1.方便抽樣50方便抽樣的優(yōu)點是容易實施,調(diào)查的成本低;其缺點是由于樣本單位的確定帶有隨意性,方便樣本無法代表有明確意義的總體,所以由方便樣本的數(shù)據(jù)無法推斷總體的特征。方便抽樣又稱隨意抽樣、偶遇抽樣,是為了某一研究目的而由調(diào)查者在特定的時間和地點上,隨意選擇回答者的非概率抽樣方式。2.判斷抽樣51判斷抽樣是指研究人員根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本,因此也叫目的抽樣。重點抽樣。重點抽樣是指在所調(diào)查的對象中,選擇一部分少數(shù)重點單位進行調(diào)查。重點抽樣的關(guān)鍵是選擇好重點單位,這些重點單位雖只是總體中的少數(shù)部分,但就調(diào)查的變量值來說卻在總量中占很大比重,目的是要了解總體的基本情況。典型抽樣。典型抽樣是根據(jù)調(diào)查研究的目的和要求,在對調(diào)查對象進行全面分析的基礎(chǔ)上,有意識地選擇若干個典型的單位進行深入調(diào)研,目的是通過典型單位來描述或揭示所研究問題的本質(zhì)和發(fā)展規(guī)律。3.自愿樣本52自愿樣本是指被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息。例子在飛機上乘務(wù)員向乘客發(fā)放調(diào)查表,乘客自愿參與調(diào)查;在微信朋友圈自愿填寫問卷;向某類節(jié)目撥打熱線電話。優(yōu)劣只有能夠接觸到調(diào)查問卷的那些人才有機會參與調(diào)查;自愿參與性的調(diào)查組織方便、成本低廉;參與者大多是對調(diào)查內(nèi)容的關(guān)心者,調(diào)查人員能夠了解這個特定群體的意見和看法。4.配額抽樣53配額抽樣也稱“定額抽樣”,是指調(diào)查人員先將調(diào)查總體按某個變量進行分類,分配各類的樣本數(shù)額,然后在各類中按照配額數(shù)目進行方便抽樣或者判斷抽樣的抽樣方式。例如,某學(xué)院的男女生比例為3:7,那么研究人員會讓其樣本的男女比例也是3:7,若抽200個學(xué)生的話,則男生抽取60位,女生抽取140位。5.滾雪球抽樣54滾雪球抽樣又稱裙帶抽樣、推薦抽樣,是指先隨機選擇若干個具有所需特征的人為最初的調(diào)查對象,再請他們提供另外一些屬于研究總體的調(diào)查對象,根據(jù)所提供的線索選擇此后的調(diào)查對象,依次類推,樣本如同滾雪球般由小變大,形成滾雪球效應(yīng)。滾雪球抽樣的費用比較低,然而這種成本的節(jié)約是以調(diào)查質(zhì)量的降低為代價的。整個樣本很可能出現(xiàn)偏差,因為那些個體的名單來源于那些最初調(diào)查過的人,而他們之間可能十分相似。2.3.3隨機抽樣與非隨機抽樣的比較55抽樣方式抽樣原則抽樣誤差特點作用隨機抽樣隨機抽取樣本,客觀性強誤差可以計算與控制抽樣推斷科學(xué)規(guī)范,但是費時、成本高、不夠靈活方便可以由樣本數(shù)據(jù)推斷總體特征非隨機抽樣非隨機抽取樣本,主觀性強誤差不能計算與控制操作簡便、時效快、成本低,抽樣技術(shù)要求不高研究總體的局部現(xiàn)象,不能推斷總體56謝謝第4章數(shù)據(jù)的概括性度量4.1數(shù)據(jù)集中趨勢的度量57數(shù)據(jù)分布的特征一是數(shù)據(jù)分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度,可以用平均指標(biāo)描述;二是數(shù)據(jù)分布的離中趨勢,反映各數(shù)據(jù)遠離其中心值的程度,可以用變異指標(biāo)描述;三是數(shù)據(jù)分布的偏斜程度和陡峭程度,反映數(shù)據(jù)分布的形狀,可以用偏度和峰度描述。584.1數(shù)據(jù)集中趨勢的度量59集中趨勢是指數(shù)據(jù)分布以某一數(shù)值為中心的傾向。作為中心的數(shù)值就稱為中心值,它反映數(shù)據(jù)分布中心點的位置所在。根據(jù)所掌握數(shù)據(jù)的類型不同,平均數(shù)有不同的計算形式和計算公式,主要包括數(shù)值平均數(shù)和位置平均數(shù)兩大類。4.1.1數(shù)值平均數(shù)60數(shù)值平均數(shù)是根據(jù)總體各單位的變量值計算得到的平均值,主要用于對數(shù)值型數(shù)據(jù)的集中趨勢度量,有算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)三種計算形式。1-1算術(shù)平均數(shù)61若總體資料未進行分組,則先計算各變量值的總和,再用總體單位數(shù)去除,計算的結(jié)果為簡單算術(shù)平均數(shù)。其計算公式為:1-1算術(shù)平均數(shù)62例:某品牌洗衣機在90天內(nèi)網(wǎng)上銷售的數(shù)據(jù)如表所示(已經(jīng)按照銷售量的大小排序),試計算該品牌洗衣機平均每天的網(wǎng)上銷售量。51768592971021081171275877859298102109118128597988939810311011812961818893991041101191336481899499105112120135668389949910611212113668839095100106113122139718390961001071151221417383919610110711612514774849197101108117126148某品牌洗衣機90天的網(wǎng)上銷售量(臺)

1-2加權(quán)算術(shù)平均數(shù)63若總體資料已經(jīng)分組,這時將各組變量值乘以其出現(xiàn)的次數(shù),然后加總求和,再除以總體單位數(shù),所得結(jié)果為加權(quán)算術(shù)平均數(shù)。其計算公式為:1-2加權(quán)算術(shù)平均數(shù)64若是分組數(shù)據(jù),則X可用各組的組中值代入。組中值的計算如下:組中值=(上限+下限)/2缺上限的組中值計算如下:組中值=下限+鄰組組距/2缺下限的組中值計算如下:組中值=上限-鄰組組距/21-2加權(quán)算術(shù)平均數(shù)65例

若對上述例題進行組距分組,數(shù)據(jù)如表,試計算該品牌洗衣機平均每天的網(wǎng)上銷售量。網(wǎng)上銷售量(臺)天數(shù)f組中值xxf80以下80-100100-120120以上133328167090110130910297030802080合計9086609040

2調(diào)和平均數(shù)66調(diào)和平均數(shù)是總體各變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),也稱倒數(shù)平均數(shù)。調(diào)和平均數(shù)按其計算方法不同,可分為簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。簡單調(diào)和平均數(shù)加權(quán)算術(shù)平均數(shù)m表示調(diào)和平均數(shù)的權(quán)數(shù)2調(diào)和平均數(shù)67例

某公司分別在A地區(qū)、B地區(qū)、C地區(qū)有三家子公司,已知各子公司的銷售計劃完成程度(%)及實際銷售如表所示,試求這三家子公司的平均銷售計劃完成程度。子公司名稱銷售計劃完成程度(%)x實際銷售(萬元)mm/x子公司A子公司B子公司C110115105319025302940290022002800合計-86607900

3幾何平均數(shù)68幾何平均數(shù)是n個比率乘積的n次方根,即把若干個變量連乘,得其乘積再開n次方根。社會經(jīng)濟統(tǒng)計中,幾何平均數(shù)適用于計算平均比率和平均速度。簡單幾何平均數(shù)的計算公式:加權(quán)幾何平均數(shù)的計算公式:4.1.2位置平均數(shù)69位置平均數(shù)是根據(jù)變量值在數(shù)據(jù)中出現(xiàn)次數(shù)的多少或出現(xiàn)的位置確定的,有眾數(shù)和中位數(shù)兩種計算形式。1眾數(shù)70眾數(shù)(Mode)是總體中出現(xiàn)次數(shù)最多的變量值,一般用字母Mo表示。眾數(shù)不受極端數(shù)值的影響。1眾數(shù)71采用直接觀察法確定眾數(shù)。例

目前消費的支付方式有很多種,常見的支付方式有:現(xiàn)金支付、刷儲蓄卡支付、刷信用卡支付、微信或支付寶二維碼支付、其他支付形式。某課題組為了調(diào)查現(xiàn)階段消費者支付形式的偏好情況,調(diào)查了1000位消費者,詢問他們最習(xí)慣用哪種支付方式,結(jié)果如表支付方式現(xiàn)金刷儲蓄卡刷信用卡微信或支付寶其他形式人數(shù)8014020056020解:從表中可知,用微信、支付寶支付方式的人最多,占了56%。,所以眾數(shù)為“微信或支付寶支付”。1眾數(shù)72如果數(shù)據(jù)是數(shù)值型數(shù)據(jù),且數(shù)據(jù)資料進行了組距分組,則確定眾數(shù)時,首先根據(jù)出現(xiàn)的最多次數(shù)確定眾數(shù)所在組(簡稱眾數(shù)組),然后利用公式計算眾數(shù)的近似值。其計算公式為:下限公式:上限公式:

1眾數(shù)73計算90天內(nèi)某品牌洗衣機網(wǎng)上銷售量的眾數(shù)。網(wǎng)上銷售量(臺)天數(shù)f組中值xxf80以下80-100100-120120以上133328167090110130910297030802080合計9086609040解:首先找出網(wǎng)上銷售額的眾數(shù)所在組,網(wǎng)上銷售額為80~100元的天數(shù)有33天,即出現(xiàn)次數(shù)最多,該組為眾數(shù)所在組。然后利用公式計算近似值。

2中位數(shù)74

2中位數(shù)7551768592971021081171275877859298102109118128597988939810311011812961818893991041101191336481899499105112120135668389949910611212113668839095100106113122139718390961001071151221417383919610110711612514774849197101108117126148例計算洗衣機銷量的中位數(shù)因為n=90為偶數(shù),中點位置為45.5。由于第45個數(shù)據(jù)和第46個數(shù)據(jù)都是99臺,所以中位數(shù)等于99臺。某品牌洗衣機90天的網(wǎng)上銷售量(臺)2中位數(shù)76由組距數(shù)列確定中位數(shù),只能適用于數(shù)值型數(shù)據(jù)。根據(jù)組距數(shù)列確定中位數(shù),可用下面的公式計算中位數(shù)的近似值。下限公式:上限公式:

2中位數(shù)77網(wǎng)上銷售量(臺)天數(shù)f組中值xxf80以下80-100100-120120以上133328167090110130910297030802080合計9086609040例計算90天內(nèi)某品牌洗衣機網(wǎng)上銷售量的中位數(shù)。

平均數(shù)、中位數(shù)、眾數(shù)7879謝謝第4章數(shù)據(jù)的概括性度量4.2數(shù)據(jù)離中趨勢的度量四分位差與全距804.2數(shù)據(jù)離中趨勢的度量離中趨勢是指數(shù)據(jù)分布中各變量值背離中心值的傾向。對離中趨勢的描述,就是要反映數(shù)據(jù)分布中各變量值遠離中心值的程度,主要用變異指標(biāo)來反映。常用的變異指標(biāo)有四分位差、全距、平均差、標(biāo)準(zhǔn)差和離散系數(shù)。811.四分位差(分位距)82

1.四分位差(分位距)83規(guī)則1如果求得的位置是整數(shù),該位置上的數(shù)值就是四分位數(shù)。規(guī)則2如果求得的位置處于兩個整數(shù)之間,則它們相應(yīng)的數(shù)值的平均數(shù)即為四分位數(shù)。規(guī)則3如果求得的位置既不是整數(shù)也不是兩個整數(shù)的中間,則先找出這兩個整數(shù)對應(yīng)位置的兩個數(shù)據(jù),可以分別稱其為低值和高值,然后可以通過下述公式計算四分位數(shù)。四分位數(shù)=低值+(高值-低值)×位置的小數(shù)部分1.四分位差(分位距)84

1.四分位差(分位距)85例計算90天內(nèi)某品牌洗衣機網(wǎng)上銷售量的四分位差。解:計算四分位數(shù)的位置

51768592971021081171275877859298102109118128597988939810311011812961818893991041101191336481899499105112120135668389949910611212113668839095100106113122139718390961001071151221417383919610110711612514774849197101108117126148

2.全距86全距也稱極差,它是總體中某變量值的最大值與最小值之差,用R表示。即若根據(jù)組距分組數(shù)據(jù)計算全距,可用數(shù)列中最高一組的上限減去最低一組的下限求得全距的近似值。87謝謝第4章數(shù)據(jù)的概括性度量884.2數(shù)據(jù)離中趨勢的度量方差、標(biāo)準(zhǔn)差與離散系數(shù)有趣的旅行團旅行社給導(dǎo)游的任務(wù):明天的旅行團一共20個人,平均年齡32歲,你們抓緊安排??!可以安排哪些活動?89有趣的旅行團實際情況是:10位成年人:均為58歲10位未成年人:均為6歲90離散程度定義:各變量值遠離其中心值的程度.63258真實的63258想象的91方差(Variance)

距離

求和均值

方差率先由羅納德·費雪(RonaldFisher)1918年在其論文中提出.是各變量值與平均數(shù)離差平方的平均數(shù).92自由度(DegreeofFreedom)樣本方差是總體方差的無偏估計

自由度是指數(shù)據(jù)個數(shù)與附加給獨立的觀測值的約束或限制的個數(shù)之差.數(shù)據(jù)個數(shù)約束個數(shù)

93例題旅行社匯總了這次旅行團成員的旅行支出情況,請計算旅行支出的總體方差,并對結(jié)果進行分析.旅行支出(元)含義:20位成員的平均支出為690元.

成年人8009001000700120090060080012001100未成年人40045050035060045030040060055094

旅行支出(元)成年人8009001000700120090060080012001100未成年人400450500350600450300400600550例題95標(biāo)準(zhǔn)差(StandardDeviation)得到的標(biāo)準(zhǔn)差與原始數(shù)據(jù)單位一致.樣本標(biāo)準(zhǔn)差

總體標(biāo)準(zhǔn)差

含義:每一位成員的支出與平均數(shù)相比,平均相差276.4元.96離散程度的比較不同群體支出的總體標(biāo)準(zhǔn)差:成年人支出的總體標(biāo)準(zhǔn)差:193.9元未成年人支出的總體標(biāo)準(zhǔn)差:96.95元結(jié)論:成年人支出的離散程度遠大于未成年人?旅行支出(元)成年人8009001000700120090060080012001100未成年人40045050035060045030040060055097離散系數(shù)(coefficientofvariation)標(biāo)準(zhǔn)差與其相應(yīng)的均值之比.對數(shù)據(jù)相對離散程度的測度.用于對不同組別數(shù)據(jù)離散程度的比較.

總體

樣本98離散系數(shù)(coefficientofvariation)成年人8009001000700120090060080012001100未成年人400450500350600450300400600550單位:元總體標(biāo)準(zhǔn)差總體均值成年人193.9920未成年人96.95460成年人:193.9/920=0.21.未成年人:

96.95/460=0.21.結(jié)論:兩個群體支出的離散程度相等支出的離散系數(shù)99小結(jié)總體樣本備注方差標(biāo)準(zhǔn)差離散系數(shù)

度量離散程度

量綱與數(shù)據(jù)一致

不同數(shù)據(jù)的離散程度比較100思考與練習(xí)思考:還有哪些離散程度的度量方法?為什么通常將隔離期設(shè)置為14天?練習(xí):見課程的網(wǎng)絡(luò)平臺.[1]LiQ,GuanX,WuP,WangX,ZhouL,TongY,RenR,LeungKS,LauEH,WongJY,XingX.EarlytransmissiondynamicsinWuhan,China,ofnovelcoronavirus–infectedpneumonia.NewEnglandJournalofMedicine.2020,382:1199-1207.[2]LintonNM,KobayashiT,YangY,HayashiK,AkhmetzhanovAR,JungSM,YuanB,KinoshitaR,NishiuraH.Incubationperiodandotherepidemiologicalcharacteristicsof2019novelcoronavirusinfectionswithrighttruncation:astatisticalanalysisofpubliclyavailablecasedata.Journalofclinicalmedicine.2020,9(2):538.101第4章數(shù)據(jù)的概括性度量4.2數(shù)據(jù)離中趨勢的度量相對位置的度量:標(biāo)準(zhǔn)化102引例:公司的招聘難題某公司要從甲乙兩位面試者中錄用1人.甲同學(xué)在分公司A完成了面試,成績?yōu)?400分,滿分為1600分.乙同學(xué)在分公司B完成了面試,成績?yōu)?0分,滿分為36分.兩個分公司各面試7人.公司該如何決策?103引例:公司的招聘難題A99899910001200140014011402B26272728292930方案甲的取值乙的取值錄用情況甲乙平均數(shù)分?jǐn)?shù)/滿分1400/1600=0.87530/36=0.833甲分?jǐn)?shù)/平均分1400/1200=1.16730/28=1.071甲看排名31乙104標(biāo)準(zhǔn)化:一種相對位置的度量總體的標(biāo)準(zhǔn)化樣本的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)分?jǐn)?shù)(Z-score)

105B減均值0112Z-score標(biāo)準(zhǔn)化的作用A99899910001200140014011402B26272728292930Z-score方案(A均值:1200,標(biāo)準(zhǔn)差201;B均值:28,標(biāo)準(zhǔn)差1.414)A99899910001200140014011402減均值Z-score作用1:度量某一個值在一組數(shù)據(jù)中相對位置106標(biāo)準(zhǔn)化的作用例:哪兩位用戶行為最相似用戶訪問頻次(次)訪問時長(分鐘)A620B530C840D545E735F232107例:哪兩位用戶行為最相似ABCDEFA0

B10.050

C20.1010.440

D25.0215.005.830

E15.035.395.1010.200

F12.653.6110.0013.345.830用戶ABCDEF658572203040453532未標(biāo)準(zhǔn)化情形下的距離矩陣

108例:哪兩位用戶行為最相似計算標(biāo)準(zhǔn)化得分均值標(biāo)準(zhǔn)差用戶ABCDEF訪問頻次訪問時長用戶ABCDEF訪問頻次658572訪問時長203040453532Z-score109例:哪兩位用戶行為最相似ABCDEFA0B1.370C2.752.030D3.211.901.710E1.971.230.831.650F2.601.603.332.292.670標(biāo)準(zhǔn)化得分的距離矩陣110例:哪兩位用戶行為最相似回到原始數(shù)據(jù),比較是否做標(biāo)準(zhǔn)化對于相似性度量的影響用戶ABCDEF訪問頻次658572訪問時長203040453532紅色:未做標(biāo)準(zhǔn)化藍色:標(biāo)準(zhǔn)化作用2:能消除不同數(shù)據(jù)量綱或規(guī)模對計算的影響CE874035111標(biāo)準(zhǔn)化的拓展112原始數(shù)據(jù)

小結(jié)相對位置:標(biāo)準(zhǔn)化定義:標(biāo)準(zhǔn)化作用:

相對于一組數(shù)據(jù)中其他值的位置度量相對位置、消除數(shù)據(jù)規(guī)模、……113思考與練習(xí)思考:是不是在任何情況下,在一組中排序第一數(shù)據(jù)的Z-score都會大于另一組排序第三數(shù)據(jù)的Z-score?練習(xí):見課程的網(wǎng)絡(luò)平臺.BZ-scoreA99899910001200140014011402Z-score114第4章數(shù)據(jù)的概括性度量4.3數(shù)據(jù)分布形態(tài)的度量1151.偏度的測定116偏度是描述數(shù)據(jù)分布形態(tài)是否對稱的指標(biāo)。資料沒有分組時,偏度的計算公式為:資料分組時,偏度的計算公式為:1.偏度的測定117上式表明,當(dāng)分布對稱時,正負總偏差相等,偏度值為0;當(dāng)分布不對稱時,正負總偏差不等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,可以判斷為正偏或者右偏;偏度值小于0表示負偏差值大,可以判斷為負偏或者左偏。偏度絕對值越大,表示數(shù)據(jù)分布形態(tài)的偏斜程度越大。2.峰度的測定118峰度是描述數(shù)據(jù)取值分布形態(tài)陡峭程度的指標(biāo)。資料沒有分組時,峰度的計算公式為:資料分組時,峰度的計算公式為:2.峰度的測定119上式表明,當(dāng)峰度值等于0時,數(shù)據(jù)分布與標(biāo)準(zhǔn)正態(tài)分布的陡峭程度相同,為正態(tài)分布;峰度值大于0時,數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭,為尖峰分布;峰度值小于0時,數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布平緩,為平峰分布。例題:計算90天網(wǎng)上銷售量的偏度和峰度120按網(wǎng)上銷售量分組(臺)組中值

80以下7013-366671.621116148437550.48392026.96100-1201102824464.24233878.12120以4212216244.09合計-9033511.5724003633.26

說明某品牌洗衣機90天網(wǎng)上銷售量的數(shù)據(jù)分布為右偏分布,但偏斜程度很小,屬于平峰分布。第5章統(tǒng)計量及其抽樣分布5.1統(tǒng)計量與常用分布1215.1.1統(tǒng)計量122

5.1.1統(tǒng)計量123

5.1.1統(tǒng)計量124反應(yīng)總體特征信息統(tǒng)計量公式總體均值信息樣本均值總體方差信息樣本方差總體偏度信息樣本偏度總體峰度信息樣本峰度幾種常見樣本統(tǒng)計量5.1.2常用分布1251.正態(tài)分布0

5.1.2常用分布1261.正態(tài)分布

0

5.1.2常用分布1271.正態(tài)分布

0

5.1.2常用分布1281.正態(tài)分布

0

5.1.2常用分布1291.正態(tài)分布

0

5.1.2常用分布1302.卡方分布

5.1.2常用分布1312.卡方分布

5.1.2常用分布1322.卡方分布

5.1.2常用分布1333.t分布

5.1.2常用分布1343.t分布

5.1.2常用分布1353.t分布

0

t分布5.1.2常用分布1363.F分布

5.1.2常用分布1373.F分布

第5章統(tǒng)計量及其抽樣分布5.2抽樣分布樣本均值及其分布138課程導(dǎo)入某企業(yè)需要運送36箱貨物.根據(jù)歷年信息,可認為貨物μ=72千克,σ=3千克.目前貨機尚可承載2646千克.貨物安全裝上飛機的概率是多少?139正態(tài)分布總體方差已知

[1]http://www.et.bs.ehu.es/~etptupaf/nuevo/ficheros/stat4econ/muestreo.pdf140正態(tài)分布總體方差已知

如果不是正態(tài)總體呢?141非正態(tài)分布且總體方差已知樣本均值的分布(雙峰)142非正態(tài)分布且總體方差已知樣本均值的分布(均勻)143非正態(tài)分布且總體方差已知樣本均值的分布(右偏)144非正態(tài)分布且總體方差已知

145非正態(tài)分布且總體方差已知回到原來的問題:

那么將所有貨物安全地裝載到飛機上并進行運輸?shù)目赡苄允嵌嗌伲?/p>

接下來的問題就是你是否愿意承擔(dān)大約為0.13%無法起飛的風(fēng)險了?146非正態(tài)分布且總體方差已知關(guān)于中心極限定理的幾個問題:當(dāng)樣本的樣本量足夠大,樣本均值將是正態(tài)分布的?

偏態(tài)系數(shù):0.067

偏態(tài)系數(shù):0.719

均勻分布總體抽樣右偏分布總體抽樣147非正態(tài)分布且總體方差已知關(guān)于中心極限定理的幾個問題:注:在金融計算中,柯西分布的“厚尾”可以用于模擬比正態(tài)分布更高概率的極端風(fēng)險.[1]Liu,Tong,etal."AnintermediatedistributionbetweenGaussianandCauchydistributions."

PhysicaA:StatisticalMechanicsanditsApplications

391.22(2012):5411-5421.[2]/staff/fmasci/home/mystats/CauchyVsGaussian.pdf

柯西分布正態(tài)分布Lindeberg-Levy中心極限定理的結(jié)論適用于任意分布.148正態(tài)分布且總體方差未知[1]WilliamM.Mendenhall著,關(guān)靜等譯,統(tǒng)計學(xué),機械工業(yè)出版社,2018.(p215)[2]CochranWG(1934)."Thedistributionofquadraticformsinanormalsystem,withapplicationstotheanalysisofcovariance".Math.Proc.Camb.Philos.Soc.30(2):178–191.

149小結(jié)總體方差已知總體方差未知正態(tài)總體非正態(tài)總體(大樣本)樣本均值的抽樣分布

?150思考與練習(xí)

[1]RobertV.Hogg,JosephW.McKean,AllenT.Craig著,王忠玉,長江譯,數(shù)理統(tǒng)計學(xué)導(dǎo)論(原書第7版),機械工業(yè)出版社,2014.(p226,p233)151第5章統(tǒng)計量及其抽樣分布5.2抽樣分布樣本比例及其分布樣本方差及其分布1525.2.2樣本比例及其分布153

5.2.2樣本比例及其分布154第500次抽樣的樣本比例與累積頻數(shù)分布第1000次抽樣的樣本比例與累積頻數(shù)分布5.2.2樣本比例及其分布155

5.2.2樣本比例及其分布156

5.2.3樣本方差及其分布157

5.2.3樣本方差及其分布158

第6章參數(shù)估計6.1點估計159參數(shù)估計160樣本

推斷

總體

6.1點估計161點估計簡單來講就是使用樣本數(shù)據(jù)來計算得到一個具體的值,并將該值用作為對于未知總體參數(shù)的估計值。

6.1點估計(例子)162

評價標(biāo)準(zhǔn)——無偏性(Unbiased)163無偏

有偏0

評價標(biāo)準(zhǔn)——無偏性(Unbiased)164

評價標(biāo)準(zhǔn)——有效性(Efficiency)165

左邊的估計更有效0

評價標(biāo)準(zhǔn)——有效性(Efficiency)166

評價標(biāo)準(zhǔn)——一致性(Consistency)167

0

評價標(biāo)準(zhǔn)——充分性(Sufficiency)168如果一個估計量使用了樣本可以提供的所有關(guān)于總體參數(shù)的信息,那么我們就稱其為充分的。例如,如果將樣本中位數(shù)作為總體均值的估計量,那么它是不充分的,因為它只使用了關(guān)于觀察排名的信息,而樣本均值則是充分的。第6章參數(shù)估計6.2置信區(qū)間6.2.1置信區(qū)間的概念6.2.2一個總體參數(shù)的置信區(qū)間1691706.2.1置信區(qū)間的概念導(dǎo)入171

導(dǎo)入172(1)“附近”到底有多近呢?也就是說當(dāng)我們給出點估計的時候,估計誤差是多少呢?(2)既然點估計恰好等于真實總體參數(shù)的概率為零,那我們能不能設(shè)置一個區(qū)間,這個區(qū)間能夠較大概率的包含總體參數(shù)呢?定義173

定義174

1756.2.2一個總體參數(shù)的置信區(qū)間一個總體參數(shù)的置信區(qū)間主要包括總體均值、總體比例和總體方差的置信區(qū)間三個部分。176

總體均值的置信區(qū)間.1正態(tài)總體、總體方差已知情形正態(tài)總體、總體方差已知情形177

正態(tài)總體、總體方差已知情形178

0

正態(tài)總體、總體方差已知情形179例題某研究院隨機對1000棵某類植物的果實產(chǎn)量進行調(diào)查。若根據(jù)歷史經(jīng)驗已知,這類植物的果實產(chǎn)量服從正態(tài)分布,標(biāo)準(zhǔn)差為1000克?,F(xiàn)在已知抽取的植物果實產(chǎn)量均值為4300克,請在95%的置信水平下,建立這類植物果實平均產(chǎn)量的置信區(qū)間。正態(tài)總體、總體方差已知情形180

正態(tài)總體、總體方差已知情形181

182.2非正態(tài)總體、大樣本情形非正態(tài)總體、大樣本情形183

非正態(tài)總體、大樣本情形184

第6章參數(shù)估計185正態(tài)總體、總體方差未知情形課程導(dǎo)入調(diào)查報告:創(chuàng)業(yè)園區(qū)的咖啡市場調(diào)查某咖啡連鎖企業(yè)計劃在某創(chuàng)業(yè)園區(qū)內(nèi)開設(shè)分店.委托調(diào)研機構(gòu)開展市場調(diào)查(樣本量120),被調(diào)查者在過去一年內(nèi)用于咖啡的平均支出為560元,標(biāo)準(zhǔn)差為100元.調(diào)查結(jié)論:過去一年,該園區(qū)員工用于咖啡的平均支出為560元.186課程導(dǎo)入

例:總體均值50,抽樣1000次總體樣本187一個總體均值的置信區(qū)間

需要給出一個總體均值的置信區(qū)間188置信區(qū)間公式(總體方差未知)

總體方差已知總體方差未知正態(tài)總體非正態(tài)總體(大樣本)

樞軸量189置信區(qū)間公式(總體方差未知)點估計估計誤差

123190公式的解讀

一個總體均值的置信區(qū)間(置信水平95%)191例題某咖啡連鎖企業(yè)計劃在某創(chuàng)業(yè)園區(qū)內(nèi)開設(shè)分店,委托調(diào)研機構(gòu)開展市場調(diào)查.機構(gòu)調(diào)查了120位園區(qū)內(nèi)的員工,被調(diào)查者在過去一年內(nèi)咖啡的平均支出為560元,標(biāo)準(zhǔn)差為100元,假設(shè)支出服從正態(tài)分布,請在95%的置信水平下,建立咖啡平均支出的置信區(qū)間.問題解析:

條件:正態(tài)總體、方差未知12192例題(求解)已知條件:

選擇公式:計算過程:1結(jié)果解釋:

234193例題(結(jié)果說明)

……194拓展討論

12195小結(jié)樞軸量:置信區(qū)間:估計誤差:

196思考與練習(xí)思考:一個總體均值的置信區(qū)間為什么是對稱的?不對稱可以嗎?會有什么問題嗎?練習(xí):見課程的網(wǎng)絡(luò)平臺.00.0250.025-1.981.9800.03750.0125-2.281.80197第6章參數(shù)估計一個總體比例的近似置信區(qū)間198APP用戶需求調(diào)查

199一個總體比例的近似置信區(qū)間

例:總體比例60%,3000次抽樣.總體樣本200一個總體比例的近似置信區(qū)間

需要給出一個總體比例的置信區(qū)間201一個總體比例的近似置信區(qū)間

假定條件總體服從兩點分布大樣本,正態(tài)近似

202

樞軸量近似置信區(qū)間公式123點估計估計誤差

203公式的解讀

一個總體比例的近似置信區(qū)間(95%置信水平)204例題某運動APP開發(fā)工程師建議在APP中增加一鍵分享功能.為了解用戶的實際需求,公司隨機抽取1200位用戶進行調(diào)查,發(fā)現(xiàn)有639位用戶認為需要增加這一功能.請在95%的置信水平下建立用戶需要新增功能比例的置信區(qū)間.

205例題(求解)已知條件:

選擇公式:計算過程:1234結(jié)果解釋:

206例題(結(jié)果解釋)

……

207例題(拓展)如果公司希望能夠降低估計誤差,可以怎么做?(假設(shè)樣本比例不變)

方案1:方案2:208小結(jié)樞軸量:置信區(qū)間:估計誤差:

209思考與練習(xí)思考:如果公司決策層只是關(guān)心有該需求用戶比例的下界.

因為比例很高沒什么問題,但是太低的話“一鍵分享”功能的開發(fā)就沒有什么意義了,這樣的單側(cè)置信區(qū)間應(yīng)該如何構(gòu)建?[1]

練習(xí):見課程的網(wǎng)絡(luò)平臺.0

[1]茆詩松,呂曉玲,數(shù)理統(tǒng)計學(xué),中國人民大學(xué)出版社,2016.(p23-35).210第6章參數(shù)估計211一個總體方差的置信區(qū)間引例某制造企業(yè)被稱為“黑燈工廠”,所有環(huán)節(jié)都由機器人完成,現(xiàn)在希望評價機器人在工作中表現(xiàn)的穩(wěn)定性,其中一項需要調(diào)查產(chǎn)品重量的方差,應(yīng)該如何做?/InnovateNews/industry/2015/201552681.html212引例100.6399.58101.3898.8399.2599.2998.1699.13101.8298.46100.17101.41100.72100.21102.39100.59100.19100.71100.6298.87100.08100.7499.5699.3899.31101.15101.5599.2699.54100.0799.2498.35100.99102.03101.0897.89

單位:kg該企業(yè)認為機器人生產(chǎn)產(chǎn)品的重量方差是1.301.213一個總體方差的置信區(qū)間

例:總體方差100,抽樣1000次,樣本量2000總體樣本214一個總體方差的置信區(qū)間

需要計算一個總體方差的置信區(qū)間215一個總體方差的置信區(qū)間假定條件:總體服

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論