數(shù)據(jù)與統(tǒng)計學課件_第1頁
數(shù)據(jù)與統(tǒng)計學課件_第2頁
數(shù)據(jù)與統(tǒng)計學課件_第3頁
數(shù)據(jù)與統(tǒng)計學課件_第4頁
數(shù)據(jù)與統(tǒng)計學課件_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第1章 數(shù)據(jù)與統(tǒng)計學2009年2月10日,國家統(tǒng)計局發(fā)布的最新統(tǒng)計顯示,今年1月份我國居民消費價格總水平(CPI)同比上漲1.0%,生產(chǎn)者物價指數(shù)(PPI)同比下降3.3%,創(chuàng)82個月以來月度新低。1.1 統(tǒng)計數(shù)據(jù)與統(tǒng)計學第一章 數(shù)據(jù)與統(tǒng)計學 1.2 統(tǒng)計學的產(chǎn)生與發(fā)展1.4 統(tǒng)計數(shù)據(jù)的來源1.5 統(tǒng)計數(shù)據(jù)的質(zhì)量1.6 統(tǒng)計學的基本概念1.3 統(tǒng)計學的分科1.1 統(tǒng)計數(shù)據(jù)與統(tǒng)計學統(tǒng)計資料統(tǒng)計學統(tǒng)計活動 統(tǒng)計學的概念1.【 統(tǒng)計的涵義 】三種政府統(tǒng)計:國家統(tǒng)計局、職能部門企事業(yè)單位統(tǒng)計:工廠統(tǒng)計機構等經(jīng)營統(tǒng)計:調(diào)查咨詢公司、統(tǒng)計事務所等其它:如研究性統(tǒng)計機構等 統(tǒng)計的涵義之二統(tǒng)計活動即統(tǒng)計實踐活

2、動,是對統(tǒng)計數(shù)據(jù)進行搜集、整理和分析的全過程 統(tǒng)計學 1869年的第七次國際統(tǒng)計會議上,在討論關于統(tǒng)計學的定義時,據(jù)說竟有180余種之多?!笆占头治鰯?shù)據(jù)的科學和藝術”。不列顛百科全書最接近科學的定義:統(tǒng)計學是一門關于數(shù)據(jù)資料的收集、整理、分析和推斷的科學。 復旦大學統(tǒng)計的涵義之三三種含義之間的關系統(tǒng)計數(shù)據(jù)與統(tǒng)計活動是統(tǒng)計成果與過程的關系,統(tǒng)計活動與統(tǒng)計學則是統(tǒng)計實踐與理論的關系統(tǒng)計規(guī)律 (一些例子)正常條件下新生嬰兒的男女性別比為107:100投擲一枚質(zhì)地均勻的硬幣,出現(xiàn)正面和反面的頻率各為1/2;投擲一枚骰子出現(xiàn)16點的頻率各為1/6農(nóng)作物的產(chǎn)量與施肥量之間存在相關關系統(tǒng)計學的故事 發(fā)生在

3、英國,二戰(zhàn)前期德國勢頭很猛,英國從敦刻爾克撤回到本島,德國每天不定期的對英國狂轟亂炸,后來英國空軍發(fā)展起來,雙方空戰(zhàn)不斷。 為了能夠提高飛機的防護能力,英國的飛機設計師們決定給飛機增加護甲,但是設計師們并不清楚應該在什么地方增加護甲,于是請來了統(tǒng)計學家,統(tǒng)計學家將每架中彈之后仍然安全返航的飛機的中彈部位描繪在一張圖上,然后將所有中彈飛機的圖都疊放在一起,這樣就形成了濃密不同的彈孔分布。工作完成了,然后統(tǒng)計學家很牛的說沒有彈孔的地方就是應該增加護甲的地方,因為這個部位中彈的飛機都沒能幸免于難。 迷信和心理作用 心理作用會對一個人身體的生物功能產(chǎn)生影響嗎?很遺憾,對這個問題還沒有實驗證據(jù)。但是已經(jīng)

4、不斷有研究報告,涉及到支持所謂“心于物質(zhì)之上”的談論。最近有一個研究報告,圣地亞哥的加利福尼亞大學的菲力普斯(D.Phillips)花了25年的時間,對老年美籍華裔婦女在一個重要的節(jié)日,中秋節(jié)前后的死亡率進行的調(diào)查,他發(fā)現(xiàn)節(jié)日前一周死亡率比通常低35.1%,節(jié)日后一周死亡率比通常高出34.6%??雌饋恚司哂幸环N能力來延續(xù)死亡直到經(jīng)歷某個吉祥的時刻。 這些研究結(jié)果是否顯示一些人能夠運用他們的能力延緩死亡日期,直到某個重要的事件發(fā)生。如生日、節(jié)日或紀念日與這個類似的一個著名例子是有關托馬斯杰弗遜(Thomas Jefferson)的報道,據(jù)說他延長了他的死亡直到1826年的7月4日剛好獨立宣言簽

5、字后的第50年,他僅僅問了醫(yī)生:“今天是7月4日嗎?”就去世了。統(tǒng)計學的研究對象 社會經(jīng)濟統(tǒng)計學的研究對象是社會經(jīng)濟現(xiàn)象總體的數(shù)量特征和數(shù)量關系。 其研究對象的特點是: 社會性、總體性、變異性統(tǒng)計在工商管理中的一些的應用企業(yè)發(fā)展戰(zhàn)略產(chǎn)品質(zhì)量管理市場研究財務分析經(jīng)濟預測人力資源管理中美純水有限公司欲為其新推出的一種純水產(chǎn)品起一個合適的名字,為此專門委托了當?shù)氐牟邉澴稍児?,取了一個名字“波瀾”。一個好的名字至少應該滿足兩個條件:(1)會使消費者聯(lián)想到正確的產(chǎn)品“純水”;(2)會使消費者產(chǎn)生與正確產(chǎn)品密切相關的聯(lián)想,如“純凈”、“清爽”等。 后來中美純水有限公司委托調(diào)查統(tǒng)計研究所,進行了一次全面的

6、市場研究,在調(diào)查中還包括簡單的名稱測試。 起名為“ 波瀾”恰當嗎?調(diào)查的代碼和含義如下:代碼含義代碼含義代碼含義Name1玉泉Product1雪糕Feel1清爽Name2雪源Product2純水Feel2甘甜Name3春溪Product3碳酸飲料Feel3歡快Name4期望Product4果汁飲料Feel4純凈Name5波瀾Product5保健食品Feel5安閑Name6天山綠Product6空調(diào)Feel6個性Name7中美純Product7洗衣機Feel7興奮Name8雪浪花Product8毛毯Feel8高檔2021對應分析圖Dimension l 由直觀圖可以看出,“波瀾”(Name5)與

7、“洗衣機”(Product7)產(chǎn)品相聯(lián)系,引起的感覺是“興奮”,因此“波瀾”不是合適的純凈水品牌名稱。中美純水公司的產(chǎn)品是“純水”(Product2),他們?nèi)绻胍乖撁Q給人們一種“純凈”(Feel4)的感覺,那么“中美純”(Name7)將是最好的商品名稱。如果想要使該名稱給人們一種“清爽”(Feel1)的感覺,那么“玉泉”(Name1)將是最好的商品名稱。中美純水公司接受了調(diào)查統(tǒng)計研究所的建議,沒有用“波瀾”這個名稱,而用了“中美純”作為品牌的名稱。實踐證明,它的確是一個成功的品牌名稱。(一)古典統(tǒng)計學時期(17C末18C末)國勢學派(也稱記述學派):創(chuàng)始人和代表人物,德國康令(H.Cor

8、ing,1606-1681)和阿亨瓦爾(G.Achenwall,1719-1772)。顯著事項的記錄1.命名“統(tǒng)計學”2.“統(tǒng)計數(shù)字資料”、“數(shù)字對比”等術語3.運用對比的方法來研究各國的實力與強弱政治算術學派:創(chuàng)始人和代表人物:英國威廉配第政治算術政治經(jīng)濟學之父,某種意義上也是統(tǒng)計學的創(chuàng)始人!1.提出了大量觀察法、典型調(diào)查、定期調(diào)查原則2.廣泛運用分類、制表及各種指標來濃縮與顯現(xiàn)數(shù)量資料的信息3.有意識地運用可度量的方法,力求依靠數(shù)字來解釋和說明社會經(jīng)濟生活英國格朗特(J.Graunt,1620-1670)關于死亡表的自然和政治觀察(三)現(xiàn)代統(tǒng)計學時期(19C末現(xiàn)在)小樣本思想、t分布理論、

9、卡方分布、方差分析、假設檢驗、估計理論、誤差理論、決策理論、多元統(tǒng)計、時間序列、面板數(shù)據(jù)等方法的出現(xiàn)統(tǒng)計方法的不斷創(chuàng)新醫(yī)學統(tǒng)計學、天文統(tǒng)計學、傳媒統(tǒng)計學、管理統(tǒng)計學、金融統(tǒng)計學、國民經(jīng)濟統(tǒng)計學、社會統(tǒng)計學、教育統(tǒng)計學、心理統(tǒng)計學、生物統(tǒng)計學等學科的出現(xiàn)統(tǒng)計應用面的的不斷拓展第一階段是統(tǒng)計學的初創(chuàng)階段 第二階段是統(tǒng)計推斷方法體系基本確定的階段 第三階段是統(tǒng)計方法與應用研究全面發(fā)展的階段 1.3 統(tǒng)計學的分科描述統(tǒng)計(descriptive statistics)研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學分支 內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析 目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q

10、4¥x = 30 s2 = 105推斷統(tǒng)計 (inferential statistics)研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學分支內(nèi)容參數(shù)估計假設檢驗目的對總體特征作出推斷樣本總體例1.1 一個隨機樣本包括200名顧客,他們同意對某一新產(chǎn)品提出意見。意見百分比(%)十分喜歡并購買該產(chǎn)品十分喜歡但可能不會購買該產(chǎn)品不喜歡該產(chǎn)品543214合計100200名顧客對新產(chǎn)品的意見年齡(歲)樣本年齡組中的人數(shù)十分喜歡并購買該產(chǎn)品的人數(shù)人數(shù)(人)比重(%)人數(shù)(人)占各年齡組人數(shù)的比重(%)1519105110.020292010420.0303972363852.7404976386281.65

11、0及以上2211313.6合計20010010854.0各年齡組中喜歡并購買該產(chǎn)品的人數(shù)分布問題:如何知道該新燈絲的平均使用壽命?回答:需進行統(tǒng)計推斷總體:所有用新燈絲生產(chǎn)的燈泡樣本:200個隨機抽檢的燈泡數(shù)據(jù)收集:每個被檢燈泡(樣本)照明的小時數(shù) 例1.2 高亮度燈泡平均使用壽命 某燈泡廠使用一種新燈絲生產(chǎn)燈泡以延長燈泡使用壽命。 如果該200個被檢燈泡的平均照明時間為76小時,則可推斷該新燈絲所生產(chǎn)燈泡的平均壽命為76小時,或者給出區(qū)間。統(tǒng)計推斷程序:1.4 統(tǒng)計數(shù)據(jù)的來源一、直接獲取數(shù)據(jù)1、普查2、抽樣調(diào)查二、間接數(shù)據(jù)的獲取P91、統(tǒng)計年鑒2、統(tǒng)計局網(wǎng)站補充:統(tǒng)計數(shù)據(jù)的分類統(tǒng)計數(shù)據(jù)的分類

12、按計量層次分類的數(shù)據(jù)順序的數(shù)據(jù)數(shù)值型數(shù)據(jù)按時間狀況截面的數(shù)據(jù)時序的數(shù)據(jù)按收集方法觀察的數(shù)據(jù)試驗的數(shù)據(jù)統(tǒng)計數(shù)據(jù)的分類 (按計量尺度分)分類數(shù)據(jù)(categorical data) 對事物進行分類的結(jié)果數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,人口按性別分為男、女兩類 順序數(shù)據(jù)(rank data) 對事物類別順序的測度數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,產(chǎn)品分為一等品、二等品、三等品、次品等 數(shù)值型數(shù)據(jù)(metric data) 對事物的精確測度結(jié)果表現(xiàn)為具體的數(shù)值例如:身高為175cm、168cm、183cm統(tǒng)計數(shù)據(jù)的分類(按收集方法分)觀測的數(shù)據(jù)(observational data) 通過調(diào)查或觀測

13、而收集到的數(shù)據(jù)在沒有對事物人為控制的條件下而得到的有關社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)試驗的數(shù)據(jù)(experimental data) 在試驗中控制試驗對象而收集到的數(shù)據(jù)比如,對一種新藥療效的試驗,對一種新的農(nóng)作物品種的試驗等自然科學領域的數(shù)據(jù)大多數(shù)都為試驗數(shù)據(jù)統(tǒng)計數(shù)據(jù)的分類(按時間狀況分)截面數(shù)據(jù)(cross-sectional data) 在相同或近似相同的時間點上收集的數(shù)據(jù)描述現(xiàn)象在某一時刻的變化情況比如,2012年我國各地區(qū)的國內(nèi)生產(chǎn)總值數(shù)據(jù)時間序列數(shù)據(jù)(time series data) 在不同時間上收集到的數(shù)據(jù)描述現(xiàn)象隨時間變化的情況比如,2000年至2012年國內(nèi)生產(chǎn)總值數(shù)

14、據(jù)1.5統(tǒng)計數(shù)據(jù)的質(zhì)量調(diào)查誤差的種類:由于人的主觀故意或失誤而產(chǎn)生的誤差,理論上它可以用某種方法加以消除登記誤差代表性誤差由樣本數(shù)值推斷總體數(shù)值時所產(chǎn)生的誤差,它不可以消除,但可以加以控制,只存在于抽樣調(diào)查中 (隨機誤差)調(diào)查誤差調(diào)查結(jié)果所得的統(tǒng)計數(shù)據(jù)與調(diào)查總體實際數(shù)量表現(xiàn)的差別和不一致從全部學生中隨機抽取20人組成樣本并計算平均體重:樣本一:52.35樣本二:50.26樣本三:53.19真值: 51.18代表性誤差誤差的控制抽樣誤差可計算和控制非抽樣誤差的控制調(diào)查員的挑選調(diào)查員的培訓督導員的調(diào)查專業(yè)水平調(diào)查過程控制調(diào)查結(jié)果進行檢驗、評估現(xiàn)場調(diào)查人員進行獎懲的制度統(tǒng)計數(shù)據(jù)的質(zhì)量要求1. 精 度

15、:最低的抽樣誤差或隨機誤差2. 準確性:最小的非抽樣誤差或偏差3. 關聯(lián)性:滿足用戶決策、管理和研究的需要4. 及時性:在最短的時間里取得并公布數(shù)據(jù)5. 一致性:保持時間序列的可比性6. 最低成本:以最經(jīng)濟的方式取得數(shù)據(jù)1.6統(tǒng)計學的基本概念一、 總體和樣本總體與個體樣本總體與樣本的關系個體總體統(tǒng)計研究的客觀對象的全體,是具有某種共同性質(zhì)的事物所組成的集合體(也稱為母體或調(diào)查對象)構成統(tǒng)計總體的個別事物稱為個體(也稱總體單位或調(diào)查單位)1.總體和個體的概念具有大量性、同質(zhì)性、差異性等特征* 總體由總體單位構成,要認識總體必須從總體單位開始,總體是統(tǒng)計認識的對象。1、總體容量隨著個體數(shù)的增減可變

16、大變小。2、隨著研究目的的不同,總體中個體可發(fā)生變化。3、隨著研究范圍的變化,總體與個體的角色可以變化。2.總體與個體的關系總體、總體單位總體、總體單位總體或總體單位的區(qū)分不是固定的,在一定條件下可以相互轉(zhuǎn)化。 所謂樣本就是從總體中抽取一部分個體所組成的集合,也稱子樣。(二)樣本樣本容量大于等于30時,稱為大樣本樣本容量小于30時,稱為小樣本*1.概念:我們在調(diào)查時,一般應選擇大樣本一位社會學家想知道,當?shù)爻赡曷殬I(yè)女性對政府的托兒補助有什么意見。1.她從當?shù)氐囊患移髽I(yè)拿到520個會員的名單,從這520個名單中隨機抽取了100人,寄問卷給她們,但只回收了42份問卷。2.她從統(tǒng)計局拿到一份當?shù)厝丝?/p>

17、的名單,選擇了其中100名成年女性,寄問卷給她們,但只回收了42份問卷。上述調(diào)查中,總體和樣本分別是什么? 1.總體是所要研究的對象,而樣本則是所要觀測的對象,樣本是總體的代表和縮影。2.樣本是用來推斷總體的。3.總體和樣本的角色是可以改變的。4.總體和樣本都具有大量性、同質(zhì)性和差異性三個特征。*2.樣本與總體的關系二、 標志和變量(一)標志 1.標志的概念 所謂標志,就是用以描述個體所具有的特征的名稱。標志在每個個體上的具體表現(xiàn)結(jié)果稱為標志表現(xiàn)。 2.標志的種類* (1)按結(jié)果的表示方式不同,可以分為品質(zhì)標志和數(shù)量標志品質(zhì)標志數(shù)量標志說明總體單位的屬性特征,在原始狀態(tài)下無法量化 ,結(jié)果只能用

18、文字表示。說明總體單位的數(shù)量特征,在原始狀態(tài)下能夠量化,結(jié)果用數(shù)值表示。數(shù)量標志又被叫作變量統(tǒng)計研究是從登記標志開始,并通過對標志的綜合來反映總體的數(shù)量特征.標志(個體)綜合指標(總體)標志性別年齡民族宗教信仰黨派身高體重男漢族佛教無黨派43歲182cm75公斤標志值品質(zhì)標志文字表述數(shù)量標志數(shù)據(jù)表述(二)變量1、變量的含義 狹義上看,變量就是可變的數(shù)量標志。 廣義上看,變量是可變的數(shù)量標志和可變的品質(zhì)標志。 注:此時的品質(zhì)標志必須經(jīng)過數(shù)量化 2、變量的分類確定性變量 隨機變量 連續(xù)型變量離散型變量如何描述(規(guī)模、集中趨勢等)如何推斷(估計、檢驗等)度量取得、重疊組限、連續(xù)分布、概率密度函數(shù)計數(shù)取得、間斷或連續(xù)組限、離散分布(二項分布、泊松分布等)定性變量 定量變量 反映定性數(shù)據(jù)反映定量數(shù)據(jù)統(tǒng)計使人豁達1、良好的統(tǒng)計訓練使人宏觀意識比較強 總體和總量是統(tǒng)計學中最基本的概念,雖然統(tǒng)計調(diào)查和處理都要從個體入手,但其最終目的是為了由此去對現(xiàn)象的總體做出評價。統(tǒng)計總是把著眼點放在宏觀大勢的把握上,對個體數(shù)據(jù)如何處理,也取決于怎樣科學地得到總體的認識。久而久之,統(tǒng)計的訓練使人宏觀意識得到強化,遇到問題習慣將之放在時空的大背景中去考慮。古人云:會當凌絕頂,一覽眾山小。統(tǒng)計訓練

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論