統(tǒng)計(jì)法-第1-8章課件011導(dǎo)論_第1頁(yè)
統(tǒng)計(jì)法-第1-8章課件011導(dǎo)論_第2頁(yè)
統(tǒng)計(jì)法-第1-8章課件011導(dǎo)論_第3頁(yè)
統(tǒng)計(jì)法-第1-8章課件011導(dǎo)論_第4頁(yè)
統(tǒng)計(jì)法-第1-8章課件011導(dǎo)論_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)Statistics

共享郵箱:

什么是統(tǒng)計(jì)學(xué)?什么是統(tǒng)計(jì)學(xué)?

(statistics)統(tǒng)計(jì)學(xué)是收集、分析、表述和解釋數(shù)據(jù)的科學(xué)(不列顛百科全書)統(tǒng)計(jì)是一門收集、分析、解釋和提供數(shù)據(jù)的科學(xué)(韋伯斯特國(guó)際辭典第3版)統(tǒng)計(jì)指的是一組方法,用來設(shè)計(jì)實(shí)驗(yàn)、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎(chǔ)上組織、概括、演示、分析、解釋和得出結(jié)論(MarioF.Triola,《初級(jí)統(tǒng)計(jì)學(xué)》)

統(tǒng)計(jì)是一套有關(guān)收集、處理、分析、解釋和從數(shù)據(jù)中得出的結(jié)論的方法(教材)應(yīng)用案例:制定宏觀經(jīng)濟(jì)政策

例如:政府制定各項(xiàng)經(jīng)濟(jì)政策要知道:未來的就業(yè)形勢(shì)?經(jīng)濟(jì)增長(zhǎng)前景?物價(jià)形勢(shì)?國(guó)際收支狀況?這些信息都需要大量的統(tǒng)計(jì)支持(數(shù)據(jù)收集、趨勢(shì)預(yù)測(cè)、政策效果的評(píng)價(jià)等等)。

應(yīng)用案例:抽樣調(diào)查2008年11月2日各民意調(diào)查機(jī)構(gòu)對(duì)美國(guó)大選的兩位候選人的支持率調(diào)查結(jié)果(選民票得票率)

馬里斯特:奧巴馬50,麥凱恩43.

拉斯馬森:奧巴馬51,

麥凱恩47.

蓋洛普:奧巴馬52,麥凱恩43.

佐格比:奧巴馬50,麥凱恩43.

迪亞喬:奧巴馬48,麥凱恩41.

戰(zhàn)場(chǎng):

奧巴馬49,

麥凱恩45.

IBD:

奧巴馬48,

麥凱恩44.實(shí)際結(jié)果:奧巴馬和麥凱恩的選民票得票率分別為52%和46%。統(tǒng)計(jì)數(shù)據(jù)無處不在舉例1:統(tǒng)計(jì)局:今年5月份CPI同比增長(zhǎng)5.5%

舉例2:期末全班同學(xué)的高等代數(shù)的平均分為75,最高分為92,最低分為40,不及格率為5%舉例3:挪威公共衛(wèi)生研究所的科學(xué)家調(diào)查表明,每天吸煙1到4支的人罹患缺血性心臟病的幾率是不吸煙者的3倍,少量吸煙的男性罹患肺癌的風(fēng)險(xiǎn)比不吸煙男性高2倍,女性少量吸煙則會(huì)使罹患肺癌的風(fēng)險(xiǎn)增加4倍。

統(tǒng)計(jì)數(shù)據(jù)無處不在舉例4:1981年,首屆國(guó)際《紅樓夢(mèng)》研討會(huì)在美國(guó)召開,威斯康星大學(xué)講師陳炳藻獨(dú)樹一幟,宣讀了題為《從詞匯上的統(tǒng)計(jì)論〈紅樓夢(mèng)〉作者的問題》的論文。他從字、詞出現(xiàn)頻率入手,通過計(jì)算機(jī)進(jìn)行統(tǒng)計(jì)、處理、分析,對(duì)《紅樓夢(mèng)》后40回系高鶚?biāo)鬟@一流行看法提出異議,認(rèn)為120回均系曹雪芹所作。統(tǒng)計(jì)學(xué)是一系列從數(shù)據(jù)中獲取有用信息以幫助決策的原理和方法。統(tǒng)計(jì)的各步驟

(statistics)1.收集數(shù)據(jù):取得數(shù)據(jù)2.處理數(shù)據(jù):整理與圖表展示分析數(shù)據(jù):利用統(tǒng)計(jì)方法研究數(shù)據(jù)數(shù)據(jù)解釋:統(tǒng)計(jì)結(jié)果的說明得到結(jié)論:從數(shù)據(jù)中提取有用的信息得出結(jié)論收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)

統(tǒng)計(jì)方法數(shù)據(jù)分析的統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)描述統(tǒng)計(jì)

(descriptivestatistics)描述統(tǒng)計(jì)

—用表格、圖形和數(shù)字來概括、顯示數(shù)據(jù)特征的統(tǒng)計(jì)方法內(nèi)容整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105描述統(tǒng)計(jì)舉例例1:2005年我國(guó)出生人口性別比(男:女)已經(jīng)升高到119.92,與正常值106相比有嚴(yán)重的偏離。例2:中國(guó)經(jīng)濟(jì)增長(zhǎng)的起伏推斷統(tǒng)計(jì)

(inferentialstatistics)推斷統(tǒng)計(jì)—研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶?duì)總體特征作出推斷樣本總體推斷統(tǒng)計(jì)舉例例1:2003年人口變動(dòng)抽樣調(diào)查以全國(guó)為總體,在全國(guó)抽取了990個(gè)縣(市、區(qū))、3734個(gè)鄉(xiāng)(鎮(zhèn)、街道)、6544個(gè)調(diào)查小區(qū)的126萬人。根據(jù)調(diào)查結(jié)果推算,2003年末全國(guó)總?cè)丝跒?29227萬人,出生人口為1599萬人,死亡人口為825萬人,凈增人口為774萬人。例2:一家大公司的會(huì)計(jì)部門會(huì)從所有的發(fā)票中選擇一部分來檢查公司所有發(fā)票的準(zhǔn)確性。描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系總體內(nèi)在的數(shù)量規(guī)律性推斷

統(tǒng)計(jì)概率論與數(shù)理統(tǒng)計(jì)描述

統(tǒng)計(jì)

總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計(jì)的應(yīng)用領(lǐng)域經(jīng)濟(jì)學(xué)管理學(xué)醫(yī)學(xué)工程學(xué)社會(huì)學(xué)…

統(tǒng)計(jì)學(xué)

由于大部分學(xué)科都涉及數(shù)據(jù)分析工作,因此統(tǒng)計(jì)學(xué)幾乎可以與任何一個(gè)學(xué)科結(jié)合起來……統(tǒng)計(jì)的應(yīng)用領(lǐng)域actuarialwork

(精算)

agriculture

(農(nóng)業(yè))animalscience

(動(dòng)物學(xué))

anthropology

(人類學(xué))archaeology(考古學(xué))

auditing(審計(jì)學(xué))crystallography(晶體學(xué))

demography(人口統(tǒng)計(jì)學(xué))dentistry(牙醫(yī)學(xué))

ecology

(生態(tài)學(xué))econometrics(經(jīng)濟(jì)計(jì)量學(xué))

education(教育學(xué))electionforecastingandprojection

(選舉預(yù)測(cè)和策劃)engineering(工程)

epidemiology(流行病學(xué))finance(金融)fisheriesresearch

(水產(chǎn)漁業(yè)研究)gambling(賭博)

genetics(遺傳學(xué))geography(地理學(xué))

geology(地質(zhì)學(xué))historicalresearch

(歷史研究)

humangenetics

(人類遺傳學(xué))統(tǒng)計(jì)的應(yīng)用領(lǐng)域hydrology(水文學(xué))

industry

(工業(yè))linguistics

(語(yǔ)言學(xué))

literature(文學(xué))manpowerplanning

(勞動(dòng)力計(jì)劃)managementscience

(管理科學(xué))marketing(市場(chǎng)營(yíng)銷學(xué))

medicaldiagnosis

(醫(yī)學(xué)診斷)meteorology(氣象學(xué))

militaryscience

(軍事科學(xué))nuclearmaterialsafeguards

(核材料安全管理)ophthalmology(眼科學(xué))

pharmaceutics(制藥學(xué))physics

(物理學(xué))

politicalscience

(政治學(xué))psychology(心理學(xué))

psychophysics(心理物理學(xué))qualitycontrol

(質(zhì)量控制)

religiousstudies

(宗教研究)sociology

(社會(huì)學(xué))

surveysampling

(調(diào)查抽樣)taxonomy(分類學(xué))

weathermodification

(氣象改善)統(tǒng)計(jì)無處不在見教材P3:統(tǒng)計(jì)在工商管理中的應(yīng)用。

統(tǒng)計(jì)學(xué)的分支理論統(tǒng)計(jì)學(xué)

—把研究對(duì)象一般化、抽象化,以數(shù)學(xué)中的概率論為基礎(chǔ),從純理論的角度,對(duì)統(tǒng)計(jì)方法加以推導(dǎo)論證。應(yīng)用統(tǒng)計(jì)學(xué)—從所研究的領(lǐng)域或?qū)iT問題出發(fā),視研究對(duì)象的性質(zhì)采用適當(dāng)?shù)慕y(tǒng)計(jì)方法,解決所需研究的問題。應(yīng)用統(tǒng)計(jì)學(xué)通常具有邊緣交叉學(xué)科的性質(zhì)第1章導(dǎo)論1.1

統(tǒng)計(jì)及其應(yīng)用領(lǐng)域1.2統(tǒng)計(jì)數(shù)據(jù)的類型1.3統(tǒng)計(jì)中的幾個(gè)基本概念1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域1.1.1什么是統(tǒng)計(jì)學(xué)1.1.2統(tǒng)計(jì)的應(yīng)用領(lǐng)域“數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!”他不耐煩地喊道,“我不能做無米之炊!”

—Sherlock·福爾摩斯數(shù)據(jù)是做統(tǒng)計(jì)分析的基礎(chǔ)1.2.1分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)1.2.2觀測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)1.2.3截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)1.2統(tǒng)計(jì)數(shù)據(jù)的類型統(tǒng)計(jì)數(shù)據(jù)的分類統(tǒng)計(jì)數(shù)據(jù)的分類按計(jì)量尺度分類的數(shù)據(jù)順序的數(shù)據(jù)數(shù)值型數(shù)據(jù)按時(shí)間狀況截面的數(shù)據(jù)時(shí)序的數(shù)據(jù)按收集方法觀察的數(shù)據(jù)實(shí)驗(yàn)的數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)的分類

(按計(jì)量尺度分)分類數(shù)據(jù)(categoricaldata)

(定類尺度/名義尺度)定義:只能歸于某一類別的數(shù)據(jù),可用文字來表述或用數(shù)字代碼表示(教材P5描述有誤)特征:各類別無順序,比率和差運(yùn)算均無意義例如,性別(男、女)、民族、職業(yè)

順序數(shù)據(jù)(rankdata)

(定序尺度/序數(shù)尺度)定義:只能歸于某一有序類別的數(shù)據(jù),可用文字來表述或數(shù)字代碼表示特征:數(shù)據(jù)有順序,但比率和差運(yùn)算均無意義例如,質(zhì)量等級(jí)(一等品、二等品、三等品、次品等),收入級(jí)別(高、中、低)。統(tǒng)計(jì)數(shù)據(jù)的分類

(按計(jì)量尺度分)數(shù)值型數(shù)據(jù)(metricdata)

(比率尺度)定義:按數(shù)字尺度測(cè)量的觀察值,特點(diǎn):數(shù)據(jù)存在自然順序,且比率和差運(yùn)算(加減乘除)均有意義,0值代表“沒有”或”不存在“例如:身高為175cm、168cm、183cm間距數(shù)據(jù)(intervaldata)

(定距尺度)定義:對(duì)現(xiàn)象類別或次序之間間距測(cè)度的數(shù)值型數(shù)據(jù)。特點(diǎn):數(shù)據(jù)存在自然順序,差運(yùn)算有意義,比率運(yùn)算無意義。0值只是尺度上的一個(gè)點(diǎn),不代表”不存在“例如:溫度間距數(shù)據(jù)與數(shù)值數(shù)據(jù)區(qū)別間距數(shù)據(jù)中“0”表示一個(gè)具體數(shù)值,不表示“沒有”或“不存在”,定比尺度中“0”表示“沒有”或“不存在”。間距數(shù)據(jù)

0℃

-

273.15℃-123.15℃26.85℃數(shù)值數(shù)據(jù)

0K

150K300K

定距尺度與定比尺度區(qū)別(續(xù))

在實(shí)際應(yīng)用中間距數(shù)據(jù)與數(shù)值型差別不大,往往不作區(qū)分。例如在某些統(tǒng)計(jì)軟件中(SPSSStatistics軟件),數(shù)據(jù)的計(jì)量尺度被分為3類(本教材也如此):分類(Nominal)順序(Ordinal)數(shù)值型(Scale

)四種計(jì)量尺度的比較1、四種尺度所包含的信息量是依次遞增的,級(jí)別由低到高。2、根據(jù)較高層次的計(jì)量尺度可以獲得較低層次的計(jì)量尺度。3、不同的尺度數(shù)據(jù)對(duì)應(yīng)著不同數(shù)據(jù)顯示方法和分析方法。低高分類順序間距數(shù)值型數(shù)據(jù)類型:例子分類數(shù)據(jù)順序數(shù)據(jù)間距數(shù)據(jù)數(shù)值數(shù)據(jù)精確程度良好1980134公斤中國(guó)國(guó)籍:健康狀況:出生年份:體重:練習(xí)P11:二練習(xí)題1.1(講)統(tǒng)計(jì)數(shù)據(jù)的分類

(按收集方法分)觀測(cè)的數(shù)據(jù)(observationaldata)

定義:在沒有對(duì)事物人為控制的條件下,通過調(diào)查或觀測(cè)而收集到的數(shù)據(jù)例如:2010年城鎮(zhèn)居民消費(fèi)支出和可支配收入數(shù)據(jù)有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)幾乎都是觀測(cè)數(shù)據(jù)實(shí)驗(yàn)的數(shù)據(jù)(experimentaldata)

定義:在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)例如:對(duì)一種新藥療效的實(shí)驗(yàn),對(duì)一種新的農(nóng)作物品種的實(shí)驗(yàn)等自然科學(xué)領(lǐng)域的數(shù)據(jù)大多數(shù)都為實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)的分類

(按時(shí)間狀況分)截面數(shù)據(jù)(cross-sectionaldata)

定義:多個(gè)事物在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)描述不同事物在某一時(shí)刻的變化情況舉例:2005年我國(guó)各省份的國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)

2006年各地區(qū)城鎮(zhèn)居民家庭人均全年可支配收入和消費(fèi)支出數(shù)據(jù)(見下表)統(tǒng)計(jì)數(shù)據(jù)的分類

(按時(shí)間狀況分)時(shí)間序列數(shù)據(jù)(timeseriesdata)

定義:同一個(gè)事物在不同時(shí)期或時(shí)間點(diǎn)上收集到的數(shù)據(jù)描述事物隨時(shí)間變化的情況舉例:2000年至2005年國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)

1990~2006年中國(guó)居民總量消費(fèi)支出數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)的分類

(按時(shí)間狀況分)面板數(shù)據(jù)(PanelData)定義:多個(gè)事物在某不同時(shí)期或時(shí)間點(diǎn)上進(jìn)行測(cè)量得到的數(shù)據(jù)兼有時(shí)間序列和截面數(shù)據(jù)舉例:2005-2006年各地區(qū)城鎮(zhèn)居民家庭人均全年消費(fèi)支出

1.3統(tǒng)計(jì)中的幾個(gè)基本概念1.3.1總體和樣本1.3.2參數(shù)和統(tǒng)計(jì)量1.3.3變量總體總體(population)定義:所研究的全部個(gè)體(數(shù)據(jù))的集合,其中的每一個(gè)個(gè)體也稱為元素舉例:(1)要研究臺(tái)灣選民對(duì)當(dāng)前兩位候選領(lǐng)導(dǎo)人馬英九和蔡英文的支持度。則總體是臺(tái)灣所有選民對(duì)兩人的支持情況。(2)要檢測(cè)某批產(chǎn)品的合格率,則該批次所有產(chǎn)品就是總體。總體分類總體(population)分為有限總體和無限總體有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的無限總體所包括的元素是無限的,不可數(shù)的區(qū)分有限和無限總體主要是為了判別在抽樣中每次抽取是否獨(dú)立,對(duì)無限總體,每次抽取一個(gè)單位并不影響下一次的抽樣結(jié)果,而對(duì)有限總體,每次抽取是不獨(dú)立的。(但當(dāng)總體數(shù)量較大時(shí),常將有限總體中的抽樣也看作是獨(dú)立的。)總體通常可以看作是一個(gè)隨機(jī)變量,統(tǒng)計(jì)推斷中通常是針對(duì)無限總體。樣本樣本(sample)定義:從總體中抽取的一部分元素的集合構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量(samplesize)舉例:(1)從臺(tái)灣所有選民中抽取出500位進(jìn)行民意調(diào)查,則這500位選民是一個(gè)樣本(2)從所有要檢測(cè)批次的產(chǎn)品中抽出100件進(jìn)行檢測(cè),則這100件產(chǎn)品就是一個(gè)樣本。參數(shù)參數(shù)(parameter)定義:描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值總體參數(shù)通常用希臘字母表示所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等總體數(shù)據(jù)常常是未知的,總體參數(shù)也是未知的,因此需要根據(jù)樣本來估計(jì)總體參數(shù)。統(tǒng)計(jì)量統(tǒng)計(jì)量(statistic)定義:用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一些量,是樣本的函數(shù)所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等基本樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量通常用小寫英文字母來表示還有一些為統(tǒng)計(jì)分析而構(gòu)造的統(tǒng)計(jì)量:z統(tǒng)計(jì)量、t統(tǒng)計(jì)量、x2統(tǒng)計(jì)量、F統(tǒng)計(jì)量等。變量

(variable)

變量—說明現(xiàn)象某種特征的概念例如:商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級(jí)等特點(diǎn):從一次觀察到下一次觀察結(jié)果會(huì)呈現(xiàn)出差別或變化變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù)變量

(基本分類)

分類變量(categoricalvariable)

:用于表示事物類別的名稱如:性別、行業(yè)等變量順序變量(rankvariable):用于表示事物有序類別的名稱如:產(chǎn)品等級(jí)、受教育程度變量數(shù)值型變量(metricv

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論