第1章-統計學和統計數據_第1頁
第1章-統計學和統計數據_第2頁
第1章-統計學和統計數據_第3頁
第1章-統計學和統計數據_第4頁
第1章-統計學和統計數據_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據分析

(方法與案例)

作者賈俊平版權所有違者必究統計學基礎(第6版)FundamentalStatistics第1章統計學和統計數據1.1

統計學及其應用領域1.2數據的類型1.3數據的來源1.4統計中的幾個基本概念1.5Excel【數據分析】工具的安裝2020-8-20學習目標統計學的含義統計的應用領域統計數據的類型統計數據的來源統計中的幾個基本概念1.1統計學及其應用領域

1.1.1什么是統計學

1.1.2統計學的應用領域第1章統計學和統計數據1.1.1什么是統計學1.1統計學及其應用領域2020-8-20什么是統計學?

(statistics)1.收集數據:取得數據2.處理數據:圖表展示分析數據:利用統計方法分析數據數據解釋:結果的說明得到結論:從數據分析中得出客觀結論

收集、處理、分析、解釋數據并從數據中得出結論的科學

2020-8-20統計方法統計方法描述統計推斷統計參數估計假設檢驗2020-8-20描述統計

(descriptivestatistics)研究數據收集、整理和描述的統計學方法內容搜集數據整理數據展示數據描述性分析目的描述數據特征找出數據的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=1052020-8-20推斷統計

(inferentialstatistics)研究如何利用樣本數據來推斷總體特征的統計學方法內容參數估計假設檢驗目的對總體特征作出推斷樣本總體1.1.2統計學的應用領域1.1統計學及其應用領域2020-8-20統計學的應用領域

企業(yè)發(fā)展戰(zhàn)略產品質量管理市場研究財務分析經濟預測人力資源管理2020-8-20統計的誤用與濫用統計濫用不好的樣本過小的樣本誤導性圖表局部描述故意曲解1.2數據的類型

1.2.1類別數據、順序數據、數值數據

1.2.2觀測的數據和實驗數據

1.2.3截面數據和時間序列數據第1章統計學和統計數據2020-8-20統計數據的分類2020-8-20統計數據的分類

(按計量尺度分)類別數據(categoricaldata)

只能歸于某一類別的非數字型數據對事物進行分類的結果,數據表現為類別,用文字來表述例如,人口按性別分為男、女兩類;產品分為一等品、二等品、三等品、次品等分為無序類別數據和有序類別數據數值數據(metricdata)按數字尺度測量的觀察值結果表現為具體的數值,對事物的精確測度例如:身高為175cm、168cm、183cm2020-8-20統計數據的分類

(按收集方法分)觀測數據(observationaldata)

通過調查或觀測而收集到的數據在沒有對事物人為控制的條件下而得到的有關社會經濟現象的統計數據幾乎都是觀測數據試驗數據(experimentaldata)

在試驗中控制試驗對象而收集到的數據比如,對一種新藥療效的試驗,對一種新的農作物品種的試驗等自然科學領域的數據大多數都為試驗數據2020-8-20統計數據的分類

(按時間狀況分)截面數據(cross-sectionaldata)

在相同或近似相同的時間點上收集的數據描述現象在某一時刻的變化情況比如,2005年我國各地區(qū)的國內生產總值數據時間序列數據(timeseriesdata)

在不同時間上收集到的數據描述現象隨時間變化的情況比如,2000年至2005年國內生產總值數據1.3數據的來源

1.3.1數據的間接來源

1.3.2數據的直接來源

1.3.3調查方案設計

1.3.4設計質量第1章統計學和統計數據1.3.1數據的間接來源1.3數據的來源2020-8-20二手數據的來源Internethttp//WWW.中國統計年鑒2001中國人口統計年鑒中國市場統計年鑒世界發(fā)展報告世界經濟年檢工業(yè)普查數據中國統計出版社統計部門和政府部門公布的有關資料,如各類統計年鑒各類經濟信息中心、信息咨詢機構、專業(yè)調查機構等提供的數據各類專業(yè)期刊、報紙、書籍所提供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學術性研討會上交流的有關資料從互聯網或圖書館查閱到的相關資料2020-8-20二手數據的特點收集容易,采集成本低作用廣泛分析所要研究的問題提供研究問題的背景幫助研究者更好地定義問題檢驗和回答某些疑問和假設尋找研究問題的思路和途徑收集二手資料在研究中應優(yōu)先考慮2020-8-20二手數據的評估數據是誰收集的?可信度評估為什么目的而收集的?數據是怎樣收集的?什么時候收集的?1.3.2數據的直接來源1.3數據的來源2020-8-20數據的直接來源

(原始數據)調查數據通過調查方法獲得的數據通常是對社會現象而言通常取自有限總體實驗數據通過實驗方法得到的數據通常是對自然現象而言

也被廣泛運用到社會科學中如心理學、教育學、社會學、經濟學、管理學等

2020-8-20抽樣調查

(samplingsurvey)

1. 從總體中隨機抽取一部分單位作為樣本進行調查,并根據樣本調查結果來推斷總體特征的數據收集方法總體

隨機樣本

2.具有經濟性、時效性強、適應面廣、準確性高等特點2020-8-20普查

(census)

為特定目的專門組織的非經常性全面調查通常是周期性的我國進行的普查主要有人口普查,每10年進行一次,末尾數字為“0”的年份進行農業(yè)普查,每10年進行一次,每逢“6”的年份進行經濟普查,每5年進行一次,每逢“3”和“8”的年份進行包括工業(yè)普查第三產業(yè)普查建筑業(yè)普查基本單位普查2020-8-20統計報表

(statisticalreportforms)

1. 統計調查方式之一2. 過去曾經是我國主要的數據收集方式3. 按照國家有關法規(guī)的規(guī)定、自上而下地統一布置、自下而上地逐級提供基本統計數據4. 有各種各樣的類型2020-8-20訪問調查

(personalinterview)1. 調查者與被調查者通過面對面地交談而獲得資料2. 有標準式訪問和非標準式訪問標準式訪問通常按事先設計好的問卷進行非標準式訪問事先一般不制作問卷2020-8-20郵寄調查

(mailsurvey)也稱郵寄問卷調查是一種標準化調查調查者與被調查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調查表或問卷送至某調查者手中,由被調查者填寫,然后將問卷寄回指定收集點問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種 2020-8-20電話調查

(telephonesurvey)調查者利用電話與被調查者進行語言交流以獲得信息時效快、成本低問題的數量不宜過多

您好!我是××調查公司的調查員…2020-8-20電腦輔助調查

(computer—assistedtelephoneinterviewing)又稱電腦輔助電話調查電腦與電話相結合完成調查的全過程一般需借助專門的軟件進行硬件設備要求較高 問卷2020-8-20座談會

(colloquia)1. 也稱集體訪談2. 將一組被調查者集中在調查現場,讓他們對調查的主題發(fā)表意見以獲得資料3. 參加座談會的人數不宜過多,一般為6~10人4. 側重于定性研究2020-8-20個別深度訪問

(personalInterviewing)一次只有一名受訪者參加、針對特殊問題的調查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側重于定性研究2020-8-20觀察法

(observationalmethod)1. 就調查對象的行動和意識,調查人員邊觀察邊記錄以收集所需信息2. 調查人員不是強行介入3. 能夠在被調查者不察覺的情況下獲得資料2020-8-20實驗法

(experimentalmethod)1. 在設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進行實驗以獲得所需資料2. 有室內實驗法和市場實驗法1.3.3調查方案設計1.3數據的來源2020-8-20調查目的

(objectiveofsurvey)1. 調查要達到的具體目標回答“為什么調查?”調查之前必須明確2020-8-20調查對象和調查單位

(RespondentandSurveyunit)調查對象:調查研究的總體或調查范圍調查單位:需要對之進行調查的單位??梢允钦{查對象的全部單位(全面調查),也可以是調查對象中的一部分單位(非全面調查)回答“向誰調查?”調查對象

調查單位?

2020-8-20調查項目

(Surveyitems)調查的具體內容通常表現為表格或問卷回答“調查什么?”Q1…………Q2…………Q3…………Q4…………2020-8-20方案設計中的其他問題1. 明確調查所采用的方法2. 確定調查資料的所屬時間和調查工作的期限3.調查的組織與實施細則1.3.4數據質量1.3數據的來源2020-8-20統計數據的誤差統計數據與客觀現實之間的差距有登記性誤差和代表性誤差兩類登記性誤差:由于調查者或被調查者的人為因素所造成的誤差。理論上講可以消除代表性誤差:用樣本數據進行推斷時所產生的誤差。通常無法消除,但事先可以進行控制和計算2020-8-20統計數據的質量要求1.精

度:最低的抽樣誤差或隨機誤差2.準確性:最小的非抽樣誤差或偏差3.關聯性:滿足用戶決策、管理和研究的需要4.及時性:在最短的時間里取得并公布數據5.一致性:保持時間序列的可比性6.最低成本:以最經濟的方式取得數據1.4統計中的幾個基本概念

1.4.1總體和樣本

1.4.2參數和統計量

1.4.3變量第1章統計學和統計數據2020-8-20總體和樣本總體(population)所研究的全部個體(數據)的集合,其中的每一個個體也稱為元素分為有限總體和無限總體有限總體的范圍能夠明確確定,且元素的數目是有限的無限總體所包括的元素是無限的,不可數的樣本(sample)從總體中抽取的一部分元素的集合構成樣本的元素的數目稱為樣本容量或樣本量(samplesize)

2020-8-20參數和統計量參數(parameter)描述總體特征的概括性數字度量,是研究者想要了解的總體的某種特征值所關心的參數主要有總體均值(

)、標準差(

)、總體比例(

)等總體參數通常用希臘字母表示統計量(statistic)用來描述樣本特征的概括性數字度量,它是根據樣本數據計算出來的一些量,是樣本的函數所關心的樣本統計量有樣本均值(

x)、樣本標準差(s)、樣本比例(p)等樣本統計量通常用小寫英文字母來表示2020-8-20統計中的幾個基本概念平均數標準差比例參數

統計量

xsp

總體

樣本2020-8-20變量

(variable)

說明現象某種特征的概念如商品銷售額、受教育程度、產品的質量等級等變量的具體表現稱為變量值,即數據變量可以分為無序類別變量(categoricalvariable)

:說明事物類別的名稱有序類別變量(rankvariable):說明事物有序類別的名稱數值變量(metricvariable)

:說明事物數字特征

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論