統(tǒng)計學(第二版)01_第1章_總論_第1頁
統(tǒng)計學(第二版)01_第1章_總論_第2頁
統(tǒng)計學(第二版)01_第1章_總論_第3頁
統(tǒng)計學(第二版)01_第1章_總論_第4頁
統(tǒng)計學(第二版)01_第1章_總論_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、統(tǒng)計學基礎(第二版)第一章第一章 統(tǒng)計和統(tǒng)計數據 一、統(tǒng)計學的含義一、統(tǒng)計學的含義統(tǒng)計學是收集、處理、分析、解釋數據并統(tǒng)計學是收集、處理、分析、解釋數據并從數據中得出結論的科學。從數據中得出結論的科學。第一節(jié)第一節(jié) 統(tǒng)計及其應用領域統(tǒng)計及其應用領域統(tǒng)計提供的數據分析方法可分為統(tǒng)計提供的數據分析方法可分為描述統(tǒng)計描述統(tǒng)計和和推斷統(tǒng)計推斷統(tǒng)計兩大類。兩大類。描述統(tǒng)計:描述統(tǒng)計:研究數據收集、處理和描述的統(tǒng)研究數據收集、處理和描述的統(tǒng)計學方法。計學方法。推斷統(tǒng)計:推斷統(tǒng)計:研究如何利用樣本數據來推斷總研究如何利用樣本數據來推斷總體特征的統(tǒng)計學方法。體特征的統(tǒng)計學方法。二、統(tǒng)計的應用領域二、統(tǒng)計的應用

2、領域統(tǒng)計方法是適用于所有學科領域的通用數據分析統(tǒng)計方法是適用于所有學科領域的通用數據分析方法,只要有數據的地方就會用到統(tǒng)計方法。方法,只要有數據的地方就會用到統(tǒng)計方法。l企業(yè)發(fā)展戰(zhàn)略l產品質量管理l市場研究l財務分析l經濟預測l人力資源管理l產品質量管理l企業(yè)發(fā)展戰(zhàn)略l產品質量管理l市場研究l企業(yè)發(fā)展戰(zhàn)略l產品質量管理l財務分析l市場研究l企業(yè)發(fā)展戰(zhàn)略l產品質量管理l經濟預測l財務分析l市場研究l企業(yè)發(fā)展戰(zhàn)略l產品質量管理l人力資源管理人力資源管理l經濟預測經濟預測l財務分析財務分析l市場研究市場研究l企業(yè)發(fā)展戰(zhàn)略企業(yè)發(fā)展戰(zhàn)略l產品質量管理產品質量管理統(tǒng)計的主要作用是幫助我們分析數據。它統(tǒng)計的

3、主要作用是幫助我們分析數據。它是一套分析數據的方法和工具,不能指望是一套分析數據的方法和工具,不能指望統(tǒng)計成為解決所有問題的靈丹妙藥。統(tǒng)計成為解決所有問題的靈丹妙藥。第二節(jié)第二節(jié) 數據的類型數據的類型按照所采用的不同計量尺度按照所采用的不同計量尺度,可以將統(tǒng)計數據分為,可以將統(tǒng)計數據分為分類數據、順序數據、數值型數據分類數據、順序數據、數值型數據一、分類數據、順序數據、數值型數據一、分類數據、順序數據、數值型數據分類數據分類數據 只能歸于某一類別的非數字型數據,成為分類數據。只能歸于某一類別的非數字型數據,成為分類數據。 例如:例如: 按照性別,人口可分為男性、女性。按照性別,人口可分為男性、

4、女性。 按照行業(yè)屬性,企業(yè)可分為醫(yī)藥企業(yè)、家電企業(yè)、紡按照行業(yè)屬性,企業(yè)可分為醫(yī)藥企業(yè)、家電企業(yè)、紡織品企業(yè)等。織品企業(yè)等。 為便于統(tǒng)計處理,對于分類數據可以用數字代碼來表為便于統(tǒng)計處理,對于分類數據可以用數字代碼來表示各個類別,如用示各個類別,如用“1”表示表示“男性男性”,“0”表示表示“女女性性”。順序數據順序數據 只能歸于某一有序類別的非數字型數據,稱為順序數據。只能歸于某一有序類別的非數字型數據,稱為順序數據。 順序數據也是對事物進行分類的結果,但這些類別是有順序數據也是對事物進行分類的結果,但這些類別是有順序的,它是由順序尺度計量形成的。順序的,它是由順序尺度計量形成的。 例如:例

5、如: 產品可以分為一等品、二等品、三等品、次等品等。產品可以分為一等品、二等品、三等品、次等品等。 一個人對某一事物的態(tài)度可以分為非常同意、同意、保一個人對某一事物的態(tài)度可以分為非常同意、同意、保持中立、不同意、非常不同意等。持中立、不同意、非常不同意等。 同樣的,同樣的,“1”可以表示可以表示“非常同意非常同意”,“2”可以表示可以表示“同意同意”,“3”表示表示“保持中立保持中立”,“4”表示表示“不同不同意意”,以此類推。,以此類推。 數值型數據數值型數據 按數字尺度測量的觀察值,稱為數值型數據。按數字尺度測量的觀察值,稱為數值型數據。 數值型數據是使用自然或度量衡單位對事物進行數值型數

6、據是使用自然或度量衡單位對事物進行測量的結果,其結果表現為具體的數值。測量的結果,其結果表現為具體的數值。 分類數據和順序數據說明的是事物的品質特征,分類數據和順序數據說明的是事物的品質特征,通常是用通常是用文字文字來表述的,其結果均表現為類別,來表述的,其結果均表現為類別,因而可統(tǒng)稱為因而可統(tǒng)稱為定性數據定性數據或或品質數據品質數據。 數值型數據說明的是現象的數量特征,通常用數值型數據說明的是現象的數量特征,通常用數數值值來表現的,因而可稱為來表現的,因而可稱為定量數據定量數據或或數量數據數量數據。按照統(tǒng)計數據的收集方法按照統(tǒng)計數據的收集方法,可以將統(tǒng)計數據分為觀,可以將統(tǒng)計數據分為觀測數據

7、和實驗數據。測數據和實驗數據。二、觀測數據和實驗數據二、觀測數據和實驗數據 觀測數據:通過調查或觀測而收集到的數據。觀測數據:通過調查或觀測而收集到的數據。 實驗數據:在實驗中控制實驗對象而收集到的數據。實驗數據:在實驗中控制實驗對象而收集到的數據。按照所描述的現象與時間的關系按照所描述的現象與時間的關系,可以將統(tǒng)計數據,可以將統(tǒng)計數據分為截面數據和時間序列數據。分為截面數據和時間序列數據。三、截面數據和時間序列數據三、截面數據和時間序列數據 截面數據:在相同或近似相同的時間點上收集的數據。截面數據:在相同或近似相同的時間點上收集的數據。 時間序列數據:在不同時間上收集到的數據。時間序列數據:

8、在不同時間上收集到的數據。1.下面的數據中屬于順序數據的是()下面的數據中屬于順序數據的是()A.5個人的年齡分別是25,22,34,41,33B.性別:男,女C.上市公司所屬的行業(yè):金屬,房地產,醫(yī)藥,機械制造D.員工對企業(yè)某項改革措施的態(tài)度:贊成,中立,反對2.一家研究機構從一家研究機構從IT從業(yè)者中隨機抽取從業(yè)者中隨機抽取500人作為樣本進人作為樣本進行調查,其中行調查,其中60%的人回答他們的月收入在的人回答他們的月收入在5000元以上,元以上,50%的人回答他們的消費支付方式是用信用卡。這里的的人回答他們的消費支付方式是用信用卡。這里的“消費支付方式消費支付方式”是()是()A.分類

9、變量 B.順序變量C.數值型變量 D.離散型變量3.下面的變量中屬于順序變量的是()下面的變量中屬于順序變量的是()A.收入 B.汽車產量 C.員工對企業(yè)某項改革措施的態(tài)度(贊成,中立,反對)D.企業(yè)類型4.一項民意調查的目的是想確定年輕人愿意與其父母討論一項民意調查的目的是想確定年輕人愿意與其父母討論的話題。調查結果表明:的話題。調查結果表明:45%的年輕人愿意與其父母討的年輕人愿意與其父母討論家庭財務狀況,論家庭財務狀況,38%的年輕人愿意與其父母討論有關的年輕人愿意與其父母討論有關教育的話題,教育的話題,15%的年輕人愿意與其父母討論愛情問題。的年輕人愿意與其父母討論愛情問題。該調查所收

10、集的數據是()該調查所收集的數據是()A.分類數據 B.順序數據 C.數值型數據 D.試驗數據第三節(jié)第三節(jié) 數據來源數據來源一、數據的間接來源一、數據的間接來源來源于別人調查或實驗的數據,對使用者來說,來源于別人調查或實驗的數據,對使用者來說,這是數據的間接來源,稱為這是數據的間接來源,稱為二手數據二手數據或或間接數據間接數據。利用二手數據對使用者來說既經濟又方便,但使用利用二手數據對使用者來說既經濟又方便,但使用時應注意統(tǒng)計數據的含義、計算口徑和計算方法,時應注意統(tǒng)計數據的含義、計算口徑和計算方法,以避免誤用或濫用。在引用二手數據時,一定要注以避免誤用或濫用。在引用二手數據時,一定要注明數據

11、的來源,尊重他人勞動成果。明數據的來源,尊重他人勞動成果。二、數據的直接來源二、數據的直接來源 數據直接來源主要有兩個渠道:數據直接來源主要有兩個渠道: 一是一是調查或觀察調查或觀察 調查是取得社會經濟數據的重要手段 二是二是實驗實驗 實驗是取得自然科學數據的主要手段。統(tǒng)計調查方式統(tǒng)計調查方式 常用的統(tǒng)計調查方式有抽樣調查、普查、統(tǒng)計報表等。常用的統(tǒng)計調查方式有抽樣調查、普查、統(tǒng)計報表等。 抽樣調查抽樣調查:從總體中隨機抽取一部分單位作為樣本進行:從總體中隨機抽取一部分單位作為樣本進行調查,并根據樣本調查結果來推斷總體特征的數據收集調查,并根據樣本調查結果來推斷總體特征的數據收集方法,稱為抽樣

12、調查。方法,稱為抽樣調查。 普查普查:為特定目的而專門組織的全面調查,稱為普查。:為特定目的而專門組織的全面調查,稱為普查。 統(tǒng)計報表統(tǒng)計報表:按照國家有關法規(guī)的規(guī)定,自上而下地統(tǒng)一:按照國家有關法規(guī)的規(guī)定,自上而下地統(tǒng)一布置,自下而上地逐級提供基本統(tǒng)計數據的調查方式。布置,自下而上地逐級提供基本統(tǒng)計數據的調查方式。數據的收集方法數據的收集方法 數據收集方法可分為詢問調查、觀察和實驗三大類。數據收集方法可分為詢問調查、觀察和實驗三大類。 詢問調查詢問調查 包括訪問調查、郵寄調查、電話調查、電腦包括訪問調查、郵寄調查、電話調查、電腦輔助調查、座談會、個別深訪。輔助調查、座談會、個別深訪。 觀察法

13、觀察法 實驗法實驗法 包括室內實驗法和市場實驗法包括室內實驗法和市場實驗法三、調查方案設計三、調查方案設計 調查目的調查目的 調查所要達到的具體目標調查所要達到的具體目標 “為什么調查為什么調查” 調查對象和調查單位調查對象和調查單位 調查對象:根據調查目的確定的調查研究的總體或調查范圍。調查對象:根據調查目的確定的調查研究的總體或調查范圍。 調查單位:構成調查對象的每一個單位。調查單位:構成調查對象的每一個單位。 例如:人口普查的調查對象是具有中國國籍并在中國境內常住的人,例如:人口普查的調查對象是具有中國國籍并在中國境內常住的人, 人口普查的調查單位是每一個人。人口普查的調查單位是每一個人

14、。 調查項目和調查表調查項目和調查表 調查項目通常以表格的形式來表現,稱為調查表。調查表是用于登記調調查項目通常以表格的形式來表現,稱為調查表。調查表是用于登記調查數據的一種表格,一般由表頭、表體和表外附加三部分。查數據的一種表格,一般由表頭、表體和表外附加三部分。 表頭:調查表的名稱,用來說明調查的內容。表頭:調查表的名稱,用來說明調查的內容。 表體:調查表的主要部分,是調查內容的具體體現表體:調查表的主要部分,是調查內容的具體體現 表外附加:通常由填表人簽名、填報日期、填表說明等內容組成。表外附加:通常由填表人簽名、填報日期、填表說明等內容組成。四、數據質量四、數據質量 如何保證統(tǒng)計數據的

15、質量是數據收集階段要重點解決如何保證統(tǒng)計數據的質量是數據收集階段要重點解決的問題。的問題。 為保證質量,需要在數據收集、整理、分析等階段盡為保證質量,需要在數據收集、整理、分析等階段盡可能減少誤差??赡軠p少誤差。 誤差主要有抽樣誤差和非抽樣誤差兩類。誤差主要有抽樣誤差和非抽樣誤差兩類。 抽樣誤差:抽樣誤差:指在用樣本數據進行推斷時所產生的隨機指在用樣本數據進行推斷時所產生的隨機誤差。誤差。 非抽樣誤差:非抽樣誤差:指調查過程中由于調查者或被調查者的指調查過程中由于調查者或被調查者的人為因素而造成的誤差。人為因素而造成的誤差。數據的質量評價標準概括為數據的質量評價標準概括為6個方面?zhèn)€方面 精度精

16、度 準確性準確性 關聯性關聯性 及時性及時性 一致性一致性 最低成本最低成本四、數據質量四、數據質量1.一個退休人員對寄居在家中的一窩燕子很感興趣,他每一個退休人員對寄居在家中的一窩燕子很感興趣,他每天觀察并記錄燕子飛出飛進的時間,以及它們喂養(yǎng)小燕子天觀察并記錄燕子飛出飛進的時間,以及它們喂養(yǎng)小燕子的習慣。這種收集數據的方法稱為()的習慣。這種收集數據的方法稱為()A.普查 B.觀察 C.實驗 D.詢問2.如果一個樣本因人故意操縱而出現偏差,這種誤差屬于如果一個樣本因人故意操縱而出現偏差,這種誤差屬于()()A.抽樣誤差 B.非抽樣誤差C.設計誤差 D.試驗誤差3.為了解居民對小區(qū)物業(yè)服務的意

17、見和看法,管理人員隨為了解居民對小區(qū)物業(yè)服務的意見和看法,管理人員隨機抽取了機抽取了50戶居民,上門通過問卷進行調查。這種數據的戶居民,上門通過問卷進行調查。這種數據的收集方法稱為()收集方法稱為()A.訪問調查 B.郵寄調查 C.座談會 D.個別深度訪問4.為了解居民對小區(qū)物業(yè)服務的意見和看法,管理為了解居民對小區(qū)物業(yè)服務的意見和看法,管理人員挑選了有代表性的人員挑選了有代表性的5戶居民,把他們召集在一戶居民,把他們召集在一起進行座談。這種數據的收集方法稱為()起進行座談。這種數據的收集方法稱為()A.訪問調查 B.郵寄調查C.座談會 D.個別深度訪問5.某小區(qū)兩戶居民因停車問題經常發(fā)生糾紛

18、,居委某小區(qū)兩戶居民因停車問題經常發(fā)生糾紛,居委會的管理人員對其中一戶居民的車主進行專門座會的管理人員對其中一戶居民的車主進行專門座談。這種數據的收集方法稱為()談。這種數據的收集方法稱為()A.訪問調查 B.郵寄調查C.座談會 D.個別深度訪問總總體體 包含所研究的全部個體(數據)的集包含所研究的全部個體(數據)的集合合一、總體與樣本一、總體與樣本 個個體體 組成總體的每一個元素組成總體的每一個元素 第四節(jié)第四節(jié) 統(tǒng)計中的幾個基本概念統(tǒng)計中的幾個基本概念樣樣本本 從總體中抽取的一部分元素的集合從總體中抽取的一部分元素的集合樣樣本量本量 構成樣本的元素數目(或稱為樣本容量)構成樣本的元素數目(

19、或稱為樣本容量) 從總體中抽取一部分元素作為樣本,目的是從總體中抽取一部分元素作為樣本,目的是要根據樣本提供的有關信息去推斷總體的特要根據樣本提供的有關信息去推斷總體的特征。征。 例如:從一批燈泡中隨機抽取例如:從一批燈泡中隨機抽取100個,這個,這100個燈泡就構成了一個樣本,然后根據這個燈泡就構成了一個樣本,然后根據這100個個燈泡的平均使用壽命去推斷這批燈泡的平均燈泡的平均使用壽命去推斷這批燈泡的平均使用壽命。使用壽命。總體根據其所包含的單位數目是否可數可以總體根據其所包含的單位數目是否可數可以 分為分為有限總體有限總體和和無限總體無限總體。對于對于無限總體無限總體,每次抽取一個單位,并

20、不影響下一次,每次抽取一個單位,并不影響下一次的抽樣結果,因此每次抽取可以看作的抽樣結果,因此每次抽取可以看作獨立獨立的。的。對于對于有限總體有限總體,在抽取一個單位后,總體元素就會減,在抽取一個單位后,總體元素就會減少一個,前一次的抽樣結果往往會影響第二次的抽樣少一個,前一次的抽樣結果往往會影響第二次的抽樣結果,因此每次抽取是結果,因此每次抽取是不獨立的不獨立的。1.某研究部門準備在全市某研究部門準備在全市200萬個家庭中抽取萬個家庭中抽取2000個家個家庭,推斷該城市所有職工家庭的年人均收入。這項研庭,推斷該城市所有職工家庭的年人均收入。這項研究的究的總體總體是()是()A.2000個家庭

21、 B.200萬個家庭C.2000個家庭的人均收入 D.200萬個家庭的人均收入2.某研究部門準備在全市某研究部門準備在全市200萬個家庭中抽取萬個家庭中抽取2000個家個家庭,推斷該城市所有職工家庭的年人均收入。這項研庭,推斷該城市所有職工家庭的年人均收入。這項研究的究的樣本樣本是()是()A.2000個家庭 B.200萬個家庭C.2000個家庭的人均收入 D.200萬個家庭的人均收入二、參數和統(tǒng)計量二、參數和統(tǒng)計量參參數數 即用來描述總體特征的概括性數字度量。即用來描述總體特征的概括性數字度量。 總體平均數、總體標準差、總體比例總體平均數、總體標準差、總體比例統(tǒng)統(tǒng)計量計量 即用來描述樣本特征

22、的概括性數字度量。即用來描述樣本特征的概括性數字度量。 樣本平均數、樣本標準差、樣本比例樣本平均數、樣本標準差、樣本比例變變量量 說明現象某種特征的概念說明現象某種特征的概念變量的特點就是從一次觀察到下一次觀察會呈現出差別或變化。變量的特點就是從一次觀察到下一次觀察會呈現出差別或變化。 如如“商品銷售額商品銷售額”“”“受教育程度受教育程度” “ “產品的質量等級產品的質量等級”等都是變量。等都是變量。三、變量三、變量分類變量分類變量 說明事物類別的一個名稱說明事物類別的一個名稱 分類變量分類變量的數值取值就是的數值取值就是分類數據分類數據 如如“性別性別”是個分類變量,其變量值為是個分類變量

23、,其變量值為“男男”或或“女女”;“行業(yè)行業(yè)”也是一個分類變量,其也是一個分類變量,其變量值可以為變量值可以為“零售業(yè)零售業(yè)”“”“旅游業(yè)旅游業(yè)”“”“汽車汽車制造業(yè)制造業(yè)”等。等。順序變量順序變量 說明事物有序類別的一個名稱說明事物有序類別的一個名稱 順序變量順序變量的數值取值就是的數值取值就是順序數據順序數據如如 “產品等級產品等級”是個順序變量,其變量值為是個順序變量,其變量值為“一等品一等品”、“二等品二等品”、“三等品三等品”、“次品次品”等;等; “受教育程度受教育程度”也是一個順序變量,其變量值可以為也是一個順序變量,其變量值可以為“小學小學”“”“初中初中”“”“高中高中”等;

24、等; 一個人對某種事物的看法也是一個順序變量,其變量一個人對某種事物的看法也是一個順序變量,其變量值可以為值可以為“同意同意”、“保持中立保持中立”、“反對反對”等。等。數值型變量數值型變量 說明事物數字特征的一個名稱說明事物數字特征的一個名稱 數值型變量數值型變量的取值就是的取值就是數值型數據數值型數據 如如“產品產量產品產量”、“商品銷售額商品銷售額”、“零件零件尺寸尺寸”、“年齡年齡”、“時間時間”等都是數值型等都是數值型變量。變量。數值型變量數值型變量 根據其取值不同,可分為離散型變量和連續(xù)型變量。根據其取值不同,可分為離散型變量和連續(xù)型變量。 離散型變量離散型變量:只能取可數值的變量

25、:只能取可數值的變量(只能取有限個值,且取值都以整位數斷開)(只能取有限個值,且取值都以整位數斷開) 連續(xù)型變量連續(xù)型變量:可以在一個或多個區(qū)間中取任何值的變量:可以在一個或多個區(qū)間中取任何值的變量(取值是連續(xù)不斷的,如(取值是連續(xù)不斷的,如“年齡年齡”“”“溫度溫度”)1.一項調查表明,在所抽取的一項調查表明,在所抽取的1000個消費者中,他們每個消費者中,他們每月在網上購物的平均花費是月在網上購物的平均花費是200元,他們選擇在網上購元,他們選擇在網上購物的主要原因是物的主要原因是“價格便宜價格便宜”。這里的。這里的參數參數是()是()A.1000個消費者B.所有在網上購物的消費者C.所有在網上購物的消費者的平均花費金額D.1000個消費者的平均花費金額2.一項調查表明,在所抽取的一項調查表明,在所抽取的1000個消費者中,他們每個消費者中,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論