版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
統(tǒng)計數(shù)據(jù)分析基礎(chǔ)教程(第二版)
―基于SPSS20和Excel2010的調(diào)查數(shù)據(jù)分析第1章概述本章內(nèi)容1.1什么是統(tǒng)計1.2統(tǒng)計、計算機與統(tǒng)計軟件1.3為何要使用Excel來學(xué)習統(tǒng)計1.4變量及其分類1.5數(shù)據(jù)的收集附錄Excel“數(shù)據(jù)分析”工具1.1什么是統(tǒng)計你想過下面的問題嗎?(1)當你買了一臺電視,被告知三年內(nèi)可以免費保修時,你想過廠家憑什么這樣說嗎?說多了,廠家會損失;說少了,會失去競爭,也是損失。到底這個保修期是怎樣決定的呢?(2)在同一年級中,同一門統(tǒng)計學(xué)的課程可能由一些不同的教師講授。教師講課方式當然不一樣,考試題目也不一定相同。那么如何比較不同班級的統(tǒng)計學(xué)成績呢?(3)大學(xué)排名是一個非常敏感的問題。不同的機構(gòu)會得出不同的結(jié)果,各自都說自己是客觀、公正和有道理的。到底如何理解這些不同的結(jié)果呢?(4)如何通過大眾調(diào)查來得到性別、年齡、職業(yè)、收入等各種因素與公眾對某件事物(比如商品或政策)的態(tài)度的關(guān)系呢?(5)如何才能夠客觀地得知某個電視節(jié)目的收視率,以確定廣告的價格是否合理呢?1.1什么是統(tǒng)計統(tǒng)計學(xué)應(yīng)用領(lǐng)域:社會學(xué)、新聞?wù){(diào)查精算、農(nóng)業(yè)、動物學(xué)、人類學(xué)、考古學(xué)、審計學(xué)、人口統(tǒng)計學(xué)、牙醫(yī)學(xué)、生態(tài)學(xué)、計量經(jīng)濟學(xué)、教育學(xué)、選舉預(yù)測和策劃、工程、流行病學(xué)、金融、水產(chǎn)漁業(yè)研究、遺傳學(xué)、地理學(xué)、地質(zhì)學(xué)、歷史研究、人類遺傳學(xué)、水文學(xué)、工業(yè)、法律、語言學(xué)、文學(xué)、勞動力計劃、管理科學(xué)、市場營銷學(xué)、醫(yī)學(xué)診斷、氣象學(xué)、軍事科學(xué)、眼科學(xué)、制藥學(xué)、物理學(xué)、政治學(xué)、心理學(xué)、心理物理學(xué)、質(zhì)量控制、宗教研究、分類學(xué)、氣象改善、博彩等。當然,大家用不著也不可能理解所有的統(tǒng)計應(yīng)用,只要能夠解決自己身邊的統(tǒng)計問題就足夠了。1.1什么是統(tǒng)計統(tǒng)計學(xué)(Statistics)是用以收集數(shù)據(jù)、分析數(shù)據(jù)并進而由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。因而有學(xué)者也將統(tǒng)計學(xué)稱為統(tǒng)計方法(StatisticalMethod)。比如,要得到某電視節(jié)目的收視率,可能首先要在該節(jié)目播出時,利用電話對看電視的人進行采訪,同時問他們在觀看什么節(jié)目。在得到了被采訪的看電視的總?cè)藬?shù)和其中觀看該節(jié)目的人數(shù)之后,就有可能得到這部分觀眾中觀看該節(jié)目的比例,即大致的收視率了。之后還要經(jīng)過統(tǒng)計分析,評估這個收視率的可信度和代表性等。顯然,這是一個收集數(shù)據(jù),然后通過分析數(shù)據(jù)得到結(jié)論的簡單例子。
1.2 統(tǒng)計、計算機與統(tǒng)計軟件現(xiàn)代生活越來越離不開計算機了。最早使用計算機的統(tǒng)計當然更離不開計算機了。計算機的使用,也從過去必須學(xué)會計算機語言發(fā)展到只需要“傻瓜式”地點擊鼠標;結(jié)果也從單純的數(shù)字輸出發(fā)展到包括漂亮的表格和圖形在內(nèi)的各種形式。統(tǒng)計軟件的發(fā)展,也使得統(tǒng)計從統(tǒng)計學(xué)家的圈內(nèi)游戲變成了大眾的游戲。只要輸入你的數(shù)據(jù),點幾下鼠標,做一些選項,馬上就得到令人驚嘆的漂亮結(jié)果了。應(yīng)該特別留神,明白自己是在干什么,不要在得到一堆毫無意義的垃圾之后還沾沾自喜。1.2 統(tǒng)計、計算機與統(tǒng)計軟件SPSS:這是一個很受歡迎的統(tǒng)計軟件。它操作容易,輸出漂亮,功能齊全,價格合理。它也有自己的程序語言,但基本上已經(jīng)“傻瓜化”。對于非專業(yè)統(tǒng)計工作者,它是很好的選擇。Excel:嚴格說來,Excel并不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟件,必然有一定的統(tǒng)計計算功能。而且凡是安裝了MicrosoftOffice的計算機,基本上都裝有Excel。但要注意,有時在安裝Office時沒有安裝(加載)“數(shù)據(jù)分析”的功能,那就必須裝(加載)了才行。當然,畫圖功能是已經(jīng)具備了的。對于簡單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”了。SAS:這是一款功能非常齊全的軟件。盡管價格相當不菲,但許多公司,特別是美國制藥公司都在使用,這多半因為其功能眾多和某些美國政府機構(gòu)一些人的偏愛。盡管現(xiàn)在已經(jīng)盡量“傻瓜化”,但仍然需要一定的訓(xùn)練才可以使用。也可以用它編程計算,但對于基本統(tǒng)計課程則不那么方便。學(xué)習軟件的最好方式是需要時在使用中學(xué)。1.3為何要使用Excel來學(xué)習統(tǒng)計由于微軟的Office已相當普及,并且廣泛地應(yīng)用于工商企業(yè)及個人使用領(lǐng)域,要想在一臺個人計算機上找到Excel,要比找到SPSS或SAS軟件容易得多,而且Excel具有易學(xué)易懂的特性。雖然Excel并沒有被歸類為統(tǒng)計軟件,并且其與統(tǒng)計有關(guān)的函數(shù)和“數(shù)據(jù)分析”功能是絕對無法與SPSS或SAS統(tǒng)計軟件相提并論的,但對絕大多數(shù)人而言已經(jīng)足夠了。生活在“信息時代”中的人們比以前任何時候都更頻繁地與數(shù)據(jù)打交道,Excel就是為現(xiàn)代人進行數(shù)據(jù)處理而定制的一個工具。無論是在科學(xué)研究、醫(yī)療教育、商業(yè)活動還是家庭生活中,Excel都能滿足大多數(shù)人的數(shù)據(jù)處理需求。Excel擁有強大的計算、分析、傳遞和共享功能,可以幫助用戶將繁雜的數(shù)據(jù)轉(zhuǎn)化為有用的信息。偉人說“實踐出真知”,在Excel中,不但實踐出真知,而且實踐出技巧。1.4 變量及其分類變量(Variable)是用來描述總體中成員的某一特性。在搜集數(shù)據(jù)的過程中,需要搜集各類的變量。例如,性別、年齡、職業(yè)、教育程度、收入等人口統(tǒng)計變量。又如,為了預(yù)測明年的銷售量,所搜集到的數(shù)據(jù)如廣告費、人事費、銷售人員數(shù)等,也都是一種變量。在現(xiàn)實生活或自然界中的一些現(xiàn)象,通常都不是單一變量可以描述得很清楚的。例如,要描述某一個人,僅使用性別變量,說他(或她)是男性(或是女性),肯定是無法說明白的。但隨著變量(例如年齡、膚色、頭發(fā)、身高、體重、種族等)的增加,可以逐漸描述得更清楚一些。1.4 變量及其分類定性變量(QualitativeVariable)也稱離散變量或分類變量。例如,使用的手機品牌、學(xué)生所在的學(xué)院、就讀的班級、宗教信仰、參加的社團、喜好的運動、最常飲用的飲料類別、最喜歡的歌手、最喜歡的影星、民族、黨派,均屬定性變量(分類變量)。分類變量的觀測結(jié)果稱為分類數(shù)據(jù)。如性別:男[1]、女[2]。定序變量:如果類別具有一定的順序,這樣的變量也稱為有序變量(RankVariable)或有序分類變量。相應(yīng)的觀測結(jié)果稱為有序數(shù)據(jù)。例如,成績:優(yōu)[5]、良[4]、中[3]、及格[2]、不及格[1];文化程度:小學(xué)[1]、中學(xué)[2]、大學(xué)[3]、研究生[4];職稱:教授[4]、副教授[3]、講師[2]、助教[1];評價:非常重要[5]、重要[4]、一般[3]、不重要[2]、非常不重要[1];態(tài)度:贊成[3]、中立[2]、反對[1]。定量變量(QuantitativeVariable)也稱數(shù)值型變量。例如,成績、年齡、收入、國民生產(chǎn)總值、體重、身高、智力、溫度等均屬定量變量。定量變量的觀測結(jié)果稱為定量數(shù)據(jù)或數(shù)值型數(shù)據(jù)。在實際應(yīng)用中,變量類型一般只分為定性變量(分類變量)和定量變量(數(shù)值型變量)兩大類。1.5數(shù)據(jù)的收集(怎樣得到數(shù)據(jù))每天翻開報紙或打開電視,就可以看到各種數(shù)據(jù),比如高速公路通車里程、股票行情、外匯牌價、房價、流行病的有關(guān)數(shù)據(jù)。當然還有國家統(tǒng)計局定期發(fā)布的各種國家經(jīng)濟數(shù)據(jù)、海關(guān)發(fā)布的進出口貿(mào)易數(shù)據(jù)等。從這些數(shù)據(jù)中,各有關(guān)方面可以提取對自己有用的信息。顯然,這些間接得到的數(shù)據(jù)都是二手數(shù)據(jù)。獲得第一手數(shù)據(jù)并不像得到二手數(shù)據(jù)那么輕松。某些企業(yè)每年至少要花三四千萬元來收集和分析數(shù)據(jù)。他們調(diào)查其產(chǎn)品目前在市場中的狀況和地位,并確定其競爭對手的態(tài)勢。他們調(diào)查不同地區(qū)、不同階層的民眾對其產(chǎn)品的認知程度和購買意愿,以改進產(chǎn)品或推出新品種以爭取新顧客。他們還收集各地方的經(jīng)濟、交通等信息,以決定如何保住現(xiàn)有市場和開發(fā)新市場。市場信息數(shù)據(jù)對企業(yè)是至關(guān)重要的,他們很舍得在這方面花錢。因為這是企業(yè)生存所必需的,絕不是可有可無的。1.5數(shù)據(jù)的收集(個體、總體和樣本)要想了解北京市民對建設(shè)北京交通設(shè)施是以包括軌道運輸在內(nèi)的公共交通工具為主還是以小汽車為主的觀點,需要進行調(diào)查。調(diào)查對象是所有北京市民,調(diào)查目的是希望知道市民中對這個問題的不同看法各自占有的比例。顯然,不可能去問所有的北京市民,而只能夠問一部分,并且根據(jù)這一部分的觀點來理解整個北京市民的總體觀點。在這個例子中,單個北京市民稱為調(diào)查的對象;而他們的觀點稱為(這個調(diào)查問題的)個體;而稱所有北京市民對這個問題的觀點為一個總體,總體是包含所有要研究的個體的集合;而調(diào)查時問到的那部分市民的觀點(也就是部分個體)稱為該總體的一個樣本,是總體中選出的一部分。當然,也有可能試圖調(diào)查所有的人,那叫普查(Census),比如人口普查。有人喜歡把作為調(diào)查對象的北京市民稱為個體,但每個市民還有其他諸如身高、體重、教育程度等無數(shù)特征,這些都不是我們調(diào)查的目的。因此,為了強調(diào)我們調(diào)查的目的,市民的觀點才應(yīng)稱為個體。1.5數(shù)據(jù)的收集(個體、總體和樣本)在抽取樣本時,如果總體中的每一個個體都有同等機會被選到樣本中,這種抽樣稱為簡單隨機抽樣(例子P42),而這樣得到的樣本則稱為隨機樣本。隨機抽樣就像從一鍋攪勻的八寶粥中舀出一勺,其中各種成分的比例應(yīng)該和鍋里的比例大致一樣。大小為N的總體中產(chǎn)生樣本量為n的隨機樣本的一個常用的方法是利用隨機數(shù)。其步驟為:(1)先把總體的所有個體編號;(2)然后產(chǎn)生n個1到N之間的隨機數(shù);(3)與如此產(chǎn)生的隨機數(shù)中的數(shù)目相同的個體則形成了樣本量為n的簡單隨機樣本。在廣泛使用計算機的今天,為了方便,很多實際工作者應(yīng)用計算機所產(chǎn)生的偽隨機數(shù)來代替真正的隨機數(shù)。在實踐中,得到隨機樣本并不容易,很多搞調(diào)查的人就采取簡單的辦法:方便樣本。具體實現(xiàn)方法:參見實驗1.3、實驗1.4和實驗1.51.5數(shù)據(jù)的收集( 收集數(shù)據(jù)時的誤差)假定在某一職業(yè)人群中女性占的比例為60%。如果在這個人群中抽取一些隨機樣本,這些隨機樣本中女性的比例并不一定剛好是60%,可能稍微多些或稍微少些。這是很正常的,因為樣本的特征不一定和總體完全一樣。這種差異不是錯誤,而是必然會出現(xiàn)的抽樣誤差。在抽樣調(diào)查中,一些人因為種種原因沒有對調(diào)查做出反應(yīng)(或回答),這種誤差稱為未響應(yīng)誤差。而另有一些人因為各種原因回答時并沒有真實反映他們的觀點,這稱為響應(yīng)誤差。和抽樣誤差不一樣,未響應(yīng)誤差和響應(yīng)誤差都會影響對真實世界的了解,應(yīng)該在設(shè)計調(diào)查方案時盡量避免。1.5數(shù)據(jù)的收集
(抽樣調(diào)查以及一些常用的方法)抽樣調(diào)查(SampleSurvey)的領(lǐng)域涉及如何用有效的方式得到樣本數(shù)據(jù)。最常用的問卷調(diào)查方式,包括通過郵件報刊等手段調(diào)查、電話調(diào)查和面對面調(diào)查等。這些調(diào)查方式都利用了問卷(questionnaire),而問卷的設(shè)計則很有學(xué)問。它涉及如何用詞、問題的次序以及問題的選擇和組合等。這涉及心理學(xué)、社會學(xué)等知識。抽樣調(diào)查設(shè)計的目的之一是確保樣本對總體的代表性,以保證后續(xù)推斷的可靠性。概率抽樣方法:系統(tǒng)抽樣(系統(tǒng)隨機抽樣的例子P42)、分層抽樣、整群抽樣、多級抽樣。非概率抽樣方法:目的抽樣、方便抽樣、判斷抽樣、定額抽樣、雪球抽樣、自我選擇。附錄Excel“數(shù)據(jù)分析”工具(P10)1.Excel數(shù)據(jù)分析工具(1)工作表函數(shù)與數(shù)據(jù)分析工具的區(qū)別(2)數(shù)據(jù)分析工具的內(nèi)容“數(shù)據(jù)”選項卡-->“分析”組-->“數(shù)據(jù)分析”2.在Excel2010中激活“分析工具庫”加載項第一步:單擊【文件】選項卡,在彈出的列表中單擊【選項】命令,這時將出現(xiàn)【Excel選項】對話框;第二步:在【Excel選項】對話框中,單擊【加載項】命令,在右側(cè)【管理】下拉列表中選定【Exce1加載項】,單擊【轉(zhuǎn)到】按鈕,打開【加載宏】對話框;第三步:在【加載宏】對話框中,勾選【分析工具庫】選項,單擊【確定】按鈕。實驗指導(dǎo)實驗1.1使用Excel的RAND隨機數(shù)函數(shù)
產(chǎn)生隨機數(shù)表實驗1.2使用Excel的“隨機
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024學(xué)校校園安全培訓(xùn)與護校合同3篇
- 2024年度教育機構(gòu)擔保合同投標委托服務(wù)協(xié)議3篇
- 2024年二零二四年度紙箱環(huán)保材料研發(fā)、生產(chǎn)與銷售合同3篇
- 2024年小微企業(yè)擔保人反擔保合同標準范本3篇
- 2024年新材料產(chǎn)業(yè)有限合伙企業(yè)合伙協(xié)議范本3篇
- 2024年度紙箱銷售與售后服務(wù)保障合同3篇
- 2024年員工臨時資金周轉(zhuǎn)及風險控制合同3篇
- 2024年度橋梁漆工施工及防腐保護合同范本3篇
- 2024年建筑項目鋼筋工承包合同
- 2024年度新型地磚材料研發(fā)與應(yīng)用合作協(xié)議3篇
- 渡槽工程施工組織設(shè)計及對策
- 施工試驗檢測計劃
- 上海小學(xué)一二年級英語單詞匯總
- 小學(xué)體育知識樹PPT課件(帶內(nèi)容)
- 汽車標準件手冊
- 全球試驗室儀器耗材國際品牌簡介
- 鋼抱箍+工字鋼梁在蓋梁施工中的應(yīng)用
- 瀝青配合比匯總
- 追求“真實、樸實、扎實”的語文課堂
- 工業(yè)機器人論文
- UC2845的應(yīng)用和PWM變壓器設(shè)計
評論
0/150
提交評論