調(diào)查問卷設(shè)計技巧案例_第1頁
調(diào)查問卷設(shè)計技巧案例_第2頁
調(diào)查問卷設(shè)計技巧案例_第3頁
調(diào)查問卷設(shè)計技巧案例_第4頁
調(diào)查問卷設(shè)計技巧案例_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

補充內(nèi)容1問卷設(shè)計

問卷設(shè)計是一門技巧性很強的學(xué)問,一份設(shè)計巧妙的問卷應(yīng)當使被訪問者完全明確調(diào)查的意圖并樂意配合作出正確的回答,同時使得調(diào)查機構(gòu)便于對調(diào)查進行計算機處理并作出推斷與預(yù)測。

這樣就要求調(diào)查問卷的設(shè)計者不僅要有大量的統(tǒng)計推斷知識,而且要對調(diào)查內(nèi)容的有關(guān)知識有所了解。例如,調(diào)查計算機網(wǎng)絡(luò)設(shè)備的市場需求問題,倘若一個人對計算機、網(wǎng)絡(luò)等都很不熟悉,那就干脆不要去設(shè)計問卷。必要時應(yīng)當與有關(guān)專家一起設(shè)計。為了使得訪問有效,設(shè)計者也應(yīng)當具有一定的心理學(xué)知識。另外,由于抽樣調(diào)查的樣本容量一般很大,通常要用計算機處理數(shù)據(jù),因此要求設(shè)計者對計算機數(shù)據(jù)處理也要有所了解。下面討論若干原則問題

(1)設(shè)置的問題應(yīng)當圍繞調(diào)查的目的展開。切忌問一些不著邊際的問題,否則,一旦被訪問者對調(diào)查產(chǎn)生懷疑的態(tài)度,那么你的調(diào)查肯定要以失敗告終。

(2)訪問時間的長短要適當控制。經(jīng)驗告訴我們,大約20~25分鐘的調(diào)查時間,只要問題妥當,就不會使得被訪問者產(chǎn)生不耐煩的情緒并配合完成調(diào)查工作。請注意,為了調(diào)查順利,請不要在人家家中或辦公室坐上半個小時還不想離開。通常問卷由30多個提問組成,往往若干個提問是了解一項信息的,一般不超過50個提問。

(3)問卷的開頭往往設(shè)置問題以區(qū)別被訪問者的類型這一點在市場調(diào)查中尤為突出。對于不同類型的被訪問者,問卷進行不同的安排。

倘若抽樣單位不是個人而是集體,如工廠、學(xué)校、車間等,然而被訪問者當然還是“一個人”,此時被訪問者的身份很重要,它可使訪問員知道此人是否了解很多有關(guān)情況,為數(shù)據(jù)的可信度提供依據(jù)。

蓋洛普公司在我國曾經(jīng)進行過一次有關(guān)計算機網(wǎng)絡(luò)使用及其需求預(yù)測的市場調(diào)查,在問題展開之前的一個預(yù)備問題很有啟發(fā)性:

“請問您在網(wǎng)絡(luò)設(shè)備的購買過程中起到哪些作用?(可選擇多項)①我決定有無必要購買網(wǎng)絡(luò)設(shè)備;②我推薦/指定品牌;③我決定購買的網(wǎng)絡(luò)產(chǎn)品應(yīng)該具備哪些功能;④我評估/進行性能測試;⑤我是購買品牌的最終決策者;⑥我批準購買網(wǎng)絡(luò)產(chǎn)品(如果只選此項,則終止訪問)”(4)所提問題要清晰,用詞要妥貼,并注意禮貌。

清晰的問題才有可能得到正確的回答。一張問卷中如果出現(xiàn)較多需要被訪問者發(fā)表議論、談?wù)効捶ǖ膯栴},則會使得被訪問者無所適從,不知從哪兒談起為好。而且也給計算機處理帶來很多麻煩。

為使問卷清晰,一般問卷常常采用選擇題、是非題、填空題之類的形式。其中選擇題擬定的可供選擇必須包含全部可能性并且各種選擇之間有明確的界限。任何模棱兩可的選項、含糊不清的答案都是絕對不容許的,否則容易產(chǎn)生混淆

例如,對某產(chǎn)品的評價問題,設(shè)計者擬定了若干項評價性的選擇:信譽最好、質(zhì)量最好、價格最低、售后服務(wù)好等條款。對這些條款再進行打分:非常贊成,5分;贊成,4分;無所謂,3分;反對,2分;非常反對,1分;不知道,9分(另行處理)。

在實際操作中,發(fā)生了被訪問者在“無所謂”與“不知道”之間隨意選擇的混淆現(xiàn)象?!盁o所謂”本指在“贊成”與“反對”之間持中立態(tài)度,而“不知道”卻是指對該問題不了解、不知道應(yīng)該怎樣選擇才好。兩個選擇存在重大差別!例如,對“價格最低”一項,有些被訪問者反映,他們對待產(chǎn)品最要緊的是質(zhì)量保證,只要質(zhì)量好,價格略高或略低均“無所謂”,因此,他的確“不知道”該產(chǎn)品是否真的“價格最低”。

問卷的禮貌用詞也許每位問卷設(shè)計著都會注意到。而問題提法的恰當妥貼更需要設(shè)計人員捉摸被訪問者的心理狀態(tài),要照顧到被訪問者的心理承受能力。

例如,在對某行業(yè)各工廠的景氣程度進行調(diào)查時,類似“你們廠在近幾年內(nèi)有倒閉或被迫轉(zhuǎn)產(chǎn)的可能性嗎?”這樣的問題應(yīng)該絕對避免。試想被訪者往往是一些廠長、經(jīng)理等負責(zé)人,既使該單位正處于相當困難時期,這樣的提問往往使對方無心繼續(xù)配合調(diào)查。

遇到這種尖刻的但又必須提問以獲得有關(guān)信息的“難題”,最好采用婉轉(zhuǎn)曲折、拆成多題、旁敲側(cè)擊等手法來力爭達到目的。例如,前面的問題可以換為“你對你的工廠近幾年的前景持何種看法?”如果他選擇比較悲觀的答復(fù),可以接著問“你的工廠將會作出何種選擇?”。

(5)問題要有層次地展開,市場調(diào)查等問卷中要注意有比較。

一般地,安排問題總是由簡單到復(fù)雜,從容易到較難,逐步讓被訪者有一個適應(yīng)的過程。一些帶有敏感性的問題通??偸欠旁谳^后面部分處理;有些尖刻的問題,若拆成多道問題來提問,則不少設(shè)計者并不是將它們放在一起接二連三地提出,因為有時連珠炮式的提問反而會引起對方的警覺與懷疑,從而產(chǎn)生不好的效果。

對某些特別重要的問題,調(diào)查機構(gòu)非常想核實但又不可能再三地問,只能設(shè)計一系列有關(guān)(但表面上看并不特別明顯)的問題逐步提出,一層層地深入到所需了解的中心。

美國總統(tǒng)選舉預(yù)測中有一個較關(guān)鍵的問題:“你是否打算在今年11月參加投票?”它直接關(guān)系到投票率以及預(yù)測的精度。美國人可以不去投票,但一般不愿公開承認不去投票,因為這樣人們會認為他不關(guān)心國事。這種想法會影響到對該問題的回答。但是,對于上一次選舉沒有投票的既成事實比較容易承認,而這個事實對這一次是否會去投票的確存在著影響,對判斷他實際上是否會去參加投票多少有一些參考價值。出于這種邏輯推理,蓋洛普公司在問卷的適當?shù)胤皆O(shè)計了諸如“上一次選舉你是否投票?”、“那次投票站設(shè)在何處?”等問題巧妙地對前面的關(guān)鍵問題進行核實(當然,核實的過程還需要用到上幾次投票的既成事實所提供的信息)。問題的有層次展開常常是指“深度”,其實問題以及提供的選擇的安排順序?qū)φ{(diào)查能否成功也有一定的影響。因為合理的順序?qū)龑?dǎo)被訪者愉快地、配合良好地、合乎邏輯地完成整份問卷。

這里所說的“引導(dǎo)”,絕對不是以調(diào)查機構(gòu)或調(diào)查員的主觀意圖去引導(dǎo)被訪者,那樣的引導(dǎo)本身就不符合抽樣調(diào)查的目的與要求。

可供選擇的答案的排列順序?qū)Ρ辉L者有可能產(chǎn)生誤導(dǎo),人們習(xí)慣于認為排在前面的是重要的,事實上排列在前的選擇的確容易給人們留下較深刻的印象。我們除了強調(diào)“排名不分先后”之外,恐怕還要采取一些小措施,比如訪問員可以隨機地按各種不同次序念出所有選擇等等。

市場調(diào)研中關(guān)于某產(chǎn)品的市場供需問題,很要緊的是同種產(chǎn)品的不同品牌不同型號之間的比較。只有比較才能真正了解什么樣的產(chǎn)品、什么樣的型號是人們所喜愛的,才能了解產(chǎn)品的市場競爭情況。

因此,在設(shè)計問卷前以及設(shè)計過程中,設(shè)計人員必須收集與了解有關(guān)產(chǎn)品的幾種最主要的品牌和型號,將它們編入問題中去。千萬不要提問“請你談?wù)剬ζ渌放频目捶ā钡然\統(tǒng)的問題。

(6)注意問卷的格式

一般在卷首印有訪問員的自我介紹,表明是代表哪個調(diào)查機構(gòu)或公司作何種目的的調(diào)查。大方且禮貌的介紹詞及其感謝語句將為調(diào)查的成功創(chuàng)造好的機會。卷末一般寫有最終感謝詞。(7)一般問卷中應(yīng)設(shè)有編碼欄

因為大多數(shù)調(diào)查的樣本容量比較大,只能借助于計算機來處理數(shù)據(jù),編碼欄的設(shè)立使計算機可以對調(diào)查數(shù)據(jù)加以統(tǒng)計、匯總和分類。以上僅僅是一些原則性的東西,一般為了使問卷設(shè)計的合理有效,調(diào)查機構(gòu)常常采用試調(diào)查手段,抽少量單元用已設(shè)計好的初稿進行試調(diào)查,從中發(fā)現(xiàn)不完善之處,并進一步修改之。不要認為實施這一步會增加工作量,實際上試調(diào)查的樣本總是作為樣本的一部分。問卷設(shè)計的步驟1.研究所需的調(diào)查資料

a.初步考慮的資料列出與篩選。

b.對需要的資料的收集方式進行研究。2.研究調(diào)查的樣本特征3.確定問題列出所有詳盡問題,對問題逐題檢查篩選,排列問題的前后。4.進行試調(diào)查

a.問題清楚明了?

b.被調(diào)查者是否能夠和愿意回答?時間長短,邏輯順序c.所得資料能否滿足調(diào)查的要求d.編碼輸入等是否存在問題

問題的設(shè)立問題的種類開放式封閉式半開半閉式答案由調(diào)查者設(shè)定,還可以細分如:你喝啤酒多少年了?優(yōu)點:暢所欲言,提高資料的質(zhì)量缺點:調(diào)查者與應(yīng)答者的偏見,調(diào)查整理遭遇瓶頸,被調(diào)查的層次不一如:您認為電腦打印紙這個產(chǎn)品,在哪方面需要改進?A.紙張質(zhì)量B.擴大品種C.銷售服務(wù)D.其他(請?zhí)顚?______封閉性問題兩項式多項式矩陣式等級式排序式表格式后續(xù)式限制式非限制式部分排序全排序例:1.您家里有電視嗎?A.有B.無

2.目前您家有幾臺電視?A.無B.1臺C.2臺D.3臺及以上3.請問您家有下列哪些家用電器?

a電視b電腦c冰箱d空調(diào)e攝像機f組合音響g洗衣機h熱水器i微波爐4.您對XX電器整體的售后服務(wù)總體評價?A.非常滿意B.滿意C.一般D.不滿意

5.您對廣州快速公交(BRT)服務(wù)質(zhì)量的最大愿望?請您在以下項目中按重要程度選擇3項,以1,2,3編號A司機態(tài)度好B車站候車秩序良好C候車時間正常D能按時到達目的地E車廂內(nèi)外整潔舒適F車輛不出故障G對老弱病殘孕的照顧

6.您一般多少時間使用下列產(chǎn)品?(每種產(chǎn)品均為單選)每天2次及以上每天1次每周4-6次每周2-3次每周1次每周少于1次不用()()()()()()()()()()()()()()()()()()()()()香水潔面乳沐浴乳姓名性別文化程度年齡7.貴單位董事長基本情況8.您家有汽車嗎?A有(跳問下一個問題)B沒有

是否兩年內(nèi)打算購買?a打算購買b不購買問題的性質(zhì)事實性問題意見性問題例:您平均每月全部收入是多少?例:您是否支持中國申辦世界杯足球賽?避免出現(xiàn)引導(dǎo)性的問題:你經(jīng)常閱讀一些社會人文類的書籍,如《知音》《故事會》?問卷的格式一、介紹詞

有些人從未接受過調(diào)查或者警惕性過分高,往往需要一番口舌,才能讓被調(diào)查對象弄明白.介紹詞的作用:1.表明進行該項調(diào)查的人或組織的身份解除對于調(diào)查工作的疑慮。一般來說:對政府系統(tǒng)或者在社會上有一定聲望的市場調(diào)查部門,人們的信任度和配合度比較高。2.說明該項調(diào)查的重要性3.使被調(diào)查對象認識到他的回答的意義讓被調(diào)查者認識到自己是按照科學(xué)抽樣程序被選中的,不能由他人代替,所以他的意見很重要。4.讓被調(diào)查對象了解對他的回答秘密處理并為之保守秘密解除顧慮,能實事求是的自主回答,真實表達自己的意見。如全國普查人口5.對被調(diào)查對象的配合與支持表示感謝感謝在先,答題在后。加強調(diào)查員與被調(diào)查者的感情聯(lián)系。二、填表說明的寫法

為使得答案規(guī)范統(tǒng)一,便于編碼與計算機錄入與數(shù)據(jù)處理,在問卷中必須寫一段填表說明,對于問題的回答和選擇做解釋,為被調(diào)查者回答問題提供幫助。如:請您根據(jù)自己的情況,在下列合適的數(shù)字上用“●”表示,除特別說明外,均為單選。補充內(nèi)容2

調(diào)查員素質(zhì)

抽樣調(diào)查是一項嚴肅認真的工作,對調(diào)查員素質(zhì)要求較高。真實可靠的調(diào)查資料是抽樣調(diào)查質(zhì)量保證的基礎(chǔ)。由于調(diào)查員工作態(tài)度的馬虎和疏漏對數(shù)據(jù)質(zhì)量造成的損失是毀滅性的。

試想一個學(xué)校為了了解教師的教學(xué)質(zhì)量,發(fā)給班長一疊調(diào)查表,班長找?guī)讉€同學(xué)一人填上十份交了回來,這種調(diào)查結(jié)果有多大意義?又如,系里管分配的一位領(lǐng)導(dǎo)找班里幾位同學(xué)開座談會,了解教師教學(xué)情況,同學(xué)們不發(fā)言,他千方百計地啟發(fā)、誘導(dǎo)、鼓勵大家積極提意見,這樣的調(diào)查結(jié)果能不帶偏性嗎?

調(diào)查員和調(diào)查機構(gòu)的中立性是保證獲得正確信息的必要條件之一。

美國蓋洛普調(diào)查公司發(fā)布的調(diào)查結(jié)果具有很高的信譽,100多家有名的的獨立報紙都愿意公布他關(guān)于總統(tǒng)選舉民意測驗的結(jié)果。大半個世紀以來,蓋洛普調(diào)查公司在調(diào)查咨詢領(lǐng)域獲得了極大的成功,這個成功與它的調(diào)查員的中立性以及客觀公正的態(tài)度是分不開的。

美國現(xiàn)場人口調(diào)查所收集的數(shù)據(jù)之所以有很高的質(zhì)量,關(guān)鍵在于他們對調(diào)查員素質(zhì)的重視,在于仔細挑選、培訓(xùn)和指導(dǎo)現(xiàn)場工作人員。在調(diào)查員上崗之前,進行約4天時間的調(diào)查程序培訓(xùn);在他們上崗之后,每個月必須進行若干小時的培訓(xùn)。調(diào)查員的主管人每年至少要對他們的工作考查一次。另外,約3%的月樣本(由單獨的概率抽樣程序選?。┯芍鞴苋酥匦略L問。所有不相符之處都與訪問員進行討論。訪問員的報告全部加以校對,即查核不完全和不一致的記載,每項差錯都與造成此差錯的人員核對一下。由于他們的嚴格管理及其認真的態(tài)度,一般來說差錯率很低,從而保證了它們的數(shù)據(jù)質(zhì)量。進行抽樣調(diào)查工作,如有可能應(yīng)使用專業(yè)調(diào)查人員。他們受過專門訓(xùn)練,有長期的調(diào)查訪問經(jīng)驗,更為重要的是,他們以調(diào)查為專門職業(yè),調(diào)查的質(zhì)量與他們的工資、獎勵相結(jié)合,調(diào)查機構(gòu)和組織內(nèi)部有一整套監(jiān)督、檢查、激勵獎懲措施。一般來說,專業(yè)調(diào)查人員比起一次性、臨時性的調(diào)查人員來說,比較重視個人的工作信譽,能夠較好地保證調(diào)查工作的質(zhì)量。

美國人口普查局每個月都要進行一次現(xiàn)場人口抽樣調(diào)查,它擁有一支由1500名專職訪問員組成的實地工作班子,向約115000人的一個全國性概率樣本征詢意見,調(diào)查結(jié)果發(fā)布于若干重要的刊物和總統(tǒng)報告上,例如:勞工評論月刊、就業(yè)與收入(月刊)、現(xiàn)場人口報告(不定期)、特別勞動力報告(不定期)、美利堅合眾國統(tǒng)計摘要(年度)、總統(tǒng)經(jīng)濟報告(年度)。它的調(diào)查結(jié)果具有極高的權(quán)威性。據(jù)說它的數(shù)據(jù)可信度比10年一次的人口普查還要高。這當然是由于它的數(shù)據(jù)是由專業(yè)人員采集的而人口普查必須動用大量臨時人員的原因。

不少抽樣調(diào)查是一次性的、臨時性的。此時,可以請調(diào)查公司代勞;當然,也可以自己組織。如果自己組織,那么在調(diào)查前必須對調(diào)查人員進行培訓(xùn)。對訪問員的培訓(xùn)是該次調(diào)查能否取得成功的關(guān)鍵之一。訪問員必須熟悉本次調(diào)查的目的與要求,必須熟悉問卷內(nèi)容,明確訪問對象的特征。在被訪問者篩選過程中,一般應(yīng)當將不同類型的被訪單位和個人一一記錄在案,通常要求訪問員做到:

(1)嚴格遵守訪問程序和指示,不允許擅自變通處理

(2)訪問過程中始終保持中立,不使用任何代誘導(dǎo)性語言。

(3)忠實被訪者的回答,嚴禁在不經(jīng)詢問或被訪人尚未回答之時,擅自代答或代填問卷。

(4)除出現(xiàn)某種情況下規(guī)定的跳答題之外,任何題均要按規(guī)定詢問,不能因為估計被訪者有可能不回答而跳過。倘若遇到拒絕回答或被訪人確實不知道等情況,則應(yīng)在答卷上一一注明。

(5)訪問大致完成時,訪問員應(yīng)當場瀏覽一遍問卷,把漏記或不明確的地方補充完整。

(6)應(yīng)盡可能在問卷中詳細記錄被訪人的姓名、單位、地址以及電話等,以便于復(fù)查。

此外,在培訓(xùn)過程中,應(yīng)當讓訪問員明白問卷的重點信息所在,這對保證調(diào)查質(zhì)量起著至關(guān)重要的作用。

每一次抽樣調(diào)查都要進行抽樣復(fù)查。一般地,在所訪問后的問卷中抽10%左右復(fù)核。復(fù)查可以通過再上門或電話訪問等手段實現(xiàn)。

以上對訪問員的要求當然是針對上門訪問:它具有回收率高、精確度高的優(yōu)點,但花費自然較大。有些大規(guī)模的抽樣調(diào)查采用郵寄或電話訪問等形式,比起上門訪問效果要差許多,尤其是郵寄問卷方式,一般回收率較低,因此大大降低調(diào)查的質(zhì)量。補充內(nèi)容3

數(shù)據(jù)處理與調(diào)查總結(jié)報告

問卷回收、核實后,接著進行數(shù)據(jù)的整理、分類、計算、匯總等處理工作。除了一些小型、臨時抽樣調(diào)查可用手工處理數(shù)據(jù)外,大多數(shù)抽樣調(diào)查數(shù)據(jù)通常用計算機進行處理。調(diào)查結(jié)束后,根據(jù)圈出的答案進行編碼,以方便計算機識別。現(xiàn)在有不少統(tǒng)計軟件用于抽樣調(diào)查的數(shù)據(jù)處理相當有效,例如SAS統(tǒng)計軟件。當然,也可以請計算機專家和統(tǒng)計專家編制一些針對具體抽樣調(diào)查的專用應(yīng)用程序。通過數(shù)據(jù)處理,最終得到所要求的濃縮信息,如總量、平均數(shù)的估計、比例、P分位數(shù)的估計,以及它們的精度等。

在抽樣調(diào)查的最后階段,應(yīng)該提交一份抽樣調(diào)查總結(jié)報告。理由很簡單,調(diào)查中所得到的大量數(shù)據(jù)看上去是那么雜亂無章,一古腦兒地收集在一起上交或轉(zhuǎn)交,上級部門無法據(jù)此作出決策,委托部門搞不清最終到底有什么樣的結(jié)論。計算機上輸出的結(jié)果也必須解釋和闡明它的實際意義。因此,必須撰寫一份調(diào)查總結(jié)報告,表現(xiàn)出這次抽樣調(diào)查和統(tǒng)計分析的基本成果。

撰寫總結(jié)報告宜開門見山,簡明扼要;應(yīng)清楚地說明本次調(diào)查的目的,具體的抽樣方案也應(yīng)該簡略地一一交待,其中包括調(diào)查的實施過程,實際走訪了多少單元,發(fā)了多少份問卷,回收率究竟有多少等等。以上所寫通常占總結(jié)報告的一小部分,報告的主體部分當然是調(diào)查結(jié)果。調(diào)查結(jié)果必須完全依據(jù)調(diào)查數(shù)據(jù)以及數(shù)據(jù)處理結(jié)果來寫。所有的推斷與預(yù)測必須依據(jù)數(shù)據(jù)而行,即所謂實事求是的作風(fēng),嚴禁憑空設(shè)想。根據(jù)數(shù)據(jù)分析結(jié)果,可以做一些適當?shù)慕忉尯妥h論,提出一些建議和看法。不過,這些不能占過多篇幅,以免喧賓奪主。

總結(jié)報告的撰寫應(yīng)當有文字、有數(shù)據(jù)、有一定的分析。

能使人一目了然的統(tǒng)計圖表非常受上級或委托部門的歡迎,因此,調(diào)查報告最好作出統(tǒng)計圖表。

調(diào)查結(jié)果要有一定的結(jié)論,至少傾向性一定要鮮明,不要模模糊糊的預(yù)測或推斷。需要明白的是,政府部門或企業(yè)、公司拿出經(jīng)費來是要你得出一些結(jié)論性的東西。因此,每個待估計的參數(shù)都要有估計的數(shù)字??梢宰鲆恍┓珠T別類的工作,可以對一些指標或者個體聚類進行分析,這樣做也許能為委托單位提供有價值的參考信息。在調(diào)查總結(jié)報告中有一個重要的數(shù)據(jù)應(yīng)該報告給委托單位,那就是調(diào)查的精確度。只告訴委托方參數(shù)的估計值而不告訴估計的精確度,那么你的工作沒有全部完成。

如你告訴電視臺某檔節(jié)目的收視率為65%,那么電視臺精明的負責(zé)人一定會問你誤差有多大,倘若該百分比的誤差為15%,則電視臺不敢認同這檔節(jié)目的收視率為65%;而如果你告訴他收視率為65%3%,那么這個65%就顯得很有意義了。

統(tǒng)計圖表往往有著用語言難以達到的效果。它可以使人們一下子就抓住事物的全貌或者特征。

有關(guān)的大批數(shù)據(jù)、次要的各種各樣的數(shù)據(jù)圖式,一般都以附錄的形式放在總結(jié)報告的最后面。

以上僅僅是調(diào)查總結(jié)報告一般性的特點,具體的內(nèi)容和格式依實際的抽樣調(diào)查而定。補充內(nèi)容4

若干數(shù)學(xué)準備抽樣推斷既然必須處理收集來的數(shù)據(jù),因此數(shù)學(xué)知識是必不可少的。下面僅就抽樣調(diào)查中一些最基本的常用數(shù)學(xué)知識和概念以直觀簡潔的方式做一些介紹。1、盒子模型一般抽樣調(diào)查面臨的總體只有有限多個初級單元。從總體中抽樣,就相當于從一個盒子里摸取若干張票,盒子里的票數(shù)相當于有限總體的單元個數(shù),票上記載著反映該單元特征的指標的值。設(shè)總體有N個單元,各指標值為則盒子如圖2-1所示:圖2-1該盒中票的平均數(shù)為:即總體平均數(shù),它表示票上指標的中心。另一個重要的總體參數(shù)是盒中票的指標的離散程度,用指標值關(guān)于中心的距離的平方和的平均數(shù)來表示:這實際上是總體的方差;但大部分情況采用:如果我們只關(guān)心總體中具有某些特定類型的集合占整個總體的比例,那么只需稍加處理,引入0-1指標,總體比例的問題立刻轉(zhuǎn)化為總體平均數(shù)的一個特例。只要將盒子中的票子分為兩類,我們感興趣的一類全標上1,其余的都標上0。于是盒子可用圖2-2表示:圖2-210則盒子中票子指標的平均數(shù)為:正好是我們關(guān)心的那類個體占總體的比例。因此,凡對總體平均數(shù)有的結(jié)果,總體比例也有相應(yīng)的結(jié)果。此時,盒子的方差化為:常采用的方差表示為:從盒子中作隨機抽取常常有兩種不同方式:隨機有放回抽取和隨機無放回抽取。從直觀上看,隨機有放回方式存在著一張票子被抽中兩次或兩次以上的可能性,而隨機無放回方式則不存在這種可能。在實際操作中,人們不太可能心甘情愿地花費兩倍以上的費用去訪問同一個單元。因此,隨機無放回通常比隨機有放回應(yīng)“有效”一些,這一點將在第三章的討論中在理論上加以肯定。但是,當盒子中的票數(shù)相當多,而抽取的票數(shù)相對較少時,有許多事件的概率習(xí)性對于有放回或無放回兩種情況幾乎差不多,因而有時候我們常從隨機有放回這一最簡單的形式入手討論問題,而將有關(guān)的結(jié)果近似地套到隨機無放回的情形。這里討論的盒子模型是對簡單隨機抽樣而言的,至于分層、分階段等其它情況無非是大盒子里放小盒子等。2、隨機誤差與無偏估計量先討論一個簡單的具體例子。設(shè)有一個容量為7的總體由下面盒子給出,如圖2-3所示:圖2-31234567總體平均數(shù)和方差為:標準差此時,盒子中指標值以及總體的參數(shù)和對于調(diào)查者來說是未知的。調(diào)查者的任務(wù)就是從總體中抽出一個樣本,構(gòu)造樣本估計量,來推斷總體平均數(shù)和方差。設(shè)樣本容量n=3,使用樣本的樣本均值和方差來估計總體的平均值和方差??紤]不放回簡單隨機抽樣,由于抽樣是隨機的,7個個體中的任何3個都可能入選樣本。所有可能的樣本數(shù)有此時,每一個樣本被抽中的概率都相等且為如抽中樣本(2,3,6),則用它們來估計總體的平均數(shù)和方差,誤差如下:對平均數(shù)有隨機誤差對方差有隨機誤差由于樣本是隨機的,誤差也將隨著樣本的不同而發(fā)生變化。如果我們的運氣不佳,抽到樣本(1,2,3),此時隨機誤差分別為隨機誤差就大得許多。也就是說,用樣本平均數(shù)和方差來估計總體平均數(shù)和方差有時是很糟糕的。為什么還要用樣本平均數(shù)和方差來估計總體平均數(shù)和方差呢?原因一:和是樣本平均數(shù)和方差的波動中心換句話說,雖然估計量和會發(fā)生隨機誤差,隨機誤差有正有負,但隨機誤差的平均值為0。或者說,所有可能的和的平均值分別為和。以前述例子為例:所有可能的的平均值為類似:所有可能的的平均值為原因二:隨著樣本容量n的增大(與總體容量N相比仍可能很小),與以及與發(fā)生大的誤差的可能性越來越小,以至于可以忽略,而誤差在0附近的可能性變得越來越大,或者說某種平均意義下的誤差越來越小。一般來說,基于抽樣數(shù)據(jù)的統(tǒng)計量——通常記為,在前面的例子中是和——作為參數(shù)的估計量,總是希望能夠較好地近似代表。由于依據(jù)局部來估計總體避免不了會發(fā)生誤差,這個誤差還是隨機的,任何兩次抽樣所產(chǎn)生的誤差都不會相同,每次所產(chǎn)生的誤差都是這個隨機變量的一次實現(xiàn)。另外,待估參數(shù)又是未知的,我們也不可能知道抽樣誤差到底等于多少。為了排除偶然因素,我們往往從平均意義上來看抽樣誤差。這就是在數(shù)學(xué)上對隨機變量取數(shù)學(xué)期望。如果估計的統(tǒng)計量具有性質(zhì):,則稱為的無偏估計。前述例子就說明:即和分別是和的無偏估計。。以上分析告訴我們,所謂無偏估計并非是說估計量與參數(shù)之間就沒有偏差,而是說估計量所有可能取值的平均值等于參數(shù)?;蛘哒f估計量與參數(shù)的平均偏差為零。數(shù)理統(tǒng)計告訴我們,并非所有的待估參數(shù)都存在無偏估計。例如成功率為p的n次貝努里試驗,其中成功的次數(shù)x服從二項分布,對于觀察到的成功次數(shù)x,可用x/n估計參數(shù)p,而且是無偏估計。但參數(shù)1/p不存在無偏估計。其實,有偏估計不見得一定討厭。雖然是的有偏估計,即,但是隨著樣本容量n的增大,并且具有其它良好的性質(zhì)。稱具有這種性質(zhì)的估計量為漸近無偏估計量。抽樣調(diào)查中的比估計量就是一種漸近無偏估計量。在抽樣調(diào)查理論中,有必要討論有偏估計,這是因為:(1)對于某些常見的參數(shù),我們經(jīng)常采用一些既合理又方便的估計量。這些估計量在實際操作中能為幾乎所有的人接受,而它們卻不是無偏估計量。(2)既使我們采用的估計量是概率意義上的無偏估計量,但在實際抽樣中卻變成了有偏估計,這是由抽樣本身造成的例如:在抽樣中常常發(fā)生不回答現(xiàn)象,這些不回答的人一般對所調(diào)查的問題帶有一定的傾向性,根據(jù)回答者提供的資料構(gòu)造的理論上的無偏估計實質(zhì)上并非整個總體的參數(shù)的無偏估計。3、隨機誤差的度量對無偏估計,我們已經(jīng)知道估計量與參數(shù)的差的所有可能取值的平均值等于0,即。用這個平均的概念是無法度量估計量的偏差的。以一元參數(shù)為例,由于隨機性,可以在的左邊,也可以在的右邊,而在前述平均意義下,這些正負偏差將互相抵消。隨機誤差的正負號是沒有多大意義的,實際關(guān)心的是距離的長度。如果兩個估計量和,遠離而卻經(jīng)常在的附近,那么我們比較喜歡使用來估計。我們也可以考慮用所有可能隨機誤差的絕對值的平均值來度量隨機誤差的大小,但是絕對值在數(shù)學(xué)上處理起來不方便。因此,我們常用所有可能隨機誤差平方的平均值來度量隨機誤差的大小,稱為均方誤差,記為在是的無偏估計的前提下,實際上是的方差即稱為的標準誤差接著討論前面的例子。在總數(shù)為7的盒子中抽出3個個體組成樣本,用作為參數(shù)的估計量,求估計量的標準誤差(具體運算見(3.7)式)也就是說,使用來估計,在平均意義上的誤差為0.94??紤]到盒子中數(shù)值都是整數(shù),標準誤差0.94不是很大。如果從盒子中抽取樣本容量為5的樣本,可得也就是說,標準誤差隨著n的增大將顯著地減小了,這是一條一般性的規(guī)律,基本上與總體數(shù)N無關(guān)。遺憾的是,在實際操作中,我們對估計量誤差的測量并不一定作得如此之好。因為在抽樣調(diào)查中,盒子中每一個體的指標值我們不能全部得知,故真正的參數(shù)也不可能得知??梢灾赖闹皇浅槌龅哪墙M樣本。因此,在實際操作中,我們只是用樣本的估計量來代替參數(shù)本身,并用樣本方差來代替總體方差,從而估計出估計量的方差和標準誤差。比如:若抽得樣本(2,3,7),則比起真正的標準誤差0.94來,近似標準誤差還不至于太令人失望。令人安慰的是,適當加大樣本容量n,我們將做得更好。前面討論的主要是無偏估計的情況。對于有偏估計來說在一定的條件下,也有類似的結(jié)果。設(shè)是的有偏估計,即。稱為的偏倚,記為。此時,的均方誤差為當是的漸近無偏估計,并且上式右端第二項是比更高階的無窮小,則仍可使用的方差和均方誤差來近似地度量隨機誤差的大小。也就是說:當n適當大后,如果第二項比起來是小得可以忽略不計的量,那么可以用均方誤差MSE近似地取代方差。4、正態(tài)曲線的應(yīng)用與置信區(qū)間如果隨機變量的概率密度函數(shù)為當時,該曲線稱為標準正態(tài)曲線,其概率密度為分布函數(shù)為則稱該隨機變量服從參數(shù)為的正態(tài)分布。記為其中是隨機變量的期望(平均值),為隨機變量的方差,為隨機變量的標準差。分布函數(shù)給出了標準正態(tài)隨機變量小于實數(shù)t的概率。一個隨機變量的變化規(guī)律用正泰曲線來描述,稱該隨機變量服從正態(tài)分布,記作:一個隨機變量的變化如果受到許多因素的共同影響,但沒有一個或數(shù)個因素起主導(dǎo)作用,那么我們認為這個變量服從正態(tài)分布。這個事實是由中心極限定理嚴格論證了的。一般地,當這些變量所來自的母體具有非零有限方差,而時,成立:也就是說,當n很大時,的分布可以近似地用代替。這就是在實際中我們把樣本平均數(shù)歸結(jié)為它具有標準正態(tài)分布的原因。在抽樣調(diào)查中,情況稍有不同,但結(jié)論類似。主要原因是抽樣調(diào)查中總體是有限總體,大多數(shù)抽樣方式是隨機無放回,因而樣本的抽取不滿足獨立同分布,不能直接應(yīng)用上述中心極限定理。然而,當N(總體總數(shù))相當大,抽樣樣本容量n相對較小時,隨機有放回與隨機無放回常有相類同的概率習(xí)性。二十世紀六七十年代,一些概率統(tǒng)計工作者,如Hajek等人,對有限總體無放回抽樣的樣本平均數(shù)進行了研究,得到如下與獨立同分布變量相同的結(jié)論:定理2.1:設(shè)有限總體單元為,從中隨機無放回抽取n個單元,記為,它們的平均數(shù)記為,總體平均數(shù)記作,方差記為,則當時,成立:上述定理告訴我們,當N,n,N-n相當大時,可將的分布近似地用看作標準正態(tài)分布。由于1/N比1/n小的多,將1/N忽略,代替S,上式和前式即為一致。在抽樣調(diào)查理論中,樣本平均數(shù)的近似正態(tài)性的重要作用之一,就是給出待估參數(shù)和的置信區(qū)間。前面講了總體平均數(shù)的估計以及標準誤差由此可以構(gòu)造一個區(qū)間,用代替,得下面區(qū)間:由于是未知參數(shù),是某一固定值。由于和是隨機樣本的函數(shù),所以該區(qū)間是一個隨機區(qū)間。它可能覆蓋,也可能沒有覆蓋。由可知,上述區(qū)間覆蓋這一隨機事件的概率為68%,稱此區(qū)間為待估參數(shù)的置信度為68%的置信區(qū)間。其含義為如果我們做了100次抽樣調(diào)查,每次得到一個這樣的區(qū)間,在這些區(qū)間中大約有68個覆蓋了。由可得的置信水平為95%的置信區(qū)間:由可得的置信水平為99.7%的置信區(qū)間:一般地,由可得的置信水平為的置信區(qū)間:可查顯著性水平為的標準正態(tài)分布表獲得。美中不足的是置信水平提高了,但是置信區(qū)間的寬度卻加大了。在實際操作中只能是選擇適當?shù)闹眯潘?,或者加大樣本容量n來彌補。比如,在上海市1994年人口變動抽樣調(diào)查中,常住人口總量95%置信水平的置信區(qū)間估計為:1308.1838.59萬,而估計的和實際登記的戶籍人口總數(shù)為1289萬,后一個數(shù)字是很精確的。但是,常住人口總量的置信區(qū)間下界為1308.18—38.59=1269.59萬,比戶籍人口數(shù)小了近20萬人。眾所周知,人口總量應(yīng)該比戶籍人口總量大,顯然,這里置信水平95%過大了,選為90%就可以了。例2.1

某大學(xué)有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論