抽樣調(diào)查作業(yè)二R語(yǔ)言_第1頁(yè)
抽樣調(diào)查作業(yè)二R語(yǔ)言_第2頁(yè)
抽樣調(diào)查作業(yè)二R語(yǔ)言_第3頁(yè)
抽樣調(diào)查作業(yè)二R語(yǔ)言_第4頁(yè)
抽樣調(diào)查作業(yè)二R語(yǔ)言_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣調(diào)查學(xué)號(hào):2013104874姓名:孫影莉班級(jí):統(tǒng)計(jì)學(xué)131一、作業(yè)要求:1、利用R軟件進(jìn)行相關(guān)運(yùn)算,給出運(yùn)算結(jié)果;2、逐一給出每題的R代碼及其相應(yīng)的運(yùn)行結(jié)果;3、作業(yè)以word文檔提交,命名格式為“學(xué)號(hào)姓名作業(yè)二”。二、作業(yè)題目:P104.3.3題:某居委會(huì)轄有三個(gè)居民新村,居委會(huì)欲對(duì)居民購(gòu)買彩票的情況進(jìn)行調(diào)查。調(diào)查者考慮以新村分層,在每個(gè)新村中隨機(jī)抽取了10個(gè)居民戶并調(diào)查每戶最近一個(gè)月購(gòu)買彩票所花費(fèi)的金額(元),結(jié)果列于下表:問(wèn)題:(1)試估計(jì)該小區(qū)居民戶購(gòu)買彩票的平均支出,并給估計(jì)的標(biāo)準(zhǔn)差。(2)當(dāng)置信度為95%,要求極限相對(duì)誤差不超過(guò)10%時(shí),按比例分配和按內(nèi)曼分配時(shí)樣本量及各層的樣本量分別為多少?解答:(1)首先計(jì)算出每層的簡(jiǎn)單估計(jì)量:ybar1、ybar2、ybar3=分別為,其中,N1、N2、N3分別為:,N=。然后求出每層的層權(quán)w1、w2、w3分別為:利用分層隨機(jī)抽樣得到該小區(qū)居民購(gòu)買彩票的平均支出的估計(jì)量ybar=購(gòu)買彩票的每層的平均支出樣本方差sh1^2、sh2^2、sh3^2為:然后fh1、fh2、fh3分別得:(Nh*yh)1、(Nh*yh)2、(Nh*yh)分別是:總和為:根據(jù)以上數(shù)據(jù)整理成表格為:然后求得方差的估計(jì)值為vybar=則估計(jì)的標(biāo)準(zhǔn)差為sybar=(2)a、比例估計(jì):總體n=,n1、n2、n3分別為:n、n1、n2、n3分別約等于:185、56、92、37b、內(nèi)曼估計(jì):總體n=,n1、n2、n3分別為:n、n1、n2、n3分別約等于:175、33、98、42代碼如下:setwd('C:\\Users\\user\\Desktop\\新建文件夾')dat<-read.csv('syl3.3.csv',header=F)View(dat)alpha<-0.05nh<-10Nh<-dat[,2]N<-sum(Nh)Wh<-Nh/Nw<-sum(Wh)#檢驗(yàn)Wh是否正確fh<-nh/Nhyh<-1:nrow(dat)#rep(0,nrow(dat))sh2<-1:nrow(dat)yh<-rowSums(dat[,3:12])/nhYh<-Nh*yhY<-crossprod(Nh,yh)ybar<-sum(Wh*yh)var_ybar<-sum(Wh^2*(1-fh)/nh*sh2)sybar<-sqrt(var_ybar)for(iin1:nrow(dat)){yh[i]<-mean(as.numeric(dat[i,3:12]))sh2[i]<-sd(dat[i,3:12])^2}#比例分配r<-0.1a<-sum(Wh*sh2)b<-(0.1*ybar/qnorm(1-alpha/2))^2n<-a/(b+a/N)#總數(shù)n1<-n*Wh#各分層樣本數(shù)#內(nèi)曼估計(jì)a1<-sum(Wh*sqrt(sh2))n2<-a1^2/(b+a/N)#總數(shù)n22<-n2*Wh*sqrt(sh2)/a1#各分層樣本數(shù)P104.3.4題:隨著經(jīng)濟(jì)發(fā)展,某市民正在悄悄的改變他們的過(guò)年習(xí)慣,雖然仍有大多數(shù)選擇除夕夜在家吃年夜飯、看電視節(jié)目,但也有一些家庭到飯店吃年夜飯或逛夜市,或利用春節(jié)假期到處旅游。為研究這種現(xiàn)象,某研究機(jī)構(gòu)以市中心165萬(wàn)居民戶作為研究對(duì)象,將居民戶按6個(gè)行政區(qū)分層,在每個(gè)行政區(qū)隨機(jī)抽取30戶居民戶進(jìn)行了調(diào)查(各層抽樣比可以忽略),每個(gè)行政區(qū)的情況以及在家(或親戚家)吃年夜飯、看電視節(jié)目的居民數(shù)見(jiàn)下表:?jiǎn)栴}:試估計(jì)該市區(qū)居民在家吃年夜飯的比例,并給出估計(jì)的標(biāo)準(zhǔn)差。當(dāng)置信度為95%,要求極限絕對(duì)誤差不超過(guò)1%時(shí),按比例分配和內(nèi)曼分配時(shí)總樣本量及各層的樣本量分別為多少?解答:(1):首先計(jì)算得到每層在家中吃年夜飯的樣本比例分別為:那么根據(jù)每一層的層權(quán),計(jì)算得到該市民在家吃年夜飯的樣本比例為:Pst=每一層在家吃年夜飯的樣本比例的方差為:V(Pn)=樣本比例方差的估計(jì)值為:V(Pst)=該估計(jì)值的標(biāo)準(zhǔn)差為:s(Pst)=所以估計(jì)量的標(biāo)準(zhǔn)差為1.99%,比例為9.24%(2)、a、比例分配的條件下:n=約等于2659所以n1、n2、n3、n4、n5、n6分別為:n1=479、n2=559、n=373、n4=240、n5=426、n6=586由于n1+n2+n3+n4+n5+n6=n所以n=2663.b、內(nèi)曼分配n2=約等于2561所以n1、n2、n3、n4、n5、n6分別為:n1=536、n2=520、n=417、n4=304、n5=396、n6=392由于n1+n2+n3+n4+n5+n6=n所以n=2565.程序代碼如下:setwd('C:\\Users\\user\\Desktop\\新建文件夾')dat<-read.csv('syl3.4.csv',header=F)View(dat)N<-165*10^4#樣本總量n1<-30#樣本量wh<-dat[,2]nh<-dat[,3]p<-nh/n1#每層樣本比例pst<-sum(wh*p)#樣本比例var_pst<-sum((wh^2-n1/(N*wh))*(p*(1-p)/(n1-1)))spst<-sqrt(var_pst)#(1)比率分配r<-0.01s<-p*(1-p)a<-sum(wh*s)b<-(r/qnorm(1-0.025))^2n<-a/(b+a/N)#總數(shù)n1<-n*wh#各分層樣本數(shù)#(2)內(nèi)曼分配a1<-sum(wh*sqrt(s))n2<-a1^2/(b+a/N)#總數(shù)n22<-n2*wh*sqrt(s)/a1#各分層樣本數(shù)P104.3.5題:某開(kāi)發(fā)區(qū)利用電話調(diào)查(RDD)對(duì)區(qū)內(nèi)居民消費(fèi)冷凍食品情況進(jìn)行調(diào)查。他們將電話號(hào)碼(六位數(shù)字)的前兩位作為一部分,后四位作為一部分,前兩位代表局號(hào),局號(hào)及每個(gè)局號(hào)中擁有的電話數(shù)可以找到,安局分層,按每個(gè)局號(hào)(剔除商戶后)擁有的電話數(shù)比例分配樣本量(分層抽樣比可以忽略)。調(diào)查后各層樣本戶購(gòu)買冷凍食品支出的中間結(jié)果見(jiàn)下表:?jiǎn)栴}:試估計(jì)該開(kāi)發(fā)區(qū)居民購(gòu)買冷凍食品的平均支出,以及估計(jì)的95%置信區(qū)間。解:先求出購(gòu)買冷凍食品的平均支出為:在計(jì)算平均支出的方差估計(jì)值為:V(ybar)=95%的置信區(qū)間為:以下為代碼:setwd('C:\\Users\\user\\Desktop\\新建文件夾')dat<-read.csv('syl3.5.csv',header=F)View<-(dat)alpha<-0.05wh<-dat[,2]nh<-dat[,3]ay<-dat[,4]sc<-dat[,5]Nh<-(nh/wh)*100ybar<-sum((ay*wh)/100)ybar<-sum((wh/100)*ay)var_ybar<-sum((wh/100)^2*(sc^2/nh))Y_interval<-ybar+c(-1,1)*qnorm(1-alpha/2)*sqrt(var_ybar)P105.3.9題:下列數(shù)據(jù)是N=6,兩層單元數(shù)相同的人為總體。對(duì)n1=n2=2的一個(gè)分層隨機(jī)樣本:?jiǎn)栴}:列出所有可能的樣本;分別用比估計(jì)和聯(lián)合比估計(jì)來(lái)估計(jì)Ybar,計(jì)算估計(jì)的偏差及MSE;對(duì)上述結(jié)果進(jìn)行比較分析。解答:所有可能的樣本的數(shù)量為3*3=9,所有的樣本如下:{(3,0),(5,3),(8,6),(15,9)};{(3,0),(5,3),(8,6),(25,15)};{(3,0),(5,3),(25,15),(15,9)};{(3,0),(10,6),(8,6),(15,9)};{(3,0),(10,6),(8,6),(25,15)};{(3,0),(5,3),(15,9),(25,15)};{(10,6),(5,3),(8,6),(15,9)};{(10,6),(5,3),(8,6),(25,15)};{(10,6),(5,3),(25,15),(15,9)};(2)比估計(jì)的估計(jì)ybar為6.5;計(jì)算估計(jì)的方差為0.1048177,MSE為3.773437聯(lián)合比估計(jì)的估計(jì)ybar為6.5;計(jì)算估計(jì)的方差為0.06370523,MSE為2.293388。(3)答:從分別比估計(jì)和聯(lián)合比估計(jì)的偏差和均方誤差可以看出,聯(lián)合比估計(jì)的MSE(2.3)<比估計(jì)的MSE(3.78),且聯(lián)合比估計(jì)的均方誤差0.06<比估計(jì)的均方誤差0.1,所以說(shuō)聯(lián)合比估計(jì)要比分別估計(jì)好。各層的比率和總體的比率相差基本差不多,從整個(gè)樣本出發(fā)進(jìn)行的聯(lián)合比估計(jì)比基于每層的分別比估計(jì)更好一些,偏差更小,均方誤差也更小。以下為本體所有代碼:setwd('C:\\Users\\user\\Desktop\\新建文件夾')dat<-read.csv('syl3.9.csv',header=F)N<-6N1<-3n1<-2N2<-3n2<-2nh<-c(n1,n2)Nh<-c(N1,N2)X1<-sum(dat[,1])X2<-sum(dat[,3])yh<-c(mean(dat[,2]),mean(dat[,4],na.rm=T))xh<-c(mean(dat[,1]),mean(dat[,3],na.rm=T))wh<-c(N1,N2)/sum(N1+N2)fh<-c(n1/N1,n2/N2)nh<-c(n1,n2)sy2<-1:2sx2<-1:2sxy<-1:2sy2[1]<-sd(dat[,2])^2sy2[2]<-sd(dat[,4])^2sx2[1]<-sd(dat[,1])^2sx2[2]<-sd(dat[,3])^2sxy[1]<-cov(dat[,1],dat[,2])sxy[2]<-cov(dat[,3],dat[,4])#比估計(jì)rh<-yh/xhyrs<-sum(wh*Rh*xh)temp1<-wh^2*(1-fh)/nhtemp2<-sy2+rh^2*sx2-2*rh*sxyvy<-sum(temp1*temp2)temp3<-Nh^2*(1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論