統(tǒng)計學原理復習重點概述_第1頁
統(tǒng)計學原理復習重點概述_第2頁
統(tǒng)計學原理復習重點概述_第3頁
統(tǒng)計學原理復習重點概述_第4頁
統(tǒng)計學原理復習重點概述_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第一章緒論。本章介紹統(tǒng)計學及有關概念,勾勒了本課程的框架構造——描(一)統(tǒng)計工作(統(tǒng)計的基本含義(二)(三)(四)1代表人物:英國的威廉·配第(1623-1687)、約翰·格朗特(1620-1674)威廉·配第的代表著《政治算術》對當時的英、荷、法等國的“國富和力能夠說,威廉·2、記述學派(代表人物:德國的康令阿亨瓦爾(1719-1772;1764年首創(chuàng)統(tǒng)計學一詞 3代表人物:比利時的凱特勒(1796-古典統(tǒng)計學時期(17世紀中后期~18世紀中后期圖表學派:近代統(tǒng)計學時期(18世紀末~19世紀末當代統(tǒng)計學時期(20世紀初至今)重要成果:借助計算機手段,1、描述統(tǒng)計學(descriptive2、推斷統(tǒng)計學(inferential研究如何根據(jù)樣本數(shù)據(jù)去推斷總體數(shù)量特性1、理論統(tǒng)計學(theoretical2、應用統(tǒng)計學(applied(一)1研究對象不同研究辦法不同2.()統(tǒng)計的研究對象、特點:界限等1、數(shù)量性交換活動、分派活動、消費活動等統(tǒng)計查、實統(tǒng)計收集統(tǒng)計查、實統(tǒng)計收集推斷統(tǒng)整理資料整理資料開發(fā)總體同質 是擬定總體的前提和基礎。它是根據(jù)統(tǒng)計的研究目的而定的大量性 樣本由總體的部分單位構成的集合稱為樣本(又稱子樣品質標志數(shù)量標志不變標志 一種總體中各單位某標志的具體體現(xiàn)都相似,稱之為不變標志。不變標是總體同質性的基礎。一種總體最少要有一種不變標志,才干夠使各單位結合成一種總變異標志統(tǒng)計指標是反映統(tǒng)計總體數(shù)量特性的概念和數(shù)值。如我國國內(nèi)生產(chǎn)總值104790.6標標標 ::×:(一)(二)(三)(四)1234(“同類”“大戶”5▼重點調(diào)查、典型調(diào)查與抽樣調(diào)查的不同1、訪問調(diào)查(派員調(diào)查):35統(tǒng)計數(shù)據(jù)的整頓(summarizingdata)是指對所收集的數(shù)據(jù)進行加工整頓、使之系統(tǒng)化、條統(tǒng)計數(shù)據(jù)的整頓◎統(tǒng)計分組標志:分組時所根據(jù)的特性或原則,有品質標志和數(shù)量標志◎頻數(shù)分布或次數(shù)分布(Frequencydistribution):分布在各組內(nèi)的數(shù)據(jù)個數(shù)稱為頻數(shù)或 frequencydistributionisatabularsummaryofasetofdatashowingthefrequency(ornumber)ofitemsineachofseveralnonoverlappingclasses.◎相對頻數(shù)(Relativefrequency)/頻率/比重:Therelativefrequencyofaclassistheproportionofthetotalnumberofdataitemsbelongingtotheclass.(=Frequencyoftheclass/n)◎百分數(shù)頻數(shù)(Percentagefrequency):istherelativefrequencymultipliedby擬定組數(shù)→?擬定組距→?(按組)第一步,擬定組數(shù)(Numberofclasses)。組數(shù)的擬定普通視數(shù)據(jù)本身的特點及數(shù)5~20KK1log第二步,擬定組距(Widthofclasses):組距是一種組的上限與下限之差,可根據(jù)組距=(最大值-最小值)/第三步,擬定各組組限(Classlimits)1、分組所遵照的重要原則是“不重不漏”(eachdatavaluebelongstooneclassandonlyoneclass)。因此,最低組限(Thelowerclasslimit)≤數(shù)據(jù)的最小值,最大組限(Theupperclasslimit)≥數(shù)據(jù)的最大值;另外,數(shù)據(jù)在每組中的歸屬習慣上采用“上組限不在內(nèi)”2、對離散型數(shù)據(jù),可采用相鄰兩組組限間斷的措施解決“不重”的問題(6~10,11~15,16~20等1組和最后一組可采用“XX下列”及“XX以上”/組距3、有時為了統(tǒng)計需要,需進一步計算累積頻數(shù)(某數(shù)值以上或下列的頻之數(shù)和統(tǒng)計分組的概念、原則、則和辦法統(tǒng)計表(14word文檔分派數(shù)列/重要有鐘形分布、UJ形分布。集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向均值(Mean)均值就是一組數(shù)據(jù)的平均值(averagevalue),用來測度中心位置(central1算算術平均數(shù)總體標志總總體單位總加權算術平均Xi為各組變量代表值(往往取組中值,F(xiàn)i為各組變量值出現(xiàn)的頻數(shù)。算術均值xy,它們的代數(shù)和的算術平均數(shù)等于兩個變量的算術平均數(shù)的2、NN幾何平均數(shù)的應用及特點107.5%,108.3%,109.3%,則各年的平均發(fā)展31.0751.083G31.0751.08326%355%3%G101.0621.0531.0354.2%調(diào)和平均數(shù),是各數(shù)據(jù)倒數(shù)的(簡樸)價格=雞蛋種價格(元銷售額(元ABCXH

1

152008000 7.8115200180001

x(個(萬元253x

8550095160010580096.03%5001600800中位數(shù)中位數(shù)是一組數(shù)據(jù)按大小排序后,處在中間位置上的變量值1、對于未分組數(shù)據(jù)Me

XN12 2 如果1據(jù)個數(shù)為偶數(shù),Me XNXN22 21 中位數(shù)的位置=中位數(shù)的位置= 2n對于M

L

2fm

mMeU

f2f

m式中:m為中位數(shù)所在的組,dL、U分別為該組的下限值與上限值,fm為該組的頻數(shù),Sm-1Sm+1Sm1fmSm1眾數(shù)MMLfmo(f )(f )MMUfmo(f )(f )式中:fm為某數(shù)值出現(xiàn)次數(shù)(頻數(shù))最多的組(m組)fm-1fm+1m-1m+1L、Um組的下限與上限值,d2、對描述品質數(shù)據(jù)的分布特性的“位置”四、1、如果數(shù)據(jù)具有單一眾數(shù),且分布是對稱的,則眾數(shù)Mo中位數(shù)Me與均值X相等MoMe2、對于非對稱分布當分布左偏時(說明存在極端小的值XXMeMo當分布右偏時(說明存在極端大的值XXMeMoMXMX1 Xe3O1、均值4、對靠近正態(tài)的分布數(shù)據(jù),慣用均值描述數(shù)據(jù)的集中趨勢;對偏態(tài)分布,慣用眾數(shù)中位數(shù)極差Range=LargestValue-Smallest▲

R=最高組上限 最低組下1、方差方差是各變量值與其均值離差(deviationaboutthemean)平方的平均數(shù)總體方差(Populationσ2其中:FiiXii個數(shù)(未分組)i組組中值(分組樣本方差(SampleS2其中:fiixii個數(shù)(未分組)i組組中值(分組原則差:方差的平方根(正2、原則差是對方差的開方運算,因此,其單位與原始數(shù)據(jù)的單位一致(原則差就是指數(shù)據(jù)“離散程度的測度值”距“均值”的距離離散系數(shù)(Coefficientof離散系數(shù):一組數(shù)據(jù)原則差與其均值的比,也稱為原則差系數(shù)四、離散系數(shù)(Coefficientof一一一一一一一一一一一一一一 一一一一 一一一一 例:五個班級規(guī)模的例中2、由于離散系數(shù)偏態(tài)(Skewness)和峰度(Kurtosis)測定偏態(tài)的辦法重要有兩種算術平均數(shù)<中位數(shù)<偏態(tài)=算術平均數(shù)-眾數(shù)這是偏態(tài)的絕對數(shù)SKp

XMoσSKp3(XMeσSKp

44460.279(二) a 一一 k一一一一一一(XN一一一 X k一一 當a=0時,即數(shù)據(jù)以原點為中心,上式稱為原點k階動差(矩當a

時,數(shù)據(jù)以算術平均數(shù)為中心,上式稱為中心k階統(tǒng)計學中常以中心3階動差(矩)來測度分布的偏K(XiX)Ki3i KiKi3=0時,為對稱分布3>0時,為正偏(右偏)分布3<0時,為負偏(左偏)分布班級規(guī)模3階動差矩計算的峰度某種頻數(shù)分布的曲線與正態(tài)分布曲線相比,是尖頂,還是平頂,其尖峰度4階動差為基礎進行α α K(XX)4ii4Kii量N表達。n表達。大樣本和小樣本:n≥30時稱大樣本,n<30**應用:4015人進行健康狀況調(diào)查,概率抽樣:**應用舉例:(三)重復(置)抽樣與不重CnCn N(N-不不不不不不不不不不不不不不不不不不不不不不不不不不不不

PnPnN(N-

52Nn-(Nn-(N-總體參數(shù): ,其中具有某種屬性的 單位,不具有某種屬性的 個單位,XXXi 或XNNmi Xifimfii⒈總體平均數(shù)(又叫總體均值設總體中N個總體單位某項標志的標志值分別為X1,X2XN,其中具有某種屬性的有N1個單位,不具有某種屬性的有N0個單位,則1NN21mmXX2iiiσ21NNXX2σ2 imm2ii⒉⒊PPN1,QN01NNσ2P1P⒋總體⒌總體是非標志的標準差P⒍總體是非標志的 P1P nmxi 或xi1 xinmfii⒈樣本平均數(shù)(又叫樣本均值分別為x1x2xn,其中具有和不具有某為為自⒉樣本單位標志值的標準1n1nxx21mxx2ii為mif1i⒊樣本單位標志值的方差s21n1nxx21mxx2is2imi1ppn1,qn01nnsp2nnp1pnn⒋⒌σP的 pnn n1⒍P的 1 lim n

當樣本容量n充分大時,可以用當試驗次數(shù)n可以olimpm當試驗次數(shù)n可以o XX~N nE(x)(xX 1nx~N( E(p)(p 1np~N(P,P1Pn)np5,n(1p)5統(tǒng)統(tǒng)計誤差? 誤??代 ?????????均誤的抽的抽樣平均誤差M第i個可能樣本的平式中x為樣本平x數(shù)X為總體平均抽樣實際誤差:抽樣平均誤差:樣本估計值的標準差。抽樣極限允許誤差置信區(qū)間抽樣誤差的可能范圍周圍變動的范圍,記作ΔμμxM MxX2ii數(shù),即樣本估計量注意:不要混淆抽為標準差與樣本標準差!數(shù)S(xx)2n1 樣本單位數(shù)的多少:簡單隨機抽樣的抽σ(xσ(xσ(xσ(xnNnNσP(1(σP(1(nσP(1(nNN(()P 在 斷 (()nnt x±xp±Δ由于提高把握程度,會增大允許誤差,由于提高把握程度,會增大允許誤差,個允許誤差范圍再求相應的把握程度。系,常用Z值及相應的概率保證程度1αxx pz ?σσσn?σσσnαxsnxσsnxσσnxS 總體均值區(qū)間估計總結1 XXα2σnX Nα2 NX所服從的分 N NXα2 NnNXtα2Sn N Ntn1)總體均值區(qū)間估計總結2或nσXSnNnN或SnnNnNX NXμ近似服σX Nσ標準正態(tài)分布求置信區(qū)間即可。(Δ,F(xiàn)(tF(t⑴給出Δ,求 抽取樣本,計算樣本指標(樣本平均數(shù)、樣本方差、抽樣平均誤差②根據(jù)給定的抽樣誤差——允許誤差Δt,F(xiàn)(tF(t 抽取樣本,計算樣本指標(樣本平均數(shù)、樣本方差、抽樣平均誤差F(t③求出抽樣極限誤差Δ和預計區(qū)間的上、下限,對總體參數(shù)作區(qū)間預計。,四、zzσzXF(z)1當當抽樣平均誤差保持不變時,極限誤差Δ(體現(xiàn)估計精度)概率度z(體現(xiàn)可靠性)兩者同向變化。因此,抽樣估計的精度與可靠性之間存在矛盾。為了調(diào)和這一矛盾的,可以低抽樣平均誤差。而要降低σ,則必須增加樣本容量n。樣容量n究竟取多x 必要的樣不超過給定的允許誤差范圍時至少應該抽取的樣本單位稱必n zα2n zα2p12 2σnn Nzα2p1N2 2p122 N2n N2Nzα1 nx2zαn 12345?–––?? 第五章假設檢查與方差分析。理解原假設、備擇假設、兩類錯誤、單側檢假設(hypothesis)假設檢查(hypothesistest)是先對總體參數(shù)提出某種假設,然后運用樣本信息判(一)原假設(nullhypothesis),又稱零假設,用 備擇假設(alternativehypothesis),用 設μ0表示在原假設和備擇假設中考慮的某一特定數(shù)值,μ表示總體的實際值。對總體H0⑴⑵⑶H1:μpH1:μ第Ⅰ類錯誤/棄真錯誤(typeⅠα。第Ⅱ類錯誤/取偽錯誤(typeⅡβ。顯著性水平0.05和0.01。(一)擬定檢查的明顯性水 用明顯性水平來擬定回絕原假 的檢查統(tǒng)計量的臨界值、回絕域回絕原假 ,否則不回絕原假 或⑵根據(jù)第5步的檢查統(tǒng)計量的值計 值。運 值來擬定與否回絕當總體方差σ2已知,用正態(tài)分布來檢驗總⑴當樣本數(shù)n30(大樣本)時的任意分布總體(根據(jù)中心極限定理);⑵當樣本數(shù)np30 sn一般用P來表示總體比例0表示總體比例因為是大樣本,中心極限定理保證了統(tǒng)計量p(()0H1:μ≠0于為α態(tài)量的數(shù)過大或過小,都將否定著α件每尾假2為Z Z≥Z時H0Z<Z就 α2α2Zα(臨界值2Zα(臨界值21方法1:選擇檢驗統(tǒng)計UXμ6.16 的95%nX1.96σ6.11.96 右邊檢 左邊檢αα接受 否定 否定 接受再查得臨界值Zα1.645ZαH:65分;H:65ZX6965n因為ZZ,檢驗統(tǒng)計量的數(shù)值落在否定域內(nèi),否定原假設,說明樣本平均數(shù)6分與總體平均數(shù)6分存在顯著差異,即新的教學方法提高了學生的成績。(右邊檢驗0.05時,Z1H0:1千克;H1:1ZX0.99621n因為Z1.64,所以認為抽樣平均數(shù)x0.9962千克與總體平均數(shù)無顯著差異,可以相信該廠生產(chǎn)的某飲料平均重量1千克。(左邊檢驗2一、區(qū)間估計與假設檢驗的1-(1)橘黃、(2)粉紅、(3)綠色、(4)無制制制制制制制制制制制制制制制制制制制制,隨機抽取了5家超市前一期的銷售量(表水平進一步的F 一一一一一一一一 一 一一 一一一 設xij=第j個子樣本中第i個觀測值nj=第j個子樣本的樣本nxj

nj=第j個子樣本的樣本rnxj1

n=全體子樣本合并的大樣本的其中 r為子樣本個于是,大樣本的總離差平方和(SumofSquaresfor n

j1

x)2設xij=第j個子樣本中第i個觀測值nj=第j個子樣本的樣本nxj

nj=第j個子樣本的樣本rnxj1

n=全體子樣本合并的大樣本的其中 r為子樣本個于是,大樣本的總離差平方和(SumofSquaresfor n

j1

x)2rn

rn

rn(xijj1

x)2(xjj1j

x)2(xjjj1jj

x rn nj(xj

x)2(xj1

x)2jj第一項變量系統(tǒng)性影響,可當作一一一一一一一mofqresforFctor,SS);第二項(),可當作一一一一一一一(mofqresforrror,E。 一一一一一一一一一一一一一用離差平方和除以自由度即得到平均平方(Mean(方差合并的(擴大的)樣本方差:TSS/(n-水平間方差(組間方差 MSA=SSA/(r-水平內(nèi)方差(組內(nèi)方差 MSE=SSE/(n-F對原假設: 按按數(shù)列中所排列指標的表現(xiàn)形式不同 a1,a2,,aN1,aNNa0,a1,,an1,aaaa 12NNN N aN1aaa N12NN N※ aN1aNa a2 a3 a4 2a2a3a4 51a1一般有:a22NN2※aa2a42a32a22a1aa 2fa 1f N22 2Nf1f2fN※a1aa2a1a21a2a31a3a4 112a32a2a1caiibi則cbcaaNacb b b b1c a1caa2 aN N2 1b2 bN N2 abcaa1a2 aN1aN 1bb2 1N2N anan1anaia0ai1a0ai ,,ana1a0,a2a0a1a0,a2a1 ,ana0,a1 ,an1, i i,平均增長量 n (aiai1n aa1,a2 ,,,a1,a2a0,a1 ,an1, (iaiaian1an a1a2 , 說明 aiLaiLaiaia0aiai1ana0a 100a0aaaiai1 100 nn0Xn,X,aa X ,a Xn XGRnX nn X517695.32.0678XG1115.64﹪100﹪ 已知a0XG和n,則最末水平ana0Xn:n已知a0XG和an,所需要的時間為:nlganlglgXana0m20 56.6萬噸:由2man有,mlganlglg mlg40500lg79862.34番lg 1G14 1 nn實際水平推算水平aaaXnnnii X2X,n,aaX X ,aa Xa Xn 已已知a015a1a2a360n則3 X2na00, X40,解得X32n①逐漸逼近 ②查“累計法查對表” 影響時間數(shù)列變動的因素可分影響時間數(shù)列變動的因素可分a0Xn X 2n:1T2S 3C4 I————先綜先綜合,后對比p銷售量指數(shù)Iq0銷售額銷售量價格指數(shù)Ipqpqq0ppqqq0q0原理:引入一個媒介因素同度量因素,解決不能直接加總的問題。2.將同度量因素固定于某一時期商品價格(元銷售銷售額(百元商單基報告基報告大百公豬公服件冰臺合同度量因素固定在報告期(報告期加權綜合指數(shù)P

P

70500111.55%

q070500105.48%7050063200

百元

q1p1q070500668403660(百元氏同度量因素固定在基期(基期加權綜合指數(shù)L

L q1p0

q066840113.15%絕對p1q066840590707770(百元

63200106.99%q1p0q063200590704130(百元四、拉氏指數(shù)與帕氏指數(shù)的比L

P 絕對數(shù)分

p1q0

PP1L Vrip

因為ViVi (例如價格與銷售量)123質量指標和數(shù)量指標的水平都下降,但在其中一個的下降速率加快的同時,另一個的下降速率則在減緩。五、綜合指數(shù)的其(一)馬歇爾——埃奇沃斯指數(shù)(馬——埃公式是對拉氏指數(shù)和帕氏指數(shù)的權數(shù)(同度量因素)進行平均(權交叉)的結果。pq0pE p

p1(q0q1)

p1q0

q02p0

p0(q0

p0q0E

q1(p0p1)

0 0

p02

(

p1

(二)理想指數(shù)(費雪公式 LpLpp0q0p1q0qq0p0q0q1p0q1 p1qc

Iq1pc q0我國的工業(yè)生產(chǎn)指數(shù)

q1q0

q2000q1995 計算每一個項目的個體指數(shù)ip1或iq 0選定權數(shù),計算個體指數(shù)的加權算術平均數(shù)或加權調(diào)和平均x

Hmxm權數(shù)p0q0

不不

不不不不不不不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論