賈俊平統(tǒng)計學總結_第1頁
賈俊平統(tǒng)計學總結_第2頁
賈俊平統(tǒng)計學總結_第3頁
賈俊平統(tǒng)計學總結_第4頁
賈俊平統(tǒng)計學總結_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、概念:第一章導論統(tǒng)計學:收集、處理、分析、解釋數(shù)據(jù)井從數(shù)據(jù)中得出結論的科學。統(tǒng)計的分類:描述統(tǒng)計:研究的是數(shù)據(jù)收集,處理,匯總,圖表描述,文字概括與分析等統(tǒng)計方法。推斷統(tǒng)計:是研究如何利用樣木數(shù)據(jù)進行推斷總體特征。數(shù)據(jù):1 .分類數(shù)據(jù):對事物進行分類的結果數(shù)據(jù),表現(xiàn)為類別,用文字來表述。例如,人口按性別分為男、女兩類2 .順序數(shù)據(jù)對事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,產(chǎn)品分為一等品、二等品、三等品、次品等3 .數(shù)值型數(shù)據(jù)對事物的精確測度,結果表現(xiàn)為具體的數(shù)值。例如:身高為175cm,190cm,200cm參數(shù):描述總體特征。有總體均值(科)、標準差()總體比例(T)統(tǒng)計量:描

2、述樣本特征,樣本標準差(s),樣木比例(p)描述統(tǒng)計推斷價計參數(shù)估計假設檢驗統(tǒng)計數(shù)據(jù)的分類據(jù)第二擲數(shù)據(jù)的搜H1.數(shù)據(jù)來源包括直接來源(一手數(shù)據(jù))和間接來源(二手數(shù)據(jù))2 .抽樣方式包括概率抽樣與非概率抽樣3 .概率抽樣:也稱隨機抽樣。按一定的概率以隨機原則抽取樣本,抽取樣本時使每個單位都有一定的機會被抽中。概率抽樣簡單隨機分層抽樣整群抽樣系飆徉多階段抽樣4.5 .抽樣誤差:是由抽樣的隨機性引起的樣本結果與總體真值之間的誤差。抽樣誤差并不是針對某個樣本的檢測結果與總體真是結果的差異而言,抽樣誤差描述的是所有樣本可能的結果與總體真值之間的平均差異。6 .抽樣誤差的大小與樣本量的大小和總體的變異程度

3、有關。第三章數(shù)據(jù)的圖表展示計算機實訓內(nèi)容,要求:1 .數(shù)據(jù)篩選,自動篩選2 .高級篩選,3 .數(shù)據(jù)排序4 .分類匯總-利用數(shù)據(jù)透視表5 .對比條形圖6 .環(huán)形圖7 .累計頻數(shù)圖8 .散點圖9 .雷達圖等等頻數(shù)分布圖兩種方法:工具-數(shù)據(jù)分析-直方圖數(shù)值型和順序數(shù)據(jù)數(shù)據(jù)-數(shù)據(jù)透視表數(shù)據(jù)透視表第四章數(shù)據(jù)的概括性度量集中趨勢:算數(shù)平均數(shù):幾何平均數(shù):指n個觀察值連乘積的n次方根,計算平均發(fā)展速度時復利下的平均年利率,最常用的一種計算公式為,幾何平均數(shù)0算術平均數(shù)。中位數(shù):有限的數(shù)集,可以通過把所有觀察值高低排序后找出正中間的一個作為中位數(shù)。(平均家庭收入)(記憶的重要性)離散程度:異眾比率:異眾比率指

4、的是總體中非眾數(shù)次數(shù)與總體全部次數(shù)之比。(了解)四分位差:(了解)方差:var標準差:STDEV平均差:相對位置的度?。簶藴史謹?shù):離散系數(shù):形狀:偏態(tài):SK>0,正值,正偏或者右偏,SK<0,負值,負偏或者左偏,絕對值0,0.5,1三個界線。右偏分布左偏分布峰態(tài):K>0,尖峰,數(shù)據(jù)分布集中,K<0,扁平,數(shù)據(jù)分布分散。第五章概率與概率分布1 .概率的分類:1.概率的古典定義,概率的統(tǒng)計定義,概率的主觀定義。2 .期望值:在離散型隨機變量X的一切可能取值的完備組中,各可能取值xi與其取相對應的概率pi乘積之和,描述離散型隨機變量取值的集中程度,記作E(X),或者小其實為加

5、權平均數(shù)。3 .二項分布的數(shù)學期望為np方差為npq標準差?區(qū)別二項分布的概率值與期望值。4 .當二項分布中n很大,p很小時,二項分布就變成為Poisson分布計算機計算二項分布計算時候,已知:1,目標概率2,實驗次數(shù)3,成功次數(shù)公式:c£藍魯(目標概率)成功的次數(shù)(1-目標概率)失敗的次數(shù)二項分布換泊松分布,已知:1,入=np=1*22,成功的次數(shù)(揉合在一起,因為都是那種目標概率小、實驗次數(shù)多的實驗)入=數(shù)學期望值E(X)=方差D(X)=npP119例子,P121例子5 .正態(tài)分布主要特點:鐘型,離科近的概率大,離d遠的概率小。標準差小,集中;標準差大,分散。正態(tài)曲線的最高點在均

6、值j它也是分布的中位數(shù)和眾數(shù)。正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值科和標準差b來區(qū)分。曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相交正態(tài)曲線下的總面積等于1。計算機計算:已知:1,正態(tài)分布(的形狀)(科與b),2.臨界值(右端值,即默認計算的是改值以左部分的面積)6 .標準正態(tài)分布:期望值科=0,(即曲線圖象對稱軸為Y軸),標準差0=1條件下的正態(tài)分布,記為N(0,1)。(N是正態(tài)英文的首字母)計算:由于形狀已知(N(0,1),所以只需要知道臨界值(右端值)7 .此段內(nèi)容只供理解,不是知識。概率函數(shù):橫軸表示“統(tǒng)計對象”,縱軸表示“概率”。故稱概率函數(shù)

7、。概率密度函數(shù):將直方圖組距縮小到很密的程度,故稱概率密度函數(shù)。分布函數(shù):分布函數(shù)F(x)在x處的函數(shù)值就表示X落在區(qū)間(-8,x上的概率。(把概率函數(shù)的面積轉換成分布函數(shù)的縱軸值)所以:找一個的具體值的概率應該在密度函數(shù)上的值,范圍區(qū)間(-8,x是在分布函數(shù)上的值,一個范圍區(qū)間(X1X2)是分布函數(shù)上X2的值-X1的值8 .正態(tài)分布的3b原則:只要是正態(tài)分布,不論標準與否,(可以反過來理解)數(shù)值分布在(四/b)中的概率為0.6826數(shù)值分布在(四-2b,四+2昉中的概率為0.9544數(shù)值分布在(四-3b,四+3昉中的概率為0.9974可以認為,Y的取值幾乎全部集中在(叱33四+3切區(qū)間內(nèi),超

8、出這個范圍的可能性僅占不到0.00269 .正態(tài)分布表"1-10 .其他公式:P(a<X<b)-(b)-0P(|X|<a)=20(a)-111 .正態(tài)分布的標準化公式:Z=(X-泊/bN(0,1)(EXCEL實例)樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為方差為0A2/n的正態(tài)分布。(那么標準差呢?)正態(tài)分布正態(tài)分布正態(tài)分布理解:m為總體個數(shù),n為抽樣時每個樣本的個數(shù),可以抽出C:個樣本,這些樣本符合正態(tài)分布。第七章:參數(shù)估計1 .參數(shù)估計:根據(jù)統(tǒng)計量計算推斷出總體低的參數(shù),包括點估計和區(qū)間估計2 .點估計:點估計3 .區(qū)間估計:條件1.均值2.標準差3.置信水平(區(qū)間應包括幾個標準差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論