賈俊平-統(tǒng)計學-總結_第1頁
賈俊平-統(tǒng)計學-總結_第2頁
賈俊平-統(tǒng)計學-總結_第3頁
賈俊平-統(tǒng)計學-總結_第4頁
賈俊平-統(tǒng)計學-總結_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第一章導論概念:統(tǒng)計學:收集、處理、分析、解釋數(shù)據(jù)井從數(shù)據(jù)中得出結論的科學。統(tǒng)計的分類:描述統(tǒng)計:研究的是數(shù)據(jù)收集,處理,匯總,圖表描述,文字概括與分析等統(tǒng)計方法。推斷統(tǒng)計:是研究如何利用樣木數(shù)據(jù)進行推斷總體特征。數(shù)據(jù):1 .分類數(shù)據(jù):對事物進行分類的結果數(shù)據(jù),表現(xiàn)為類別,用文字來表述。例如,人口按性別 分為男、女兩類2 .順序數(shù)據(jù)對事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,產(chǎn)品分為一等品、 二等品、三等品、次品等3 .數(shù)值型數(shù)據(jù)對事物的精確測度,結果表現(xiàn)為具體的數(shù)值。例如:身高為175cm, 190cm, 200cm參數(shù):描述總體特征。有總體均值(口)、標準差()總體比例(T)統(tǒng)

2、計量:描述樣本特征,樣本標準差,樣木比例(p)統(tǒng)計方法統(tǒng)計數(shù)據(jù)的分類按計層次按收集方法按時間狀況第二章數(shù)據(jù)的搜集1 .數(shù)據(jù)來源包括直接來源(一手數(shù)據(jù))和間接來源(二手數(shù)據(jù))2 .抽樣方式包括概率抽樣與非概率抽樣3 .概率抽樣:也稱隨機抽樣。按一定的概率以隨機原則抽取樣本,抽取樣本時使每個單位都 有一定的機會被抽中。5 .抽樣誤差:是由抽樣的隨機性引起的樣本結果與總體真值之間的誤差。抽樣誤 差并不是針對某個樣本的檢測結果與總體真是結果的差異而言,抽樣誤差描述 的是所有樣本可能的結果與總體真值之間的平均差異。6 .抽樣誤差的大小與樣本量的大小和總體的變異程度有關。第三章數(shù)據(jù)的圖表展示計算機實訓內(nèi)容

3、,要求:1 .數(shù)據(jù)篩選,自動篩選2 .高級篩選,3 .數(shù)據(jù)排序4 .分類匯總-利用數(shù)據(jù)透視表5 .對比條形圖6 .環(huán)形圖7 .累計頻數(shù)圖8 .散點圖9 .雷達圖等等頻數(shù)分布圖兩種方法:工具-數(shù)據(jù)分析-直方圖數(shù)值型和順序數(shù)據(jù) 數(shù)據(jù)-數(shù)據(jù)透視表數(shù)據(jù)透視表第四章數(shù)據(jù)的概括性度量集中趨勢:算數(shù)平均數(shù):幾何平均數(shù):指n個觀察值連乘積的n次方根,計算平均發(fā)展速度時復利下的 平均年利率,最常用的一種計算公式為,幾何平均數(shù)二算術平均數(shù)。中位數(shù):有限的數(shù)集,可以通過把所有觀察值高低排序后找出正中間的一個作為 中位數(shù)。(平均家庭收入)(記憶的重要性)離散程度:異眾比率:異眾比率指的是總體中非眾數(shù)次數(shù)與總體全部次數(shù)

4、之比。(了解)四分位差:(了解) 方差:var標準差:STD EV平均差相對位置的度量:標準分數(shù):離散系數(shù): 形狀:偏態(tài):SK>0 ,正值,正偏或者右偏,SK<0 ,負值,負偏或者左偏, 絕對值0 0.5, 1三個界線。公右偏分布,小數(shù)集中八左儡分布,大數(shù)集41峰態(tài):K>0 ,尖峰,數(shù)據(jù)分布集中,KvO ,扁平,數(shù)據(jù)分布分散。第五章概率與概率分布L概率的分類:1.概率的古典定義,概率的統(tǒng)計定義,概率的主觀定義。2 .期望值:在離散型隨機變量X的一切可能取值的完備組中,各可能取值總與其取相對應 的概率出乘積之和,描述離散型隨機變量取值的集中程度,記作E(X),或者以,其實為加權

5、 平均數(shù)。3 .二項分布的數(shù)學期望為E (X) = np方差為D (X) = npq標準差?區(qū)別二項分布的概率值與期望值。4 .當二項分布中n很大,p很小時,二項分布就變成為Poisson分布計算機計算二項分布計算時候,已知:1,目標概率 2,實驗次數(shù) 3,成功次數(shù)公式:0歌黑震(目標概率產(chǎn)功的次數(shù)(1-目標概率泮的次數(shù)二I頁分布換泊松分布,已知:1,入= np=l*2 2 ,成功的次數(shù)(揉合在一起,因為都是那種目標概率小、實驗次數(shù)多的實購)入=數(shù)學期望值E(X):方差DQ() = npP119例子,P121例子5 .正態(tài)分布主要特點:鐘型,離H近的概率大,離H遠的概率小。標準差小,集中;標準

6、差大,分散。正態(tài)曲線的最高點在均值H,它也是分布的中位數(shù)和眾數(shù)。正態(tài)分布是一個分布族,每一特定正態(tài)分布通過由值聞標準差。來區(qū)分。曲線f(x)相對于均值網(wǎng)稱,尾端向兩個方向無限延伸,目理論上永遠不會 與橫軸相交正態(tài)曲線下的總面積等于1。計算機計算:已知:1,正態(tài)分布(的形狀)(H與。),2.臨界值(右端值,即默認計算 的是改值以左部分的面積)6 .標準正態(tài)分布:期望值卜=0,(即曲線圖象對稱軸為Y軸),標準差。=1條件下的正態(tài)分布,記為N(0,1)。(N是正態(tài)英文的首字母)計算:由于形狀已知(N(0,1),所以只需要知道臨界值(右端值)7 .此段內(nèi)容只供理解,不是知識。概率函數(shù):橫軸表示“統(tǒng)計對

7、象”,縱軸表示“概率"。故稱概率函數(shù)。概率密度函數(shù):將直方圖組距縮小到很密的程度,故稱概率密度函數(shù)。分布函數(shù):分布函數(shù)F(x)在x處的函數(shù)值就表示X落在區(qū)間(-8,x上的概率。(把概率函 數(shù)的面枳轉換成分布函數(shù)的縱軸值)所以:找一個的具體值的概率應該在密度函數(shù)上的值,范圍區(qū)間(-8,x是在分布函數(shù)上的 值,一個范圍區(qū)間(X1X2 )是分布函數(shù)上X2的值XT的值8.正態(tài)分布的3。原則:只要是正態(tài)分布,不論標準與否,(可以反過來理解)數(shù)值分布在(HP,n+o)中的概率為0.6826數(shù)值分布在(H2(j,h+2o)中的概率為0.9544數(shù)值分布在(火3。串+刈中的概率為0.9974可以認為

8、,Y的取值幾乎全部集中在(氏3。串+3。)區(qū)間內(nèi),超出這個范圍的可能性僅占不到0.00269 .正態(tài)分布表0 Gx)=1 0(x)10 .其他公式:?(«<x<6>0(6) 0(a)P(|X| <)=2 -111 .正態(tài)分布的標準化公式:Z=(X-n)/aN(0,l) ( EXCEL實例)樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為內(nèi)方差為aA2/n的正態(tài)分布。(那么標準差呢?)理解:m為總體個數(shù),n為抽樣時每個樣本的個數(shù),可以抽出C;個樣本,這些樣本符合正態(tài)分布。第七章:參數(shù)估計L參數(shù)估計:根據(jù)統(tǒng)計量計算推斷出總體低的參數(shù),包括點估計和區(qū)間估計2 .點估計:點估計3 .區(qū)間估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論