作業(yè)和課堂實例數(shù)據(jù)統(tǒng)計方法匯總_第1頁
作業(yè)和課堂實例數(shù)據(jù)統(tǒng)計方法匯總_第2頁
作業(yè)和課堂實例數(shù)據(jù)統(tǒng)計方法匯總_第3頁
作業(yè)和課堂實例數(shù)據(jù)統(tǒng)計方法匯總_第4頁
作業(yè)和課堂實例數(shù)據(jù)統(tǒng)計方法匯總_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

*相對頻數(shù))的合計平均值=(數(shù)據(jù)總和)/(數(shù)據(jù)數(shù))中位數(shù)是一組數(shù)據(jù)中間位置上的代表值.其特點是不受數(shù)據(jù)均四分位數(shù)是指,將數(shù)據(jù)從小到大排列并分成4等份后,處于3=(組值-平均值)的平方*(相對頻數(shù))的合計通過S.D1個S.D2數(shù)據(jù)組XaYY平均值是數(shù)據(jù)X的平均值加上a,數(shù)據(jù)Y的方差和S.D.與數(shù)據(jù)X相比不變數(shù)據(jù)組XkYY平均值是數(shù)據(jù)X的平均值乘以k,數(shù)據(jù)Y的方差是數(shù)據(jù)X方差的k平方倍,S.D.是k倍平均值為0,S.D.為1通常用樣本空間S表示,S={正面,},而正面朝上這一特如果一個試驗可以分為循序的k1N12N2有的試驗結(jié)果的總數(shù)為N1*N2*N3...*Nk。種結(jié)果。所以試驗結(jié)果的總數(shù)是2X2=4從NnN和n這從Nn布在平均值、中位數(shù)和眾數(shù)周圍,之前我們有提到大約68%的數(shù)據(jù)在平均值的1個標準偏差內(nèi),95%的數(shù)據(jù)在平均值的2當X是呈正態(tài)分布N(μ,σ2)的隨數(shù)時:0,S.D1橫軸區(qū)間(μ1.96σμ1.96σ)內(nèi)的面積為式z=(x-μ)/σ回到標準正態(tài)分布(z即為數(shù)據(jù)與平z小于或者等于某個給定值的概率,直接帶入分布函數(shù)如:p(z<=1)=φ(1)=0.8413(1值左邊標準正態(tài)曲線如:P(-1<=z<=1.25P(z<=1.25)–P(z<=-1(1.25)-φ(1)如:P(z>1)1-P(z<=1)1-φ(1從上面的正態(tài)分布曲線圖可以知道,如果想加大預(yù)測95%預(yù)測命中區(qū)間為-1.96+1.96[μ-1.96σ,μ+1.96σ]樣本均值x是總體均值的u樣本比率pp看作一次試驗,那么x就有期望、方差、標準差和概率分布了(x的概率分布也就是x的抽樣分布)x的抽樣:樣本均值xx其中μx的標準差其中n,Nσσx是如果總體服從正態(tài)分布時:任何樣本容量下的x的抽樣分布其實在大多數(shù)的應(yīng)用中,樣本容量大于30x的抽樣分布近似服從正態(tài)概率分布樣本容量足夠大,并且np>=5和n(1-p)>=5,二項分布可用正態(tài)分布近似,p的抽樣分布可用正態(tài)分布來近到樣本均值的概率小于,0.05即50.01即1%或0.0010.10.1非常不可能的,這些叫做α水平。自己選擇一個α水平,然后規(guī)定如果獲得特定樣本均值的概率小于該α水平,那么就證明有效,通常我們會選擇α水平0.05,對于α水平0.05,在單尾檢驗和雙尾檢驗這兩種情形設(shè))或Ha(對立假設(shè))來表示。之間沒有顯著差異,將表示為當前總體參數(shù)μ等于干預(yù)后的要利用總體標準差σσuσ兩用s估計σ時,邊際誤差和總體均值的區(qū)間估計依據(jù)tttt標準正態(tài)分布的差別越??;t分布的均值為0。只有n-1t分 其中Eα已知;zα/2由置信水平確定如果σ未知,可通過以下方法確定σ的初始值:總體比率p的區(qū)間的估計由于抽樣前p所要的樣本容量,因此令p*表示p的計劃值。 系統(tǒng)),中一般根據(jù)客戶資產(chǎn)或者貢獻度把客戶分成私行客客戶,由外呼團隊批量。距離”,也就是后面要介紹的K-means。計算:x為簇內(nèi)樣本,u為簇的中心,E值越小,說明簇首先,給定樣本集D(也就是分類的個數(shù),DK個樣本作為初始向量。然后進入迭代,第一可;高效,時間復(fù)雜度為O(T*K*N)改進K,找到“拐點”。如下圖這種情況,當K=5時,聚類性能基本最終的聚類算法K值即可選擇為5。201%的客戶收入為200萬以上,那么我們在做歸一化處理時,不妨選取99%客戶收入的最大值為最大值,那1%的收入直接置為1即可。YX它的相應(yīng)表達式為:Y=a+b×X+e。其中ay軸截距,b是回歸線斜率,e是誤差項。為擬合最好的那條回歸線(a和b的值),最常規(guī)的方法下一年度的銷售量,那么銷售量Y就是因變量。通過市場Logistic回歸一般用于判斷成功/失敗的概率,如果因變LogisticY是一個值域為[0,1]的值,可以用下方odds=p/(1-p)=發(fā)生概率/未發(fā)生概ln(odds)=ln(p/(1-p))logit(p)=ln(p/(1-p))= Logistic回歸使用了對數(shù)函數(shù)求解參數(shù)。Logistic回歸無需依賴自變量和因變量之間的線性關(guān)系,為了避免過擬合和欠擬合,Logistic回歸需要包含所有重Logistic回歸對樣本大小有較高要求,因為對于過小的數(shù)沒有關(guān)系(即原假設(shè),H0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論