




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
關于中小型銀行大數(shù)據(jù)的統(tǒng)計分析學院專業(yè)*****班級***學號*****姓名指導教師沈陽航空航天大學年月目錄TOC\o"1-3"\h\u前言 1一、采集樣本及數(shù)據(jù)整理 21、數(shù)據(jù)的搜集方法及說明 22、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明 53、畫出直方圖和折線圖并給出說明 54、畫出經(jīng)驗分布函數(shù) 7二、假定總體服從正態(tài)分布,給出,的估計 81、矩估計法 82、極大似然估計 8三、參數(shù)區(qū)間估計 101、方差未知,求數(shù)學期望的置信區(qū)間 102、數(shù)學期望,均未知,求方差的置信區(qū)間 10四、參數(shù)的假設檢驗 11 11檢驗 11五、非參數(shù)假設檢驗 13六、結(jié)論 15參考文獻 16前言數(shù)理統(tǒng)計是一門對隨機現(xiàn)象進行有限次的觀測或試驗的結(jié)果進行數(shù)量研究,并依之對總體的數(shù)理規(guī)律性作出具有一定可靠性推斷的應用數(shù)學學科。也就是說,數(shù)理統(tǒng)計學是統(tǒng)計學的數(shù)學根底,它是研究怎樣有效地收集、整理和分析帶有隨機性的數(shù)據(jù),以對所考察的問題作出推斷和預測,直至為采取一定的決策和行動提供依據(jù)和建議的數(shù)學分支。近幾十年來,數(shù)理統(tǒng)計的廣泛應用是非常引人注目的。在社會科學中,選舉人對政府意見的調(diào)查、民意測驗、經(jīng)濟價值的評估、產(chǎn)品銷路的預測、犯罪案件的偵破等,都有數(shù)理統(tǒng)計的功績[1]。在經(jīng)濟領域,從某種商品未來的銷售情況預測,甚至整個國家國民經(jīng)濟狀況預測及開展方案的制定都要用到數(shù)理統(tǒng)計知識[2]。在自然科學、軍事科學、工農(nóng)業(yè)生產(chǎn)、醫(yī)療衛(wèi)生等領域,哪一個門類都離不開數(shù)理統(tǒng)計。它的用處之大不勝枚舉?;\統(tǒng)地說,數(shù)理統(tǒng)計學的理論和方法,與人類活動的各個領域在不同程度上都有關聯(lián)。因為各個領域內(nèi)的活動,都得在不同的程度上與數(shù)據(jù)打交道,都有如何收集和分析數(shù)據(jù)的問題,因此也就有數(shù)理統(tǒng)計學用武之地??梢赃@么說,現(xiàn)代人的生活、科學的開展都離不開數(shù)理統(tǒng)計。從某種意義上講,數(shù)理統(tǒng)計在一個國家中的應用標志著這個國家的科學水平[3]。數(shù)理統(tǒng)計可以看做是概率論的推廣應用,其眾多內(nèi)容都是建立在概率論根底之上的[4]。但是,數(shù)理統(tǒng)計作為純數(shù)學的一個方向,如果僅僅研究數(shù)理統(tǒng)計的數(shù)學性質(zhì),就脫離了數(shù)學在科學研究中應有的價值。正如數(shù)學以其邏輯性和嚴密性被其他學科作為有力工具運用于分析應用中一樣,數(shù)理統(tǒng)計也因為其邏輯性和嚴密性被引用到銀行的領域中。本文就是對這方面的應用,通過用計算機領域中的信息平安技術,對全國中小型銀行的大數(shù)據(jù)處理個數(shù)的統(tǒng)計。其間分別進行了數(shù)據(jù)模型的選擇和建立,數(shù)據(jù)的采集,數(shù)據(jù)的整理,對數(shù)據(jù)進行的統(tǒng)計推斷,給出矩法估計、極大似然估計、給出參數(shù)估計區(qū)間、給出的t檢驗和檢驗,進行非參數(shù)擬合優(yōu)度檢驗,從而得出相應的結(jié)論。一、采集樣本及數(shù)據(jù)整理1、數(shù)據(jù)的搜集方法及說明眾所周知,數(shù)據(jù)的搜集方法有直接搜集方法和間接搜集方法,直接搜集是直接向調(diào)查對象搜集反映調(diào)查單位的原始資料數(shù)據(jù)。而我采用的是間接搜集方法,也就是通過網(wǎng)絡搜集到已經(jīng)加工整理過的、能夠說明總表達象的數(shù)據(jù)。本文采集的是2012年5月1日中國局部中小型銀行利用信息平安技術對大數(shù)據(jù)處理個數(shù)。如表1-1所示:表1-1中國局部中小型銀行數(shù)據(jù)統(tǒng)計地區(qū)銀行名稱截止時間大數(shù)據(jù)〔億〕湖北孝感市商業(yè)銀行2011-10-1遼寧丹東市商業(yè)銀行2011-10-1湖南岳陽市商業(yè)銀行2011-10-1浙江象山縣綠葉城市信用社2011-10-1457四川宜賓市商業(yè)銀行2011-10-1黑龍江牡丹江市商業(yè)銀行2011-10-1云南曲靖市商業(yè)銀行2011-10-15山西晉中市商業(yè)銀行2011-10-1山西陽泉市商業(yè)銀行2011-10-1四川遂寧市商業(yè)銀行2011-10-1湖北黃石市商業(yè)銀行2011-10-1山東棗莊市商業(yè)銀行2011-10-11388重慶重慶三峽銀行2011-10-11501陜西寶雞市商業(yè)銀行2011-10-1河南信陽市商業(yè)銀行2011-10-11722遼寧鞍山市商業(yè)銀行2011-10-1河北邢臺市商業(yè)銀行2011-10-11800湖北荊州市商業(yè)銀行2011-10-11800河南安陽市商業(yè)銀行2011-10-11800河南焦作市商業(yè)銀行2011-10-1內(nèi)蒙古烏海市商業(yè)銀行2011-10-1山東濟寧市商業(yè)銀行2011-10-11810河南許昌市商業(yè)銀行2011-10-1遼寧撫順市商業(yè)銀行2011-10-1內(nèi)蒙古呼和浩特市商業(yè)銀行2011-10-11江西九江銀行2011-10-1河北秦皇島市商業(yè)銀行2011-10-11816河南平頂山市商業(yè)銀行2011-10-1青海青海銀行2011-10-1湖南湘潭市商業(yè)銀行2011-10-1湖南株洲市商業(yè)銀行2011-10-12000湖南衡陽市商業(yè)銀行2011-10-12000福建泉州市商業(yè)銀行2011-10-1江西贛州銀行2011-10-12055.47河南南陽市商業(yè)銀行2011-10-12106遼寧阜新市商業(yè)銀行2011-10-12107湖北宜昌市商業(yè)銀行2011-10-1廣西桂林市商業(yè)銀行2011-10-1黑龍江齊齊哈爾市商業(yè)銀行2011-10-12178浙江湖州市商業(yè)銀行2011-10-1河北滄州市商業(yè)銀行2011-10-1河南新鄉(xiāng)市商業(yè)銀行2011-10-12217廣東湛江商業(yè)銀行2011-10-12225浙江浙江泰隆商業(yè)銀行2011-10-1河北張家口市商業(yè)銀行2011-10-1廣西柳州市商業(yè)銀行2011-10-1河北冀中銀行2011-10-12244浙江嘉興市商業(yè)銀行2011-10-12247廣西廣西北部灣銀行2011-10-1河北廊坊銀行2011-10-1遼寧營口銀行2011-10-12249遼寧葫蘆島市商業(yè)銀行2011-10-16山東東營市商業(yè)銀行2011-10-12503浙江浙江民泰商業(yè)銀行2011-10-12507山東德州市商業(yè)銀行2011-10-12534遼寧朝陽市商業(yè)銀行2011-10-12548黑龍江大慶市商業(yè)銀行2011-10-1浙江浙江稠州市商業(yè)銀行2011-10-1山西大同市商業(yè)銀行2011-10-1山東萊蕪市商業(yè)銀行2011-10-1浙江金華市商業(yè)銀行2011-10-12605山東臨商銀行2011-10-12609河南洛陽市商業(yè)銀行2011-10-12627福建廈門市商業(yè)銀行2011-10-1山東日照市商業(yè)銀行2011-10-1山西太原市商業(yè)銀行2011-10-12652山東濰坊市商業(yè)銀行2011-10-1浙江臺州市商業(yè)銀行2011-10-1山東威海市商業(yè)銀行2011-10-1寧夏寧夏銀行2011-10-1浙江紹興市商業(yè)銀行2011-10-12680新疆烏魯木齊市商業(yè)銀行2011-10-1山東齊商銀行2011-10-12682江西南昌銀行2011-10-1山東煙臺市商業(yè)銀行2011-10-12689甘肅蘭州市商業(yè)銀行2011-10-12699浙江溫州銀行2011-10-12871貴州貴陽市商業(yè)銀行2011-10-1河南鄭州市商業(yè)銀行2011-10-12900山東青島市商業(yè)銀行2011-10-12901遼寧錦州市商業(yè)銀行2011-10-1福建海峽銀行2011-10-1云南富滇銀行2011-10-1湖北漢口銀行2011-10-1山東齊魯銀行2011-10-1河北石家莊市商業(yè)銀行2011-10-13005重慶重慶銀行2011-10-1吉林吉林銀行2011-10-1黑龍江哈爾濱銀行2011-10-1304內(nèi)蒙古包商銀行2011-10-1湖南長沙銀行2011-10-1四川成都銀行2011-10-1廣東東莞銀行2011-10-13118浙江杭州市商業(yè)銀行2011-10-1遼寧大連銀行2011-10-13520遼寧盛京銀行2011-10-1廣東廣州銀行2011-10-1天津天津銀行2011-10-1安徽徽商銀行2011-10-1江蘇南京銀行2011-10-1浙江寧波銀行2011-10-1廣東深圳平安銀行2011-10-1江蘇江蘇銀行2011-10-1上海上海銀行2011-10-1北京北京銀行2011-10-1從表1-1中,可以非常明顯得看到各中小型銀行的大數(shù)據(jù)處理個數(shù),下面我們對各銀行做下討論與研究。2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明從上面的表中看到,銀行大數(shù)據(jù)〔單元:億〕的樣本觀察值的最小值是湖北省孝感市商業(yè)銀行的個數(shù),最大值是位于北京市的北京銀行,取a=78,b=4418,全距L=4418-78=4340,把數(shù)據(jù)分布的區(qū)間(78,4418]等分為10個子區(qū)間,等組距為,i=1,2,…10。通過計數(shù)求出落在各子區(qū)間的大數(shù)據(jù)個數(shù),那么得頻數(shù)和頻率分布,列入表1-2。表1-2大數(shù)據(jù)頻數(shù)和頻率分布表序號大數(shù)據(jù)子區(qū)間組中值頻數(shù)頻率12345678910(78,512](512,946](946,1380](1380,1814](1814,2248](2248,2682](2682,3116](3116,3550](3550,3984](3984,4418]2957291163515972031246528993333376742014251425222083213、畫出直方圖和折線圖并給出說明由于等組距,故在橫軸上截取子區(qū)間,且各子區(qū)間的寬度等于組距434,第i個小矩形的高為組頻數(shù),由此從直方圖的分布上可以大致看出大數(shù)據(jù)的分布。直方圖1-1和折線圖1-2所示。圖1-1頻數(shù)-大數(shù)據(jù)子區(qū)間直方圖圖1-2頻數(shù)-大數(shù)據(jù)子區(qū)間折線圖由圖1-1和圖1-2可見,直方圖大致呈對稱形狀,可以認為大數(shù)據(jù)近似服從正態(tài)分布,其數(shù)學期望大致在2300附近。畫出經(jīng)驗分布函數(shù)由于依賴順序統(tǒng)計量的觀察值,所以是一個隨機變量,它的可能取值為:,,…,,1,故表示n次獨立試驗中,事件發(fā)生的頻率。樣本X1,X2,…Xn中n個隨機變量相互獨立,導致事件發(fā)生的概率等價于進行n次伯努力試驗,事件發(fā)生k次的概率,即其中是總體X的分布函數(shù)。二、假定總體服從正態(tài)分布,給出,的估計1、矩估計法從總體中隨機抽取25個樣本:162.33,,1233.85,1501,1795.1,1800,1928.38,2000,2107,2217,2240.77,2247.81,2507,2577.56,2627,2668.4,2681.5,2699,2926.7,2998.13,3015.24,3108.56,3533.6,3716,4417.65將樣本值代入,得出和的矩估計值:的矩估計值為=的矩估計值為2、極大似然估計對正態(tài)總體,是二維參數(shù),設有樣本,,…,那么似然函數(shù)及其對數(shù)分別為將分別關于兩個分量求偏導并令其為0,即得到似然方程組解此方程組,可得的極大似然估計為將之代入第二方程,得出的極大似然估計所以的極大似然估計量為的極大似然估計量為將樣本值代入,得出,的極大似然估計值=三、參數(shù)區(qū)間估計1、方差未知,求數(shù)學期望的置信區(qū)間當時,選取樣本的函數(shù)服從標準正態(tài)分布,即給定置信水平0.95,使分位數(shù)為,上式等價于那么2、數(shù)學期望,均未知,求方差的置信區(qū)間選取樣本的函數(shù)為給定置信水平0.95,使從分布表查出分位數(shù)為,,于是樣本方差為四、參數(shù)的假設檢驗假設所有銀行所處理的大數(shù)據(jù)個數(shù)都為2400億個。(1)原假設和備擇假設,(2)選取檢驗統(tǒng)計量當原假設為真時,檢驗統(tǒng)計量為(3)確定拒絕域給定顯著水平,使查t分布表得臨界值為,那么拒絕域為或。(4)樣本標準差為,計算檢驗統(tǒng)計量的觀察值,(5)作判斷由于,因此接受原假設。認為所有銀行所處理的大數(shù)據(jù)均為2400億個。檢驗(1)原假設和備擇假設,(2)選取檢驗統(tǒng)計量當原假設為真時,檢驗統(tǒng)計量為(3)確定拒絕域樣本方差為844117.9,給定顯著性水平,使那么拒絕域為(0,10.856]或[42.980,)。計算檢驗統(tǒng)計量的觀察值(5)作判斷因為,所以接受原假設。非參數(shù)假設檢驗擬合優(yōu)度檢驗頻率分布如表1-2所示,通過畫直方圖,粗略知大數(shù)據(jù)個數(shù)服從正態(tài)分布,數(shù)學期望大致在2300左右。檢驗在顯著性水平下,各銀行的大數(shù)據(jù)個數(shù)X是否服從正態(tài)分布。原假設和備擇假設為,不真其中,均為未知參數(shù)。,的極大似然估計值分別為=2376.5,以表1-2為根底,原假設為真時,計算隨機變量X落在各小區(qū)間的概率?!葍r檢驗假設,,…,計算結(jié)果列于表5-1。表5-1各區(qū)間概率序號大數(shù)據(jù)子區(qū)間頻數(shù)12345678910(78,512](512,946](946,1380](1380,1814](1814,2248](2248,2682](2682,3116](3116,3550](3550,3984](3984,4418]142522208105合并后的區(qū)間個數(shù)為k=7,隨機變量分布中含有兩個未知參數(shù),因此當原假設為真時,檢驗統(tǒng)計量為給定顯著性水平,使臨界值為,那么拒絕域為[9.448,)。檢驗統(tǒng)計量的觀察值為因此,因此接受原假設,可以認為大數(shù)據(jù)個數(shù)服從正態(tài)分布N2)。六、結(jié)論本文第一局部對全國中小型銀行的大數(shù)據(jù)處理情況分別進行采集、數(shù)據(jù)整理,給
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同范例廣聯(lián)達
- 寫勞動合同范本
- 北京自住房合同范本
- 合同范本游樂場
- 合同范本修改格式
- 合作廠房修建合同范本
- 2025年IC卡鑒別機項目發(fā)展計劃
- 單位分工合同范本
- 創(chuàng)業(yè)培訓合同范本
- 基地種植合作合同范本
- 2024年全國國家版圖知識競賽題庫及答案(中小學組)
- 湘教版高中地理必修2全冊導學案
- 2024陜西西安事業(yè)單位歷年公開引進高層次人才和急需緊缺人才筆試參考題庫(共500題)答案詳解版
- 2024年時事政治熱點題庫200道含完整答案(必刷)
- 《石油化工企業(yè)場地地下水污染防治技術指南》(T-CAEPI 39-2021)
- 人大代表身份證明
- 城區(qū)排水管網(wǎng)雨污分流改造項目可行性報告
- 充電設施運營管理制度文件范文
- 《幼兒教育評價》課程標準
- 教職工安全教育培訓課件
- 2024年山東省春季高考技能考試-汽車專業(yè)備考試題庫(濃縮500題)
評論
0/150
提交評論