演示文稿大數(shù)據(jù)與安全生產(chǎn)綜述_第1頁
演示文稿大數(shù)據(jù)與安全生產(chǎn)綜述_第2頁
演示文稿大數(shù)據(jù)與安全生產(chǎn)綜述_第3頁
演示文稿大數(shù)據(jù)與安全生產(chǎn)綜述_第4頁
演示文稿大數(shù)據(jù)與安全生產(chǎn)綜述_第5頁
已閱讀5頁,還剩105頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

演示文稿大數(shù)據(jù)與安全生產(chǎn)綜述當(dāng)前1頁,總共110頁。(優(yōu)選)大數(shù)據(jù)與安全生產(chǎn)綜述當(dāng)前2頁,總共110頁。2014年12月12日,總局黨組書記、局長楊棟梁主持召開黨組(擴大)會議,提出“建立安全生產(chǎn)統(tǒng)一數(shù)據(jù)庫,實現(xiàn)‘來源可查、去向可追、責(zé)任可究、規(guī)律可循’”。貫徹落實總局棟梁局長的指示當(dāng)前3頁,總共110頁。2015年4月2日,國務(wù)院辦公廳印發(fā)《關(guān)于加強安全生產(chǎn)監(jiān)管執(zhí)法的通知》(國辦發(fā)〔2015〕20號)。要大力提升安全生產(chǎn)“大數(shù)據(jù)”利用能力,加強安全生產(chǎn)周期性、關(guān)聯(lián)性等特征分析,做到檢索查詢即時便捷、歸納分析系統(tǒng)科學(xué),實現(xiàn)來源可查、去向可追、責(zé)任可究、規(guī)律可循。貫徹落實國辦20號文件精神當(dāng)前4頁,總共110頁。云計算移動互聯(lián)網(wǎng)智慧城市大數(shù)據(jù)物聯(lián)網(wǎng)社交網(wǎng)絡(luò)社會管理大數(shù)據(jù)時代已經(jīng)到來當(dāng)前5頁,總共110頁。社會治理行為方式生活方式企業(yè)經(jīng)營工作方式思維方式互聯(lián)網(wǎng)思維、大數(shù)據(jù)等信息技術(shù)正在改變……當(dāng)前6頁,總共110頁。安全生產(chǎn)大數(shù)據(jù)工作思路4匯報提綱大數(shù)據(jù)概述與應(yīng)用2安全生產(chǎn)大數(shù)據(jù)現(xiàn)狀與問題23基本概念簡述1當(dāng)前7頁,總共110頁。云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、電子商務(wù)、即時通信等技術(shù)形式的涌現(xiàn),推動人類從現(xiàn)實社會快速切換到網(wǎng)絡(luò)社會形態(tài),形成了人類不同于傳統(tǒng)生活方式的虛擬生活方式。(一)信息時代的特征當(dāng)前8頁,總共110頁。學(xué)習(xí)交流娛樂看報購物理財現(xiàn)實世界真實生活移動互聯(lián)網(wǎng)社交網(wǎng)絡(luò)社交網(wǎng)絡(luò)網(wǎng)上教學(xué)門戶網(wǎng)站網(wǎng)游網(wǎng)上購物互聯(lián)網(wǎng)金融網(wǎng)絡(luò)社會虛擬生活三、大數(shù)據(jù)時代(一)信息時代特征當(dāng)前9頁,總共110頁。=2Byte(字節(jié))1PB=1024T一年國產(chǎn)電視劇(1.7萬部)容量1EB=1024PB;5EB相當(dāng)于至今全世界人類所講過的話語1ZB=1024EB;全世界海灘上的沙子數(shù)量總和1TB=1024G一家大型醫(yī)院X光圖片1GB=1024M一部廣播級電影1MB=1024K50萬個漢字1KB=1024B500個漢字Megabyte(MB)Kilobyte(KB)Gigabyte(GB)Terabyte(TB)Petabyte(PB)三、大數(shù)據(jù)應(yīng)用(二)數(shù)據(jù)的概念當(dāng)前10頁,總共110頁。上傳30小時視頻130萬人評論200萬條搜索27.7萬人登錄600萬條信息發(fā)布2.04億封郵件全球產(chǎn)生7.5PB數(shù)據(jù)互聯(lián)網(wǎng)上一分鐘三、大數(shù)據(jù)應(yīng)用(二)數(shù)據(jù)的概念當(dāng)前11頁,總共110頁。(三)互聯(lián)網(wǎng)、互聯(lián)網(wǎng)+新的媒體形式的出現(xiàn)起源

上世紀(jì)90年代中后期應(yīng)用領(lǐng)域郵件、門戶網(wǎng)站、電子商務(wù)政府、企業(yè)大規(guī)模信息化建設(shè)新的商業(yè)模式的出現(xiàn)互聯(lián)網(wǎng)開始顛覆傳統(tǒng)產(chǎn)業(yè)之旅當(dāng)前12頁,總共110頁?;ヂ?lián)網(wǎng)+讓傳統(tǒng)行業(yè)插上互聯(lián)網(wǎng)的翅膀!互聯(lián)網(wǎng)可以+?工業(yè)金融交通政務(wù)農(nóng)業(yè)教育醫(yī)療民生

互聯(lián)網(wǎng)正在改變物質(zhì)之上的所有組織形態(tài)、改變物質(zhì)生產(chǎn)的組織方式。

信息技術(shù)不是在融合,而是在融化、重構(gòu)和顛覆其他產(chǎn)業(yè)形態(tài)。(三)互聯(lián)網(wǎng)、互聯(lián)網(wǎng)+當(dāng)前13頁,總共110頁。傳統(tǒng)模式:每個業(yè)務(wù)需要配備獨立的設(shè)備(服務(wù)器、存儲等)計算資源難以共享、孤島現(xiàn)象、資源浪費辦公人事財務(wù)網(wǎng)站虛擬機虛擬機虛擬機虛擬機云計算模式:

把計算資源合并成一個大的計算資源池(云計算中心)云計算中心根據(jù)各個業(yè)務(wù)需要,提供相應(yīng)的計算能力(四)云計算、云服務(wù)當(dāng)前14頁,總共110頁。云計算的目標(biāo)是讓用戶像用電、用水一樣使用信息基礎(chǔ)設(shè)施各自配備小發(fā)電機電廠集中發(fā)電云計算的本質(zhì)是把計算能力的專用服務(wù)變?yōu)榱斯梅?wù)電網(wǎng)集中供電(四)云計算、云服務(wù)當(dāng)前15頁,總共110頁。虛擬化–“一拆多”分布式–“多合一”虛擬拆分物理計算機虛擬機虛擬整合物理計算機虛擬機(四)云計算、云服務(wù)當(dāng)前16頁,總共110頁。(五)物聯(lián)網(wǎng)

物聯(lián)網(wǎng)(TheInternetofthings)的概念是在1999年提出的,又名傳感網(wǎng),物物相連的互聯(lián)網(wǎng)。把所有物品通過射頻識別(RFID)、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備與互聯(lián)網(wǎng)連接起來,進行信息交換和通訊,實現(xiàn)智能化識別、定位、跟蹤、監(jiān)控和管理。國際電信聯(lián)盟曾描繪“物聯(lián)網(wǎng)”時代的圖景:當(dāng)司機出現(xiàn)操作失誤時汽車會自動報警;公文包會提醒主人忘帶了什么東西;衣服會“告訴”洗衣機對顏色和水溫的要求等等。當(dāng)前17頁,總共110頁。

人類的網(wǎng)絡(luò)社會行為,包括聊天、購物、搜索、點贊等,產(chǎn)生了諸如日志、圖片、音頻、視頻等規(guī)模巨大、類型多樣的存貯在各類介質(zhì)上的數(shù)據(jù)。人類由此進入大數(shù)據(jù)時代!(六)大數(shù)據(jù)當(dāng)前18頁,總共110頁。單日信息產(chǎn)生量超過50TB,存儲量40PB淘寶國家電網(wǎng)到2012年10月資訊系統(tǒng)累計產(chǎn)生大資料2PB第一醫(yī)院所存資訊2008年130TB,預(yù)計2015年1PB高峰期每秒100萬次回應(yīng)請求聯(lián)通用戶上網(wǎng)記錄83萬條/秒,對應(yīng)信息量3.6PB/年每天產(chǎn)生信息超過10TB,現(xiàn)已存20PB,預(yù)計該基因庫最終將達1EB每天1千億次服務(wù)調(diào)用、55萬億次計算、300TB存儲量公交一卡通每天刷卡4000萬次地鐵1000萬次每秒產(chǎn)生2千元的交易額,累計各種信息達到PB中山大學(xué)新浪微博華大基因每天約處理60億次搜索請求幾十PB數(shù)據(jù)百度騰訊交通銀行北京公交每日約處理600G數(shù)據(jù)。存量信息超過70TB京東商城農(nóng)夫山泉每天從銷售其礦泉水的超市回傳10張照片,每月3TB三、大數(shù)據(jù)應(yīng)用(六)大數(shù)據(jù)當(dāng)前19頁,總共110頁。核心技術(shù):自然語言處理語義分析機器學(xué)習(xí)垂直搜索綜合門戶新聞門戶交友社區(qū)娛樂網(wǎng)站音樂網(wǎng)站體育網(wǎng)站網(wǎng)上購物旅行網(wǎng)站網(wǎng)上招聘網(wǎng)絡(luò)游戲……新聞評論博客博文討論話題音視點播網(wǎng)購記錄網(wǎng)上簡歷…...交互信息痕跡信息民生民意生活習(xí)慣網(wǎng)民喜好關(guān)注焦點人群分類人性分析行為分析全民記錄記錄全民(六)大數(shù)據(jù)當(dāng)前20頁,總共110頁。大數(shù)據(jù)技術(shù):在海量、無序的數(shù)據(jù)中洞察規(guī)律,發(fā)現(xiàn)價值!數(shù)據(jù)的價值不在于數(shù)據(jù)本身在于數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系當(dāng)前21頁,總共110頁。

大數(shù)據(jù)將成為國家競爭力的重要標(biāo)志,與礦產(chǎn)、土地、石油一樣成為國家的基礎(chǔ)性戰(zhàn)略資產(chǎn)。提高國家治理體系和治理能力現(xiàn)代化要靠大數(shù)據(jù)。(六)大數(shù)據(jù)當(dāng)前22頁,總共110頁。安全生產(chǎn)大數(shù)據(jù)工作思路4匯報提綱大數(shù)據(jù)概述與應(yīng)用2安全生產(chǎn)大數(shù)據(jù)現(xiàn)狀與問題23基本概念簡述1當(dāng)前23頁,總共110頁。*(一)大數(shù)據(jù)概念溯源2001年,MetaGroup(Gartner的前身)指出,隨著網(wǎng)絡(luò)及其應(yīng)用(電子商務(wù)等)發(fā)展,數(shù)據(jù)將呈現(xiàn)出爆炸式增長的趨勢,并提出3DDataManagement的技術(shù)預(yù)測,即DataVolume、DataVelocity

和DataVariety2012年,Gartner的IT技術(shù)發(fā)展趨勢戰(zhàn)略報告指出:大數(shù)據(jù)正在逼近“TippingPoint”(爆發(fā)點),40%以上的企業(yè)開始大數(shù)據(jù)方面的投資。當(dāng)前24頁,總共110頁。*(一)大數(shù)據(jù)概念溯源2008年9月4日《自然》(Nature)刊登了一個名為“BigData”的專輯,從互聯(lián)網(wǎng)技術(shù)、網(wǎng)絡(luò)經(jīng)濟學(xué)、生物醫(yī)藥等多個方面探討了大數(shù)據(jù)的挑戰(zhàn)與機遇2009年7月O’ReillyMedia出版了名為“BeautifulData”,介紹大數(shù)據(jù)相關(guān)的技術(shù)2009年10月微軟為紀(jì)念JimGray,出版了“第四范式—數(shù)據(jù)密集的科學(xué)發(fā)現(xiàn)”,認(rèn)為科學(xué)研究范式的發(fā)展“理論科學(xué)實驗科學(xué)計算機仿真數(shù)據(jù)科學(xué)”2011年2月11日:Science刊登了一個名為“DealingwithData”的專輯,聯(lián)合Science:Signaling、Science:TranslationalMedicine和ScienceCareers推出相關(guān)專題,討論數(shù)據(jù)對科學(xué)研究的重要性2012年4月,歐洲信息學(xué)與數(shù)學(xué)協(xié)會會刊ERCIMNews出版??癇igData”討論了數(shù)據(jù)管理、數(shù)據(jù)密集型研究等問題當(dāng)前25頁,總共110頁。*facebook社交網(wǎng)絡(luò)…淘寶、ebay電子商務(wù)…微博、Apps移動互聯(lián)…

21世紀(jì)是數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大?;ヂ?lián)網(wǎng)(社交、搜索、電商)、移動互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。(二)大數(shù)據(jù)概述當(dāng)前26頁,總共110頁。

GBTBPBEBZB想駕馭這龐大的數(shù)據(jù),我們必須了解大數(shù)據(jù)的特征。地球上至今總共的數(shù)據(jù)量:在2006年,個人用戶才剛剛邁進TB時代,全球一共新產(chǎn)生了約180EB的數(shù)據(jù);在2011年,這個數(shù)字達到了1.8ZB。市場研究機構(gòu)預(yù)測:到2020年,整個世界的數(shù)據(jù)總量將會增長44倍,達到35.2ZB(1ZB=10億TB)!隨著信息不斷膨脹與爆炸,已經(jīng)積累到了引發(fā)變革的程度。更多的信息增長速度也在指數(shù)級加快。1TB=1024GB1PB=1024TB1EB=1024PB1ZB=1024EB(二)大數(shù)據(jù)概述當(dāng)前27頁,總共110頁。大數(shù)據(jù)無法在容許的時間內(nèi),用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合;大數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)是持續(xù)變化的;大數(shù)據(jù)當(dāng)前泛指單一數(shù)據(jù)集的大小在幾十TB和數(shù)PB之間

---維基百科定義三、大數(shù)據(jù)應(yīng)用(二)大數(shù)據(jù)概述當(dāng)前28頁,總共110頁。2008年9月美國《自然》雜志刊登了一個名為“BigData”的專輯,首次提出大數(shù)據(jù)(BigData)概念。

大數(shù)據(jù),或稱巨量資料,是指由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多的數(shù)據(jù)所構(gòu)成的數(shù)據(jù)集合,必須通過特殊化處理分析才能形成有規(guī)律、可預(yù)測的信息服務(wù)能力。(二)大數(shù)據(jù)概述當(dāng)前29頁,總共110頁。(二)大數(shù)據(jù)概述

4V特征數(shù)據(jù)類型繁多VarietyV數(shù)據(jù)體量巨大VolumeV處理速度快VelocityV價值密度低Valuev當(dāng)前30頁,總共110頁。數(shù)據(jù)存儲量大、計算量大(Volume)

預(yù)計到2020年,中國產(chǎn)生的數(shù)據(jù)總量將是8.5ZB,全球的數(shù)據(jù)總量預(yù)計將達到40ZB。若以光盤存儲,其總重量相當(dāng)于424艘滿載的尼米茲航空母艦。2020年35ZB光盤重量=43,078,400噸424艘尼米茲號航母重量(101,600噸)當(dāng)前31頁,總共110頁。數(shù)據(jù)來源多、格式多(Variety)大數(shù)據(jù)類型分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)是指用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,如數(shù)字、符號;非結(jié)構(gòu)化數(shù)據(jù)是指無法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示,如文本、圖像、聲音、網(wǎng)頁、地理位置信息等,這些多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高要求。當(dāng)前32頁,總共110頁。大數(shù)據(jù)的來源互聯(lián)網(wǎng)快速發(fā)展,社交網(wǎng)絡(luò)成熟移動終端普及物聯(lián)網(wǎng)、傳感器、監(jiān)控設(shè)備云計算……主要三類:人和人之間、人和物(機器)之間、物和物之間數(shù)據(jù)量驟增,數(shù)據(jù)來源多樣。主動、被動和自動方式產(chǎn)生數(shù)據(jù),數(shù)據(jù)產(chǎn)生方式的巨大變化導(dǎo)致大數(shù)據(jù)的產(chǎn)生。當(dāng)前33頁,總共110頁。移動互聯(lián)網(wǎng)智慧城市物聯(lián)網(wǎng)電子商務(wù)…社交網(wǎng)絡(luò)iPhoneiPadNoteBookPC條碼RFID視頻采集設(shè)備GPS終端二維碼淘寶微博百度騰訊華大基因國家電網(wǎng)聯(lián)通北京公交當(dāng)前34頁,總共110頁。價值密度低(Value)

浪里淘沙又彌足珍貴。一部1小時的視頻,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一二秒。如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。當(dāng)前35頁,總共110頁。監(jiān)控卡口1監(jiān)控卡口2監(jiān)控卡口3監(jiān)控卡口41億/天車行軌跡2300萬車輛信息9000千萬人口3000萬駕駛員卡口信息:牌號:魯F123****車型:解放j6p顏色:藍色位置:濟南經(jīng)十山大路口方向:自西向東時間:2013.2.58:45:30山東省17地市交通卡口每天采集行車記錄數(shù)將近1億條根據(jù)牌號比對一天的車輛行駛信息,耗時30分鐘,查出4000多輛嫌疑車輛監(jiān)控卡口...套牌車查找-大數(shù)據(jù)的分析計算車牌號車型顏色距離...卡口信息卡口信息卡口信息卡口信息卡口信息數(shù)據(jù)調(diào)取數(shù)據(jù)調(diào)取計算結(jié)果當(dāng)前36頁,總共110頁。數(shù)據(jù)增長、處理速度快Volecity

利用各種大數(shù)據(jù)分析工具,比如Hadoop、SPSS和R,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這一點和傳統(tǒng)的數(shù)據(jù)分析技術(shù)有著本質(zhì)的區(qū)別。當(dāng)前37頁,總共110頁。

(二)大數(shù)據(jù)概述大數(shù)據(jù)正在改變?nèi)祟惖乃季S方式?隨機樣本精確求解因果關(guān)系全體數(shù)據(jù)近似求解關(guān)聯(lián)關(guān)系傳統(tǒng)思維大數(shù)據(jù)思維當(dāng)前38頁,總共110頁。(三)大數(shù)據(jù)國內(nèi)外應(yīng)用現(xiàn)狀1.國外現(xiàn)狀2012年3月,美國奧巴馬政府宣布推出“大數(shù)據(jù)的研究和發(fā)展計劃”。該計劃承諾將投資兩億多美元,大力推動和改善與大數(shù)據(jù)相關(guān)的收集、組織和分析工具及技術(shù),以推進從大量的、復(fù)雜的數(shù)據(jù)集合中獲取知識和洞見的能力。當(dāng)前39頁,總共110頁。案例1:美國治理警察超速行駛大數(shù)據(jù)應(yīng)用美國佛羅里達州為了治理警察超速行駛問題,通過對不同高速口收費站的原始數(shù)據(jù)記錄(約為110萬條)的比對挖掘分析,得到了一個驚人的結(jié)果:當(dāng)?shù)氐?900輛警車在13個月的時間里共發(fā)生了5100多次的超速行駛記錄。通過進一步的篩選分析發(fā)現(xiàn),警車超速行駛的時間竟然大部分都發(fā)生在上下班時間。通過對海量數(shù)據(jù)的分析處理可以得出的結(jié)論是,警車超速行駛大都不是為了執(zhí)行公務(wù)。分析結(jié)果公布在《太陽哨兵報》之后,翔實的數(shù)據(jù)紀(jì)錄與可信的分析結(jié)果引起了當(dāng)?shù)孛癖姷膹V泛關(guān)注,牽扯到超速案件的12個部門近800名警察受到處理,“警察開快車”事件被有效治理和糾正。當(dāng)前40頁,總共110頁。案例2:疾病預(yù)防美國人在去醫(yī)院前,喜歡在谷歌搜索類似“流感癥狀”的詞匯谷歌據(jù)此預(yù)測流感趨勢,比美國疾病控制和預(yù)防中心(CDC)的流感通報提早一周到10天政府由此可提前準(zhǔn)備應(yīng)對措施谷歌推出流感趨勢監(jiān)測系統(tǒng)(GoogleFluTrends)當(dāng)前41頁,總共110頁。2010年,美國西弗吉尼亞州發(fā)生死亡29人的礦難,由于該煤礦的監(jiān)管記錄保存完整,每條記錄都包括檢查的時間、結(jié)果、違反的法律條款、處理的意見、罰款的多少、已繳納的金額、煤礦是否申訴等數(shù)據(jù)項。

逾千條的監(jiān)管記錄為事故追責(zé)提供了重要證據(jù),最終事故認(rèn)定煤礦安全健康局無監(jiān)管失職,出事煤礦所屬公司應(yīng)承擔(dān)主要責(zé)任。案例3:美國礦難大數(shù)據(jù)應(yīng)用當(dāng)前42頁,總共110頁。GPSGPSGPS

小松挖掘機上裝有GPS衛(wèi)星定位系統(tǒng)和工作狀態(tài)無線傳輸系統(tǒng)小松公司在后臺能夠看到每臺挖掘機的位置、工作時間和挖掘量案例4:挖掘機預(yù)測經(jīng)濟發(fā)展當(dāng)前43頁,總共110頁。2.國內(nèi)現(xiàn)狀

國務(wù)院總理李克強主持召開國務(wù)院常務(wù)會議,要求“建立部門間互聯(lián)共享信息平臺,運用大數(shù)據(jù)等手段提升監(jiān)管水平”。

李克強總理在山東考察時,“現(xiàn)場辦公”要求要以云計算、大數(shù)據(jù)理念,與企業(yè)信息技術(shù)平臺有機對接,建立統(tǒng)一綜合信用信息平臺,實現(xiàn)“大數(shù)據(jù)”共享。*(三)大數(shù)據(jù)國內(nèi)外應(yīng)用現(xiàn)狀當(dāng)前44頁,總共110頁。案例1:互聯(lián)網(wǎng)金融利用掌握的大數(shù)據(jù)和大數(shù)據(jù)技術(shù),為中小企業(yè)提供貸款服務(wù)從提出申請,到商戶收到貸款,整個過程最快只需三分鐘累計貸款總額260億,單日利息收入100萬,壞賬率僅千份之三商品供應(yīng)商(企業(yè)和個人)商品購買者(企業(yè)和個人)

資金流資金流云計算平臺信息流交易信息信息流網(wǎng)絡(luò)數(shù)據(jù)模型在線視頻調(diào)查模式交叉檢驗技術(shù)(輔以第三方驗證)客戶信用水平和還款能力評估報告和結(jié)果交易信息發(fā)放貸款信息流監(jiān)控客戶現(xiàn)金流各渠道信息和調(diào)研獲得的客戶信用記錄、交易狀況、投訴情況海量的客戶和交易數(shù)據(jù)賦予了阿里巴巴掌握客戶信息及其交易行為的強大的優(yōu)勢當(dāng)前45頁,總共110頁。案例2:全國公安系統(tǒng)大數(shù)據(jù)應(yīng)用-網(wǎng)上抓逃犯2014年起,全國公安系統(tǒng)利用基于大數(shù)據(jù)、云計算技術(shù)研發(fā)的多點碰撞應(yīng)用系統(tǒng)助力民警辦案。應(yīng)用系統(tǒng)通過3至10秒的大數(shù)據(jù)碰撞,即可迅速從2.8億條旅館和21億條網(wǎng)吧數(shù)據(jù)中,提取出600萬住宿人員和2500萬網(wǎng)吧上網(wǎng)人員,進行交叉碰撞計算,獲得53個候選名單,縮小了排查范圍,最后交給辦案單位進一步篩選,提高了破案效率。當(dāng)前46頁,總共110頁。案例3:淘寶網(wǎng)大數(shù)據(jù)應(yīng)用

淘寶上的買家在購買商品前,會比較多家供應(yīng)商的產(chǎn)品,進而反映到淘寶網(wǎng)站統(tǒng)計數(shù)據(jù)中,通過用戶比選、購買行為進行貿(mào)易分析預(yù)測。2008年初,淘寶上買家詢盤數(shù)急劇下滑,淘寶網(wǎng)預(yù)測到歐美對中國的采購在下滑,最后推斷出世界貿(mào)易即將發(fā)生變化。當(dāng)前47頁,總共110頁。案例4:360反欺詐應(yīng)用360互聯(lián)網(wǎng)安全中心通過1億設(shè)備,6.49億網(wǎng)名,累計監(jiān)測到網(wǎng)民個人信息多大11.2億條,內(nèi)容包括姓名、電話、上網(wǎng)賬戶、銀行卡密、身份證號碼等多種用戶隱身信息,在GIS地圖上生產(chǎn)了中國網(wǎng)絡(luò)騙子地圖。360通過手機衛(wèi)士為用戶提供騷擾電話攔截服務(wù),識別出騷擾電話中“響一聲”最多,占到了總量一半,每天上午10點騷擾電話最猖獗,周一是騷擾電話也要“休息”,統(tǒng)計出騷擾電話分布圖。中國網(wǎng)絡(luò)騙子地圖2014年騷擾電話分布當(dāng)前48頁,總共110頁。

2012年3月通過“大數(shù)據(jù)研究與發(fā)展倡議”,率先將大數(shù)據(jù)上升為國家戰(zhàn)略,大力提升美國從海量復(fù)雜的數(shù)據(jù)集合中獲取知識和洞見的能力。第一波投資兩億多美元,通過公布重要部門的大數(shù)據(jù)項目規(guī)劃,扶持重要領(lǐng)域的大數(shù)據(jù)技術(shù)研發(fā),帶動其他部門和社會各界對大數(shù)據(jù)技術(shù)的研發(fā)投入和推廣應(yīng)用。具體實現(xiàn)三個目標(biāo):(1)開發(fā)能對大量數(shù)據(jù)進行收集、存儲、維護、管理、分析和共享的最先進的核心技術(shù);(2)利用這些技術(shù)加快科學(xué)和工程學(xué)領(lǐng)域探索發(fā)現(xiàn)的步伐,加強國家安全,轉(zhuǎn)變現(xiàn)有的教學(xué)方式;(3)擴大從事大數(shù)據(jù)技術(shù)開發(fā)和應(yīng)用的人員數(shù)量。(四)大數(shù)據(jù)戰(zhàn)略——美國當(dāng)前49頁,總共110頁。

2013年10月31日,英國發(fā)布《把握數(shù)據(jù)帶來的機遇:英國數(shù)據(jù)能力戰(zhàn)略》。該戰(zhàn)略由英國商業(yè)、創(chuàng)新與技術(shù)部牽頭編制。

戰(zhàn)略旨在促進英國在數(shù)據(jù)挖掘和價值萃取中的世界領(lǐng)先地位,為英國公民、企業(yè)、學(xué)術(shù)機構(gòu)和公共部門在信息經(jīng)濟條件下創(chuàng)造更多收益。為實現(xiàn)上述目標(biāo),該戰(zhàn)略從提升數(shù)據(jù)分析技術(shù)、加強國家基礎(chǔ)設(shè)施建設(shè)、推動研究與產(chǎn)業(yè)合作、確保數(shù)據(jù)被安全存取和共享等幾個方面做出了部署,并作出11項行動承諾,確保戰(zhàn)略目標(biāo)得以落地,投資金額達1.89億英鎊。(四)大數(shù)據(jù)戰(zhàn)略——英國當(dāng)前50頁,總共110頁。

2013年10月,澳大利亞政府發(fā)布又信息管理辦公室成立的“大數(shù)據(jù)工作組”制定的公共服務(wù)大數(shù)據(jù)戰(zhàn)略。

該戰(zhàn)略旨在推動公共部門利用大數(shù)據(jù)分析進行服務(wù)改革,制定更好的公共政策,保護公民隱私。戰(zhàn)略還決定成立數(shù)據(jù)分析卓越中心(DACOE),通過構(gòu)建一個通用的能力框架幫助政府部門獲得數(shù)據(jù)分析能力,并促成政府與第三方機構(gòu)合作以培養(yǎng)分析技術(shù)專家。列舉了2014年7月前需完成的6項大數(shù)據(jù)行動計劃。(四)大數(shù)據(jù)戰(zhàn)略——澳大利亞當(dāng)前51頁,總共110頁。法國政府宣布將在2013年投入1150萬歐元,用于7個大數(shù)據(jù)市場研發(fā)項目。

目的在于“通過發(fā)展創(chuàng)新性解決方案,并將其用于實踐,來促進法國在大數(shù)據(jù)領(lǐng)域的發(fā)展。三、大數(shù)據(jù)應(yīng)用(四)大數(shù)據(jù)戰(zhàn)略——法國當(dāng)前52頁,總共110頁。

2012年,中國政府批復(fù)“十二五國家政務(wù)信息化建設(shè)工程規(guī)劃”,標(biāo)志著我國開放、共享和智能的大數(shù)據(jù)時代已經(jīng)來臨。我國在“十二五”戰(zhàn)略新興產(chǎn)業(yè)發(fā)展規(guī)劃中就明確提出了,要支持海量數(shù)據(jù)的存儲處理技術(shù)的研發(fā)和產(chǎn)業(yè)化。(四)大數(shù)據(jù)戰(zhàn)略——中國2014年底發(fā)改委、工信部牽頭聯(lián)合相關(guān)部門制定大數(shù)據(jù)戰(zhàn)略與行動綱要。2014年政府工作報告明確提出,“設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺,在新一代移動通信、集成電路、大數(shù)據(jù)。。?!?015年政府工作報告明確提出:互聯(lián)網(wǎng)+大數(shù)據(jù)、中國制造2015當(dāng)前53頁,總共110頁。

(五)大數(shù)據(jù)標(biāo)準(zhǔn)化大數(shù)據(jù)標(biāo)準(zhǔn)化工作是支撐大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和應(yīng)用的重要基礎(chǔ)國際上若干大數(shù)據(jù)標(biāo)準(zhǔn)化相關(guān)工作組,如ISO/IECJTC1WG9、ITU-T、NISTNBD-PWG等工信部和國標(biāo)委2014年成立了“全國信標(biāo)委大數(shù)據(jù)標(biāo)準(zhǔn)工作組”與發(fā)達國家相比還有差距,需結(jié)合我國建設(shè)需求和特色,推進標(biāo)準(zhǔn)化的建設(shè)當(dāng)前54頁,總共110頁。

(五)大數(shù)據(jù)標(biāo)準(zhǔn)化國內(nèi)大數(shù)據(jù)標(biāo)準(zhǔn)化工作工作范圍:

負責(zé)制定和完善我國大數(shù)據(jù)領(lǐng)域標(biāo)準(zhǔn)體系;組織開展大數(shù)據(jù)相關(guān)技術(shù)和標(biāo)準(zhǔn)的研究;申報國家、行業(yè)標(biāo)準(zhǔn),承擔(dān)國家、行業(yè)標(biāo)準(zhǔn)制修訂計劃任務(wù),宣傳、推廣標(biāo)準(zhǔn)實施;組織推動國際標(biāo)準(zhǔn)化活動正在編制《大數(shù)據(jù)標(biāo)準(zhǔn)化白皮書》2.0版本研制2014年下達的大數(shù)據(jù)領(lǐng)域10項國家標(biāo)準(zhǔn)征集大數(shù)據(jù)領(lǐng)域的相關(guān)標(biāo)準(zhǔn)需求序號計劃號標(biāo)準(zhǔn)名稱120141172-T-469多媒體數(shù)據(jù)語義描述要求220141184-T-469數(shù)據(jù)能力成熟度評價模型320141190-T-469信息技術(shù)大數(shù)據(jù)技術(shù)參考模型420141191-T-469信息技術(shù)大數(shù)據(jù)術(shù)語520141194-T-469信息技術(shù)科學(xué)數(shù)據(jù)引用620141200-T-469信息技術(shù)數(shù)據(jù)交易服務(wù)平臺交易數(shù)據(jù)描述720141201-T-469信息技術(shù)數(shù)據(jù)交易服務(wù)平臺通用功能要求820141202-T-469信息技術(shù)數(shù)據(jù)溯源描述模型920141203-T-469信息技術(shù)數(shù)據(jù)質(zhì)量評價指標(biāo)1020141204-T-469信息技術(shù)通用數(shù)據(jù)導(dǎo)入接口規(guī)范當(dāng)前55頁,總共110頁。(六)大數(shù)據(jù)處理技術(shù)大數(shù)據(jù)采集與預(yù)處理大數(shù)據(jù)存儲與管理大數(shù)據(jù)計算模式大數(shù)據(jù)分析與挖掘大數(shù)據(jù)可視化分析大數(shù)據(jù)安全當(dāng)前56頁,總共110頁。大數(shù)據(jù)采集與預(yù)處理數(shù)據(jù)的多源和多樣性,導(dǎo)致數(shù)據(jù)質(zhì)量存在差異,嚴(yán)重影響數(shù)據(jù)的可用性。很多公司已經(jīng)推出了多種數(shù)據(jù)清洗和質(zhì)量控制工具(如IBM的DataStage)。大數(shù)據(jù)存儲與管理存儲規(guī)模大,管理復(fù)雜,要兼顧結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。分布式文件系統(tǒng)和分布式數(shù)據(jù)庫的發(fā)展正在有效的解決這些問題。對于大數(shù)據(jù)存儲和管理,尤其值得關(guān)注的是大數(shù)據(jù)索引和查詢技術(shù)、實時及流式大數(shù)據(jù)存儲與處理的發(fā)展。當(dāng)前57頁,總共110頁。大數(shù)據(jù)計算模式大數(shù)據(jù)處理多樣性的需求,出現(xiàn)了多種典型的計算模式,如大數(shù)據(jù)查詢分析計算(如Hive)、批處理計算(如HadoopMapReduce)、流式計算(如Storm)、迭代計算(如HaLoop)、圖計算(如Pregel)和內(nèi)存計算(如Hana),這些計算模式的混合計算模式將成為滿足多樣性大數(shù)據(jù)處理和應(yīng)用需求的有效手段。大數(shù)據(jù)分析與挖掘?qū)ρ杆倥蛎浀臄?shù)據(jù)進行深度分析和挖掘,對自動化分析要求越來越高,越來越多的大數(shù)據(jù)數(shù)據(jù)分析工具和產(chǎn)品應(yīng)運而生,如用于大數(shù)據(jù)挖掘的RHadoop版、基于MapReduce開發(fā)的數(shù)據(jù)挖掘算法等。當(dāng)前58頁,總共110頁。大數(shù)據(jù)可視化分析可視化方式可幫助人們探索和解釋復(fù)雜的數(shù)據(jù),有利于決策者挖掘數(shù)據(jù)的商業(yè)價值。各種相關(guān)商品不斷出現(xiàn),可視化工具Tabealu的成功上市反映了大數(shù)據(jù)可視化的需求。大數(shù)據(jù)安全大數(shù)據(jù)的安全一直是企業(yè)和學(xué)術(shù)界非常關(guān)注的研究方向。通過文件訪問控制來限制呈現(xiàn)對數(shù)據(jù)的操作、基礎(chǔ)設(shè)備加密、匿名化保護技術(shù)和加密保護等技術(shù)正在最大程度的保護數(shù)據(jù)安全。當(dāng)前59頁,總共110頁。安全生產(chǎn)大數(shù)據(jù)工作思路4匯報提綱大數(shù)據(jù)概述與應(yīng)用2安全生產(chǎn)大數(shù)據(jù)現(xiàn)狀與問題23基本概念簡述1當(dāng)前60頁,總共110頁。安全生產(chǎn)大數(shù)據(jù):企業(yè)安全生產(chǎn)、政府安全監(jiān)管、社會個人參與以及與此關(guān)聯(lián)的經(jīng)濟活動全過程所形成的文本、音頻、視頻、圖片等海量信息的集合。當(dāng)下還處于大數(shù)據(jù)的初級階段。(一)安全生產(chǎn)大數(shù)據(jù)概念監(jiān)管機構(gòu)企業(yè)個人中介機構(gòu)安委會成員單位來源對象數(shù)據(jù)內(nèi)容調(diào)查報告視頻動態(tài)信息安全管理動態(tài)信息安全管理靜態(tài)信息生產(chǎn)圖紙信息事故信息大安全大數(shù)據(jù)大監(jiān)管互聯(lián)網(wǎng)當(dāng)前61頁,總共110頁。真實性:安全生產(chǎn)大數(shù)據(jù)是在依法行政的許可下采集的,任何被采集對象有義務(wù)如實地填報各項數(shù)據(jù),因此數(shù)據(jù)要求是真實準(zhǔn)確的,并具有法律效用。原始性:安全生產(chǎn)大數(shù)據(jù)不論是一次采集還是多次采集,均直接來源于政府、企業(yè)或個人,都是最為原始可靠的數(shù)據(jù)采集。完整性:監(jiān)管機構(gòu)為了完成一項或幾項工作開展數(shù)據(jù)采集工作,必須努力保證所采集數(shù)據(jù)對于該項工作的完成是完整的。公正性:安全生產(chǎn)大數(shù)據(jù)采集所涉及到的組織或個人,都必須履行義務(wù)接受采集,任何組織或個人不可以隨意拒絕。(二)安全生產(chǎn)大數(shù)據(jù)具有“七性”當(dāng)前62頁,總共110頁??沙掷m(xù)性:安全生產(chǎn)大數(shù)據(jù)可以根據(jù)業(yè)務(wù)需要定時、定期采集,如安全生產(chǎn)誠信信息等。也可以根據(jù)需要經(jīng)授權(quán)后隨時獲取,確保業(yè)務(wù)的持續(xù)性??商幚硇裕喊踩a(chǎn)大數(shù)據(jù)是安監(jiān)機構(gòu)為了履行行政職能而采集的,數(shù)據(jù)的內(nèi)在關(guān)系是明確的,數(shù)據(jù)結(jié)構(gòu)是合理的,是可以和便于機器自動處理的??砷_放性:安全生產(chǎn)大數(shù)據(jù)是安監(jiān)機構(gòu)在依法行政下獲取的,在確保國家安全、組織或個人的隱私與利益不受侵害的前提下,可以依法開放。任何機構(gòu)、組織或個人也有權(quán)向相關(guān)部門提出獲得和使用數(shù)據(jù)的申請。(二)安全生產(chǎn)大數(shù)據(jù)要具有“七性”當(dāng)前63頁,總共110頁。(三)安全生產(chǎn)大數(shù)據(jù)面臨的主要問題數(shù)據(jù)規(guī)模小缺乏原始信息缺乏統(tǒng)一的標(biāo)準(zhǔn)部門協(xié)調(diào)能力不足信息化能力弱分析工具欠缺專業(yè)人員缺乏主要問題當(dāng)前64頁,總共110頁。數(shù)據(jù)量小、質(zhì)量差:雖然安監(jiān)部門都有一定規(guī)模安全生產(chǎn)相關(guān)數(shù)據(jù),但由于其數(shù)據(jù)搜集、數(shù)據(jù)整理等能力不足,數(shù)據(jù)完整性、規(guī)范性方面還存在很大缺陷。特別是原始、動態(tài)數(shù)據(jù)不足,難以實現(xiàn)全覆蓋。缺乏標(biāo)準(zhǔn):目前我國建筑、交通、鐵路、民航、民爆等行業(yè)的安全監(jiān)管職責(zé)在行業(yè)管理部門,非煤、?;?、工礦商貿(mào)等其他行業(yè)的安全監(jiān)管職責(zé)在安監(jiān)部門,各部門建立的事故信息、監(jiān)管信息等數(shù)據(jù)庫沒有形成統(tǒng)一的標(biāo)準(zhǔn),為數(shù)據(jù)銜接造成很大局限。部門協(xié)調(diào)能力不足:安全監(jiān)管對象眾多,各級機構(gòu)限于能力和手段,在采集企業(yè)、個人及公共安全數(shù)據(jù)、互聯(lián)共享中協(xié)調(diào)能力不足,難以得到充分授權(quán)與發(fā)揮作用。(三)安全生產(chǎn)大數(shù)據(jù)當(dāng)前面臨的主要問題當(dāng)前65頁,總共110頁。企業(yè)信息化能力弱。安全生產(chǎn)隱患排查主要靠人力,易受到主觀因素影響,且很難界定安全與危險狀態(tài),可靠性差。分析工具缺乏:在安全生產(chǎn)管理中,由于缺少有效的分析工具,缺少對事故規(guī)律的認(rèn)識,導(dǎo)致我國對于安全生產(chǎn)主要采取“事后管理”的方式,缺少事前預(yù)防,在事故發(fā)生后才分析事故原因、追究事故責(zé)任、制定防治措施。這種方式存在很大局限性,不能達到從源頭上防止事故的目的。大數(shù)據(jù)專業(yè)分析人員缺乏:大數(shù)據(jù)建設(shè)的每個環(huán)節(jié)都需要依靠專業(yè)人員完成,其關(guān)鍵環(huán)節(jié)數(shù)據(jù)分析是基于預(yù)言建?;蛭磥碲厔莘治?,傳統(tǒng)的數(shù)據(jù)分析師并不具備開發(fā)預(yù)測分析應(yīng)用程序模型的技能,安全生產(chǎn)領(lǐng)域的相應(yīng)人才更是少之又少。(三)安全生產(chǎn)大數(shù)據(jù)面臨的主要問題當(dāng)前66頁,總共110頁。數(shù)據(jù)采集的基礎(chǔ)支撐環(huán)境較弱因國家政務(wù)外網(wǎng)云尚未完成全覆蓋,依托其運行的安全生產(chǎn)專網(wǎng)云目前只覆蓋了總局、32個省級安監(jiān)局、26個省級煤監(jiān)局、76個監(jiān)察分局和2/3的地級、1/3的縣級安全監(jiān)管機構(gòu)。其他機構(gòu)目前僅能通過互聯(lián)網(wǎng)專用通道連接。受帶寬限制,聯(lián)網(wǎng)傳輸速度不高。?還有約1/3的地級和2/3的縣級安全監(jiān)管機構(gòu)沒有接入安全生產(chǎn)專網(wǎng)。32個省級安監(jiān)局,全覆蓋26個省級煤監(jiān)局77個煤監(jiān)分局省級安全監(jiān)管監(jiān)察機構(gòu)已覆蓋2/31/3未覆蓋地級安全監(jiān)管機構(gòu)縣級安全監(jiān)管機構(gòu)已覆蓋1/32/3未覆蓋當(dāng)前67頁,總共110頁。缺乏統(tǒng)一的數(shù)據(jù)交互標(biāo)準(zhǔn)規(guī)范數(shù)據(jù)之間的交互能力較弱業(yè)務(wù)流程不同系統(tǒng)對接困難數(shù)據(jù)無法交互某市安監(jiān)局整改治理驗收評價整改治理評價總局當(dāng)前68頁,總共110頁。數(shù)據(jù)采集不全、缺乏動態(tài)音視頻數(shù)據(jù)安全監(jiān)管監(jiān)察部門企業(yè)各級安全監(jiān)管監(jiān)察部門基本上未與企業(yè)實現(xiàn)網(wǎng)絡(luò)的有效連接,缺乏采集和更新企業(yè)安全生產(chǎn)基礎(chǔ)數(shù)據(jù)的標(biāo)準(zhǔn)和通道。致使現(xiàn)有采集的企業(yè)安全生產(chǎn)基礎(chǔ)數(shù)據(jù)不完整、不準(zhǔn)確,更難以及時更新。當(dāng)前69頁,總共110頁。類型少:數(shù)據(jù)類型單一,絕大部分為關(guān)系型數(shù)據(jù),圖像、視頻、文本等安全生產(chǎn)業(yè)務(wù)數(shù)據(jù)少。時效性差:目前的數(shù)據(jù)獲取方式主要依賴企業(yè)報送,數(shù)據(jù)按月、按季度上報,相對傳感器等物聯(lián)網(wǎng)技術(shù)實時獲取數(shù)據(jù),時效性差價值密度低:累計上報的結(jié)構(gòu)化數(shù)據(jù)大都是間接性數(shù)據(jù)、可利用價值較低,非結(jié)構(gòu)化比重小導(dǎo)致其可挖掘的范圍小。目前,各個統(tǒng)計累計報送數(shù)量達到100余萬條,累計報送報表超過500余張,上報單位約10萬家。數(shù)據(jù)類型少和時效性差當(dāng)前70頁,總共110頁。2、價值密度低:上報的隱患數(shù)據(jù)中96%為結(jié)構(gòu)化數(shù)據(jù),2%為非結(jié)構(gòu)化數(shù)據(jù),2%為蘊含隱患的圖片數(shù)據(jù)1、企業(yè)隱患數(shù)據(jù)體量巨大,但是目前全國隱患數(shù)據(jù)庫僅有150余萬條企業(yè)自查數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù):餐廳操作間地面污水比較多,人員走路容易滑到,存在安全隱患需要及時清理4、時效性差:試點企業(yè)7600家,2014年平均每家企業(yè)排查13條隱患3、隱患數(shù)據(jù)類型少:安全生產(chǎn)隱患類型紛雜多樣,但是統(tǒng)計歸類的隱患只有23項數(shù)據(jù)類型少和時效性差當(dāng)前71頁,總共110頁。

對安全監(jiān)管監(jiān)察機構(gòu)而言,大數(shù)據(jù)可帶來六大轉(zhuǎn)變,最終為實現(xiàn)事故的超前預(yù)防提供預(yù)測預(yù)警:從粗放式管理向精細化轉(zhuǎn)變從單向管制向政民互動轉(zhuǎn)變從各自為戰(zhàn)向共享協(xié)作轉(zhuǎn)變從被動響應(yīng)向主動預(yù)見轉(zhuǎn)變從行政主導(dǎo)的政府向以人為本服務(wù)型政府轉(zhuǎn)變從經(jīng)驗決策向基于大數(shù)據(jù)的科學(xué)決策轉(zhuǎn)變(四)安全生產(chǎn)大數(shù)據(jù)的思考當(dāng)前72頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考當(dāng)前的安全生產(chǎn)數(shù)據(jù)是大數(shù)據(jù)嗎?當(dāng)前數(shù)據(jù)概況大數(shù)據(jù)概況數(shù)據(jù)來源,主要采取的是人工錄入,較少采取物聯(lián)網(wǎng)等傳感器自動抓去的信息。大數(shù)據(jù)是永遠在線的,數(shù)據(jù)來源非常廣泛,主要是UGC(用戶產(chǎn)生內(nèi)容),機器抓取數(shù)據(jù)、用戶行為數(shù)據(jù)、移動互聯(lián)網(wǎng)數(shù)據(jù)、車聯(lián)網(wǎng)和物聯(lián)網(wǎng)等傳感數(shù)據(jù)。數(shù)據(jù)類型,主要是以結(jié)構(gòu)性數(shù)據(jù)為主,語音、視頻、圖片等非結(jié)構(gòu)性數(shù)據(jù)相對較少。大數(shù)據(jù)更多是依賴于非結(jié)構(gòu)性數(shù)據(jù)而生存,當(dāng)前占據(jù)互聯(lián)網(wǎng)90%以上的數(shù)據(jù)是圖片、語音和視頻等。數(shù)據(jù)價值,主要是用于年度、季度和月度的統(tǒng)計分析,數(shù)據(jù)的共享交換能力較弱。結(jié)果數(shù)據(jù)過多,過程數(shù)據(jù)較少,因此其挖掘價值較低。大數(shù)據(jù)的產(chǎn)生速度可以說是毫秒級別,成幾何級數(shù)增長。數(shù)據(jù)處理速度,數(shù)據(jù)收集、存儲、加工和傳輸速度較慢,與企業(yè)的實時監(jiān)控設(shè)備互聯(lián)互通、信息共享較弱。大數(shù)據(jù)由于其覆蓋范圍廣,一旦挖掘成功,其價值是難以估算。如,淘寶網(wǎng)的用戶推薦系統(tǒng),銀行的信用評級系統(tǒng),均是大數(shù)據(jù)的價值之體現(xiàn)。當(dāng)前73頁,總共110頁。大數(shù)據(jù)算法是不用隨機分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)的方法?!髷?shù)據(jù)經(jīng)典《大數(shù)據(jù)時代》(四)安全生產(chǎn)大數(shù)據(jù)的思考國家工商總局商品定向監(jiān)測(抽樣數(shù)據(jù))對比

阿里巴巴大數(shù)據(jù)打假平臺(全部數(shù)據(jù))假貨總會露出馬腳,大數(shù)據(jù)使環(huán)境越來越透明,假貨無處藏身。數(shù)據(jù)來源當(dāng)前74頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考以結(jié)構(gòu)化數(shù)據(jù)(表單)為主對比

多元數(shù)據(jù)類型(圖片/音頻/視頻)數(shù)據(jù)類型RFID數(shù)據(jù)進貨物流:XX省XX市圖片與文本數(shù)據(jù):意大利進口數(shù)據(jù)標(biāo)準(zhǔn)結(jié)果1110±3合格230220±20合格153120±15不合格2L2±0.2L合格1.7L1.8±0.2L合格假貨音頻與視頻數(shù)據(jù)大數(shù)據(jù)打假案例當(dāng)前75頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考以結(jié)構(gòu)化數(shù)據(jù)(表單)為主對比

多元數(shù)據(jù)類型(圖片/音頻/視頻)數(shù)據(jù)價值新穎精致宏偉的大價值微不足道的小數(shù)據(jù)數(shù)據(jù)標(biāo)準(zhǔn)1110±3230220±20153120±152L2±0.2L1.7L1.8±0.2L通常存儲的表單數(shù)據(jù)當(dāng)前76頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考分析模型當(dāng)前77頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考算法當(dāng)前78頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考傳統(tǒng)數(shù)據(jù)分析與應(yīng)用大數(shù)據(jù)分析與應(yīng)用大數(shù)據(jù)分析模型傳統(tǒng)分析是對有限的樣本數(shù)據(jù)進行分析,大多數(shù)據(jù)倉庫都有一個精致的提取、轉(zhuǎn)換和加載(ETL)的流程和數(shù)據(jù)庫限制,這意味著加載進數(shù)據(jù)倉庫的數(shù)據(jù)是容易理解、清洗,并符合業(yè)務(wù)的元數(shù)據(jù)大數(shù)據(jù)分析是對總體數(shù)據(jù),尤其是針對傳統(tǒng)手段捕捉到的數(shù)據(jù)之外的非結(jié)構(gòu)化數(shù)據(jù)進行分析,這意味著數(shù)據(jù)的理解、清洗等加工過程是復(fù)雜多變的,這使它更具有挑戰(zhàn)性,但同時它提供了在數(shù)據(jù)中獲得更多洞察力的可能。大數(shù)據(jù)中結(jié)構(gòu)性數(shù)據(jù)主要是時間序列數(shù)據(jù),非結(jié)構(gòu)性數(shù)據(jù)主要是文件數(shù)據(jù),因此,需精通的模型覆蓋范圍比傳統(tǒng)數(shù)據(jù)分析要廣泛。計量經(jīng)濟學(xué):時間序列模型,路徑分析模型、貝葉斯模型等統(tǒng)計學(xué):相關(guān)性分析,線性回歸模型、矩陣等計算機科學(xué):神經(jīng)網(wǎng)絡(luò)、文本分析與挖掘、關(guān)聯(lián)規(guī)則分析等傳統(tǒng)分析是建立在關(guān)系數(shù)據(jù)模型之上的,主題之間的關(guān)系在系統(tǒng)內(nèi)就被創(chuàng)立,分析在此基礎(chǔ)上進行。在真實的世界里,很難在所有的信息間以一種正式的方式建立關(guān)系,因此以圖片、視頻、移動互聯(lián)網(wǎng)、無線射頻識別(RFID)等產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)廣泛存在。絕大多數(shù)的大數(shù)據(jù)分析是基于非結(jié)構(gòu)化數(shù)據(jù)。傳統(tǒng)分析是定向定時的批處理,而且我們在獲得所需的洞察力之前需要每晚等待提取、轉(zhuǎn)換和加載(ETL)以及轉(zhuǎn)換工作的完成大數(shù)據(jù)分析更多是針對數(shù)據(jù)的實時性分析。在一個傳統(tǒng)的分析系統(tǒng)中,并行是通過昂貴的硬件,如大規(guī)模并行處理(MPP)或?qū)ΨQ多處理(SMP)系統(tǒng)來實現(xiàn)。當(dāng)前的數(shù)據(jù)分析平臺是主要基于相對便宜的X86小型服務(wù)器集群,實現(xiàn)動態(tài)增減服務(wù)器容量與計算量。大多數(shù)據(jù)分析軟件主流是基于開源的Hadoop系統(tǒng)產(chǎn)生。傳統(tǒng)數(shù)據(jù)分析與應(yīng)用大數(shù)據(jù)分析與應(yīng)用=?當(dāng)前79頁,總共110頁。(四)安全生產(chǎn)大數(shù)據(jù)的思考傳統(tǒng)數(shù)據(jù)分析人才大數(shù)據(jù)分析人才=?熟悉統(tǒng)計學(xué)基本原理可以不懂計算機可以不會統(tǒng)計軟件編程可以沒有太豐富想象力必須熟悉統(tǒng)計學(xué)和計量經(jīng)濟學(xué)原理;必須會使用C++、Java等主流編程語言;必須會使用高級統(tǒng)計分析軟件,如R、SAS和SPSS等必須理解分布式計算的原理,熟悉MapReduce+Java想象力必須豐富當(dāng)前80頁,總共110頁。不是因果關(guān)系,而是相互關(guān)系。不是隨機樣本,而是全體數(shù)據(jù);“樣本=總體”不是精確性,而是混雜性,尤其是大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復(fù)雜算法有效;(四)安全生產(chǎn)大數(shù)據(jù)的思考簡而言之,大數(shù)據(jù)分析:

大數(shù)據(jù)時代最大的轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。這顛覆了千百年來人類的思維慣例,對人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)。當(dāng)前81頁,總共110頁。安全生產(chǎn)大數(shù)據(jù)工作思路4匯報提綱大數(shù)據(jù)概述與應(yīng)用2安全生產(chǎn)大數(shù)據(jù)現(xiàn)狀與問題23基本概念簡述1當(dāng)前82頁,總共110頁。國務(wù)院安委會部委省政府地市/區(qū)縣政府安監(jiān)工商質(zhì)檢人社民政公安交通水利環(huán)保自然人(公眾)法人(組織)公共資源(一)安全生產(chǎn)綜合監(jiān)管模式“矩陣式”的網(wǎng)狀結(jié)構(gòu)當(dāng)前83頁,總共110頁。以應(yīng)用為中心向以數(shù)據(jù)為中心轉(zhuǎn)變OA“煙囪式”、每個應(yīng)用建設(shè)一套數(shù)據(jù)DATA結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)構(gòu)筑大數(shù)據(jù)平臺,搭建不同應(yīng)用單一應(yīng)用平臺構(gòu)建ERPCRMPDMERPCRMPDMOABI 煙囪式:每個應(yīng)用建設(shè)一套數(shù)據(jù)(二)安全生產(chǎn)大數(shù)據(jù)服務(wù)模式當(dāng)前84頁,總共110頁。1各部門的業(yè)務(wù)基本覆蓋智慧安監(jiān)

-五級成熟度模型跨部門的業(yè)務(wù)實現(xiàn)關(guān)聯(lián)公眾服務(wù)實現(xiàn)互動基礎(chǔ)資源實現(xiàn)共享大數(shù)據(jù)服務(wù)安全監(jiān)管2345(二)安全生產(chǎn)大數(shù)據(jù)服務(wù)模式-智慧安監(jiān)當(dāng)前85頁,總共110頁。業(yè)務(wù)上云應(yīng)用創(chuàng)新數(shù)據(jù)整合基礎(chǔ)設(shè)施云平臺云應(yīng)用++(二)安全生產(chǎn)大數(shù)據(jù)服務(wù)模式-“三步走”非煤礦山監(jiān)管?;繁O(jiān)管煙花爆竹監(jiān)管煤礦安全監(jiān)察工貿(mào)行業(yè)監(jiān)管。。。非煤基礎(chǔ)信息煤礦基礎(chǔ)信息隱患排查信息標(biāo)準(zhǔn)化信息事故調(diào)查信息行政執(zhí)法信息。。。趨勢分析指數(shù)分析輿情分析預(yù)警分析。。。

當(dāng)前86頁,總共110頁。工貿(mào)煙花行政許可云計算IaaS平臺計算池存儲池網(wǎng)絡(luò)池傳統(tǒng)架構(gòu)(煙囪式)非煤…………煤礦?;總€系統(tǒng)對應(yīng)一套硬件系統(tǒng)系統(tǒng)相對封閉、數(shù)據(jù)共享受限不改變現(xiàn)有軟件系統(tǒng)開放式大數(shù)據(jù)處理平臺監(jiān)管執(zhí)法數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)……模式轉(zhuǎn)換創(chuàng)新監(jiān)管應(yīng)用標(biāo)準(zhǔn)化第一步上云第二步數(shù)據(jù)整合隱患排查云計算模式(三)基于云計算的安全生產(chǎn)大數(shù)據(jù)服務(wù)當(dāng)前87頁,總共110頁。靜態(tài)隱患排查上報動態(tài)物聯(lián)網(wǎng)隱患采集手工填報智能互聯(lián)政府檢查移動執(zhí)法社會舉報檢查舉報隱患排查云服務(wù)數(shù)據(jù)中心社會化監(jiān)督重大隱患辨識事故隱患致因分析事故隱患關(guān)聯(lián)分析粉塵隱患監(jiān)控預(yù)警重大危險源監(jiān)控預(yù)警有限空間作業(yè)監(jiān)控預(yù)警工貿(mào)行業(yè)隱患預(yù)警分析重點企業(yè)隱患預(yù)警分析地區(qū)隱患排查預(yù)警分析微博微信智能搜索當(dāng)前88頁,總共110頁。一企一檔標(biāo)準(zhǔn)化達標(biāo)投訴舉報情況許可情況……處罰情況隱患排查檢查情況二級達標(biāo)企業(yè)全員隱患查報率100%隱患整改率100%無事故發(fā)生有事故發(fā)生隱患無上報標(biāo)準(zhǔn)化不達標(biāo)檢查發(fā)現(xiàn)存在重大隱患無隱患舉報設(shè)立未滿三年企業(yè)A企業(yè)B企業(yè)標(biāo)簽投訴頻繁加大扶持重點抽查聯(lián)合懲戒安全生產(chǎn)責(zé)任保險費率增加10%…………安全生產(chǎn)責(zé)任保險費率降低20%…………加強監(jiān)管企業(yè)安全生產(chǎn)誠信大數(shù)據(jù)應(yīng)用當(dāng)前89頁,總共110頁。1、發(fā)生安全事故的A企業(yè)屬地歸屬、行業(yè)歸屬2、發(fā)生安全事故的A企業(yè)其法人情況(包括年齡、性格、祖籍、違法情況等)3、發(fā)生安全事故的A企業(yè)安全生產(chǎn)違規(guī)情況A企業(yè)安全生產(chǎn)檔案-大數(shù)據(jù)的分析計算法人(年齡、性別、地域)事故情況(輕傷事故、重傷事故、死亡事故)標(biāo)準(zhǔn)化等級(一級達標(biāo)、二級達標(biāo))隱患排查情況(是否排查隱患、整改率)...事故追溯安委會成員單位交換數(shù)據(jù)庫工商建筑質(zhì)檢消防…企業(yè)基本信息煤礦數(shù)據(jù)庫非煤數(shù)據(jù)庫?;瘮?shù)據(jù)庫工貿(mào)數(shù)據(jù)庫…安全生產(chǎn)監(jiān)管監(jiān)察數(shù)據(jù)庫法人(年齡、性別、地域)1、企業(yè)注冊追溯(其他地域是否存在相同法人企業(yè))2、企業(yè)安全生產(chǎn)全過程追溯過程追溯當(dāng)前90頁,總共110頁。運輸監(jiān)督企業(yè)登記注冊舉報投訴處罰執(zhí)法追蹤溯源信用評估許可審批應(yīng)急響應(yīng)管理監(jiān)督分析統(tǒng)計協(xié)同治理?;穫}儲應(yīng)急處置?;肥褂迷朴嬎?物聯(lián)網(wǎng)實時監(jiān)控企業(yè)規(guī)范經(jīng)營、政府高效監(jiān)管、輿論有效監(jiān)督

來源可查、去向可追、責(zé)任可糾、規(guī)律可循?;坟?zé)任追朔危化品生產(chǎn)?;饭芾懋?dāng)前91頁,總共110頁。語義分析引擎鋁粉膠木灰煤塵鋅粉濕度機械溫度木屑…………………匹配匹配語法庫語義庫百度百科維基百科行業(yè)詞庫安全詞庫????????????互聯(lián)網(wǎng)數(shù)據(jù)標(biāo)記偏移量0偏移量1偏移量2偏移量3事故:粉塵爆炸按規(guī)則分詞名稱粉塵鋁粉氧化劑互聯(lián)網(wǎng)公開網(wǎng)頁爬蟲軟件原始網(wǎng)頁鏡像文本信息圖片信息腳本信息索引信息??????分詞→詞庫語法庫行業(yè)詞庫安全詞庫……數(shù)據(jù)資源目錄按行業(yè)煤礦非煤礦山危化煙花輕工機械冶金……

按地區(qū)全國北京上海廣東廣西海南天津重慶江蘇浙江西藏……按性質(zhì)安全生產(chǎn)旅游政務(wù)論壇……按……互聯(lián)網(wǎng)鋁鎂粉塵爆炸搜索當(dāng)前92頁,總共110頁。大數(shù)據(jù)展現(xiàn)KPI監(jiān)控分析預(yù)警分析綜合評價分析與數(shù)據(jù)挖掘分布分析構(gòu)成分析地域分析占比逾趨勢分析逾趨勢分析類型分析關(guān)聯(lián)因素分析安全生產(chǎn)大數(shù)據(jù)可視化展現(xiàn)當(dāng)前93頁,總共110頁。企業(yè)基本信息行政許可信息地理信息一張圖重大危險源監(jiān)控監(jiān)測數(shù)據(jù)視頻信息重大隱患信息應(yīng)急資源信息當(dāng)前94頁,總共110頁。安全生產(chǎn)指數(shù):綜合地表征企業(yè)/區(qū)域安全風(fēng)險狀況》事故發(fā)生的季節(jié)性、周期性、關(guān)聯(lián)性等規(guī)律,制定安全生產(chǎn)決策提供支持。安全生產(chǎn)事故與標(biāo)準(zhǔn)化達標(biāo)情況關(guān)系分析安全生產(chǎn)事故數(shù)量在特定月份地域分布關(guān)系分析當(dāng)前95頁,總共110頁。安全生產(chǎn)輿情分析預(yù)警當(dāng)前96頁,總共110頁。通過數(shù)據(jù)挖掘,建立安全生產(chǎn)輿情大數(shù)據(jù)分析模型,實現(xiàn)關(guān)聯(lián)結(jié)果分析、趨勢預(yù)判分析、模擬預(yù)測分析。當(dāng)前97頁,總共110頁。重大事件全國定位基于GIS系統(tǒng),通過安全生產(chǎn)輿情指數(shù)模型分析,實現(xiàn)省級安全生產(chǎn)輿情熱度分析、重大事件全國定位、重點地市輿情排行、區(qū)域安全生產(chǎn)輿情分析。

省級安全生產(chǎn)輿情熱度分析重點地市輿情排行區(qū)域安全生產(chǎn)輿情分析當(dāng)前98頁,總共110頁。通過大數(shù)據(jù)挖掘分析,探索輿情傳播規(guī)律,構(gòu)建輿情預(yù)警指標(biāo)體系,及時發(fā)現(xiàn)輿情危機苗頭并預(yù)警。當(dāng)前99頁,總共110頁。依托國家電子政務(wù)外網(wǎng)、互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng),以安全生產(chǎn)信息資源規(guī)劃和數(shù)據(jù)應(yīng)用服務(wù)為導(dǎo)向,充分運用云計算技術(shù),從服務(wù)于國家安

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論