![大數(shù)據(jù)及其典型應(yīng)用_第1頁](http://file4.renrendoc.com/view/e36bdd77c739581c3e7cfba91b5b6a2c/e36bdd77c739581c3e7cfba91b5b6a2c1.gif)
![大數(shù)據(jù)及其典型應(yīng)用_第2頁](http://file4.renrendoc.com/view/e36bdd77c739581c3e7cfba91b5b6a2c/e36bdd77c739581c3e7cfba91b5b6a2c2.gif)
![大數(shù)據(jù)及其典型應(yīng)用_第3頁](http://file4.renrendoc.com/view/e36bdd77c739581c3e7cfba91b5b6a2c/e36bdd77c739581c3e7cfba91b5b6a2c3.gif)
![大數(shù)據(jù)及其典型應(yīng)用_第4頁](http://file4.renrendoc.com/view/e36bdd77c739581c3e7cfba91b5b6a2c/e36bdd77c739581c3e7cfba91b5b6a2c4.gif)
![大數(shù)據(jù)及其典型應(yīng)用_第5頁](http://file4.renrendoc.com/view/e36bdd77c739581c3e7cfba91b5b6a2c/e36bdd77c739581c3e7cfba91b5b6a2c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
信息資源管理-擴展知識
大數(shù)據(jù)及其典型應(yīng)用2023/1/132引子棱鏡門波士頓馬拉松爆炸案PredPol少數(shù)派報告2013大數(shù)據(jù)元年video一、大數(shù)據(jù)的相關(guān)概念二、國內(nèi)外大數(shù)據(jù)分析的研究現(xiàn)狀三、構(gòu)建大數(shù)據(jù)分析平臺四、公共安全領(lǐng)域大數(shù)據(jù)應(yīng)用案例目錄2023/1/133一、大數(shù)據(jù)的相關(guān)概念
2023/1/134數(shù)據(jù)管理技術(shù)發(fā)展歷史數(shù)據(jù)管理技術(shù)歷經(jīng)人工管理、文件管理、數(shù)據(jù)庫管理等時代,大數(shù)據(jù)技術(shù)的出現(xiàn)使該領(lǐng)域進入了一個新的發(fā)展階段-5-194619511956196119701974197919912001200320082011第一臺計算機ENIAC面世磁帶+卡片人工管理磁盤被發(fā)明,進入文件管理時代網(wǎng)絡(luò)型SQLE-RGE公司發(fā)明第一個網(wǎng)絡(luò)模型數(shù)據(jù)庫,但僅限于GE自己的主機1960年代,IT系統(tǒng)規(guī)模和復(fù)雜度變大,數(shù)據(jù)與應(yīng)用分離的需求開始產(chǎn)生,數(shù)據(jù)庫技術(shù)開始萌芽并蓬勃發(fā)展,并在1990年后逐步統(tǒng)一到以關(guān)系型數(shù)據(jù)庫為主導(dǎo)提出關(guān)系模型SQL語言被發(fā)明關(guān)系型數(shù)據(jù)庫ORACLE發(fā)布第一個商用SQL關(guān)系數(shù)據(jù)庫,后續(xù)快速發(fā)展數(shù)據(jù)倉庫數(shù)據(jù)倉庫開始涌現(xiàn),關(guān)系數(shù)據(jù)庫開始全面普及且平臺無關(guān),進入成熟期2001年后,互聯(lián)網(wǎng)迅速發(fā)展,數(shù)據(jù)量成倍遞增,量變引起質(zhì)變,開始對數(shù)據(jù)管理技術(shù)提出全新的要求1946年,電腦誕生,數(shù)據(jù)與應(yīng)用緊密捆綁在文件中,彼此不分Hadoop成為Apache頂級項目,重點支持海量數(shù)據(jù)分布式管理和分布式計算GFS谷歌發(fā)表論文介紹分布式計算大數(shù)據(jù)發(fā)展背景全球信息化發(fā)展已步入大數(shù)據(jù)時代150億個設(shè)備連接到互聯(lián)網(wǎng)全球每秒鐘發(fā)送290萬封電子郵件每天有2.88萬小時視頻上傳到Y(jié)outubeFacebook每日評論達32億條,每天上傳照片近3億張,每月處理數(shù)據(jù)總量約130萬TB2011年全球產(chǎn)生數(shù)據(jù)量1.8ZB,預(yù)計2020年將增長到35ZB大數(shù)據(jù)正迅速成為最值得關(guān)注的IT領(lǐng)域之一2011年5月,EMCWorld2011大會主題“云計算相遇大數(shù)據(jù)”,EMC除了一直倡導(dǎo)的云計算外,還拋出"大數(shù)據(jù)"(BigData)概念2011年6月底,IBM、麥肯錫等眾多國外機構(gòu)發(fā)布"大數(shù)據(jù)"相關(guān)研究報告,予以積極跟進2011年10月,Gartner認為2012年十大戰(zhàn)略技術(shù)將包括"大數(shù)據(jù)"2011年11月底,IDC將"大數(shù)據(jù)"放入2012年信息通信產(chǎn)業(yè)十大預(yù)測之一-6-IDC全球數(shù)據(jù)量預(yù)測(1ZB
=1百萬PB=10億TB)Google網(wǎng)站Bigdata關(guān)鍵詞搜索及新聞引用量什么是大數(shù)據(jù)123大數(shù)據(jù)的定義理解大數(shù)據(jù)的“4V”特征大數(shù)據(jù)的產(chǎn)生、增長2023/1/137“大數(shù)據(jù)”是如何產(chǎn)生的?facebook社交網(wǎng)絡(luò)淘寶電子商務(wù)微博、Apps移動互聯(lián)21世紀是數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大?;ヂ?lián)網(wǎng)(社交、搜索、電商)、移動互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。
半個世紀以來,隨著計算機技術(shù)全面融入社會生活,信息爆炸已經(jīng)積累到了一個開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息爆炸的學(xué)科如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個概念*。如今,這個概念幾乎應(yīng)用到了所有人類智力與發(fā)展的領(lǐng)域中。2023/1/138大數(shù)據(jù)時代的爆炸增長想駕馭這龐大的數(shù)據(jù),我們必須了解大數(shù)據(jù)的特征。地球上至今總共的數(shù)據(jù)量:在2006年,個人用戶才剛剛邁進TB時代,全球一共新產(chǎn)生了約180EB的數(shù)據(jù);在2011年,這個數(shù)字達到了1.8ZB。而有市場研究機構(gòu)預(yù)測:到2020年,整個世界的數(shù)據(jù)總量將會增長44倍,達到35.2ZB(1ZB=10億TB)!GBTBPBEBZB1GB
=2^30字節(jié)1TB=2^40字節(jié)1PB
=2^50字節(jié)1EB
=2^60字節(jié)1ZB=2^70字節(jié)2023/1/139大數(shù)據(jù)的4V特征“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度低(Value)”就是“大數(shù)據(jù)”的顯著特征,或者說,只有具備這些特點的數(shù)據(jù),才是大數(shù)據(jù)。VolumeVelocityValueVariety2023/1/1310大數(shù)數(shù)據(jù)據(jù)的的構(gòu)構(gòu)成成大數(shù)數(shù)據(jù)據(jù)=海量量數(shù)數(shù)據(jù)據(jù)+復(fù)雜雜類類型型的的數(shù)數(shù)據(jù)據(jù)海量量交交易易數(shù)數(shù)據(jù)據(jù)::企業(yè)業(yè)內(nèi)內(nèi)部部的的經(jīng)經(jīng)營營交交易易信信息息主主要要包包括括聯(lián)聯(lián)機機交交易易數(shù)數(shù)據(jù)據(jù)和和聯(lián)聯(lián)機機分分析析數(shù)數(shù)據(jù)據(jù),,是是結(jié)結(jié)構(gòu)構(gòu)化化的的、、通通過過關(guān)關(guān)系系數(shù)數(shù)據(jù)據(jù)庫庫進進行行管管理理和和訪訪問問的的靜靜態(tài)態(tài)、、歷歷史史數(shù)數(shù)據(jù)據(jù)。。通通過過這這些些數(shù)數(shù)據(jù)據(jù),,我我們們能能了了解解過過去去發(fā)發(fā)生生了了什什么么。。大數(shù)數(shù)據(jù)據(jù)包包括括::交易易數(shù)數(shù)據(jù)據(jù)和和交交互互數(shù)數(shù)據(jù)據(jù)集集在在內(nèi)內(nèi)的的所所有有數(shù)數(shù)據(jù)據(jù)集集海量量交交互互數(shù)數(shù)據(jù)據(jù)::源于于Facebook、Twitter、LinkedIn及其其他他來來源源的的社社交交媒媒體體數(shù)數(shù)據(jù)據(jù)構(gòu)構(gòu)成成。。它它包包括括了了呼呼叫叫詳詳細細記記錄錄CDR、設(shè)設(shè)備備和和傳傳感感器器信信息息、、GPS和地地理理定定位位映映射射數(shù)數(shù)據(jù)據(jù)、、通通過過管管理理文文件件傳傳輸輸ManageFileTransfer協(xié)議議傳傳送送的的海海量量圖圖像像文文件件、、Web文本本和和點點擊擊流流數(shù)數(shù)據(jù)據(jù)、、科科學(xué)學(xué)信信息息、、電電子子郵郵件件等等等等。??煽梢砸愿娓嬖V訴我我們們未未來來會會發(fā)發(fā)生生什什么么。。海量量數(shù)數(shù)據(jù)據(jù)處處理理::大數(shù)數(shù)據(jù)據(jù)的的涌涌現(xiàn)現(xiàn)已已經(jīng)經(jīng)催催生生出出了了設(shè)設(shè)計計用用于于數(shù)數(shù)據(jù)據(jù)密密集集型型處處理理的的架架構(gòu)構(gòu)。。例例如如具具有有開開放放源源碼碼、、在在商商品品硬硬件件群群中中運運行行的的ApacheHadoop。2022/12/3111分析技術(shù):數(shù)據(jù)處理:自自然語言處理理技術(shù)統(tǒng)計和分析::A/Btest;topN排行榜;地域域占比;文本本情感分析數(shù)據(jù)挖掘:關(guān)關(guān)聯(lián)規(guī)則分析析;分類;聚聚類模型預(yù)測:預(yù)預(yù)測模型;機機器學(xué)習(xí);建建模仿真大數(shù)據(jù)技術(shù)::數(shù)據(jù)采集:ETL工具數(shù)據(jù)存?。宏P(guān)關(guān)系數(shù)據(jù)庫;;NoSQL;SQL等基礎(chǔ)架構(gòu)支持持:云存儲;;分布式文件件系統(tǒng)等計算結(jié)果展現(xiàn)現(xiàn):云計算;;標簽云;關(guān)關(guān)系圖等一些相關(guān)技術(shù)術(shù)存儲結(jié)構(gòu)化數(shù)據(jù)海量數(shù)據(jù)的查查詢、統(tǒng)計、、更新等操作作效率低非結(jié)構(gòu)化數(shù)據(jù)據(jù)圖片、視頻、、word、pdf、ppt等文件存儲不利于檢索、、查詢和存儲儲半結(jié)構(gòu)化數(shù)據(jù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化化存儲按照非結(jié)構(gòu)化化存儲解決方案:Hadoop(MapReduce技術(shù))流計算(twitter的storm和yahoo!的S4)數(shù)據(jù)采集數(shù)據(jù)儲存數(shù)據(jù)管理數(shù)據(jù)分析與挖掘2022/12/31122022/12/3113大數(shù)據(jù)的市場場潛力利用GPS數(shù)據(jù)了解交通通狀況智能電表應(yīng)用用級家庭能源源監(jiān)測2012年3月29日奧巴馬政府府公布了”大數(shù)據(jù)研發(fā)計計劃”。該計劃的目目標是改進現(xiàn)現(xiàn)有人們從海海量和復(fù)雜的的數(shù)據(jù)中獲取取知識的能力力,從而加速速美國在科學(xué)學(xué)與工程領(lǐng)域域發(fā)明的步伐伐,增強國家家安全,轉(zhuǎn)變變現(xiàn)有的教學(xué)學(xué)和學(xué)習(xí)方式式?!按髷?shù)據(jù)戰(zhàn)略略”上升為美美國最高國策策對數(shù)據(jù)占有和和控制,做為為在陸權(quán)、海海權(quán)、空權(quán)之之外的另一種種國家核心能能力。大數(shù)據(jù)的浪潮谷歌搜索與流流感預(yù)測大數(shù)據(jù)與喬布布斯的癌癥治治療微博&投資沃爾瑪?shù)钠【凭婆c紙尿布塔吉特預(yù)測少少女懷孕沃爾瑪?shù)皳榕c與颶風(fēng)用品的的關(guān)系“魔毯”病人人的監(jiān)控智慧城市&智能化交通谷歌翻譯系統(tǒng)統(tǒng)理解大數(shù)據(jù)數(shù)據(jù)已經(jīng)成為為可以與物質(zhì)質(zhì)資產(chǎn)和人力力資本相提并并論的重要的的生產(chǎn)要素——麥肯錫《大數(shù)據(jù):下一個創(chuàng)新、、競爭和生產(chǎn)產(chǎn)力的前沿》二、國內(nèi)外大大數(shù)據(jù)分析的的研究現(xiàn)狀流感趨勢預(yù)測測2022/12/31172022/12/3118全球每星期會會有數(shù)以百萬萬計的用戶在在網(wǎng)上搜索健健康信息。正正如您所預(yù)料料的那樣,在在流感季節(jié),,與流感有關(guān)關(guān)的搜索會明明顯增多;到到了過敏季節(jié)節(jié),與過敏有有關(guān)的搜索會會顯著上升;;而到了夏季季,與曬傷有有關(guān)的搜索又又會大幅增加加。某些搜索字詞詞非常有助于于了解流感疫疫情。Google流感趨勢會根根據(jù)匯總的Google搜索數(shù)據(jù),近近乎實時地對對全球當(dāng)前的的流感疫情進進行估測。搜索流感相關(guān)關(guān)主題的人數(shù)數(shù)與實際患有有流感癥狀的的人數(shù)之間存存在著密切的的關(guān)系。當(dāng)然然,并非每個個搜索“流感感”的人都真真的患有流感感,但將與流流感有關(guān)的搜搜索查詢匯總總到一起時,,便可以找到到一種模式。。將統(tǒng)計的查查詢數(shù)量與傳傳統(tǒng)流感監(jiān)測測系統(tǒng)的數(shù)據(jù)據(jù)進行了對比比,結(jié)果發(fā)現(xiàn)現(xiàn)許多搜索查查詢在流感季季節(jié)確實會明明顯增多。通通過對這些搜搜索查詢的出出現(xiàn)次數(shù)進行行統(tǒng)計,便可可以估測出世世界上不同國國家和地區(qū)的的流感傳播情情況。Detectinginfluenzaepidemicsusingsearchenginequerydata,Nature457,1012-1014(19February2009)2022/12/3119上圖顯示了根根據(jù)歷史查詢詢所得的美國國近幾年的流流感估測結(jié)果果,以及這些些結(jié)果與官方方的流感監(jiān)測測數(shù)據(jù)的對比比。從圖中可可以看出,根根據(jù)與流感相相關(guān)的Google搜搜索查詢所所得到的估測測結(jié)果,與以以往的流感疫疫情指示線非非常接近。當(dāng)當(dāng)然,過去的的表現(xiàn)并不能能保證以后的的結(jié)果一定準準確。2022/12/31202022/12/31212022/12/3122卡耐基基梅隆隆大學(xué)學(xué)的JiweiLi和和康乃乃爾大大學(xué)的的ClaireCardie,成成功利利用Twitter預(yù)預(yù)測測了早早期流流感爆爆發(fā)。。他們的的方式式與Google類類似。。首先先,從從Twitter數(shù)數(shù)據(jù)流流中過過濾包包含與與“流流感””相關(guān)關(guān),并并帶有有位置置標簽簽的tweet;;然后后,在在地圖圖上標標注這這些tweet的的位位置分分布,,以及及隨時時間產(chǎn)產(chǎn)生的的變化化。同同時,,還制制作了了流感感的動動態(tài)變變化模模型。。新模模型中中,流流感包包括4個個階階段::無傳傳染階階段、、爆發(fā)發(fā)階段段、穩(wěn)穩(wěn)定階階段以以及衰衰退階階段。。此外,,采用用了全全新的的算法法,試試圖盡盡可能能快得得發(fā)現(xiàn)現(xiàn)不同同時期期的轉(zhuǎn)轉(zhuǎn)換節(jié)節(jié)點。。實際際上,,Li和和Cardie在在2008年年6月月至2010年年6月月間,,已經(jīng)經(jīng)利用用100萬萬美國國人的的360萬萬條tweet,,驗驗證了了該方方法的的有效效性。。為為了檢檢驗他他們的的預(yù)測測是否否成真真,Li和和Cardie將將他們們的分分析與與CDC進進行對對比。。他們們說,,“我我們確確信,,流感感相關(guān)關(guān)tweet與與CDC提提供的的流感感疾病病案例例數(shù)目目,呈呈顯著著相關(guān)關(guān)?!薄?022/12/31232022/12/3124日本國國內(nèi)有有一個個網(wǎng)站站,你你只要要打開開這個個網(wǎng)站站用自自己的的Twitter賬號登登錄,,就可可以在在短時時間內(nèi)內(nèi)通過過數(shù)萬萬條Twitter找出可可能感感冒的的人,,并通通過過過去的的感冒冒情況況和今今日的的感冒冒情況況進行行分析析(以以及統(tǒng)統(tǒng)計目目前發(fā)發(fā)燒以以及嗓嗓子痛痛的患患者數(shù)數(shù)量)),另另外該該程序序還會會結(jié)合合氣溫溫和濕濕度的的變化化來預(yù)預(yù)測將將來來感冒冒的流流行情情況,,并制制作一一個““易感感冒日日歷””。目目前,,此類類服務(wù)務(wù)正在在日本本陸續(xù)續(xù)展開開。通通過這這個服服務(wù)器器的分分析,,大家家就能能夠知知道在在自己己身邊邊到底底有多多少人人有感感冒的的癥狀狀,并并提前前做好好預(yù)防防準備備。日本國國立感感染癥癥研究究所將將會把把全國國約5000個醫(yī)療診診所的流流感患者者進行統(tǒng)統(tǒng)計并發(fā)發(fā)布數(shù)據(jù)據(jù)。經(jīng)過過對比,,研究所所得出的的實際統(tǒng)統(tǒng)計數(shù)字字和網(wǎng)站站上預(yù)測測的結(jié)果果基本是是一致的的,那么么為什么么大數(shù)據(jù)據(jù)的結(jié)果果會很準準呢?首先是因因為通過過網(wǎng)絡(luò)信信息分析析的技術(shù)術(shù)有所進進步,已已經(jīng)可以以通過各各種各樣樣的留言言自動搜搜索到相相關(guān)的數(shù)數(shù)據(jù),并并自動分分類。就就像Google現(xiàn)在所使使用的技技術(shù),就就是利用用服務(wù)器器分析與與流感關(guān)關(guān)系十分分密切的的十幾個個單詞進進行統(tǒng)計計。另一個就就是大數(shù)數(shù)據(jù)所特特有的功功能。在在流感最最嚴重的的時候,,每天會會有成千千上萬條條Tweets發(fā)布,即即便有一一些誤差差,但通通過數(shù)據(jù)據(jù)分析也也能分析析出數(shù)據(jù)據(jù)的精準準度。以往,公公共機構(gòu)構(gòu)在發(fā)布布流感情情報的時時候至少少要延遲遲一周,,在有些些偏遠地地區(qū)的立立桿信息息也并不不確切,,而現(xiàn)在在,通過過網(wǎng)絡(luò)能能夠有效效彌補這這些缺憾憾。2022/12/31252022/12/3126淘寶的數(shù)數(shù)據(jù)化運營——實例分析分析流程程1.分析主題題確定及及數(shù)據(jù)指指標的選選擇;2.數(shù)據(jù)倉庫庫數(shù)據(jù)提提取及清清洗;3.不相關(guān)指指標剔除除;4.用訓(xùn)練數(shù)數(shù)據(jù)建立立模型;;5.用測試數(shù)數(shù)據(jù)檢驗驗?zāi)P停唬?.預(yù)測新的的流失用用戶,并并提取用用戶名單單;7.制訂挽留留策略::對圈定定的客戶戶進一步步進行分分群,然然后逐群群制訂有針對對的挽留留策略。。比如有有的群組組是屬于于夜間通通話多((和總體的均均值相比比)的客客戶,那那么針對對他們的的挽留策策略可能能是推薦一些些夜間通通話優(yōu)惠惠的資費費方案。。8.實施挽留留行動、、收集客客戶反饋饋。9.評估挽留留效果::2022/12/3127三、構(gòu)建建大數(shù)據(jù)據(jù)分析平平臺四、公共共安全領(lǐng)領(lǐng)域大數(shù)數(shù)據(jù)應(yīng)用用案例面向公共共安全領(lǐng)領(lǐng)域的大大數(shù)據(jù)分分析技術(shù)術(shù)平臺數(shù)據(jù)挖掘掘DataMiner多維分析析BIBeans查詢Discoverer數(shù)據(jù)倉庫庫管理(OEM)數(shù)據(jù)提取取WarehouseBuilder應(yīng)用服務(wù)務(wù)器ApplicationServer/PortalDataBase人口數(shù)數(shù)據(jù)外部數(shù)據(jù)犯罪數(shù)據(jù)報表ReportsDataMiningOLAP數(shù)據(jù)轉(zhuǎn)換換中央數(shù)據(jù)據(jù)倉庫知識發(fā)現(xiàn)現(xiàn)信息展現(xiàn)現(xiàn)應(yīng)用系統(tǒng)統(tǒng)源數(shù)據(jù)數(shù)據(jù)獲取數(shù)據(jù)管理數(shù)據(jù)使用2022/12/3130刑偵的的犯罪罪預(yù)防防搜集犯犯罪的的信息息推斷罪罪犯的的習(xí)慣慣預(yù)測罪罪案的的發(fā)生生非法出出入境境判別別海關(guān)走走私模模式的的分析析緊急事事件的的處理理人員的的緊急急疏散散資源的的緊急急調(diào)配配緊急狀狀態(tài)的的安全全管理理緊急事事件發(fā)發(fā)生的的預(yù)演演交通管管理公共安安全領(lǐng)領(lǐng)域基基于大大數(shù)據(jù)據(jù)的智智能分分析2022/12/3131信息的的來源源銀行交交易歷史資資料庫庫/知識識庫公共信信息政府?dāng)?shù)數(shù)據(jù)庫庫Internet截獲/監(jiān)聽聽情報報通信情情報人工情情報2022/12/3132問題的的關(guān)鍵鍵大量的的信息息(有有關(guān)/無關(guān)關(guān))是是分析析的基基礎(chǔ),,也是是分析析的障障礙事件的的信息息往往往是隨隨機獲獲得不確定定的因因素影影響分分析的的結(jié)果果分析的的速度度是關(guān)關(guān)鍵2022/12/3133飛速膨膨脹的的信息息多種學(xué)學(xué)科的的邊緣緣結(jié)合合有限的的記憶憶和注注意范范圍長時間間持續(xù)續(xù)的分分析工工作嚴重依依賴分分析人人員的的經(jīng)驗驗如何用用計算算機系系統(tǒng)支支持復(fù)復(fù)雜海海量的的分析析過程程?限制……他們承承擔(dān)了了大部部分負負擔(dān)依靠分分析人人員2022/12/3134限制……分析人人員的的沉重重負擔(dān)擔(dān)依靠分分析人人員2022/12/3135當(dāng)前的分析析需求從不同的來來源有效的的集成知識識和信息連續(xù)的知識識積累提供自動的的警告為分析人員員的查詢提提供答案構(gòu)造不同的的案件情節(jié)節(jié)假設(shè)2022/12/3136定性,定定量分析時間&頻頻率分析析Databases經(jīng)驗自由文本統(tǒng)一的知識識系統(tǒng)從不同信息息來源和格格式獲取數(shù)數(shù)據(jù)2022/12/3137基本信息組織個人人工情報事件數(shù)據(jù)庫銀行交易其它數(shù)據(jù)源政府?dāng)?shù)據(jù)庫庫通信情報監(jiān)聽
反饋
人工情報詢問檢查模擬聯(lián)結(jié)事件生成
Events:Meeting(What,Who,Where,When,Frequency)Travel(Who,How,Where,When,Length)Phonecall(Who,When,Length,Content,Frequency)Delivery(Who,When,How,Size,What,Frequent,Payment)Other(What,Who,When,Where)Crime(What,When,Where,Who,How)2022/12/3138典型應(yīng)用1–刑事罪案自自動分析2022/12/3139參與分析的的數(shù)據(jù)罪犯–犯罪技技巧(爆爆炸-爆炸炸物制作,殺人方方式,動動機等等),屬于于特定團伙伙和團伙中中的角色(計劃者者,輔助助者,領(lǐng)領(lǐng)導(dǎo)者,執(zhí)執(zhí)行者/馬仔等等等),戶戶籍地/暫暫住地,入入獄歷史史團伙–成員,角色潛在目標–人群/公共機構(gòu)構(gòu)/商業(yè)機機構(gòu),他他們的位置置知識和經(jīng)驗驗–這些因因素如何相相互作用––包括括外在的影影響和經(jīng)驗驗(過去去發(fā)生的事事件)新的信息會會源源不斷斷…2022/12/3140模擬擬案案例例-西西西西里里,巴巴勒勒莫莫,4/4/03:“Corradi拘捕捕了了DonMarcello””(公共共信信息息)理解解信信息息Corradi是巴巴勒勒莫莫警警方方的的的的首首席席偵偵探探DonMarcello是Marcello家族族的的教教父父Marcello家族族具具有有很很強強的的報報復(fù)復(fù)性性巴勒勒莫莫警警方方很很可可能能遭遭到到報報復(fù)復(fù)文本本信信息息的的理理解解外部部數(shù)數(shù)據(jù)據(jù)訪訪問問外部部數(shù)數(shù)據(jù)據(jù)訪訪問問DataMining/先驗驗知知識識推理理,警警報報2022/12/3141新的的信信息息理解解信信息息Bob是Marcello家族族的的成成員員Bob是家家族族中中的的計計劃劃者者和和談?wù)勁信写肀鞰arcello家族族的的勢勢力力只只限限于于巴巴勒勒莫莫談判判代代表表到到外外面面的的地地區(qū)區(qū)尋尋找找家家族族內(nèi)內(nèi)沒沒有有的的炸炸彈彈專專家家炸彈彈制制造造和和使使用用是是Marcello家族族沒沒有有的的技技術(shù)術(shù),Parsi地區(qū)區(qū)的的黑黑手手黨黨家家族族有有這這樣樣的的專專家家Per是Parsi地區(qū)區(qū)的的黑黑手手黨黨炸炸彈彈專專家家同時時間間服服刑刑的的罪罪犯犯經(jīng)經(jīng)常常會會一一起起合合作作犯犯案案Per和Bob有同同時時間間服服刑刑的的歷歷史史Marcello家族族有有可可能能以以炸炸彈彈攻攻擊擊的的方方式式報報復(fù)復(fù)DonMarcello的被被拘拘捕捕Bob有可可能能計計劃劃用用炸炸彈彈攻攻擊擊巴巴勒勒莫莫警警方方巴勒勒莫莫,4/4/03:“Corradi拘捕捕了了DonMarcello””(公共共信信息息)巴勒勒莫莫,5/5/03:“Bob在Parsi出現(xiàn)現(xiàn)”(警警方方通通報報)文本信息的理解外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗知識外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗知識DataMining/先驗知識推理,警報外部數(shù)據(jù)訪問2022/12/3142新的信息巴勒莫,4/4/03:“Corradi拘捕了DonMarcello”(公共信息)巴勒莫,5/5/03:“Bob在Parsi出現(xiàn)”(警方通報)羅馬,5/5/03:“Fabrizzi將會29號在在巴勒莫法庭庭宣判DonMarcello"(公共信息)巴勒莫,7/5/03:“這個月巴勒莫莫會發(fā)生一些些事情”(警方情報)……有可能報復(fù)巴巴勒莫警方––可能是是一起炸彈攻攻擊有可能針對Fabrizzi法官–可可能的攻擊手手段,謀殺殺或是炸彈攻攻擊基于時間的相關(guān)分析(所有的分析都是與時間高度相關(guān)的)2022/12/3143新的信息如果我們拘捕捕Per?炸彈攻擊的威威脅會降低,但是不會會消失–Marcello家族的談判代代表還知道其其他的炸彈專專家,等等等…如果我們同時時拘捕Per和Bob?推理,假設(shè)分析推理,假設(shè)分析2022/12/3144巴勒莫,4/4/03:“Corradi拘捕了DonMarcello”(公共信息)巴勒莫,5/5/03:“Bob在Parsi出現(xiàn)”(警方通報)羅馬,5/5/03:“Fabrizzi將會29號在在巴勒莫法庭庭宣判DonMarcello"(公共信息)巴勒莫,7/5/03:“這個月巴勒莫莫會發(fā)生一些些事情”(警方情報)本月有事情(突發(fā)事件)在巴勒莫發(fā)生生Fabrizzi將在29日宣宣判DonMarcelloBob出現(xiàn)在Parsi密切注意相關(guān)人員的接觸炸彈有可能在制造中(假設(shè)事件與Marcello家族有關(guān)-警告會在三個月內(nèi)有效)可能的報復(fù)DonMarcello被囚禁DonMarcello被拘捕事件與沖突2022/12/3145系統(tǒng)的功能系統(tǒng)包含了先先驗知識閱讀自由結(jié)構(gòu)構(gòu)的文本并建建立事件事件被聯(lián)系起起來,按照照邏輯,觸觸發(fā)原因,警警報,額額外事件的發(fā)發(fā)生,等等等結(jié)合自由文本理解解人像特征、指指紋特征自動動識別推理DataMining聯(lián)結(jié)外部的信信息資源2022/12/3146在信息息的海海洋中中搜索索問題的的關(guān)鍵鍵在于于面臨臨不斷斷變化化的信信息和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度地下空間開發(fā)施工合同規(guī)范文本
- 2025年度印刷材料行業(yè)環(huán)保型采購與生產(chǎn)合同
- 低碳環(huán)保的活動方案范文(13篇)
- 2025年債務(wù)解決方案資產(chǎn)協(xié)議書
- 2025年企業(yè)電氣設(shè)施維護合同
- 2025年家用空氣調(diào)節(jié)器項目提案報告模稿
- 2025年電子脂肪秤項目立項申請報告模范
- 2025年芝士片項目立項申請報告模范
- 2025年空心槳葉干燥機項目立項申請報告模板
- 2025年臨時性雜工勞動合同
- 教育強國建設(shè)規(guī)劃綱要(2024-2035年)要點解讀(教育是強國建設(shè)民族復(fù)興之基)
- 2025年電梯專用電機項目可行性研究報告
- 煤礦安全生產(chǎn)方針及法律法規(guī)課件
- 建筑行業(yè)新員工試用期考核制度
- 2025年教科室工作計劃樣本(四篇)
- 2024年版古董古玩買賣合同:古玩交易稅費及支付規(guī)定
- 幼兒園費用報銷管理制度
- 【7歷期末】安徽省宣城市2023-2024學(xué)年七年級上學(xué)期期末考試歷史試題
- 髖部脆性骨折帶來的思考
- 馬桶采購合同范例
- 小學(xué)二年級有余數(shù)的除法口算題(共300題)
評論
0/150
提交評論