信息資源管理擴展知識大數(shù)據(jù)及其典型應(yīng)用_第1頁
信息資源管理擴展知識大數(shù)據(jù)及其典型應(yīng)用_第2頁
信息資源管理擴展知識大數(shù)據(jù)及其典型應(yīng)用_第3頁
信息資源管理擴展知識大數(shù)據(jù)及其典型應(yīng)用_第4頁
信息資源管理擴展知識大數(shù)據(jù)及其典型應(yīng)用_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信息資源管理-擴展知識

大數(shù)據(jù)及其典型應(yīng)用2023/1/122引子棱鏡門波士頓馬拉松爆炸案PredPol少數(shù)派報告2013大數(shù)據(jù)元年video一、大數(shù)據(jù)的相關(guān)概念二、國內(nèi)外大數(shù)據(jù)分析的研究現(xiàn)狀三、構(gòu)建大數(shù)據(jù)分析平臺四、公共安全領(lǐng)域大數(shù)據(jù)應(yīng)用案例目錄2023/1/123一、大數(shù)據(jù)的相關(guān)概念

2023/1/124數(shù)據(jù)管理技術(shù)發(fā)展歷史數(shù)據(jù)管理技術(shù)歷經(jīng)人工管理、文件管理、數(shù)據(jù)庫管理等時代,大數(shù)據(jù)技術(shù)的出現(xiàn)使該領(lǐng)域進入了一個新的發(fā)展階段-5-194619511956196119701974197919912001200320082011第一臺計算機ENIAC面世磁帶+卡片人工管理磁盤被發(fā)明,進入文件管理時代網(wǎng)絡(luò)型SQLE-RGE公司發(fā)明第一個網(wǎng)絡(luò)模型數(shù)據(jù)庫,但僅限于GE自己的主機1960年代,IT系統(tǒng)規(guī)模和復(fù)雜度變大,數(shù)據(jù)與應(yīng)用分離的需求開始產(chǎn)生,數(shù)據(jù)庫技術(shù)開始萌芽并蓬勃發(fā)展,并在1990年后逐步統(tǒng)一到以關(guān)系型數(shù)據(jù)庫為主導提出關(guān)系模型SQL語言被發(fā)明關(guān)系型數(shù)據(jù)庫ORACLE發(fā)布第一個商用SQL關(guān)系數(shù)據(jù)庫,后續(xù)快速發(fā)展數(shù)據(jù)倉庫數(shù)據(jù)倉庫開始涌現(xiàn),關(guān)系數(shù)據(jù)庫開始全面普及且平臺無關(guān),進入成熟期2001年后,互聯(lián)網(wǎng)迅速發(fā)展,數(shù)據(jù)量成倍遞增,量變引起質(zhì)變,開始對數(shù)據(jù)管理技術(shù)提出全新的要求1946年,電腦誕生,數(shù)據(jù)與應(yīng)用緊密捆綁在文件中,彼此不分Hadoop成為Apache頂級項目,重點支持海量數(shù)據(jù)分布式管理和分布式計算GFS谷歌發(fā)表論文介紹分布式計算大數(shù)據(jù)發(fā)展背景全球信息化發(fā)展已步入大數(shù)據(jù)時代150億個設(shè)備連接到互聯(lián)網(wǎng)全球每秒鐘發(fā)送290萬封電子郵件每天有2.88萬小時視頻上傳到Y(jié)outubeFacebook每日評論達32億條,每天上傳照片近3億張,每月處理數(shù)據(jù)總量約130萬TB2011年全球產(chǎn)生數(shù)據(jù)量1.8ZB,預(yù)計2020年將增長到35ZB大數(shù)據(jù)正迅速成為最值得關(guān)注的IT領(lǐng)域之一2011年5月,EMCWorld2011大會主題“云計算相遇大數(shù)據(jù)”,EMC除了一直倡導的云計算外,還拋出"大數(shù)據(jù)"(BigData)概念2011年6月底,IBM、麥肯錫等眾多國外機構(gòu)發(fā)布"大數(shù)據(jù)"相關(guān)研究報告,予以積極跟進2011年10月,Gartner認為2012年十大戰(zhàn)略技術(shù)將包括"大數(shù)據(jù)"2011年11月底,IDC將"大數(shù)據(jù)"放入2012年信息通信產(chǎn)業(yè)十大預(yù)測之一-6-IDC全球數(shù)據(jù)量預(yù)測(1ZB

=1百萬PB=10億TB)Google網(wǎng)站Bigdata關(guān)鍵詞搜索及新聞引用量什么是大數(shù)據(jù)123大數(shù)據(jù)的定義理解大數(shù)據(jù)的“4V”特征大數(shù)據(jù)的產(chǎn)生、增長2023/1/127“大數(shù)據(jù)”是如何產(chǎn)生的?facebook社交網(wǎng)絡(luò)淘寶電子商務(wù)微博、Apps移動互聯(lián)21世紀是數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大?;ヂ?lián)網(wǎng)(社交、搜索、電商)、移動互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學影像、安全監(jiān)控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。

半個世紀以來,隨著計算機技術(shù)全面融入社會生活,信息爆炸已經(jīng)積累到了一個開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息爆炸的學科如天文學和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個概念*。如今,這個概念幾乎應(yīng)用到了所有人類智力與發(fā)展的領(lǐng)域中。2023/1/128大數(shù)據(jù)時代的爆炸增長想駕馭這龐大的數(shù)據(jù),我們必須了解大數(shù)據(jù)的特征。地球上至今總共的數(shù)據(jù)量:在2006年,個人用戶才剛剛邁進TB時代,全球一共新產(chǎn)生了約180EB的數(shù)據(jù);在2011年,這個數(shù)字達到了1.8ZB。而有市場研究機構(gòu)預(yù)測:到2020年,整個世界的數(shù)據(jù)總量將會增長44倍,達到35.2ZB(1ZB=10億TB)!GBTBPBEBZB1GB

=2^30字節(jié)1TB=2^40字節(jié)1PB

=2^50字節(jié)1EB

=2^60字節(jié)1ZB=2^70字節(jié)2023/1/129大數(shù)據(jù)的4V特征“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度低(Value)”就是“大數(shù)據(jù)”的顯著特征,或者說,只有具備這些特點的數(shù)據(jù),才是大數(shù)據(jù)。VolumeVelocityValueVariety2023/1/1210大數(shù)據(jù)的的構(gòu)成大數(shù)據(jù)=海量數(shù)據(jù)據(jù)+復(fù)雜類型型的數(shù)據(jù)據(jù)海量交易易數(shù)據(jù)::企業(yè)內(nèi)部部的經(jīng)營營交易信信息主要要包括聯(lián)聯(lián)機交易易數(shù)據(jù)和和聯(lián)機分分析數(shù)據(jù)據(jù),是結(jié)結(jié)構(gòu)化的的、通過過關(guān)系數(shù)數(shù)據(jù)庫進進行管理理和訪問問的靜態(tài)態(tài)、歷史史數(shù)據(jù)。。通過這這些數(shù)據(jù)據(jù),我們們能了解解過去發(fā)發(fā)生了什什么。大數(shù)據(jù)包包括:交易數(shù)據(jù)據(jù)和交互互數(shù)據(jù)集集在內(nèi)的的所有數(shù)數(shù)據(jù)集海量交互互數(shù)據(jù)::源于Facebook、Twitter、LinkedIn及其他來來源的社社交媒體體數(shù)據(jù)構(gòu)構(gòu)成。它它包括了了呼叫詳詳細記錄錄CDR、設(shè)備和和傳感器器信息、、GPS和地理定定位映射射數(shù)據(jù)、、通過管管理文件件傳輸ManageFileTransfer協(xié)議傳送送的海量量圖像文文件、Web文本和點點擊流數(shù)數(shù)據(jù)、科科學信息息、電子子郵件等等等??煽梢愿嬖V訴我們未未來會發(fā)發(fā)生什么么。海量數(shù)據(jù)據(jù)處理::大數(shù)據(jù)的的涌現(xiàn)已已經(jīng)催生生出了設(shè)設(shè)計用于于數(shù)據(jù)密密集型處處理的架架構(gòu)。例例如具有有開放源源碼、在在商品硬硬件群中中運行的的ApacheHadoop。2022/12/3111分析技術(shù)術(shù):數(shù)據(jù)處理理:自然然語言處處理技術(shù)術(shù)統(tǒng)計和分分析:A/Btest;topN排行榜;;地域占占比;文文本情感感分析數(shù)據(jù)挖掘掘:關(guān)聯(lián)聯(lián)規(guī)則分分析;分分類;聚聚類模型預(yù)測測:預(yù)測測模型;;機器學學習;建建模仿真真大數(shù)據(jù)據(jù)技術(shù)術(shù):數(shù)據(jù)采采集::ETL工具數(shù)據(jù)存存?。海宏P(guān)系系數(shù)據(jù)據(jù)庫;;NoSQL;SQL等基礎(chǔ)架架構(gòu)支支持::云存存儲;;分布布式文文件系系統(tǒng)等等計算結(jié)結(jié)果展展現(xiàn)::云計計算;;標簽簽云;;關(guān)系系圖等等一些相相關(guān)技技術(shù)存儲結(jié)構(gòu)化化數(shù)據(jù)據(jù)海量數(shù)數(shù)據(jù)的的查詢詢、統(tǒng)統(tǒng)計、、更新新等操操作效效率低低非結(jié)構(gòu)構(gòu)化數(shù)數(shù)據(jù)圖片、、視頻頻、word、pdf、ppt等文件件存儲儲不利于于檢索索、查查詢和和存儲儲半結(jié)構(gòu)構(gòu)化數(shù)數(shù)據(jù)轉(zhuǎn)換為為結(jié)構(gòu)構(gòu)化存存儲按照非非結(jié)構(gòu)構(gòu)化存存儲解決方方案::Hadoop(MapReduce技術(shù)))流計算算(twitter的storm和yahoo!的S4)數(shù)據(jù)采集數(shù)據(jù)儲存數(shù)據(jù)管理數(shù)據(jù)分析與挖掘2022/12/31122022/12/3113大數(shù)據(jù)據(jù)的市市場潛潛力利用GPS數(shù)據(jù)了了解交交通狀狀況智能電電表應(yīng)應(yīng)用級級家庭庭能源源監(jiān)測測2012年3月29日奧巴巴馬政政府公公布了了”大數(shù)據(jù)據(jù)研發(fā)發(fā)計劃劃”。該計計劃的的目標標是改改進現(xiàn)現(xiàn)有人人們從從海量量和復(fù)復(fù)雜的的數(shù)據(jù)據(jù)中獲獲取知知識的的能力力,從從而加加速美美國在在科學學與工工程領(lǐng)領(lǐng)域發(fā)發(fā)明的的步伐伐,增增強國國家安安全,,轉(zhuǎn)變變現(xiàn)有有的教教學和和學習習方式式?!按髷?shù)數(shù)據(jù)戰(zhàn)戰(zhàn)略””上升升為美美國最最高國國策對數(shù)據(jù)據(jù)占有有和控控制,,做為為在陸陸權(quán)、、海權(quán)權(quán)、空空權(quán)之之外的的另一一種國國家核核心能能力。。大數(shù)據(jù)的的浪潮潮谷歌搜搜索與與流感感預(yù)測測大數(shù)據(jù)據(jù)與喬喬布斯斯的癌癌癥治治療微博&投資沃爾瑪瑪?shù)钠∑【婆c與紙尿尿布塔吉特特預(yù)測測少女女懷孕孕沃爾瑪瑪?shù)皳閾榕c颶颶風用用品的的關(guān)系系“魔毯毯”病病人的的監(jiān)控控智慧城城市&智能化化交通通谷歌翻翻譯系系統(tǒng)理解大大數(shù)據(jù)據(jù)數(shù)據(jù)已已經(jīng)成成為可可以與與物質(zhì)質(zhì)資產(chǎn)產(chǎn)和人人力資資本相相提并并論的的重要要的生生產(chǎn)要要素——麥肯錫錫《大數(shù)據(jù)據(jù):下一個個創(chuàng)新新、競競爭和和生產(chǎn)產(chǎn)力的的前沿沿》二、國國內(nèi)外外大數(shù)數(shù)據(jù)分分析的的研究究現(xiàn)狀狀流感趨趨勢預(yù)預(yù)測2022/12/31172022/12/3118全球每星星期會有有數(shù)以百百萬計的的用戶在在網(wǎng)上搜搜索健康康信息。。正如您您所預(yù)料料的那樣樣,在流流感季節(jié)節(jié),與流流感有關(guān)關(guān)的搜索索會明顯顯增多;;到了過過敏季節(jié)節(jié),與過過敏有關(guān)關(guān)的搜索索會顯著著上升;;而到了了夏季,,與曬傷傷有關(guān)的的搜索又又會大幅幅增加。。某些搜索索字詞非非常有助助于了解解流感疫疫情。Google流感趨勢勢會根據(jù)據(jù)匯總的的Google搜索數(shù)據(jù)據(jù),近乎乎實時地地對全球球當前的的流感疫疫情進行行估測。。搜索流感感相關(guān)主主題的人人數(shù)與實實際患有有流感癥癥狀的人人數(shù)之間間存在著著密切的的關(guān)系。。當然,,并非每每個搜索索“流感感”的人人都真的的患有流流感,但但將與流流感有關(guān)關(guān)的搜索索查詢匯匯總到一一起時,,便可以以找到一一種模式式。將統(tǒng)統(tǒng)計的查查詢數(shù)量量與傳統(tǒng)統(tǒng)流感監(jiān)監(jiān)測系統(tǒng)統(tǒng)的數(shù)據(jù)據(jù)進行了了對比,,結(jié)果發(fā)發(fā)現(xiàn)許多多搜索查查詢在流流感季節(jié)節(jié)確實會會明顯增增多。通通過對這這些搜索索查詢的的出現(xiàn)次次數(shù)進行行統(tǒng)計,,便可以以估測出出世界上上不同國國家和地地區(qū)的流流感傳播播情況。。Detectinginfluenzaepidemicsusingsearchenginequerydata,Nature457,1012-1014(19February2009)2022/12/3119上圖顯示示了根據(jù)據(jù)歷史查查詢所得得的美國國近幾年年的流感感估測結(jié)結(jié)果,以以及這些些結(jié)果與與官方的的流感監(jiān)監(jiān)測數(shù)據(jù)據(jù)的對比比。從圖圖中可以以看出,,根據(jù)與與流感相相關(guān)的Google搜索索查詢所所得到的的估測結(jié)結(jié)果,與與以往的的流感疫疫情指示示線非常常接近。。當然,,過去的的表現(xiàn)并并不能保保證以后后的結(jié)果果一定準準確。2022/12/31202022/12/31212022/12/3122卡耐基梅隆大大學的JiweiLi和康乃乃爾大學的ClaireCardie,成成功利用Twitter預(yù)測了了早期流感爆爆發(fā)。他們的方式與與Google類似似。首先,從從Twitter數(shù)數(shù)據(jù)流中過濾濾包含與“流流感”相關(guān),,并帶有位置置標簽的tweet;;然后,在地地圖上標注這這些tweet的位位置分布,以以及隨時間產(chǎn)產(chǎn)生的變化。。同時,還制制作了流感的的動態(tài)變化模模型。新模型型中,流感包包括4個個階段:無傳傳染階段、爆爆發(fā)階段、穩(wěn)穩(wěn)定階段以及及衰退階段。。此外,采用了了全新的算法法,試圖盡可可能快得發(fā)現(xiàn)現(xiàn)不同時期的的轉(zhuǎn)換節(jié)點。。實際上,Li和Cardie在2008年6月至2010年年6月月間,已經(jīng)利利用100萬美國人人的360萬條tweet,,驗證了該該方法的有效效性。為了了檢驗他們的的預(yù)測是否成成真,Li和和Cardie將將他們的分析析與CDC進行對比比。他們說,,“我們確信信,流感相關(guān)關(guān)tweet與CDC提供供的流感疾病病案例數(shù)目,,呈顯著相關(guān)關(guān)。”2022/12/31232022/12/3124日本本國國內(nèi)內(nèi)有有一一個個網(wǎng)網(wǎng)站站,,你你只只要要打打開開這這個個網(wǎng)網(wǎng)站站用用自自己己的的Twitter賬號號登登錄錄,,就就可可以以在在短短時時間間內(nèi)內(nèi)通通過過數(shù)數(shù)萬萬條條Twitter找出出可可能能感感冒冒的的人人,,并并通通過過過過去去的的感感冒冒情情況況和和今今日日的的感感冒冒情情況況進進行行分分析析((以以及及統(tǒng)統(tǒng)計計目目前前發(fā)發(fā)燒燒以以及及嗓嗓子子痛痛的的患患者者數(shù)數(shù)量量)),,另另外外該該程程序序還還會會結(jié)結(jié)合合氣氣溫溫和和濕濕度度的的變變化化來來預(yù)預(yù)測測將將來來感感冒冒的的流流行行情情況況,,并并制制作作一一個個““易易感感冒冒日日歷歷””。。目目前前,,此此類類服服務(wù)務(wù)正正在在日日本本陸陸續(xù)續(xù)展展開開。。通通過過這這個個服服務(wù)務(wù)器器的的分分析析,,大大家家就就能能夠夠知知道道在在自自己己身身邊邊到到底底有有多多少少人人有有感感冒冒的的癥癥狀狀,,并并提提前前做做好好預(yù)預(yù)防防準準備備。。日本本國國立立感感染染癥癥研研究究所所將將會會把把全全國國約約5000個醫(yī)醫(yī)療療診診所所的的流流感感患患者者進進行行統(tǒng)統(tǒng)計計并并發(fā)發(fā)布布數(shù)數(shù)據(jù)據(jù)。。經(jīng)經(jīng)過過對對比比,,研研究究所所得得出出的的實實際際統(tǒng)統(tǒng)計計數(shù)數(shù)字字和和網(wǎng)網(wǎng)站站上上預(yù)預(yù)測測的的結(jié)結(jié)果果基基本本是是一一致致的的,,那那么么為為什什么么大大數(shù)數(shù)據(jù)據(jù)的的結(jié)結(jié)果果會會很很準準呢呢??首先先是是因因為為通通過過網(wǎng)網(wǎng)絡(luò)絡(luò)信信息息分分析析的的技技術(shù)術(shù)有有所所進進步步,,已已經(jīng)經(jīng)可可以以通通過過各各種種各各樣樣的的留留言言自自動動搜搜索索到到相相關(guān)關(guān)的的數(shù)數(shù)據(jù)據(jù),,并并自自動動分分類類。。就就像像Google現(xiàn)在在所所使使用用的的技技術(shù)術(shù),,就就是是利利用用服服務(wù)務(wù)器器分分析析與與流流感感關(guān)關(guān)系系十十分分密密切切的的十十幾幾個個單單詞詞進進行行統(tǒng)統(tǒng)計計。。另一一個個就就是是大大數(shù)數(shù)據(jù)據(jù)所所特特有有的的功功能能。。在在流流感感最最嚴嚴重重的的時時候候,,每每天天會會有有成成千千上上萬萬條條Tweets發(fā)布布,,即即便便有有一一些些誤誤差差,,但但通通過過數(shù)數(shù)據(jù)據(jù)分分析析也也能能分分析析出出數(shù)數(shù)據(jù)據(jù)的的精精準準度度。。以往往,,公公共共機機構(gòu)構(gòu)在在發(fā)發(fā)布布流流感感情情報報的的時時候候至至少少要要延延遲遲一一周周,,在在有有些些偏偏遠遠地地區(qū)區(qū)的的立立桿桿信信息息也也并并不不確確切切,,而而現(xiàn)現(xiàn)在在,,通通過過網(wǎng)網(wǎng)絡(luò)絡(luò)能能夠夠有有效效彌彌補補這這些些缺缺憾憾。。2022/12/31252022/12/3126淘寶的數(shù)數(shù)據(jù)化運營——實例分析分析流程程1.分析主題題確定及及數(shù)據(jù)指指標的選選擇;2.數(shù)據(jù)倉庫庫數(shù)據(jù)提提取及清清洗;3.不相關(guān)指指標剔除除;4.用訓練數(shù)數(shù)據(jù)建立立模型;;5.用測試數(shù)數(shù)據(jù)檢驗驗?zāi)P?;?.預(yù)測新的的流失用用戶,并并提取用用戶名單單;7.制訂挽留留策略::對圈定定的客戶戶進一步步進行分分群,然然后逐群群制訂有針對對的挽留留策略。。比如有有的群組組是屬于于夜間通通話多((和總體的均均值相比比)的客客戶,那那么針對對他們的的挽留策策略可能能是推薦一些些夜間通通話優(yōu)惠惠的資費費方案。。8.實施挽留留行動、、收集客客戶反饋饋。9.評估挽留留效果::2022/12/3127三、構(gòu)建大數(shù)數(shù)據(jù)分析平臺臺四、公共安全全領(lǐng)域大數(shù)據(jù)據(jù)應(yīng)用案例面向公共安全全領(lǐng)域的大數(shù)數(shù)據(jù)分析技術(shù)術(shù)平臺數(shù)據(jù)挖掘DataMiner多維分析BIBeans查詢Discoverer數(shù)據(jù)倉庫管理理(OEM)數(shù)據(jù)提取WarehouseBuilder應(yīng)用服務(wù)器ApplicationServer/PortalDataBase人口

數(shù)據(jù)外部數(shù)據(jù)犯罪數(shù)據(jù)報表ReportsDataMiningOLAP數(shù)據(jù)轉(zhuǎn)換中央數(shù)據(jù)倉庫庫知識發(fā)現(xiàn)信息展現(xiàn)應(yīng)用系統(tǒng)源數(shù)據(jù)數(shù)據(jù)獲取數(shù)據(jù)管理數(shù)據(jù)使用2022/12/3130刑偵的犯罪預(yù)預(yù)防搜集犯罪的信信息推斷罪犯的習習慣預(yù)測罪案的發(fā)發(fā)生非法出入境判判別海關(guān)走私模式式的分析緊急事件的處處理人員的緊急疏疏散資源的緊急調(diào)調(diào)配緊急狀態(tài)的安安全管理緊急事件發(fā)生生的預(yù)演交通管理公共安全領(lǐng)域域基于大數(shù)據(jù)據(jù)的智能分析析2022/12/3131信息的來源銀行交易歷史資料庫/知識庫公共信息政府數(shù)據(jù)庫Internet截獲/監(jiān)聽情情報通信情報人工情報2022/12/3132問題的關(guān)鍵大量的信息(有關(guān)/無關(guān)關(guān))是分析的的基礎(chǔ),也是是分析的障礙礙事件的信息往往往是隨機獲獲得不確定的因素素影響分析的的結(jié)果分析的速度是是關(guān)鍵2022/12/3133飛速膨脹的信信息多種學科的邊邊緣結(jié)合有限的記憶和和注意范圍長時間持續(xù)的的分析工作嚴重依賴分析析人員的經(jīng)驗驗如何用計算機機系統(tǒng)支持復(fù)復(fù)雜海量的分分析過程?限制…他們承擔了大大部分負擔依靠分析人員員2022/12/3134限制……分析人人員的的沉重重負擔擔依靠分分析人人員2022/12/3135當前的的分析析需求求從不同同的來來源有有效的的集成成知識識和信信息連續(xù)的的知識識積累累提供自自動的的警告告為分析析人員員的查查詢提提供答答案構(gòu)造不不同的的案件件情節(jié)節(jié)假設(shè)設(shè)2022/12/3136定性,定定量分分析時間&頻頻率率分析析Databases經(jīng)驗自由文文本統(tǒng)一的的知識識系統(tǒng)統(tǒng)從不同同信息息來源源和格格式獲獲取數(shù)數(shù)據(jù)2022/12/3137基本信息息組織個人人工情報報事件數(shù)據(jù)庫銀行交易易其它數(shù)據(jù)源政府數(shù)據(jù)據(jù)庫通信情報報監(jiān)聽

反饋

人工情報報詢問檢查模擬聯(lián)結(jié)事件生成成

Events:Meeting(What,Who,Where,When,Frequency)Travel(Who,How,Where,When,Length)Phonecall(Who,When,Length,Content,Frequency)Delivery(Who,When,How,Size,What,Frequent,Payment)Other(What,Who,When,Where)Crime(What,When,Where,Who,How)2022/12/3138典型應(yīng)用用1––刑事罪案案自動分分析2022/12/3139參與分析析的數(shù)據(jù)據(jù)罪犯–犯罪罪技巧(爆炸炸-爆炸炸物制作作,殺殺人方式式,動動機等等等),屬屬于特特定團伙伙和團伙伙中的角角色(計劃者者,輔輔助者,領(lǐng)導導者,執(zhí)執(zhí)行者者/馬仔仔等等),戶戶籍地/暫住地地,入入獄歷史史團伙–成員員,角角色潛在目標標–人群群/公共共機構(gòu)/商業(yè)機機構(gòu),他他們的的位置知識和經(jīng)經(jīng)驗–這些些因素如如何相互互作用––包包括外在在的影響響和經(jīng)驗驗(過過去發(fā)生生的事件件)新的信息息會源源源不斷…2022/12/3140模擬案例例-西西西里,巴巴勒莫莫,4/4/03:“Corradi拘捕了DonMarcello””(公共信息息)理解信息息Corradi是巴勒莫莫警方的的的首席席偵探DonMarcello是Marcello家族的教教父Marcello家族具有有很強的的報復(fù)性性巴勒莫警警方很可可能遭到到報復(fù)文本信息息的理解解外部數(shù)據(jù)據(jù)訪問外部數(shù)據(jù)據(jù)訪問DataMining/先驗知識識推理,警警報2022/12/3141新的信息理解信息Bob是Marcello家族的成員員Bob是家族中的的計劃者和和談判代表表Marcello家族的勢力力只限于巴巴勒莫談判代表到到外面的地地區(qū)尋找家家族內(nèi)沒有有的炸彈專專家炸彈制造和和使用是Marcello家族沒有的的技術(shù),Parsi地區(qū)的黑手手黨家族有有這樣的專專家Per是Parsi地區(qū)的黑手手黨炸彈專專家同時間服刑刑的罪犯經(jīng)經(jīng)常會一起起合作犯案案Per和Bob有同時間服服刑的歷史史Marcello家族有可能能以炸彈攻攻擊的方式式報復(fù)DonMarcello的被拘捕Bob有可能計劃劃用炸彈攻攻擊巴勒莫莫警方巴勒莫,4/4/03:“Corradi拘捕了DonMarcello””(公共信息)巴勒莫,5/5/03:“Bob在Parsi出現(xiàn)”(警方通報報)文本信息的理解外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗知識外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗知識DataMining/先驗知識推理,警報外部數(shù)據(jù)訪問2022/12/3142新的信息巴勒莫,4/4/03:“Corradi拘捕了DonMarcello””(公共信息)巴勒莫,5/5/03:“Bob在Parsi出現(xiàn)”(警方通報報)羅馬,5/5/03:““Fabrizzi將會29號號在巴勒莫莫法庭宣判判DonMarcello"(公共信息)巴勒莫,7/5/03:“這個月巴勒勒莫會發(fā)生生一些事情情”(警方情報報)……有可能報復(fù)復(fù)巴勒莫警警方–可可能是一一起炸彈攻攻擊有可能針對對Fabrizzi法官–可可能的攻攻擊手段,謀殺或或是炸彈攻攻擊基于時間的相關(guān)分析(所有的分析都是與時間高度相關(guān)的)2022/12/3143新的信息如果我們拘拘捕Per?炸彈攻擊的的威脅會降降低,但但是不會消消失–Marcello家族的談判判代表還知知道其他的的炸彈專家家,等等等…如果我們同同時拘捕Per和Bob?推理,假設(shè)分析推理,假設(shè)分析2022/12/3144巴勒莫,4/4/03:“Corradi拘捕了DonMarcello””(公共信息)巴勒莫,5/5/03:“Bob在Parsi出現(xiàn)”(警方通報報)羅馬,5/5/03:““Fabrizzi將會會29號號在在巴巴勒勒莫莫法法庭庭宣宣判判DonMarcello"(公共共信信息息)巴勒勒莫莫,7/5/03:“這個個月月巴巴勒勒莫莫會會發(fā)發(fā)生生一一些些事事情情”(警警方方情情報報)本月月有有事事情情(突發(fā)發(fā)事事件件)在巴巴勒勒莫莫發(fā)發(fā)生生Fabrizzi將在在29日日宣宣判判DonMarcelloBob出現(xiàn)在Parsi密切注意相關(guān)人員的接觸炸彈有可能在制造中(假設(shè)事件與Marcello家族有關(guān)-警告會在三個月內(nèi)有效)可能的報復(fù)DonMarcello被囚禁DonM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論