大數(shù)據(jù)及其典型應(yīng)用_第1頁
大數(shù)據(jù)及其典型應(yīng)用_第2頁
大數(shù)據(jù)及其典型應(yīng)用_第3頁
大數(shù)據(jù)及其典型應(yīng)用_第4頁
大數(shù)據(jù)及其典型應(yīng)用_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信息資源管理-擴(kuò)展知識(shí)

大數(shù)據(jù)及其典型應(yīng)用2023/2/32引子棱鏡門波士頓馬拉松爆炸案PredPol少數(shù)派報(bào)告2013大數(shù)據(jù)元年video一、大數(shù)據(jù)的相關(guān)概念二、國(guó)內(nèi)外大數(shù)據(jù)分析的研究現(xiàn)狀三、構(gòu)建大數(shù)據(jù)分析平臺(tái)四、公共安全領(lǐng)域大數(shù)據(jù)應(yīng)用案例目錄2023/2/33一、大數(shù)據(jù)的相關(guān)概念

2023/2/34數(shù)據(jù)管理技術(shù)發(fā)展歷史數(shù)據(jù)管理技術(shù)歷經(jīng)人工管理、文件管理、數(shù)據(jù)庫管理等時(shí)代,大數(shù)據(jù)技術(shù)的出現(xiàn)使該領(lǐng)域進(jìn)入了一個(gè)新的發(fā)展階段-5-194619511956196119701974197919912001200320082011第一臺(tái)計(jì)算機(jī)ENIAC面世磁帶+卡片人工管理磁盤被發(fā)明,進(jìn)入文件管理時(shí)代網(wǎng)絡(luò)型SQLE-RGE公司發(fā)明第一個(gè)網(wǎng)絡(luò)模型數(shù)據(jù)庫,但僅限于GE自己的主機(jī)1960年代,IT系統(tǒng)規(guī)模和復(fù)雜度變大,數(shù)據(jù)與應(yīng)用分離的需求開始產(chǎn)生,數(shù)據(jù)庫技術(shù)開始萌芽并蓬勃發(fā)展,并在1990年后逐步統(tǒng)一到以關(guān)系型數(shù)據(jù)庫為主導(dǎo)IBME.F.Dodd提出關(guān)系模型SQL語言被發(fā)明關(guān)系型數(shù)據(jù)庫ORACLE發(fā)布第一個(gè)商用SQL關(guān)系數(shù)據(jù)庫,后續(xù)快速發(fā)展數(shù)據(jù)倉庫數(shù)據(jù)倉庫開始涌現(xiàn),關(guān)系數(shù)據(jù)庫開始全面普及且平臺(tái)無關(guān),進(jìn)入成熟期2001年后,互聯(lián)網(wǎng)迅速發(fā)展,數(shù)據(jù)量成倍遞增,量變引起質(zhì)變,開始對(duì)數(shù)據(jù)管理技術(shù)提出全新的要求1946年,電腦誕生,數(shù)據(jù)與應(yīng)用緊密捆綁在文件中,彼此不分Hadoop成為Apache頂級(jí)項(xiàng)目,重點(diǎn)支持海量數(shù)據(jù)分布式管理和分布式計(jì)算GFS谷歌發(fā)表論文介紹分布式計(jì)算大數(shù)據(jù)發(fā)展背景全球信息化發(fā)展已步入大數(shù)據(jù)時(shí)代150億個(gè)設(shè)備連接到互聯(lián)網(wǎng)全球每秒鐘發(fā)送290萬封電子郵件每天有2.88萬小時(shí)視頻上傳到Y(jié)outubeFacebook

每日評(píng)論達(dá)32億條,每天上傳照片近3億張,每月處理數(shù)據(jù)總量約130萬TB2011年全球產(chǎn)生數(shù)據(jù)量1.8ZB,預(yù)計(jì)2020年將增長(zhǎng)到35ZB大數(shù)據(jù)正迅速成為最值得關(guān)注的IT領(lǐng)域之一2011年5月,EMCWorld2011大會(huì)主題“云計(jì)算相遇大數(shù)據(jù)”,EMC除了一直倡導(dǎo)的云計(jì)算外,還拋出"大數(shù)據(jù)"(BigData)概念2011年6月底,IBM、麥肯錫等眾多國(guó)外機(jī)構(gòu)發(fā)布"大數(shù)據(jù)"相關(guān)研究報(bào)告,予以積極跟進(jìn)2011年10月,Gartner認(rèn)為2012年十大戰(zhàn)略技術(shù)將包括"大數(shù)據(jù)"2011年11月底,IDC將"大數(shù)據(jù)"放入2012年信息通信產(chǎn)業(yè)十大預(yù)測(cè)之一-6-IDC全球數(shù)據(jù)量預(yù)測(cè)(1ZB

=1百萬PB=10億TB)Google網(wǎng)站Bigdata關(guān)鍵詞搜索及新聞引用量什么是大數(shù)據(jù)123大數(shù)據(jù)的定義理解大數(shù)據(jù)的“4V”特征大數(shù)據(jù)的產(chǎn)生、增長(zhǎng)2023/2/37“大數(shù)據(jù)”是如何產(chǎn)生的?21世紀(jì)是數(shù)據(jù)信息大發(fā)展的時(shí)代,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。互聯(lián)網(wǎng)(社交、搜索、電商)、移動(dòng)互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融(銀行、股市、保險(xiǎn))、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。

半個(gè)世紀(jì)以來,隨著計(jì)算機(jī)技術(shù)全面融入社會(huì)生活,信息爆炸已經(jīng)積累到了一個(gè)開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長(zhǎng)速度也在加快。信息爆炸的學(xué)科如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念*。如今,這個(gè)概念幾乎應(yīng)用到了所有人類智力與發(fā)展的領(lǐng)域中。2023/2/38大數(shù)據(jù)時(shí)代的爆炸增長(zhǎng)想駕馭這龐大的數(shù)據(jù),我們必須了解大數(shù)據(jù)的特征。地球上至今總共的數(shù)據(jù)量:在2006年,個(gè)人用戶才剛剛邁進(jìn)TB時(shí)代,全球一共新產(chǎn)生了約180EB的數(shù)據(jù);在2011年,這個(gè)數(shù)字達(dá)到了1.8ZB。而有市場(chǎng)研究機(jī)構(gòu)預(yù)測(cè):到2020年,整個(gè)世界的數(shù)據(jù)總量將會(huì)增長(zhǎng)44倍,達(dá)到35.2ZB(1ZB=10億TB)!1GB

=2^30字節(jié)1TB=2^40字節(jié)1PB

=2^50字節(jié)1EB

=2^60字節(jié)1ZB=2^70字節(jié)2023/2/39大數(shù)據(jù)的4V特征“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價(jià)值密度低(Value)”就是“大數(shù)據(jù)”的顯著特征,或者說,只有具備這些特點(diǎn)的數(shù)據(jù),才是大數(shù)據(jù)。VolumeVelocityValueVariety2023/2/310大數(shù)據(jù)的構(gòu)成大數(shù)據(jù)=海量數(shù)據(jù)+復(fù)雜類型的數(shù)據(jù)海量交易數(shù)據(jù):企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息主要包括聯(lián)機(jī)交易數(shù)據(jù)和聯(lián)機(jī)分析數(shù)據(jù),是結(jié)構(gòu)化的、通過關(guān)系數(shù)據(jù)庫進(jìn)行管理和訪問的靜態(tài)、歷史數(shù)據(jù)。通過這些數(shù)據(jù),我們能了解過去發(fā)生了什么。大數(shù)據(jù)包括:交易數(shù)據(jù)和交互數(shù)據(jù)集在內(nèi)的所有數(shù)據(jù)集海量交互數(shù)據(jù):源于Facebook、Twitter、LinkedIn及其他來源的社交媒體數(shù)據(jù)構(gòu)成。它包括了呼叫詳細(xì)記錄CDR、設(shè)備和傳感器信息、GPS和地理定位映射數(shù)據(jù)、通過管理文件傳輸ManageFileTransfer協(xié)議傳送的海量圖像文件、Web文本和點(diǎn)擊流數(shù)據(jù)、科學(xué)信息、電子郵件等等。可以告訴我們未來會(huì)發(fā)生什么。海量數(shù)據(jù)處理:大數(shù)據(jù)的涌現(xiàn)已經(jīng)催生出了設(shè)計(jì)用于數(shù)據(jù)密集型處理的架構(gòu)。例如具有開放源碼、在商品硬件群中運(yùn)行的ApacheHadoop。2023/2/311分析技術(shù):數(shù)據(jù)處理:自然語言處理技術(shù)統(tǒng)計(jì)和分析:A/Btest;topN排行榜;地域占比;文本情感分析數(shù)據(jù)挖掘:關(guān)聯(lián)規(guī)則分析;分類;聚類模型預(yù)測(cè):預(yù)測(cè)模型;機(jī)器學(xué)習(xí);建模仿真大數(shù)據(jù)技術(shù):數(shù)據(jù)采集:ETL工具數(shù)據(jù)存取:關(guān)系數(shù)據(jù)庫;NoSQL;SQL等基礎(chǔ)架構(gòu)支持:云存儲(chǔ);分布式文件系統(tǒng)等計(jì)算結(jié)果展現(xiàn):云計(jì)算;標(biāo)簽云;關(guān)系圖等一些相關(guān)技術(shù)存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)海量數(shù)據(jù)的查詢、統(tǒng)計(jì)、更新等操作效率低非結(jié)構(gòu)化數(shù)據(jù)圖片、視頻、word、pdf、ppt等文件存儲(chǔ)不利于檢索、查詢和存儲(chǔ)半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化存儲(chǔ)按照非結(jié)構(gòu)化存儲(chǔ)解決方案:Hadoop(MapReduce技術(shù))流計(jì)算(twitter的storm和yahoo!的S4)2023/2/3122023/2/313大數(shù)據(jù)的市場(chǎng)潛力利用GPS數(shù)據(jù)了解交通狀況智能電表應(yīng)用級(jí)家庭能源監(jiān)測(cè)2012年3月29日奧巴馬政府公布了”大數(shù)據(jù)研發(fā)計(jì)劃”。該計(jì)劃的目標(biāo)是改進(jìn)現(xiàn)有人們從海量和復(fù)雜的數(shù)據(jù)中獲取知識(shí)的能力,從而加速美國(guó)在科學(xué)與工程領(lǐng)域發(fā)明的步伐,增強(qiáng)國(guó)家安全,轉(zhuǎn)變現(xiàn)有的教學(xué)和學(xué)習(xí)方式?!按髷?shù)據(jù)戰(zhàn)略”上升為美國(guó)最高國(guó)策對(duì)數(shù)據(jù)占有和控制,做為在陸權(quán)、海權(quán)、空權(quán)之外的另一種國(guó)家核心能力。大數(shù)據(jù)的浪潮谷歌搜索與流感預(yù)測(cè)大數(shù)據(jù)與喬布斯的癌癥治療微博&投資沃爾瑪?shù)钠【婆c紙尿布塔吉特預(yù)測(cè)少女懷孕沃爾瑪?shù)皳榕c颶風(fēng)用品的關(guān)系“魔毯”病人的監(jiān)控智慧城市&智能化交通谷歌翻譯系統(tǒng)理解大數(shù)據(jù)數(shù)據(jù)已經(jīng)成為可以與物質(zhì)資產(chǎn)和人力資本相提并論的重要的生產(chǎn)要素

——麥肯錫《大數(shù)據(jù):下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的前沿》二、國(guó)內(nèi)外大數(shù)據(jù)分析的研究現(xiàn)狀

流感趨勢(shì)預(yù)測(cè)

2023/2/317全球每年約10%~15%的人群會(huì)患上流感,受感染人群約5000萬人,死亡人數(shù)約50萬。這可不是個(gè)小數(shù)字。如果我們能夠盡早提前預(yù)測(cè)到流感即將爆發(fā),無疑將使全球公眾都將受益:政府和醫(yī)療機(jī)構(gòu)提前拿出應(yīng)對(duì)措施,就能挽救大量生命。2008年,谷歌推出了其著名的流感趨勢(shì)網(wǎng)站(/flutrends)。該網(wǎng)站假定的前提是:如果用戶患上了流感,則他們會(huì)搜索更多同流感相關(guān)的信息。如此一來,如果對(duì)任何一個(gè)國(guó)家或地區(qū)有關(guān)流感的搜索量進(jìn)行統(tǒng)計(jì),就能較好推斷出某個(gè)國(guó)家或地區(qū)是否正爆發(fā)流感。事實(shí)上,谷歌的這項(xiàng)統(tǒng)計(jì)數(shù)據(jù)被證實(shí)很有效。谷歌的相應(yīng)數(shù)據(jù),同美國(guó)疾病控制與預(yù)防中心(CDC)等政府機(jī)構(gòu)所統(tǒng)計(jì)的數(shù)據(jù)非常接近(97%)。在某些情況下,谷歌甚至能夠比CDC提前一周預(yù)測(cè)出哪些地區(qū)將爆發(fā)流感。2023/2/318全球每星期會(huì)有數(shù)以百萬計(jì)的用戶在網(wǎng)上搜索健康信息。正如您所預(yù)料的那樣,在流感季節(jié),與流感有關(guān)的搜索會(huì)明顯增多;到了過敏季節(jié),與過敏有關(guān)的搜索會(huì)顯著上升;而到了夏季,與曬傷有關(guān)的搜索又會(huì)大幅增加。某些搜索字詞非常有助于了解流感疫情。Google流感趨勢(shì)會(huì)根據(jù)匯總的Google搜索數(shù)據(jù),近乎實(shí)時(shí)地對(duì)全球當(dāng)前的流感疫情進(jìn)行估測(cè)。搜索流感相關(guān)主題的人數(shù)與實(shí)際患有流感癥狀的人數(shù)之間存在著密切的關(guān)系。當(dāng)然,并非每個(gè)搜索“流感”的人都真的患有流感,但將與流感有關(guān)的搜索查詢匯總到一起時(shí),便可以找到一種模式。將統(tǒng)計(jì)的查詢數(shù)量與傳統(tǒng)流感監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)進(jìn)行了對(duì)比,結(jié)果發(fā)現(xiàn)許多搜索查詢?cè)诹鞲屑竟?jié)確實(shí)會(huì)明顯增多。通過對(duì)這些搜索查詢的出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),便可以估測(cè)出世界上不同國(guó)家和地區(qū)的流感傳播情況。Detectinginfluenzaepidemicsusingsearchenginequerydata,Nature

457,1012-1014(19February2009)2023/2/319上圖顯示了根據(jù)歷史查詢所得的美國(guó)近幾年的流感估測(cè)結(jié)果,以及這些結(jié)果與官方的流感監(jiān)測(cè)數(shù)據(jù)的對(duì)比。從圖中可以看出,根據(jù)與流感相關(guān)的Google搜索查詢所得到的估測(cè)結(jié)果,與以往的流感疫情指示線非常接近。當(dāng)然,過去的表現(xiàn)并不能保證以后的結(jié)果一定準(zhǔn)確。2023/2/3202023/2/3212023/2/322卡耐基梅隆大學(xué)的JiweiLi和康乃爾大學(xué)的ClaireCardie,成功利用Twitter預(yù)測(cè)了早期流感爆發(fā)。他們的方式與Google類似。首先,從Twitter數(shù)據(jù)流中過濾包含與“流感”相關(guān),并帶有位置標(biāo)簽的tweet;然后,在地圖上標(biāo)注這些tweet的位置分布,以及隨時(shí)間產(chǎn)生的變化。同時(shí),還制作了流感的動(dòng)態(tài)變化模型。新模型中,流感包括4個(gè)階段:無傳染階段、爆發(fā)階段、穩(wěn)定階段以及衰退階段。此外,采用了全新的算法,試圖盡可能快得發(fā)現(xiàn)不同時(shí)期的轉(zhuǎn)換節(jié)點(diǎn)。實(shí)際上,Li和Cardie在2008年6月至2010年6月間,已經(jīng)利用100萬美國(guó)人的360萬條tweet,驗(yàn)證了該方法的有效性。為了檢驗(yàn)他們的預(yù)測(cè)是否成真,Li和Cardie將他們的分析與CDC進(jìn)行對(duì)比。他們說,“我們確信,流感相關(guān)tweet與CDC提供的流感疾病案例數(shù)目,呈顯著相關(guān)?!?023/2/3232023/2/324日本國(guó)內(nèi)有一個(gè)網(wǎng)站,你只要打開這個(gè)網(wǎng)站用自己的Twitter賬號(hào)登錄,就可以在短時(shí)間內(nèi)通過數(shù)萬條Twitter找出可能感冒的人,并通過過去的感冒情況和今日的感冒情況進(jìn)行分析(以及統(tǒng)計(jì)目前發(fā)燒以及嗓子痛的患者數(shù)量),另外該程序還會(huì)結(jié)合氣溫和濕度的變化來預(yù)測(cè)將來感冒的流行情況,并制作一個(gè)“易感冒日歷”。目前,此類服務(wù)正在日本陸續(xù)展開。通過這個(gè)服務(wù)器的分析,大家就能夠知道在自己身邊到底有多少人有感冒的癥狀,并提前做好預(yù)防準(zhǔn)備。日本國(guó)立感染癥研究所將會(huì)把全國(guó)約

5000個(gè)醫(yī)療診所的流感患者進(jìn)行統(tǒng)計(jì)并發(fā)布數(shù)據(jù)。經(jīng)過對(duì)比,研究所得出的實(shí)際統(tǒng)計(jì)數(shù)字和網(wǎng)站上預(yù)測(cè)的結(jié)果基本是一致的,那么為什么大數(shù)據(jù)的結(jié)果會(huì)很準(zhǔn)呢?首先是因?yàn)橥ㄟ^網(wǎng)絡(luò)信息分析的技術(shù)有所進(jìn)步,已經(jīng)可以通過各種各樣的留言自動(dòng)搜索到相關(guān)的數(shù)據(jù),并自動(dòng)分類。就像Google現(xiàn)在所使用的技術(shù),就是利用服務(wù)器分析與流感關(guān)系十分密切的十幾個(gè)單詞進(jìn)行統(tǒng)計(jì)。另一個(gè)就是大數(shù)據(jù)所特有的功能。在流感最嚴(yán)重的時(shí)候,每天會(huì)有成千上萬條Tweets發(fā)布,即便有一些誤差,但通過數(shù)據(jù)分析也能分析出數(shù)據(jù)的精準(zhǔn)度。以往,公共機(jī)構(gòu)在發(fā)布流感情報(bào)的時(shí)候至少要延遲一周,在有些偏遠(yuǎn)地區(qū)的立桿信息也并不確切,而現(xiàn)在,通過網(wǎng)絡(luò)能夠有效彌補(bǔ)這些缺憾。2023/2/3252023/2/326淘寶的數(shù)據(jù)化運(yùn)營(yíng)——實(shí)例分析分析流程1.分析主題確定及數(shù)據(jù)指標(biāo)的選擇;

2.數(shù)據(jù)倉庫數(shù)據(jù)提取及清洗;

3.不相關(guān)指標(biāo)剔除;

4.用訓(xùn)練數(shù)據(jù)建立模型;

5.用測(cè)試數(shù)據(jù)檢驗(yàn)?zāi)P停?/p>

6.預(yù)測(cè)新的流失用戶,并提取用戶名單;7.制訂挽留策略:對(duì)圈定的客戶進(jìn)一步進(jìn)行分群,然后逐群制訂有針對(duì)的挽留策略。比如有的群組是屬于夜間通話多(和

總體的均值相比)的客戶,那么針對(duì)他們的挽留策略可能是

推薦一些夜間通話優(yōu)惠的資費(fèi)方案。8.實(shí)施挽留行動(dòng)、收集客戶反饋。9.評(píng)估挽留效果:

2023/2/327三、構(gòu)建大數(shù)據(jù)分析平臺(tái)

四、公共安全領(lǐng)域大數(shù)據(jù)應(yīng)用案例

面向公共安全領(lǐng)域的大數(shù)據(jù)分析技術(shù)平臺(tái)數(shù)據(jù)挖掘DataMiner多維分析BIBeans查詢Discoverer數(shù)據(jù)倉庫管理(OEM)數(shù)據(jù)提取WarehouseBuilder應(yīng)用服務(wù)器ApplicationServer/PortalDataBase人口

數(shù)據(jù)外部數(shù)據(jù)犯罪數(shù)據(jù)報(bào)表ReportsDataMiningOLAP數(shù)據(jù)轉(zhuǎn)換中央數(shù)據(jù)倉庫知識(shí)發(fā)現(xiàn)信息展現(xiàn)應(yīng)用系統(tǒng)源數(shù)據(jù)數(shù)據(jù)獲取數(shù)據(jù)管理數(shù)據(jù)使用2023/2/330刑偵的犯罪預(yù)防搜集犯罪的信息推斷罪犯的習(xí)慣預(yù)測(cè)罪案的發(fā)生非法出入境判別海關(guān)走私模式的分析緊急事件的處理人員的緊急疏散資源的緊急調(diào)配緊急狀態(tài)的安全管理緊急事件發(fā)生的預(yù)演交通管理公共安全領(lǐng)域基于大數(shù)據(jù)的智能分析2023/2/331信息的來源銀行交易歷史資料庫/知識(shí)庫公共信息政府?dāng)?shù)據(jù)庫Internet截獲/監(jiān)聽情報(bào)通信情報(bào)人工情報(bào)2023/2/332問題的關(guān)鍵大量的信息(有關(guān)/無關(guān))是分析的基礎(chǔ),也是分析的障礙事件的信息往往是隨機(jī)獲得不確定的因素影響分析的結(jié)果分析的速度是關(guān)鍵2023/2/333飛速膨脹的信息多種學(xué)科的邊緣結(jié)合有限的記憶和注意范圍長(zhǎng)時(shí)間持續(xù)的分析工作嚴(yán)重依賴分析人員的經(jīng)驗(yàn)如何用計(jì)算機(jī)系統(tǒng)支持復(fù)雜海量的分析過程?限制…他們承擔(dān)了大部分負(fù)擔(dān)依靠分析人員2023/2/334限制…分析人員的沉重負(fù)擔(dān)依靠分析人員2023/2/335當(dāng)前的分析需求從不同的來源有效的集成知識(shí)和信息連續(xù)的知識(shí)積累提供自動(dòng)的警告為分析人員的查詢提供答案構(gòu)造不同的案件情節(jié)假設(shè)2023/2/336定性,定量分析時(shí)間&頻率分析Databases經(jīng)驗(yàn)自由文本統(tǒng)一的知識(shí)系統(tǒng)從不同信息來源和格式獲取數(shù)據(jù)2023/2/337基本信息

組織個(gè)人人工情報(bào)事件數(shù)據(jù)庫銀行交易其它數(shù)據(jù)源政府?dāng)?shù)據(jù)庫通信情報(bào)監(jiān)聽

反饋

人工情報(bào)詢問

檢查模擬聯(lián)結(jié)事件生成

Events:Meeting(What,Who,Where,When,Frequency)Travel(Who,How,Where,When,Length)Phonecall(Who,When,Length,Content,Frequency)Delivery(Who,When,How,Size,What,Frequent,Payment)Other(What,Who,When,Where)Crime(What,When,Where,Who,How)2023/2/338典型應(yīng)用1–

刑事罪案自動(dòng)分析2023/2/339參與分析的數(shù)據(jù)罪犯–犯罪技巧(爆炸-爆炸物制作,殺人方式,動(dòng)機(jī)等等),屬于特定團(tuán)伙和團(tuán)伙中的角色(計(jì)劃者,輔助者,領(lǐng)導(dǎo)者,執(zhí)行者/馬仔等等),戶籍地/暫住地,入獄歷史團(tuán)伙–成員,角色潛在目標(biāo)–人群/公共機(jī)構(gòu)/商業(yè)機(jī)構(gòu),他們的位置知識(shí)和經(jīng)驗(yàn)–這些因素如何相互作用–包括外在的影響和經(jīng)驗(yàn)(過去發(fā)生的事件)新的信息會(huì)源源不斷…2023/2/340模擬案例-西西里,巴勒莫,4/4/03:“Corradi拘捕了

DonMarcello”(公共信息)理解信息Corradi

是巴勒莫警方的的首席偵探DonMarcello是Marcello家族的教父Marcello家族具有很強(qiáng)的報(bào)復(fù)性巴勒莫警方很可能遭到報(bào)復(fù)文本信息的理解外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗(yàn)知識(shí)推理,警報(bào)2023/2/341新的信息理解信息Bob是Marcello家族的成員Bob是家族中的計(jì)劃者和談判代表Marcello家族的勢(shì)力只限于巴勒莫談判代表到外面的地區(qū)尋找家族內(nèi)沒有的炸彈專家炸彈制造和使用是Marcello家族沒有的技術(shù),Parsi

地區(qū)的黑手黨家族有這樣的專家Per是Parsi

地區(qū)的黑手黨炸彈專家同時(shí)間服刑的罪犯經(jīng)常會(huì)一起合作犯案Per和Bob有同時(shí)間服刑的歷史Marcello家族有可能以炸彈攻擊的方式報(bào)復(fù)DonMarcello的被拘捕Bob有可能計(jì)劃用炸彈攻擊巴勒莫警方巴勒莫,4/4/03:“Corradi

拘捕了

DonMarcello”(公共信息)巴勒莫,5/5/03:“Bob在

Parsi

出現(xiàn)”(警方通報(bào))文本信息的理解外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗(yàn)知識(shí)外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問DataMining/先驗(yàn)知識(shí)DataMining/先驗(yàn)知識(shí)推理,警報(bào)外部數(shù)據(jù)訪問2023/2/342新的信息巴勒莫,4/4/03:“Corradi

拘捕了

DonMarcello”(公共信息)巴勒莫,5/5/03:“Bob在

Parsi

出現(xiàn)”(警方通報(bào))羅馬,5/5/03:“Fabrizzi

將會(huì)29號(hào)在巴勒莫法庭宣判

DonMarcello"(公共信息)巴勒莫,7/5/03:“這個(gè)月巴勒莫會(huì)發(fā)生一些事情”(警方情報(bào))

…有可能報(bào)復(fù)巴勒莫警方–可能是一起炸彈攻擊有可能針對(duì)Fabrizzi

法官–可能的攻擊手段,謀殺或是炸彈攻擊基于時(shí)間的相關(guān)分析(所有的分析都是與時(shí)間高度相關(guān)的)2023/2/343新的信息如果我們拘捕Per?炸彈攻擊的威脅會(huì)降低,但是不會(huì)消失–Marcello家族的談判代表還知道其他的炸彈專家,等等…如果我們同時(shí)拘捕Per和Bob?推理,假設(shè)分析推理,假設(shè)分析2023/2/344巴勒莫,4/4/03:“Corradi

拘捕了

DonMarcello”(公共信息)巴勒莫,5/5/03:“Bob在

Parsi

出現(xiàn)”(警方通報(bào))羅馬,5/5/03:“Fabrizzi

將會(huì)29號(hào)在巴勒莫法庭宣判

DonMarcello"(公共信息)巴勒莫,7/5/03:“這個(gè)月巴勒莫會(huì)發(fā)生一些事情”(警方情報(bào))本月有事情(突發(fā)事件)在巴勒莫發(fā)生Fabrizzi將在29日宣判DonMarcelloBob出現(xiàn)在Parsi密切注意相關(guān)人員的接觸炸彈有可能在制造中(假設(shè)事件與Marcello家族有關(guān)-警告會(huì)在三個(gè)月內(nèi)有效)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論