下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)詐騙犯罪研究
1當前分析1.1詐騙行為的主動化互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展有助于人們的生活方式。同時,網(wǎng)絡(luò)犯罪的趨勢也為犯罪分子提供了新的犯罪場所。在網(wǎng)絡(luò)犯罪中,以網(wǎng)絡(luò)詐騙犯罪較為常見。網(wǎng)絡(luò)詐騙犯罪是通過互聯(lián)網(wǎng)進行詐騙犯罪行為的總稱。從刑法學的角度出發(fā),網(wǎng)絡(luò)詐騙犯罪是指以非法占有他人財產(chǎn)所有權(quán)為目的,以計算機及網(wǎng)絡(luò)為工具,用虛構(gòu)事實或者隱瞞真相的方法騙取公私財物(數(shù)額較大)的行為北京市公安局網(wǎng)絡(luò)安全保衛(wèi)總隊與360互聯(lián)網(wǎng)安全中心聯(lián)合發(fā)起成立的“獵網(wǎng)平臺”發(fā)布的《2015年網(wǎng)絡(luò)詐騙趨勢研究報告》表明,近年來,網(wǎng)絡(luò)詐騙犯罪數(shù)量及涉案金額都在不斷的增長。2015年獵網(wǎng)平臺收到的網(wǎng)絡(luò)詐騙案件舉報24886例,涉及總金額1.27億余元,人均損失5104元。與2014年相比,在舉報數(shù)量只增長了7.96%的情況下,人均損失金額卻增長了146.67%1.2網(wǎng)絡(luò)欺詐犯罪特點綜合分析1協(xié)助公安機關(guān)偵查案件犯罪嫌疑人在實施傳統(tǒng)詐騙犯罪時,需要與受害者建立直接溝通的動態(tài)過程,受害者能夠向公安機關(guān)提供與嫌疑人有關(guān)的直接線索(如體態(tài)、口音等),在某種程度上協(xié)助公安機關(guān)偵查案件。而在實施網(wǎng)絡(luò)詐騙犯罪時,詐騙分子充分利用網(wǎng)絡(luò)的虛擬性和跨地域性,以虛假信息形成虛假身份,使用境外網(wǎng)絡(luò)代理等技術(shù)手段進行掩護,通過即時通信工具、虛假網(wǎng)站、網(wǎng)絡(luò)電話軟件等非直接接觸方式行騙,詐騙得手之后可以立即變換虛假身份,轉(zhuǎn)移地點,繼續(xù)實施犯罪。這種“打一槍換一炮”的作案方式具有極高的隱蔽性,也為案件的偵破、犯罪嫌疑人的跨地域追捕帶來了難度。2形成黑色產(chǎn)業(yè)鏈由于互聯(lián)網(wǎng)的普及性,以及網(wǎng)絡(luò)詐騙犯罪的投入產(chǎn)出比高,近年來詐騙分子開始形成分工明確、等級森嚴的職業(yè)犯罪團伙,進行有組織有計劃、少量多次、積少成多的網(wǎng)絡(luò)詐騙犯罪,并逐漸形成了網(wǎng)絡(luò)詐騙犯罪的黑色產(chǎn)業(yè)鏈。上游依靠提供技術(shù)支持的黑客,下游為支持或參與網(wǎng)絡(luò)詐騙犯罪分工的周邊組織3多樣性多樣性原則隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)詐騙的形式越發(fā)的多樣化。常見的網(wǎng)絡(luò)詐騙犯罪形式有網(wǎng)絡(luò)購物詐騙、網(wǎng)絡(luò)信用卡詐騙、中獎詐騙、冒充熟人詐騙、網(wǎng)絡(luò)賭博詐騙、網(wǎng)絡(luò)捐款詐騙、兌換積分詐騙等2網(wǎng)絡(luò)詐騙案件特點的多層次性探討在現(xiàn)有的公安機關(guān)辦理詐騙案件平臺及流程中,專門針對網(wǎng)絡(luò)詐騙犯罪案件的偵辦平臺還有待建設(shè),系統(tǒng)性的案件數(shù)據(jù)分析也尚未形成,缺少對詐騙案件人群規(guī)律的挖掘研究,無法從大量且無序的案件數(shù)據(jù)中挖掘出某個時期內(nèi)網(wǎng)絡(luò)詐騙案件的特點與趨勢,無論為公安機關(guān)偵查案件和防范治理提供方向性指引和針對重點涉案人群的防范治理措施。為解決以上問題,本文通過將案件信息轉(zhuǎn)換為離散數(shù)據(jù)項的方式進行先期處理,再基于SPSSClementine的K-means聚類分析算法和CHAID決策樹算法,通過創(chuàng)建并訓練算法模型,將數(shù)據(jù)導入算法模型進行算法,得出結(jié)果的步驟對案件數(shù)據(jù)進行分析,找到涉案人群的特點以及案件屬性對于詐騙案件金額的影響權(quán)重。2.1聚類區(qū)分算法K-means算法是一種基于劃分的聚類算法,最早在1967年由J.B.MacQueen提出。該算法認為在幾何距離上兩個對象越靠近,相似度就越高。在一定閾值界定下,被認為相互靠近的對象的集合就是K-means算法認定的簇,因此把得到緊密而單獨的簇作為該算法的最終目標輸入:目標聚類數(shù)k的值、包含n個數(shù)據(jù)對象的數(shù)據(jù)對象集D;輸出:k個聚類1)從數(shù)據(jù)對象集D中隨機地選擇k個數(shù)據(jù)對象作為初始的質(zhì)心,作為各聚類簇的代表;2)分別計算D中的每一個數(shù)據(jù)對象到各質(zhì)心的距離,得到一組距離值,從中找出最小距離值對應的質(zhì)心,將此數(shù)據(jù)對象分配至該簇中;3)待所有數(shù)據(jù)對象分配完畢之后,根據(jù)每個初始簇所包含的對象集合,重新計算得到一個新質(zhì)心。若質(zhì)心發(fā)生改變,則重復步驟2)和步驟3),直至聚類不再發(fā)生變化,且滿足目標函數(shù)條件,跳至步驟4);4)輸出聚類結(jié)果K-means算法采用了幾何上的歐幾里得距離作為計算數(shù)據(jù)對象之間相似性的量度,其具體公式是:其中i=(x其中,x為子對象集D通過以上介紹,我們可以看出K-means算法的優(yōu)點在于算法框架清晰、簡單、可理解。當聚類簇是密集的,且聚類簇之間差別明顯的時候,算法確定的k個聚類簇能使SSE最小,從而實現(xiàn)最好的聚類效果。在處理大型數(shù)據(jù)對象集的時候,算法相對來說在具有可伸縮性的同時兼顧了。算法的計算復雜度為O(nkt),其中n為數(shù)據(jù)對象的個數(shù),t為算法迭代運行的次數(shù),且存在t<<n、k<<n,故一般情況下我們把計算復雜度記為O(n)。相比于其他聚類效果好的算法來說其計算復雜度較低,所需時間少,實現(xiàn)了高效率的運行。相比之下,K-means算法也存在不少的缺陷,主要為算法運行前需要用戶自行初始化聚類數(shù)目k;算法在多數(shù)情況下只能發(fā)現(xiàn)球狀簇,對其他形狀的聚類簇不敏感;算法對于孤立點數(shù)據(jù)和噪聲數(shù)據(jù)是非常敏感的,少量的該類數(shù)據(jù)能夠?qū)Υ仄骄诞a(chǎn)生非常大的影響,從而導致聚類結(jié)果的失準。2.2ch關(guān)于多分形決策樹的設(shè)計CHAID(CHi-squaredAutomaticInteractiondetection,卡方自動交叉檢驗)算法是一種適用于連續(xù)型、離散型、定類、定序等多種數(shù)據(jù)變量,以目標最優(yōu)為依據(jù),具有目標選擇和變量篩選功能的決策樹算法,由Kass于1980年提出。CHAID算法會根據(jù)不同類型的解釋變量和目標變量選擇不同的屬性測試標準,在生成決策樹過程中,將測試標準的顯著性水平作為停止建樹的參照。由于CHAID算法是從統(tǒng)計顯著性水平的角度來確定數(shù)據(jù)對象集的分枝變量和分隔值,因此可以認為算法是采用先剪枝的方法,優(yōu)化生成樹的過程。CHAID算法以原始數(shù)據(jù)處理為起點,首先選定目標變量,當目標變量為定類變量時,算法會構(gòu)成一個以解釋變量類別為列、以目標變量類別為行的二維交叉分類表,交叉分類,再產(chǎn)生一系列二維表,計算二維表的皮爾遜卡方值(Pearsonchi-squared)統(tǒng)計量或者似然估計統(tǒng)計量(Likelihoodratio)作為標準比較其大小,標準數(shù)值最大的二維表即為最佳初始分類表。在此基礎(chǔ)上,繼續(xù)使用分類解釋變量對目標變量進行分類,重復上述過程,直到P值滿足預定的收斂條件時停止建樹;當目標變量為連續(xù)型變量時,算法選擇基于F檢驗的P值作為標準;當目標變量為定序或者離散型變量時,以似然估計統(tǒng)計量作為標準似然估計統(tǒng)計量為:其中,實際分布頻率fCHAID算法的優(yōu)點在于能生成多分枝的決策樹,而且對目標變量沒有限制,適用性強。不過,在剩余的數(shù)據(jù)對象類別之間在統(tǒng)計上均存在顯著性差異的條件下,CHAID算法會停止合并這些類別,因此會發(fā)生找不到分類預測變量的最佳分割點的情況3智能分析的實現(xiàn)3.1基于數(shù)字的身份信息比對從現(xiàn)有的公安執(zhí)法辦案平臺和電信詐騙案件偵查協(xié)作平臺獲取案件信息后,對數(shù)據(jù)進行先期分類,分為受害者屬性和犯罪嫌疑人屬性,分別分為受害者年齡、性別、文化程度、職業(yè)、月收入、受詐騙類型、首次聯(lián)系方式、交易方式、發(fā)現(xiàn)形式,以及犯罪嫌疑人年齡、性別、文化程度、接觸網(wǎng)絡(luò)時間、有無前科情況,并以數(shù)字代替屬性內(nèi)容的方式將案件信息數(shù)據(jù)化、離散化。3.2基于不同特征的受害者的網(wǎng)絡(luò)詐騙類型在本文中把K-means算法分別運用到受害者和犯罪嫌疑人上,求出這兩類人群的大致聚類及其特點。通過多次改動目標聚類數(shù)k的試驗后,得出如表1和表2所示的結(jié)果。由表1可以看出,受害者主要有五種類型:1)年齡在40歲左右,職業(yè)為經(jīng)商或者個體經(jīng)營,初中文化程度,詐騙類型為釣魚網(wǎng)站;2)年齡在20歲左右,從事服務業(yè),高中文化程度,詐騙類型為虛假兼職;3)年齡在48歲左右,職業(yè)為工人,小學及以下文化程度,詐騙類型為積分中獎詐騙;4)年齡在28歲左右,職業(yè)為公司職員,大學文化程度,詐騙類型為網(wǎng)絡(luò)購物;5)年齡在33歲左右,從事服務業(yè),初中文化程度,詐騙類型為網(wǎng)絡(luò)購物。從上述受害者類型可總結(jié)得出,受害者普遍為高中及以下文化程度,多從事與資金流動關(guān)系較為密切的個體經(jīng)營及服務業(yè),網(wǎng)絡(luò)購物仍為受害者容易上當受騙的詐騙類型。由表2可以看出,實施網(wǎng)絡(luò)詐騙的嫌疑人年齡平均分布在19歲到33歲之間,普遍較為年輕;文化程度不超過初中,且從小就接觸網(wǎng)絡(luò),平均網(wǎng)齡在10年以上。3.3影響大學生詐騙案件金額的因素以詐騙案件金額為目標變量,利用CHAID算法對受害者及犯罪嫌疑人的屬性生成決策樹,并比較其預測精度。由于在目標變量為連續(xù)型的情況下,算法的輸出效果不佳,在此處取詐騙金額數(shù)據(jù)項的中位數(shù)為中值,將詐騙金額分為兩類,分別以0和1代表小于和大于中值在通過CHAID算法建立的決策樹中,越靠上的子層對于目標變量的影響程度越高,故由圖1可見,受害者的月收入對于詐騙案件金額的影響程度最高,其次是嫌疑人的文化程度和前科情況。根據(jù)這三個影響因子,可以做出如下預測:一方面,受害者的文化程度越低,月收入越高,詐騙案件的金額也會越高;另一方面,嫌疑人多由于接觸網(wǎng)絡(luò)時間較早,導致沉迷網(wǎng)絡(luò)而無心于學業(yè),故文化程度普遍沒有達到高中以上,容易誤入歧途,實施犯罪。操作少、易上手、投入產(chǎn)出比高的網(wǎng)絡(luò)詐騙犯罪對于有前科的嫌疑人來說更具有吸引力,故嫌疑人存在重操舊業(yè)的可能,再次開始實施網(wǎng)絡(luò)詐騙由圖2可見,通過CHAID算法建立的決策樹的精度達到了90%以上,基本認為以上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023三年級英語下冊 Unit 1 Animals on the farm(Again Please)說課稿 冀教版(三起)
- 8的乘法口訣(說課稿)-2024-2025學年二年級上冊數(shù)學北京版
- 2024年九年級語文上冊 第四單元 第15課《少年中國說》說課稿 北京課改版
- 16 麻雀 第一課時 說課稿-2024-2025學年語文四年級上冊統(tǒng)編版
- 2024年春七年級語文下冊 第二單元 8 木蘭詩說課稿 新人教版
- 1 折彩粽(說課稿)蘇教版二年級下冊綜合實踐活動001
- Unit 4 My home Part B Lets learn(說課稿)-2024-2025學年人教PEP版英語四年級上冊
- 2025樓房承包合同協(xié)議模板
- 2025家居裝修工程施工合同范文
- 2025房地產(chǎn)銷售代理合同范本
- 2024年6月浙江省高考地理試卷真題(含答案逐題解析)
- 物業(yè)管理服務應急響應方案
- 醫(yī)院培訓課件:《如何撰寫護理科研標書》
- 風車的原理小班課件
- 河南省鄭州市2023-2024學年高二上學期期末考試 數(shù)學 含答案
- 2024年山東省濟南市中考英語試題卷(含答案)
- 2024年北師大版八年級上冊全冊數(shù)學單元測試題含答案
- 江蘇省南京市第二十九中2025屆數(shù)學高二上期末學業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 六年級數(shù)學競賽試題及答案(六套)
- 八年級下學期期末考試語文試題(PDF版含答案)
- 浙教版八年級下冊科學第一章 電和磁整章思維導圖
評論
0/150
提交評論