基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用

上傳人：十*** IP屬地：廣東上傳時(shí)間：2024-11-11 格式：DOCX 頁(yè)數(shù)：12 大?。?24.50KB 積分：50 舉報(bào) 版權(quán)申訴

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用_第2頁(yè)

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用_第3頁(yè)

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用_第4頁(yè)

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用_第5頁(yè)

已閱讀5頁(yè)，還剩7頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)類突發(fā)事件處理中的應(yīng)用摘要：網(wǎng)絡(luò)信息服務(wù)的范圍在逐漸拓展，表現(xiàn)出鮮明的智慧化和精細(xì)化特點(diǎn)。互聯(lián)網(wǎng)上的頻繁行為產(chǎn)生了海量信息，造成了網(wǎng)絡(luò)信息量巨大而難以解決；網(wǎng)絡(luò)空間以其開(kāi)放性，強(qiáng)交互性，高隱蔽性和快速傳播速度成為不法分子實(shí)施危害社會(huì)公共安全行為的主戰(zhàn)場(chǎng)，這對(duì)于網(wǎng)絡(luò)治理模塊中國(guó)家安全部門(mén)的應(yīng)急處理策略與手段也有了更高層次的要求。針對(duì)上述情況，本研究提出基于機(jī)器學(xué)習(xí)文本情感分析方法并對(duì)該方法在社會(huì)類突發(fā)事件敏感信息采集與處理方面的應(yīng)用進(jìn)行了分析。關(guān)鍵詞：機(jī)器學(xué)習(xí)；文本情感分析；社會(huì)類突發(fā)事件信息收集引言網(wǎng)絡(luò)信息服務(wù)的范圍逐漸拓展，涉及金融，醫(yī)療，旅游，環(huán)保等各個(gè)方面，互聯(lián)網(wǎng)絡(luò)表現(xiàn)出鮮明的智慧化和精細(xì)化特點(diǎn)。短視頻應(yīng)用快速興起，電子商務(wù)和移動(dòng)社交應(yīng)用深度結(jié)合，移動(dòng)支付軟件大范圍應(yīng)用，這些都顯示了互聯(lián)網(wǎng)應(yīng)用所帶來(lái)的便利。同時(shí)，互聯(lián)網(wǎng)中的頻繁互動(dòng)會(huì)產(chǎn)生海量的數(shù)據(jù)，導(dǎo)致相關(guān)部門(mén)對(duì)數(shù)據(jù)的處理的難度大增。近年來(lái)社交用戶隱私泄露，遇到網(wǎng)上詐騙，設(shè)備內(nèi)病毒或者木馬問(wèn)題突出，同時(shí)也出現(xiàn)了不實(shí)信息恣意擴(kuò)散的情況，所以網(wǎng)絡(luò)綜合治理還有待加強(qiáng)。網(wǎng)絡(luò)空間具有高度開(kāi)放性，強(qiáng)烈交互性，高度隱蔽性和傳播速度快等特征，互聯(lián)網(wǎng)絡(luò)已經(jīng)成為社會(huì)類突發(fā)事件應(yīng)急預(yù)防處理的主戰(zhàn)場(chǎng)，對(duì)網(wǎng)絡(luò)治理模塊中國(guó)家安全部門(mén)的應(yīng)急處理戰(zhàn)略和手段也提出了更多的要求。社會(huì)類突發(fā)事件情報(bào)工作始終面臨著對(duì)文本信息進(jìn)行分析和加工的困難。文本信息本身存在著一詞多義，歧義和斷句不清的現(xiàn)象，這給文本分析和處理時(shí)帶來(lái)了很大的噪聲干擾，再加上網(wǎng)絡(luò)空間信息流速較高，使得社會(huì)類突發(fā)事件情報(bào)部門(mén)無(wú)法快速地獲取信息或截獲情報(bào)，難以從這些情報(bào)中解剖到大量寶貴而可用的情報(bào)。與大數(shù)據(jù)技術(shù)和傳統(tǒng)機(jī)器學(xué)習(xí)方法相比較，深度學(xué)習(xí)算法激勵(lì)采集大數(shù)據(jù)集，并可通過(guò)培訓(xùn)完成數(shù)據(jù)深層特征抽取。1、機(jī)器學(xué)習(xí)發(fā)展歷程1.1機(jī)器學(xué)習(xí)發(fā)展歷程機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支，其發(fā)展歷程可追溯至20世紀(jì)50年代。早期研究主要基于神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)學(xué)習(xí)理論。1957年，F(xiàn)rankRosenblatt教授提出了感知機(jī)（Perceptron）概念，成為神經(jīng)網(wǎng)絡(luò)模型的開(kāi)山鼻祖。1959年，IBM公司的ArthurSamuel設(shè)計(jì)了一個(gè)具有學(xué)習(xí)能力的跳棋程序，標(biāo)志著機(jī)器學(xué)習(xí)正式進(jìn)入發(fā)展期。20世紀(jì)60年代至70年代末，機(jī)器學(xué)習(xí)發(fā)展相對(duì)緩慢，處于所謂的“冷靜時(shí)期”。但在這期間，基于邏輯表示的符號(hào)主義學(xué)習(xí)技術(shù)開(kāi)始蓬勃發(fā)展，如結(jié)構(gòu)學(xué)習(xí)系統(tǒng)、基于邏輯的歸納學(xué)習(xí)系統(tǒng)等。進(jìn)入20世紀(jì)80年代，機(jī)器學(xué)習(xí)迎來(lái)了復(fù)興時(shí)期。1986年，機(jī)器學(xué)習(xí)成為新的邊緣學(xué)科并在高校形成一門(mén)課程。此時(shí)，機(jī)器學(xué)習(xí)理論基礎(chǔ)得以鞏固，多種形式的集成學(xué)習(xí)系統(tǒng)研究興起，如連接學(xué)習(xí)符號(hào)學(xué)習(xí)的耦合。此外，機(jī)器學(xué)習(xí)與人工智能各種基礎(chǔ)問(wèn)題的統(tǒng)一性觀點(diǎn)開(kāi)始形成。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展，機(jī)器學(xué)習(xí)進(jìn)入了一個(gè)新的階段。特別是近年來(lái)，機(jī)器學(xué)習(xí)在圖像識(shí)別、自然語(yǔ)言處理、推薦系統(tǒng)等領(lǐng)域取得了顯著成果。如今，機(jī)器學(xué)習(xí)已成為許多行業(yè)的核心技術(shù)，如自動(dòng)駕駛、醫(yī)療診斷、金融分析等。同時(shí)，機(jī)器學(xué)習(xí)也在不斷探索新的理論和方法，以應(yīng)對(duì)未來(lái)可能面臨的挑戰(zhàn)。1.2機(jī)器學(xué)習(xí)的關(guān)鍵技術(shù)機(jī)器學(xué)習(xí)是一門(mén)由統(tǒng)計(jì)學(xué)、概率論、凸分析、算法復(fù)雜度理論等多個(gè)學(xué)科組成的交叉研究。它是人工智能的關(guān)鍵所在，是一種以模仿和實(shí)現(xiàn)人的學(xué)習(xí)行為來(lái)獲得知識(shí)和技術(shù)，并且通過(guò)對(duì)現(xiàn)有知識(shí)的不斷重組來(lái)提高自己的能力。機(jī)器學(xué)習(xí)可以分為如下圖幾個(gè)方面。圖1機(jī)器學(xué)習(xí)的內(nèi)容有監(jiān)督學(xué)習(xí)是使用已帶標(biāo)簽的樣本數(shù)據(jù)去訓(xùn)練一個(gè)分類器模型，再利用這個(gè)模型把所有輸入的數(shù)據(jù)轉(zhuǎn)換為相應(yīng)的標(biāo)簽輸出，這便可以實(shí)現(xiàn)未知數(shù)據(jù)相應(yīng)的預(yù)測(cè)和分類功能。有監(jiān)督學(xué)習(xí)中的數(shù)據(jù)是提前做好標(biāo)記的，已知數(shù)據(jù)的分類情況，相應(yīng)的訓(xùn)練集數(shù)據(jù)是包含特征和標(biāo)簽信息的，根據(jù)訓(xùn)練集對(duì)分類器的訓(xùn)練從而得到測(cè)試集相應(yīng)的輸出。無(wú)監(jiān)督學(xué)習(xí)所使用的訓(xùn)練集包含的數(shù)據(jù)的標(biāo)記信息不是提前知道的，它可以從沒(méi)有標(biāo)記的數(shù)據(jù)中發(fā)掘出數(shù)據(jù)的本質(zhì)和關(guān)系。無(wú)監(jiān)督學(xué)習(xí)無(wú)論是研究范圍還是應(yīng)用范圍最大的都是聚類。半監(jiān)督學(xué)習(xí)則處于有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的中間，它所使用的訓(xùn)練集數(shù)據(jù)有一部分是帶標(biāo)簽的，但其中無(wú)標(biāo)簽數(shù)據(jù)的數(shù)量遠(yuǎn)大于有標(biāo)簽數(shù)據(jù)的數(shù)量。半監(jiān)督學(xué)習(xí)方法的優(yōu)點(diǎn)在于它能顯著降低模型對(duì)標(biāo)簽數(shù)據(jù)的依賴性，同時(shí)，由于未標(biāo)記數(shù)據(jù)更易于獲取，因此可以帶來(lái)更多的應(yīng)用價(jià)值。1.3深度學(xué)習(xí)深度學(xué)習(xí)從本質(zhì)上講是一種通過(guò)加入各種算法、構(gòu)建多樣化模型模擬人類神經(jīng)系統(tǒng)、再通過(guò)大量數(shù)據(jù)訓(xùn)練所構(gòu)造的多層隱藏層、提取圖像抽象特征、分類整合等方法以提高分類和預(yù)測(cè)精度的一種算法。深度學(xué)習(xí)憑借自身優(yōu)越的性能和前景，從機(jī)器學(xué)習(xí)中嶄露頭角并發(fā)展為新興分支，對(duì)于促進(jìn)人工智能發(fā)展至關(guān)重要[1]。深度學(xué)習(xí)就是模擬與人腦深層相似的神經(jīng)網(wǎng)絡(luò)對(duì)各種數(shù)據(jù)擬合的機(jī)器學(xué)習(xí)方法，利用多層次圖像空間位點(diǎn)的特征學(xué)習(xí)形成樹(shù)狀操控模式并對(duì)其進(jìn)行深層次識(shí)別。深度學(xué)習(xí)過(guò)程可看作是一個(gè)從底層向高層逐層對(duì)輸入信號(hào)進(jìn)行處理，以實(shí)現(xiàn)與輸出目標(biāo)關(guān)系并不密切的原始輸入表示向與輸出目標(biāo)關(guān)系較為密切的表示特征的學(xué)習(xí)，這種從下到上對(duì)信息進(jìn)行分層處理的方法有助于得到較為抽象，歧義較小以及魯棒性較強(qiáng)的特征。深度模型對(duì)問(wèn)題的處理能力主要取決于它的模型復(fù)雜度，隱層神經(jīng)元個(gè)數(shù)的增加促進(jìn)了模型復(fù)雜度的提高，增加水平越高精度越高，顯著改善了模型性能[2]。1.4文本特征提取文本特征選擇以文本描述主體與表現(xiàn)形式為主線，貼近語(yǔ)料背景進(jìn)行研究，既要兼顧文本本身的特點(diǎn)，又要避免一詞多義以及特征代表性不強(qiáng)的問(wèn)題，原則在于去除無(wú)關(guān)特征項(xiàng)以及冗余信息以實(shí)現(xiàn)降維表示。傳統(tǒng)文本特征的選擇是以統(tǒng)計(jì)方法為基礎(chǔ)進(jìn)行的，即將文本中有代表性的高頻詞選為特征單元，利用統(tǒng)計(jì)方法來(lái)計(jì)算特征權(quán)重需要消耗大量的人力和物力，同時(shí)由于人為參與比較大，會(huì)產(chǎn)生很大的噪聲與錯(cuò)誤，忽視上下文語(yǔ)義結(jié)構(gòu)以及多詞匯語(yǔ)義連貫性等問(wèn)題，使得特征提取不夠精確，文本分類不夠全面。隨著互聯(lián)網(wǎng)絡(luò)的迅猛發(fā)展和數(shù)據(jù)爆炸式增長(zhǎng)，人們對(duì)特征選擇方法的需求越來(lái)越大，出現(xiàn)了基于自然語(yǔ)言處理和深度學(xué)習(xí)的文本特征選擇方法，語(yǔ)義連貫性和數(shù)據(jù)處理高效性得到了顯著提高[3]。文本特征的主要選取方法見(jiàn)表1。表1主要特征選擇方法簡(jiǎn)介2、基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)敏感信息界定2.1網(wǎng)絡(luò)敏感詞類別本研究中的網(wǎng)絡(luò)敏感信息專指敏感性質(zhì)文本信息，具體地說(shuō)就是政治色彩鮮明或隱蔽的詞匯，攻擊性或威脅性詞匯，也可以指惡意宣泄不愉快情緒而對(duì)網(wǎng)絡(luò)空間環(huán)境造成沖擊的詞匯。根據(jù)敏感詞歸屬的語(yǔ)義及環(huán)境特征將網(wǎng)絡(luò)敏感詞劃分為6個(gè)范疇，即宗教信仰范疇，時(shí)事政治范疇，國(guó)際事務(wù)或者國(guó)際關(guān)系范疇，本國(guó)領(lǐng)土主權(quán)范疇，法律范疇和社會(huì)生活范疇。網(wǎng)絡(luò)敏感詞匯的所屬范疇和相應(yīng)標(biāo)志性詞匯示如圖1.在實(shí)際敏感詞匯的識(shí)別中，各種范疇中所含敏感詞都會(huì)出現(xiàn)反復(fù)[4]。圖1敏感詞類別及對(duì)應(yīng)示例2.2敏感詞表現(xiàn)形式網(wǎng)絡(luò)信息中所含敏感詞的表現(xiàn)形式多種多樣，這與其中文漢字及拼音的構(gòu)造及表現(xiàn)形式密切相關(guān)，從中可以看出敏感詞往往呈現(xiàn)出拼音形式，簡(jiǎn)稱形式及拆分形式等。為逃避網(wǎng)絡(luò)平臺(tái)的監(jiān)視和辨認(rèn)，部分網(wǎng)民會(huì)選擇用字母來(lái)表述自己的意思。比如，在最近一段時(shí)間里，大家都在討論新冠病毒的控制問(wèn)題，許多人都將怒火發(fā)泄到了武漢市政府身上，一些人在網(wǎng)上留言的時(shí)候，都會(huì)用“WHZF（武漢政府）”來(lái)表達(dá)自己的不滿。又比如，當(dāng)我們看到一些名人的圖片或者錄像時(shí)，很多名人的粉絲都會(huì)用到"awsl（啊我死了）"這樣的夸張?jiān)~語(yǔ)，來(lái)表示自己對(duì)名人的喜歡。中文最常用的表述方式為簡(jiǎn)稱或簡(jiǎn)稱。人們習(xí)慣用最少的文字來(lái)精確地表達(dá)自己的意志，例如“犯罪嫌疑人”往往被表示成“嫌犯”。這種簡(jiǎn)稱更多地用于人們的日常生活，法律條款的表達(dá)，新聞報(bào)道等方面[5]。3、基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)敏感信息感知必要性3.1大規(guī)模數(shù)據(jù)加大敏感信息感知難度無(wú)論危害公共安全的行為地點(diǎn)是選擇在真實(shí)的地區(qū)還是抽象的網(wǎng)絡(luò)平臺(tái)上，都會(huì)產(chǎn)生幾何級(jí)數(shù)增長(zhǎng)的數(shù)據(jù)，包括與組織相關(guān)的人員信息、地理位置、活動(dòng)范圍和運(yùn)營(yíng)策略。數(shù)據(jù)顯示，全球的數(shù)據(jù)總量正在快速增長(zhǎng)，在二零一九年數(shù)據(jù)市場(chǎng)已經(jīng)達(dá)到了一千八百七十億美元[6]。就大數(shù)據(jù)的類型而言，一般有四類：政府?dāng)?shù)據(jù)、企業(yè)大數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)和個(gè)人大數(shù)據(jù)。詳見(jiàn)圖2。圖2敏感信息與個(gè)人信息的關(guān)系敏感信息和智能數(shù)據(jù)來(lái)源于外界，其中既有政府機(jī)關(guān)提供的信息，也有犯罪嫌疑人的日常活動(dòng)，如財(cái)務(wù)、交通、通訊等，還包括互聯(lián)網(wǎng)等。伴隨著科技的不斷發(fā)展，各種有計(jì)劃、有預(yù)謀的非法組織將戰(zhàn)場(chǎng)轉(zhuǎn)移到了互聯(lián)網(wǎng)上，情報(bào)機(jī)構(gòu)也適時(shí)地將自己的陣地轉(zhuǎn)移到了互聯(lián)網(wǎng)上，并對(duì)互聯(lián)網(wǎng)上的信息展開(kāi)監(jiān)測(cè)、跟蹤、處理和分析，以確定目標(biāo)，這說(shuō)明了情報(bào)工作的結(jié)果。與此形成鮮明對(duì)比的是，互聯(lián)網(wǎng)上的個(gè)人信息已大量占用了人們的工作和娛樂(lè)時(shí)間，而身份、婚姻狀態(tài)、社會(huì)偏好、地理位置等信息則被大量曝光，極易被社會(huì)類突發(fā)事件部門(mén)所利用。由于數(shù)據(jù)量太大，情報(bào)機(jī)構(gòu)不能精確地過(guò)濾掉無(wú)關(guān)的信息，也不能排除公民個(gè)人信息，這無(wú)疑使敏感信息的處理變得更加復(fù)雜。3.2敏感信息采集與處理技術(shù)易造成隱私信息泄露數(shù)據(jù)信息安全和大數(shù)據(jù)分析有著千絲萬(wàn)縷的聯(lián)系，甚至能夠把二者劃上等號(hào)。大數(shù)據(jù)環(huán)境下情報(bào)采集的路徑大致有網(wǎng)絡(luò)監(jiān)控，新聞媒體報(bào)道，專項(xiàng)情報(bào)數(shù)據(jù)庫(kù)的建立，人工情報(bào)采集和政府部門(mén)等產(chǎn)業(yè)的情報(bào)采集。毫無(wú)疑問(wèn)，許多大數(shù)據(jù)處理技術(shù)都是有針對(duì)性的，能夠有效地解決絕大多數(shù)的網(wǎng)絡(luò)安全問(wèn)題。從現(xiàn)實(shí)需求出發(fā)，大數(shù)據(jù)處理與分析技術(shù)的確應(yīng)當(dāng)被用于信息安全與情報(bào)工作，但并非完全安全。以數(shù)據(jù)挖掘技術(shù)為例，它包括了數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)分析與利用、知識(shí)應(yīng)用（見(jiàn)圖3）。圖3大數(shù)據(jù)處理過(guò)程中的隱私泄露數(shù)據(jù)獲取包括用戶不了解數(shù)據(jù)源的選擇，從而帶來(lái)潛在威脅；預(yù)處理要求濾除無(wú)關(guān)或者關(guān)系不是很好的信息，而用戶又不能了解信息是否得到了妥善處理或者拋棄或者破壞，即使進(jìn)行了二次利用或者違規(guī)利用也會(huì)造成最大的影響。數(shù)據(jù)分析和使用意味著對(duì)有用信息的處理，一般來(lái)說(shuō)，數(shù)據(jù)會(huì)被去掉身份，但這并不是100%的安全，因?yàn)槿サ羯矸莸臄?shù)據(jù)信息可以和數(shù)據(jù)庫(kù)中的其他信息聯(lián)系起來(lái)，在受到惡意攻擊的情況下，用戶信息仍然可以被恢復(fù)。數(shù)據(jù)挖掘的終極目標(biāo)在于挖掘蘊(yùn)藏在數(shù)據(jù)中的寶貴知識(shí)，情報(bào)機(jī)構(gòu)可將獲取的信息用于對(duì)將來(lái)可能出現(xiàn)的以公共安全及有關(guān)人員為對(duì)象的事件進(jìn)行預(yù)測(cè)。若現(xiàn)階段信息未被有效儲(chǔ)存，從而造成信息泄露，無(wú)疑會(huì)給個(gè)人數(shù)據(jù)帶來(lái)巨大的威脅。由此可見(jiàn)，用于敏感信息采集與加工的大規(guī)模數(shù)據(jù)處理與分析技術(shù)并不是絕對(duì)安全的。重視數(shù)據(jù)處理中缺乏嚴(yán)格監(jiān)督與管理程序、如何保證各項(xiàng)數(shù)據(jù)都能得到適當(dāng)?shù)谋４媾c保護(hù)等問(wèn)題是今后的工作方向。4、基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)敏感信息感知框架構(gòu)建4.1網(wǎng)絡(luò)敏感信息感知影響因子根據(jù)網(wǎng)絡(luò)敏感信息產(chǎn)生的外部環(huán)境和自身因素，分析網(wǎng)絡(luò)敏感信息結(jié)果如圖4所示。圖4網(wǎng)絡(luò)敏感信息感知影響因子從外部環(huán)境出發(fā)，可依據(jù)敏感事件時(shí)網(wǎng)絡(luò)環(huán)境狀態(tài)，敏感詞出現(xiàn)與出現(xiàn)時(shí)間及目前網(wǎng)絡(luò)監(jiān)管水平等因素來(lái)分析。事件環(huán)境：敏感詞必須取決于對(duì)某個(gè)事件的評(píng)價(jià)，或者是由這個(gè)詞所導(dǎo)致的一系列網(wǎng)絡(luò)事件；在上述兩種情形中，事件處理網(wǎng)絡(luò)環(huán)境影響了敏感信息感知。事件發(fā)生的時(shí)間：主要考慮是需要檢查的資料是否出現(xiàn)在關(guān)鍵時(shí)期，即所謂特殊時(shí)期。特殊時(shí)期通常會(huì)引起人們對(duì)于事件的大量討論或者是沒(méi)有根據(jù)的推測(cè)，在這一過(guò)程中敏感信息的出現(xiàn)是非常可能的。詞匯在文本中的位置：互聯(lián)網(wǎng)文本信息采集分析效率與其關(guān)鍵詞所處位置緊密相關(guān)，實(shí)際數(shù)據(jù)表明敏感詞發(fā)生在正文起始處，其對(duì)全文的影響大于發(fā)生在正文末尾。詞匯在課文中的出現(xiàn)頻度：所考察信息在課文中所起的作用與其頻度成正相關(guān)、頻度高、敏感性高。詞匯呈現(xiàn)方式：前一節(jié)中提到敏感信的呈現(xiàn)方式會(huì)影響敏感信息的發(fā)現(xiàn)與感知過(guò)程，且呈現(xiàn)方式越繁雜，工作進(jìn)展越易受影響。對(duì)文本的意義：敏感詞為文本做出貢獻(xiàn)，可綜合考慮該詞語(yǔ)在文中出現(xiàn)頻率，字符長(zhǎng)度進(jìn)行計(jì)算。4.2網(wǎng)絡(luò)敏感信息感知框架構(gòu)建由于網(wǎng)絡(luò)中敏感信息難以被察覺(jué)和認(rèn)知，且難以避免與私人信息產(chǎn)生沖突，所以需要在保證深層次敏感信息精確抽取的前提下降低情報(bào)機(jī)構(gòu)工作負(fù)荷和難度，提升情報(bào)分析準(zhǔn)確性、及時(shí)性?；诖耍ヂ?lián)網(wǎng)敏感信息（危及社會(huì)公共安全）檢測(cè)框架見(jiàn)圖5。圖5基于深度學(xué)習(xí)方法的網(wǎng)絡(luò)敏感信息感知框架由于在互聯(lián)網(wǎng)上跟蹤和發(fā)現(xiàn)敏感信息的具體過(guò)程，嚴(yán)格控制數(shù)據(jù)來(lái)源是重中之重。在互聯(lián)網(wǎng)廣泛普及，視頻監(jiān)控與跟蹤，圖像識(shí)別等技術(shù)廣泛應(yīng)用，數(shù)據(jù)傳輸速度日益加快的情況下，網(wǎng)民的線上線下行為極可能得到時(shí)刻監(jiān)測(cè)?；ヂ?lián)網(wǎng)中的大部分敏感信息都源于對(duì)人日常生活特別是其在線行為的監(jiān)測(cè)。該流程隱蔽性強(qiáng)，為國(guó)家網(wǎng)絡(luò)監(jiān)控部門(mén)對(duì)網(wǎng)絡(luò)空間進(jìn)行凈化所必需，這些數(shù)據(jù)信息通常由當(dāng)事人不了解。為避免沖突，首先要在數(shù)據(jù)源中盡可能精確地采集有用信息，以免對(duì)非敏感信息產(chǎn)生無(wú)效的獲取與利用。這需要情報(bào)人員能及時(shí)地發(fā)現(xiàn)問(wèn)題并鎖定目標(biāo)區(qū)域及人群，同時(shí)對(duì)網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)提出更高的需求。對(duì)數(shù)據(jù)處理技術(shù)而言，如何在海量領(lǐng)域與影像中對(duì)敏感詞匯進(jìn)行快速捕獲與精確監(jiān)控具有挑戰(zhàn)性。5、網(wǎng)絡(luò)敏感信息感知系統(tǒng)下社會(huì)類突發(fā)事件應(yīng)急處理進(jìn)程優(yōu)化在社會(huì)類突發(fā)事件爆發(fā)之前，若不掌握情報(bào)就盲目開(kāi)展活動(dòng)，不僅不能抑制社會(huì)類突發(fā)事件，而且還會(huì)浪費(fèi)很多人力、物力、財(cái)力，更會(huì)加劇社會(huì)類突發(fā)事件所帶來(lái)的危害，因此這時(shí)的觀測(cè)應(yīng)屬于廣義上的觀測(cè)與防范。社會(huì)類突發(fā)事件發(fā)生后，武警現(xiàn)場(chǎng)指揮員要想確保應(yīng)急處理進(jìn)程更加順利，就必須在有效的時(shí)間里獲得更多的情報(bào)，可通過(guò)公安“天網(wǎng)工程”“雪亮工程”以及大數(shù)據(jù)平臺(tái)來(lái)獲得社會(huì)面治安狀況等信息，并通過(guò)網(wǎng)絡(luò)敏感的信息感知系統(tǒng)來(lái)了解競(jìng)爭(zhēng)對(duì)手的情況，民情社情，天候地形，電磁環(huán)境以及輿論情況等等，這樣才能更早地一步了解社會(huì)類突發(fā)事件的導(dǎo)火索到底是什么，給民眾造成的威脅有多大，又能得到誰(shuí)的支持，怎樣配合協(xié)同應(yīng)急處理，才能在社會(huì)類突發(fā)事件應(yīng)急處理中取得突破。這一階段是用來(lái)搜集能有助于問(wèn)題解決的多種有關(guān)資料，并為進(jìn)一步分析判斷奠定所需數(shù)據(jù)基礎(chǔ)。社會(huì)類突發(fā)事件行動(dòng)中武警部隊(duì)?wèi)?yīng)加快高新技術(shù)的信息化和現(xiàn)代化建設(shè)，運(yùn)用網(wǎng)絡(luò)敏感信息感知系統(tǒng)增強(qiáng)信息化應(yīng)急處理優(yōu)勢(shì)。武警指揮員應(yīng)善于運(yùn)用信息化通信技術(shù)手段和無(wú)人化智能化新型裝備來(lái)豐富多種觀察，判斷和決策手段，極大地縮短任務(wù)部隊(duì)?wèi)?yīng)急處理實(shí)施時(shí)間，并在應(yīng)急處理過(guò)程中切實(shí)提髙容錯(cuò)率，以實(shí)現(xiàn)最終制勝。另外，還應(yīng)加上社會(huì)類突發(fā)事件信息的搜集，建立有效的社會(huì)類突發(fā)事件怖活動(dòng)預(yù)警體

人人文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì) > 任務(wù)書(shū)類

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于機(jī)器學(xué)習(xí)的文本情感分析在社會(huì)突發(fā)事件處理中的應(yīng)用

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔