




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
[11]。1.5研究?jī)?nèi)容本文采用了基于Word2vec模型的主題識(shí)別算法,和文獻(xiàn)計(jì)量學(xué)的研究手段,首先對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域最近三十年的研究現(xiàn)狀進(jìn)行基礎(chǔ)分析,分別從不同時(shí)間段文獻(xiàn)產(chǎn)出量、核心作者及合作情況、核心期刊、核心研究機(jī)構(gòu)等多個(gè)方面對(duì)其進(jìn)行文獻(xiàn)計(jì)量學(xué)上的分析。最后對(duì)文本進(jìn)行處理,構(gòu)建Word2vec模型,最后通過(guò)K-means算法進(jìn)行聚類(lèi),共分成四個(gè)章節(jié),主要內(nèi)容有:第一章,緒論。是本文的基礎(chǔ)性?xún)?nèi)容,主要包括本文研究背景,分別對(duì)國(guó)內(nèi)和國(guó)外的研究現(xiàn)狀進(jìn)行綜述,然后對(duì)本文的研究目的和研究意義進(jìn)行論述,最后介紹了本文將用到的統(tǒng)計(jì)數(shù)據(jù)和將要使用的具體方法。最后整體描述進(jìn)行本文研究?jī)?nèi)容和框架。第二章,我國(guó)網(wǎng)絡(luò)安全領(lǐng)域研究現(xiàn)狀的文獻(xiàn)計(jì)量學(xué)分析。為了保障數(shù)據(jù)的全面性和準(zhǔn)確性,本文選擇中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)(CNKI)中的數(shù)據(jù)庫(kù)作為研究的數(shù)據(jù)來(lái)源。以檢索式:主題=網(wǎng)絡(luò)安全或者題名=網(wǎng)絡(luò)安全或者v_subject=中英文擴(kuò)展(網(wǎng)絡(luò)安全)或者title=中英文擴(kuò)展(網(wǎng)絡(luò)安全)或者主題=同義詞拓展(網(wǎng)絡(luò)安全),并對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,去除明顯與本研究不符的文獻(xiàn),在此基礎(chǔ)上對(duì)其進(jìn)行文獻(xiàn)計(jì)量學(xué)上的分析。第三章,研究熱點(diǎn)主題識(shí)別,通過(guò)上一步的結(jié)果,通過(guò)Word2vec算法構(gòu)建矩陣,再通過(guò)K-means聚類(lèi)算法進(jìn)行研究熱點(diǎn)的聚類(lèi)。研究熱點(diǎn)的主題識(shí)別是文獻(xiàn)計(jì)量學(xué)中重要的領(lǐng)域。當(dāng)前學(xué)界一般都采用共現(xiàn)關(guān)系使用社會(huì)網(wǎng)絡(luò)分析的方法來(lái)進(jìn)行矩陣的構(gòu)建或關(guān)系的刻畫(huà),而本文采用一種新方法——Word2vec模型來(lái)進(jìn)行構(gòu)建矩陣,它對(duì)主題識(shí)別的精確性有所提升。之后再使用K-means算法對(duì)進(jìn)行主題聚類(lèi)。最后得出該領(lǐng)域的研究熱點(diǎn),相對(duì)而言可以對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的的研究主題進(jìn)行更精確的識(shí)別。第四章,總結(jié)與展望。對(duì)論文以上研究?jī)?nèi)容進(jìn)行系統(tǒng)的總結(jié),首先是闡述本文的主要難點(diǎn)和創(chuàng)新點(diǎn),以及研究中得到的結(jié)論和啟發(fā)。其次是對(duì)本文研究?jī)?nèi)容方面的不足進(jìn)行論述和反思,最后結(jié)合本文的研究?jī)?nèi)容對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域進(jìn)行展望。1.6研究方法1.6.1文獻(xiàn)研究法文獻(xiàn)研究方法是為了解決某些研究問(wèn)題或是根據(jù)某些目的,通過(guò)查閱文獻(xiàn)(包括紙質(zhì)文獻(xiàn)和電子文獻(xiàn))獲取信息的一種方法,從而能全面、合理地了解和掌握所研究課題的脈絡(luò),該方法廣泛應(yīng)用于不同的學(xué)科,其主要作用首先是了解其研究歷史和研究現(xiàn)狀,從而可以讓研究者以高屋建瓴對(duì)研究?jī)?nèi)容進(jìn)行謀篇布局,確立自己研究的重點(diǎn)和創(chuàng)新點(diǎn)。其次是讓研究者對(duì)其有初步印象,避免研究時(shí)出現(xiàn)“兩眼一抹黑”的情況,同時(shí)可以與自己所得到的第一手資料進(jìn)行對(duì)比,針對(duì)兩者之間的共性和差異進(jìn)行思考。最后我們可以充分了解研究?jī)?nèi)容的全貌,可以“站在巨人的肩膀上”,從而在前人的成果上更進(jìn)一步。1.6.2文獻(xiàn)分析法文獻(xiàn)計(jì)量學(xué)是一門(mén)運(yùn)用數(shù)理統(tǒng)計(jì)方法定量分析所有知識(shí)載體的交叉學(xué)科,其交叉的學(xué)科有數(shù)學(xué)、統(tǒng)計(jì)學(xué)和文獻(xiàn)學(xué),是一個(gè)廣泛的數(shù)學(xué)知識(shí)體系,文獻(xiàn)計(jì)量學(xué)的對(duì)象包括文獻(xiàn)數(shù)量(包括多種出版物,特別是期刊論文和引語(yǔ))、文獻(xiàn)作者(個(gè)人或研究機(jī)構(gòu))、詞匯數(shù)量(包括詞頻和共現(xiàn)情況等),在對(duì)其進(jìn)行定量的分析之后,由研究者對(duì)其進(jìn)行定性的分析。
2我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的計(jì)量分析2.1數(shù)據(jù)來(lái)源與預(yù)處理2.1.1數(shù)據(jù)來(lái)源及預(yù)處理因?yàn)楸疚闹饕芯课覈?guó)網(wǎng)絡(luò)安全領(lǐng)域,而且選擇的期刊為核心期刊,所以本文的數(shù)據(jù)庫(kù)選擇中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù)作為數(shù)據(jù)庫(kù)來(lái)源,檢索條件設(shè)定為:主題=網(wǎng)絡(luò)安全或者題名=網(wǎng)絡(luò)安全或者v_subject=中英文擴(kuò)展(網(wǎng)絡(luò)安全)或者title=中英文擴(kuò)展(網(wǎng)絡(luò)安全)或者主題=同義詞拓展(網(wǎng)絡(luò)安全),同時(shí)選擇同義詞拓展,檢索日期為2020年12月31日,時(shí)間跨度為1992年到2020年,共得到相關(guān)的中文文獻(xiàn)11243篇,對(duì)檢索結(jié)果進(jìn)行人工逐篇篩選,刪除新聞、訪(fǎng)談、法律條文、會(huì)議征稿、考題、賀詞、通知等非學(xué)術(shù)性文獻(xiàn)和作者信息不全等無(wú)效性文獻(xiàn),最后得到10280篇有效文獻(xiàn)。對(duì)中國(guó)知網(wǎng)(CNKI)的數(shù)據(jù)以Endnote格式導(dǎo)出txt文件,在使用COOC軟件和excel進(jìn)行分析時(shí)需要將Endnote格式的文本轉(zhuǎn)化為excel常用的xlsx格式,本文通過(guò)COOC自帶的數(shù)據(jù)提取模塊進(jìn)行轉(zhuǎn)化,COOC支持Endnote格式的txt文件轉(zhuǎn)化,生成excel表格后,再使用其的數(shù)據(jù)清洗模塊對(duì)數(shù)據(jù)進(jìn)行去重,可得到年份、全部作者、期刊、關(guān)鍵詞、機(jī)構(gòu)、標(biāo)題和摘要的字段信息,2.2研究基礎(chǔ)計(jì)量分析2.2.1文獻(xiàn)數(shù)量分析通過(guò)對(duì)1992-2020年國(guó)內(nèi)網(wǎng)絡(luò)安全領(lǐng)域在中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù)中的核心期刊的論文發(fā)表數(shù)量,可以很好地從時(shí)間維度上刻畫(huà)我國(guó)在該領(lǐng)域發(fā)展?fàn)顩r,如下表2.1所示:表2.11992-2020年我國(guó)網(wǎng)絡(luò)安全領(lǐng)域在核心期刊上論文發(fā)表量年份數(shù)量占比年份數(shù)量占比199250.05%20076025.86%199380.08%20084664.53%199490.09%20095235.09%199570.07%20105255.11%1996180.18%20114884.75%1997260.25%20124944.81%1998380.37%20134974.83%1999780.76%20144644.51%20001591.55%20154564.44%20012492.42%20165735.57%20023493.39%20175805.64%20034554.43%20184083.97%20044194.08%20197146.95%20054724.59%20206956.76%20065034.89%圖2.1論文發(fā)布年代分布情況從圖2.1可以看出,21世紀(jì)之前論文發(fā)表數(shù)量還比較少,側(cè)面說(shuō)明當(dāng)時(shí)我國(guó)對(duì)網(wǎng)絡(luò)安全領(lǐng)域關(guān)注度較低。在2000-2020二十年間,我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的論文數(shù)量總體呈上升趨勢(shì),雖在中途有一段時(shí)間的波動(dòng),在2007達(dá)到第一個(gè)小高峰,通過(guò)查閱資料可得知,在2006年底,名為"熊貓燒香"的病毒爆發(fā),數(shù)目眾多的計(jì)算機(jī)遭到攻擊,造成了不小經(jīng)濟(jì)損失,這是我國(guó)互聯(lián)網(wǎng)歷史上有關(guān)網(wǎng)絡(luò)安全的一場(chǎng)標(biāo)志性事件,讓我國(guó)很多人認(rèn)識(shí)到網(wǎng)絡(luò)安全的重要性。同時(shí)調(diào)查也顯示:2006年以來(lái)的新病毒中其中大部分具有明顯的逐利性質(zhì),這也意味著病毒生產(chǎn)者的目的由最初的玩樂(lè)、炫耀或?qū)W習(xí)心理轉(zhuǎn)變?yōu)閺氖芎φ呤种蟹欠踩〗?jīng)濟(jì)利益為主,因此在第二年,也就是2007年,網(wǎng)絡(luò)安全有關(guān)研究出現(xiàn)井噴,出現(xiàn)第一個(gè)小高峰;第二個(gè)小高峰出現(xiàn)于2016年、2017年,原因在于2015年我國(guó)正式公布并施行了新的《國(guó)家安全法》,相比于1993年的《國(guó)家安全法》有很多修改,其中第二章第二十五條規(guī)定“維護(hù)國(guó)家網(wǎng)絡(luò)空間主權(quán)、安全和發(fā)展利益”,從頂層設(shè)計(jì)的角度為網(wǎng)絡(luò)安全領(lǐng)域發(fā)展保駕護(hù)航。2016年《網(wǎng)絡(luò)安全法》標(biāo)志著我國(guó)從立法層面上對(duì)網(wǎng)絡(luò)安全問(wèn)題進(jìn)行規(guī)范和管理,標(biāo)志我國(guó)網(wǎng)絡(luò)安全管理走向正規(guī)化。而最近一個(gè)高峰是2019年和2020年,一方面是因?yàn)槲覈?guó)科研水平不斷提升,另一方面也是因?yàn)?018年,全國(guó)網(wǎng)絡(luò)安全和信息化工作會(huì)議召開(kāi),習(xí)近平總書(shū)記系統(tǒng)闡述了網(wǎng)絡(luò)強(qiáng)國(guó)戰(zhàn)略思想,引發(fā)學(xué)界對(duì)網(wǎng)絡(luò)安全的持續(xù)關(guān)注。這一系列說(shuō)明我國(guó)對(duì)網(wǎng)絡(luò)安全領(lǐng)域的研究非?;钴S,但同時(shí)也從另一個(gè)角度證明了目前隨著時(shí)代發(fā)展,網(wǎng)絡(luò)安全領(lǐng)域發(fā)現(xiàn)不少問(wèn)題,學(xué)術(shù)界也對(duì)此進(jìn)行持續(xù)關(guān)注和研究2.2.2核心作者分析作者是文獻(xiàn)的創(chuàng)作主體,通過(guò)對(duì)其進(jìn)行分析可以有效地了解學(xué)科發(fā)展的脈絡(luò)。根據(jù)普萊斯定律,判斷一個(gè)領(lǐng)域的核心作者所需要滿(mǎn)足的數(shù)量關(guān)系:為核心作者群發(fā)文總數(shù)大約為該領(lǐng)域全部論文數(shù)的一半,由此我們可以倒推核心作者的最低發(fā)文量為即M=0.749?其中NMAX為該領(lǐng)域核心作者的最高發(fā)文量。經(jīng)過(guò)對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的全部作者(總)發(fā)文量進(jìn)行統(tǒng)計(jì),得出個(gè)人發(fā)文量最多的是馬建峰,共發(fā)表論文55篇,將55帶入以上的公式,得到M≈5.555≈5,即在該領(lǐng)域發(fā)文量大于等于5篇的作者有資格成為該領(lǐng)域核心作者的候選人。經(jīng)過(guò)統(tǒng)計(jì),發(fā)表論文5篇及以上的作者有597人,其論文數(shù)量總計(jì)4891篇,占文獻(xiàn)總量的47.58%,在誤差允許的范圍內(nèi),滿(mǎn)足普萊斯定律這最后本文采用CiteSpace對(duì)數(shù)據(jù)進(jìn)行可視化分析,本文將發(fā)文量大于等于5的論文作者進(jìn)行共現(xiàn)分析,分析時(shí)間設(shè)置為數(shù)據(jù)庫(kù)中發(fā)文日期最早的1992年到數(shù)據(jù)下載前的2020年12月31日,節(jié)點(diǎn)類(lèi)型設(shè)為作者,可視化之后再對(duì)閾值進(jìn)行設(shè)置。通過(guò)查閱指導(dǎo)書(shū),我們可以知道其用了路徑尋找(Pathfinder)算法圖2.2我國(guó)網(wǎng)絡(luò)安全領(lǐng)域核心作者候選人可視化圖譜圖中的節(jié)點(diǎn)大小代表發(fā)文量的多少,在我國(guó)網(wǎng)絡(luò)安全領(lǐng)域發(fā)文量排前五位分別是:馬建峰(55)、楊義先(48)、方濱興(37)、云曉春(36)、張玉清(32)。另外,通過(guò)深入觀(guān)察論文作者情況可以發(fā)現(xiàn),國(guó)內(nèi)網(wǎng)絡(luò)安全領(lǐng)域論文學(xué)者合著現(xiàn)象比較普遍,通過(guò)查閱有關(guān)文獻(xiàn),發(fā)現(xiàn)國(guó)外網(wǎng)絡(luò)安全領(lǐng)域作者合著現(xiàn)象也比較頻繁,這種共性說(shuō)明了網(wǎng)絡(luò)安全領(lǐng)域的特殊性,即網(wǎng)絡(luò)安全領(lǐng)域跨學(xué)科、跨專(zhuān)業(yè)的現(xiàn)象很常見(jiàn),需要作者綜合多方面知識(shí)進(jìn)行研究,對(duì)作者要求比較高,而通過(guò)合作,可以進(jìn)行合理的分工,使得作者不需要精通每一個(gè)領(lǐng)域,從而可以有效地解決這一問(wèn)題,所以合著現(xiàn)象在網(wǎng)絡(luò)安全領(lǐng)域較為普遍。2.2.3核心機(jī)構(gòu)分析核心機(jī)構(gòu)是領(lǐng)域發(fā)展的重要引擎,一般來(lái)說(shuō),在一個(gè)領(lǐng)域內(nèi)的核心機(jī)構(gòu)在該領(lǐng)域的學(xué)術(shù)地位也比較高。經(jīng)過(guò)對(duì)機(jī)構(gòu)發(fā)文量的統(tǒng)計(jì),結(jié)果如表2.2所示,
表2.2我國(guó)網(wǎng)絡(luò)安全領(lǐng)域核心研究機(jī)構(gòu)及發(fā)文數(shù)量機(jī)構(gòu)所在城市所處地區(qū)發(fā)文數(shù)量國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院長(zhǎng)沙華南127四川大學(xué)計(jì)算機(jī)學(xué)院成都西南97中南大學(xué)信息科學(xué)與工程學(xué)院長(zhǎng)沙華南85中國(guó)科學(xué)院計(jì)算技術(shù)研究所北京華北81華中科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院武漢華中71清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系北京華北70西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院西安西北64哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院哈爾濱東北63中國(guó)科學(xué)院研究生院北京華北60北京科技大學(xué)信息工程學(xué)院北京華北58從表中可以看出網(wǎng)絡(luò)安全領(lǐng)域的核心機(jī)構(gòu)都是我國(guó)有名的大學(xué)和研究機(jī)構(gòu),可以看出我國(guó)在網(wǎng)絡(luò)安全領(lǐng)域形成了以國(guó)防科技大學(xué)、中南大學(xué)以及四川大學(xué)等文獻(xiàn)數(shù)量和質(zhì)量都很優(yōu)秀的研究機(jī)構(gòu)。而且集中于北京、長(zhǎng)沙、哈爾濱、西安,形成了四個(gè)主要的研究機(jī)構(gòu)城市群,說(shuō)明我國(guó)網(wǎng)絡(luò)安全領(lǐng)域核心研究機(jī)構(gòu)地理位置較為集中,這也與網(wǎng)絡(luò)安全研究需要一定的硬件設(shè)施和人才的高度集中有一定的相關(guān)性,同時(shí)對(duì)有關(guān)作者合作發(fā)文提供了便利。2.2.4核心期刊分析對(duì)一個(gè)學(xué)術(shù)領(lǐng)域做期刊分析能夠確定該領(lǐng)域的核心期刊,而通過(guò)核心期刊的文獻(xiàn)的發(fā)文數(shù)量也可以看出核心期刊的學(xué)術(shù)地位。經(jīng)過(guò)統(tǒng)計(jì)可以得到表2.3表2.3我國(guó)網(wǎng)絡(luò)安全領(lǐng)域核心期刊及發(fā)文數(shù)量期刊發(fā)文數(shù)量創(chuàng)刊時(shí)間主管單位計(jì)算機(jī)工程4911975國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)工程與應(yīng)用4411964中國(guó)電子科技集團(tuán)公司計(jì)算機(jī)應(yīng)用研究3041984四川省科學(xué)技術(shù)廳計(jì)算機(jī)工程與設(shè)計(jì)2881980中國(guó)航天科工集團(tuán)計(jì)算機(jī)科學(xué)2711974國(guó)家科技部西南信息中心可以看出網(wǎng)絡(luò)安全領(lǐng)域的核心期刊主要是計(jì)算機(jī)相關(guān)領(lǐng)域的期刊,同時(shí)從創(chuàng)刊日期可以看出主要的核心期刊主要?jiǎng)?chuàng)立于八、九十年代,當(dāng)時(shí)我國(guó)計(jì)算機(jī)領(lǐng)域方興未艾,它們具有一定的先發(fā)優(yōu)勢(shì),這也說(shuō)明一個(gè)領(lǐng)域內(nèi)的核心期刊需要時(shí)間的沉淀和積累。且主管部門(mén)相比于其他領(lǐng)域主要由大學(xué)主管,我國(guó)網(wǎng)絡(luò)安全領(lǐng)域主要為政府相關(guān)部門(mén)和與軍事方面聯(lián)系較緊密的大學(xué)主管,權(quán)威性較高,同時(shí)也是由于其關(guān)系國(guó)家安全和利益的特殊性。2.2.5共現(xiàn)矩陣分析我們需要構(gòu)建高頻關(guān)鍵詞的共現(xiàn)矩陣,本文通過(guò)COOC軟件統(tǒng)計(jì)關(guān)鍵詞發(fā)生兩兩共現(xiàn)的頻次,可以得到高頻關(guān)鍵詞的共現(xiàn)矩陣。表2.5關(guān)鍵詞共現(xiàn)矩陣(部分)檢測(cè)攻擊算法協(xié)議治理安全性社會(huì)……電子商務(wù)檢測(cè)0510455146415315……6攻擊5100372248930535……8算法4553720161226713……6協(xié)議1462481610331312……19治理492302229……5安全性1533052673132026……41社會(huì)15351312229260……21認(rèn)證351328523832288……21無(wú)線(xiàn)8418716318202123……2防御16727912054189125……2通信106137132169820213……4平臺(tái)76684562418260……22傳感器7914113313301483……1神經(jīng)網(wǎng)絡(luò)10144137402312……0中國(guó)6173619712140……14服務(wù)47995967418651……11路由5813410817301221……0密鑰181069615701901……6……………………電子商務(wù)6861954121……0基于高頻關(guān)鍵詞的共現(xiàn)矩陣,我們可以在之后通過(guò)共現(xiàn)網(wǎng)絡(luò)探究網(wǎng)絡(luò)安全領(lǐng)域的研究熱點(diǎn)主題,與本文所提出的通過(guò)Word2vec模型構(gòu)建的關(guān)系,這部分在第四章將進(jìn)行詳細(xì)分析。3我國(guó)網(wǎng)絡(luò)安全領(lǐng)域研究熱點(diǎn)主題識(shí)別及實(shí)現(xiàn)3.1研究熱點(diǎn)主題識(shí)別實(shí)現(xiàn)及分析3.1.1構(gòu)建Word2vec模型在以往文獻(xiàn)計(jì)量學(xué)的研究中,研究熱點(diǎn)主題識(shí)別是是一個(gè)不可或缺的領(lǐng)域。首先它要基于一個(gè)矩陣或一種關(guān)系來(lái)對(duì)主題進(jìn)行識(shí)別;那么要解決兩個(gè)問(wèn)題:一是如何構(gòu)建矩陣或如何刻畫(huà)關(guān)系,二是用什么方法從矩陣或關(guān)系中確定主題。第一個(gè)問(wèn)題當(dāng)前學(xué)術(shù)界一般都是基于共現(xiàn)關(guān)系使用社會(huì)網(wǎng)絡(luò)分析的方法來(lái)進(jìn)行矩陣的構(gòu)建或關(guān)系的刻畫(huà),但這種方法也不是十全十美的,由于該方法本身所具有的局限性,所以在對(duì)文本的矩陣構(gòu)建中,它的矩陣具有稀疏性,對(duì)聚類(lèi)的結(jié)果有一定的影響。而本文采用一種較新的方法:Word2vec模型來(lái)進(jìn)行構(gòu)建關(guān)系矩陣,它可以抓住語(yǔ)義關(guān)系,構(gòu)建一個(gè)低維的矩陣,這個(gè)矩陣相對(duì)而言是不稀疏的,對(duì)主題識(shí)別的精確性有所提升。而之后再使用K-means算法對(duì)主題進(jìn)行聚類(lèi)。最后通過(guò)設(shè)置閾值,得出一個(gè)時(shí)間段內(nèi)該領(lǐng)域的研究熱點(diǎn)。有利于對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域研究的研究熱點(diǎn)主題演化進(jìn)行更精準(zhǔn)的識(shí)別。Word2vec是一個(gè)用來(lái)產(chǎn)生詞向量的相關(guān)模型。該模型主要作用是用來(lái)訓(xùn)練重新建構(gòu)詞的屬性,它是一個(gè)雙層神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)以詞作為連接節(jié)點(diǎn),同時(shí)可以猜測(cè)相鄰左右位置的輸入詞,Word2Vec的一大特點(diǎn),也是其與詞袋模型最大的不同是詞的順序相對(duì)而言影響更低。當(dāng)Word2Vec模型訓(xùn)練完成以后,可以獲得一個(gè)擁有設(shè)定維數(shù)的詞向量,向量代表著詞與詞之間的關(guān)系,詞向量也叫該神經(jīng)網(wǎng)絡(luò)的隱藏層。Word2Vec模型有兩種算法:分別是連續(xù)詞袋模型(CBOW)和Skip-Gram模型。前者跟常見(jiàn)的詞袋模型有一定相同之處,它通過(guò)創(chuàng)建每個(gè)單獨(dú)詞語(yǔ)的特征向量來(lái)構(gòu)建該詞語(yǔ)的單詞向量,其步驟為先創(chuàng)建一個(gè)動(dòng)態(tài)、可移動(dòng)的窗口,然后從給定文本中目標(biāo)詞語(yǔ)附近的詞語(yǔ)來(lái)進(jìn)行神經(jīng)網(wǎng)絡(luò)構(gòu)建,最后對(duì)其進(jìn)行預(yù)測(cè)。然后我們就將其作為特征向量,并存在其對(duì)應(yīng)的窗口中。在訓(xùn)練完成以后,特征向量就會(huì)成為該詞語(yǔ)的單詞向量。后者在形式上恰好與后者相反——即我們將采用其中一個(gè)已經(jīng)確定的單詞預(yù)測(cè)其附近單詞,毫無(wú)疑問(wèn)其難度更大,所以需要耗費(fèi)的時(shí)間和算力也更加龐大。但是其也有優(yōu)點(diǎn),也就是對(duì)于一些少見(jiàn)的詞語(yǔ)或數(shù)量比較小的數(shù)據(jù)集,其準(zhǔn)確度相對(duì)于前者更高。首先為了得到一個(gè)符合我們需求的Word2vec模型,那么需要先對(duì)下載下來(lái)的數(shù)據(jù)中的文本進(jìn)行分詞,在這里我們選取的是將一篇文獻(xiàn)的標(biāo)題及摘要作為文本的選取目標(biāo),這也是文獻(xiàn)分析學(xué)中對(duì)文本分析較常選取的文獻(xiàn)部分,然后因?yàn)槲覀兯芯康哪繕?biāo)詞語(yǔ)主要是中文和英文,所以將其中的標(biāo)點(diǎn)符號(hào)刪去。同時(shí)保證同一篇文獻(xiàn)的標(biāo)題和摘要在同一行上,避免對(duì)后續(xù)結(jié)果造成影響。然后我們對(duì)文本進(jìn)行分詞,在這里我們采用的是jieba分詞,它是一個(gè)中文分詞,可以用來(lái)對(duì)中文文本進(jìn)行分詞(有多種模式)、判斷詞性等功能,其特點(diǎn)是可以添加自定義詞典。本文使用精確模式對(duì)文本進(jìn)行分詞,但觀(guān)察分詞結(jié)果我們也不難發(fā)現(xiàn),所得到的文本有許多與研究?jī)?nèi)容無(wú)關(guān)的詞語(yǔ),如語(yǔ)氣詞、量詞、部分副詞和形容詞,如云云、云爾、人們等。同時(shí)有許多網(wǎng)絡(luò)安全領(lǐng)域的專(zhuān)有名詞被分開(kāi)。為提高分詞的準(zhǔn)確度,本文的停用詞使用了以哈爾濱工業(yè)大學(xué)和百度公司公開(kāi)的停用詞表為主,同時(shí)通過(guò)jieba分詞自帶的詞性分析,人工進(jìn)行補(bǔ)充,最后結(jié)果達(dá)到10000個(gè)詞,之后又補(bǔ)充網(wǎng)絡(luò)安全領(lǐng)域?qū)S忻~加入自定義詞典中,這大大提高了分詞的準(zhǔn)確性。最后對(duì)文本進(jìn)行Word2vec模型的訓(xùn)練,本文調(diào)用了sklearn包中所帶的Word2vec,其中參數(shù)設(shè)置為sg=1,表示因?yàn)閿?shù)據(jù)量的原因使用Skip-Gram模型進(jìn)行訓(xùn)練,當(dāng)前詞與預(yù)測(cè)詞在一個(gè)句子中的最大距離設(shè)置為10,詞頻門(mén)檻設(shè)置為50次,得出的結(jié)果向量維度為100,最后得出來(lái)的Word2vec模型(部分)如下圖所示。表3.1Word2vec模型詞語(yǔ)及其維數(shù)詞語(yǔ)/維數(shù)123456…100檢測(cè)-0.53110.421359-0.04533-0.098160.027157-0.24618…0.555707攻擊-0.4757-0.247740.493668-0.130350.441392-0.32968…0.028761算法-0.348090.150490.261222-0.546590.241454-0.08297…0.052867協(xié)議-0.532670.1474970.484934-0.269340.1475390.08672…0.04682治理-0.03312-0.239960.2830420.1887230.00871-0.32984…-0.08085安全性-0.42254-0.080910.423337-0.440430.2638640.05572…0.13481社會(huì)0.128743-0.263340.3003820.07661-0.2042-0.07083…-0.32217認(rèn)證-0.275560.1227590.466344-0.401810.3994880.247974…0.11009無(wú)線(xiàn)-0.381210.1859820.758464-0.099790.1998540.112995…0.326804防御-0.58865-0.054330.178287-0.233690.37413-0.31469…0.344163……………平臺(tái)-0.326220.419522-0.245710.0487280.270672-0.16799…0.0410643.1.2使用K-means算法進(jìn)行主題聚類(lèi)K均值聚類(lèi)算法是一種半監(jiān)督聚類(lèi)算法,一般認(rèn)為,半監(jiān)督聚類(lèi)在使用類(lèi)標(biāo)簽的數(shù)據(jù)集的信息幫助下相比于只用無(wú)類(lèi)標(biāo)簽的數(shù)據(jù)集可以得到的相對(duì)更好的簇,提高聚類(lèi)的準(zhǔn)確度REF_Ref66475254\r\h[12]。K-means通過(guò)對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行距離的計(jì)算(一般采用歐氏距離),兩個(gè)目標(biāo)之間的距離差距越小,就認(rèn)為其相似度越高,從而聚類(lèi)在一起的可能性越大。K-means的算法步驟如下:第一步是選擇對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行初始化,隨機(jī)選取k個(gè)對(duì)象作為初始聚類(lèi)中心a=a1,a2,?ak;第二步,計(jì)算數(shù)據(jù)集中每個(gè)樣本x其優(yōu)點(diǎn)有原理簡(jiǎn)單,相對(duì)而言容易理解,算法復(fù)雜度低。收斂速度快,聚類(lèi)速度也較快,聚類(lèi)效果較優(yōu),雖然是局部最優(yōu),但一般情況下,局部最優(yōu)也是全局最優(yōu)。而且當(dāng)K值近似高斯分布時(shí),效果很好。同時(shí)伸縮性好,無(wú)論是對(duì)數(shù)據(jù)較小或是數(shù)據(jù)較大的數(shù)據(jù)集都能保證其伸縮性。缺點(diǎn)有K值是人為設(shè)置的,而且十分敏感,K值的變動(dòng)對(duì)聚類(lèi)結(jié)果影響較大。對(duì)噪音、異常值比較敏感,最好對(duì)數(shù)據(jù)進(jìn)行一定的預(yù)處理。一個(gè)樣本只能分配給一個(gè)類(lèi),無(wú)法滿(mǎn)足多分類(lèi)需求。對(duì)數(shù)據(jù)有一定要求,不適合離散程度高的數(shù)據(jù)集、樣本類(lèi)別差距較大的數(shù)據(jù)集、非凸形狀的數(shù)據(jù)集(較難收斂)。要進(jìn)行K-means聚類(lèi),首先要確定K值,在本文中,采用的是CH分?jǐn)?shù)(CalinskiHarabaszScore)來(lái)評(píng)價(jià)聚類(lèi)效果的優(yōu)劣,由此來(lái)倒推最合適的K值,其數(shù)學(xué)公式為:s其中Bk代表簇間色散平均值,wwBCalinski-Harabasz分?jǐn)?shù)與內(nèi)部協(xié)方差呈負(fù)相關(guān),與類(lèi)別之間的協(xié)方差呈正相關(guān),也就是說(shuō)在不知道真實(shí)標(biāo)簽的情況下,其分?jǐn)?shù)越高,代表聚類(lèi)效果越好。根據(jù)測(cè)試,其Calinski-Harabasz分?jǐn)?shù)最高的K值為7。其Calinski-Harabasz分?jǐn)?shù)如下表所示:
表3.2K值及其對(duì)應(yīng)的Calinski-Harabasz分?jǐn)?shù)K值Calinski-Harabasz分?jǐn)?shù)1896.72895.73933.54935.65907.96938.27939.88925.39914.510909.9最后我們將K=7代入K-means函數(shù)中,得到的散點(diǎn)圖如下圖所示(已使用PCA進(jìn)行降維)其中心詞以及中心詞坐標(biāo)如下表所示:(坐標(biāo)保留四位小數(shù))表3.3中心詞及其對(duì)應(yīng)坐標(biāo)中心詞坐標(biāo)認(rèn)證(-0.5388,-0.7791)治理(1.5812,0.0666)神經(jīng)網(wǎng)絡(luò)(-0.7534,1.0380)防御(-0.2374,0.2298)信息化(0.5902,-0.4877)輿情(0.7101,0.7176)檢測(cè)(-0.9590,-0.0826)3.2我國(guó)網(wǎng)絡(luò)安全研究領(lǐng)域研究熱點(diǎn)主題分析但此時(shí)我們還無(wú)法確定這些類(lèi)的標(biāo)簽,這時(shí)我們使用Word2vec構(gòu)建模型的優(yōu)勢(shì)就展現(xiàn)出來(lái),我們可以讀取與中心詞詞向量最接近的幾個(gè)詞(在這里統(tǒng)一選擇五個(gè)詞,相似度保留四位小數(shù)),就可以判斷每個(gè)類(lèi)的標(biāo)簽和相關(guān)領(lǐng)域3.2.1認(rèn)證服務(wù)領(lǐng)域與中心詞“認(rèn)證”相關(guān)度最高的五個(gè)詞如下表所示:表3.4按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1漫游0.74682私鑰0.69923公鑰0.68454協(xié)議0.67545身份認(rèn)證0.6690“漫游”“私鑰”“公鑰”“協(xié)議”“身份認(rèn)證”代表該類(lèi)是屬于認(rèn)證領(lǐng)域。認(rèn)證在網(wǎng)絡(luò)安全領(lǐng)域一般指通信的雙方通過(guò)約定好的協(xié)議互相確認(rèn)對(duì)方身份,從而保證信息安全三要素中的保密性,保證信息不被泄露給非授權(quán)的用戶(hù),從而保證信息的安全。在如今的信息化社會(huì)中,信息價(jià)值日益重要,如網(wǎng)上購(gòu)物的興起,企業(yè)和政府辦公信息化導(dǎo)致很多個(gè)人、企業(yè)和國(guó)家的重要信息都通過(guò)網(wǎng)絡(luò)進(jìn)行傳輸,這成為很多不法分子竊取從而牟利的目標(biāo)。在網(wǎng)絡(luò)安全領(lǐng)域,身份認(rèn)證是三個(gè)主要保密目標(biāo)之首,不同的身份擁有不同的權(quán)限,也是各個(gè)主體判斷用戶(hù)合法性的來(lái)源,由于其在網(wǎng)絡(luò)安全領(lǐng)域擁有重要的地位,所以近些年來(lái)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域也持續(xù)關(guān)注認(rèn)證服務(wù)領(lǐng)域,如“協(xié)議”一般是通信雙方進(jìn)行認(rèn)證的方法,而“漫游”也是最常使用認(rèn)證服務(wù)的工具之一,如消息漫游等,都需要用戶(hù)進(jìn)行驗(yàn)證,當(dāng)然這也是他人竊取信息的重要來(lái)源之一?!肮€”和“私鑰”則是現(xiàn)代密碼學(xué)中不可或缺的產(chǎn)物,也是認(rèn)證服務(wù)領(lǐng)域常用的專(zhuān)業(yè)術(shù)語(yǔ),所以這也證明認(rèn)證服務(wù)領(lǐng)域已成為研究熱點(diǎn)之一。3.2.2社會(huì)治理領(lǐng)領(lǐng)域與中心詞“治理”相關(guān)度最高的五個(gè)詞如下表所示:表3.5按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1法治化0.82172社會(huì)治理0.80763綜合治理0.78184法治0.75565非傳統(tǒng)0.7521網(wǎng)絡(luò)安全領(lǐng)域雖然是偏向自然科學(xué)方面的研究領(lǐng)域,但由于網(wǎng)絡(luò)越來(lái)越深入我們的日常生活,所以網(wǎng)絡(luò)安全問(wèn)題也成為一個(gè)社會(huì)問(wèn)題,是我國(guó)政府乃至于全世界政府都要面臨的一個(gè)社會(huì)治理問(wèn)題,這也理所當(dāng)然的成為學(xué)界研究熱點(diǎn)之一。從“法治化”“社會(huì)治理”“綜合治理”“法治”“非傳統(tǒng)”等相關(guān)詞語(yǔ)我們可以看出,學(xué)界對(duì)網(wǎng)絡(luò)安全問(wèn)題衍生而來(lái)的相關(guān)社會(huì)問(wèn)題,一般關(guān)注法律和綜合治理的作用,這也不難理解,網(wǎng)絡(luò)安全領(lǐng)域是一個(gè)新興領(lǐng)域,無(wú)論是立法層面還是政府監(jiān)督方面在以往都處于空白期,只靠行業(yè)和個(gè)人的自律必然無(wú)法解決網(wǎng)絡(luò)安全問(wèn)題,幾年之前國(guó)家發(fā)布《網(wǎng)絡(luò)安全法》和《國(guó)家網(wǎng)絡(luò)空間安全戰(zhàn)略》,從而讓網(wǎng)絡(luò)安全領(lǐng)域“有法可依”。學(xué)者們?cè)谙嚓P(guān)法律法規(guī)出臺(tái)前研究社會(huì)現(xiàn)狀,提出立法建議,在其出臺(tái)后研究其落實(shí)現(xiàn)狀,提出自己的改進(jìn)意見(jiàn)和方向,也為我國(guó)政府治理能力現(xiàn)代化做出卓越貢獻(xiàn)。同時(shí)由于網(wǎng)絡(luò)安全社會(huì)問(wèn)題的多主體性和復(fù)雜性,它又是非傳統(tǒng)和綜合的,往往需要多方合力才能妥善解決相關(guān)的社會(huì)問(wèn)題。3.2.3機(jī)器學(xué)習(xí)領(lǐng)域與中心詞“神經(jīng)網(wǎng)絡(luò)”相關(guān)度最高的五個(gè)詞如下表所示:表3.6按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1BP0.84342RBF0.75353人工神經(jīng)網(wǎng)絡(luò)0.74834訓(xùn)練0.73935擬合0.7218“BP”“RBF”“人工神經(jīng)網(wǎng)絡(luò)”“訓(xùn)練”“擬合”等表明機(jī)器學(xué)習(xí)應(yīng)用在網(wǎng)絡(luò)安全領(lǐng)域已成為我國(guó)網(wǎng)絡(luò)安全的重要分支之一。機(jī)器學(xué)習(xí)是一門(mén)交叉學(xué)科,主要是為了讓計(jì)算機(jī)模仿或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新知,我們也可以在其相關(guān)詞語(yǔ)看到“BP”“RBF”等機(jī)器學(xué)習(xí)中常用的神經(jīng)網(wǎng)絡(luò),其中BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一,理論和實(shí)際應(yīng)用都比較成熟,RBF神經(jīng)網(wǎng)絡(luò)又叫徑向基神經(jīng)網(wǎng)絡(luò),其實(shí)屬于BP神經(jīng)網(wǎng)絡(luò),但相比于由于使用了全局逼近而導(dǎo)致速度較慢的BP神經(jīng)網(wǎng)絡(luò),其使用的是局部映射(也叫局部逼近),更能滿(mǎn)足一些對(duì)演算速度和實(shí)時(shí)性要求較高場(chǎng)景,其在網(wǎng)絡(luò)安全領(lǐng)域常應(yīng)用于風(fēng)險(xiǎn)評(píng)估方面,如一個(gè)主機(jī)或系統(tǒng)的網(wǎng)絡(luò)安全態(tài)勢(shì)的評(píng)估,為網(wǎng)絡(luò)安全專(zhuān)家提高系統(tǒng)的安全性提供參考。而訓(xùn)練和擬合則是機(jī)器學(xué)習(xí)中調(diào)整參數(shù)常使用的術(shù)語(yǔ)之一。3.2.4網(wǎng)絡(luò)攻防領(lǐng)域與中心詞“防御”相關(guān)度最高的五個(gè)詞如下表所示:
表3.7按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1擬態(tài)0.56442主動(dòng)防御0.56253密網(wǎng)0.55354誘騙0.54915APT0.5178“擬態(tài)”“主動(dòng)防御”“密網(wǎng)”“誘騙”“APT”等屬于網(wǎng)絡(luò)攻防領(lǐng)域的范疇。如擬態(tài)一般是指就是不久之前提出的網(wǎng)絡(luò)空間擬態(tài)防御(CMD),由國(guó)內(nèi)研究團(tuán)隊(duì)提出,針對(duì)目前網(wǎng)絡(luò)安全“易攻難守”的網(wǎng)絡(luò)形勢(shì),構(gòu)建一套動(dòng)態(tài)變化的并行架構(gòu)保護(hù)網(wǎng)絡(luò)安全,也就是說(shuō)它是一套可以主動(dòng)防御的方法,可以說(shuō)是具有革命性的新方法。密網(wǎng)也是一種主動(dòng)防御措施,有點(diǎn)類(lèi)似于釣魚(yú)的“魚(yú)餌”,為了保證自己的重要信息不被攻擊和竊取,預(yù)先設(shè)好“陷阱”,等待攻擊者上鉤,然后根據(jù)攻擊手段調(diào)整防御策略,從而保護(hù)真正的重要數(shù)據(jù)的安全。而APT就指即高級(jí)可持續(xù)威脅攻擊,值對(duì)特定對(duì)象進(jìn)行高強(qiáng)度、持續(xù)的攻擊以獲取利益。在網(wǎng)絡(luò)安全領(lǐng)域,黑客與網(wǎng)絡(luò)安全專(zhuān)家之間的網(wǎng)絡(luò)攻防是學(xué)界研究的重要內(nèi)容。黑客采用多種方法如研究漏洞,獲取系統(tǒng)的信任以提高權(quán)限等進(jìn)行網(wǎng)絡(luò)攻擊,為的是獲取利益或炫耀自己的技術(shù);而防御者們則運(yùn)用防火墻、監(jiān)控等方式保障系統(tǒng)的安全,而有時(shí)候?yàn)榱恕爸褐恕币矔?huì)對(duì)黑客的攻擊手段進(jìn)行研究,圍繞著網(wǎng)絡(luò)攻防之間的研究也就成為了學(xué)術(shù)界核心研究熱點(diǎn)之一。3.2.5社會(huì)信息化領(lǐng)域與中心詞“信息化”相關(guān)度最高的五個(gè)詞如下表所示:表3.8按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1現(xiàn)代化0.62752財(cái)務(wù)管理0.59473經(jīng)濟(jì)社會(huì)0.59264管理制度0.59135宣傳0.5749“現(xiàn)代化”“財(cái)務(wù)管理”“經(jīng)濟(jì)社會(huì)”“管理制度”“宣傳”等都是社會(huì)信息化建設(shè)領(lǐng)域的研究對(duì)象。信息化常常與現(xiàn)代化共同出現(xiàn),可以說(shuō),在信息社會(huì)的今天,社會(huì)的信息化也是現(xiàn)代化的重要一環(huán)。信息化是“萬(wàn)物皆數(shù)”的一個(gè)過(guò)程,通過(guò)將工作生活中得到的數(shù)據(jù)傳輸至數(shù)據(jù)庫(kù),以輔助人們?cè)诠ぷ?、學(xué)習(xí)、決策中提高效率,降低成本,推動(dòng)社會(huì)的進(jìn)步。如財(cái)務(wù)管理和管理制度改革領(lǐng)域如果能合理利用社會(huì)信息化紅利,那么就能大大提高了人們的生產(chǎn)效率,但這些數(shù)據(jù)傳輸時(shí)也會(huì)遇到網(wǎng)絡(luò)安全問(wèn)題,這成為當(dāng)今學(xué)術(shù)界研究的熱點(diǎn)之一。3.2.6.網(wǎng)絡(luò)輿情領(lǐng)域與中心詞“輿情”相關(guān)度最高的五個(gè)詞如下表所示:表3.9按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1食品安全0.69882網(wǎng)民0.68423突發(fā)事件0.66454食品0.66345微博0.6465“食品安全”“網(wǎng)民”“突發(fā)事件”“生態(tài)”“食品”“微博’屬于網(wǎng)絡(luò)輿情管理的范疇。網(wǎng)絡(luò)安全并不局限于個(gè)人與企業(yè)、個(gè)人與國(guó)家之間的網(wǎng)絡(luò)對(duì)抗,也有可能伴隨著國(guó)家與國(guó)家之間的對(duì)抗,當(dāng)一場(chǎng)爭(zhēng)議性較高的突發(fā)事件(如食品安全事件)引發(fā)網(wǎng)民熱議時(shí),如何進(jìn)行輿情管理,及時(shí)公開(kāi)信息就成為政府治理能力現(xiàn)代化的必修課。而不可否認(rèn),很多境外反華勢(shì)力利用輿論進(jìn)行造謠,這也是網(wǎng)絡(luò)安全的一個(gè)重要組成部分,也成為學(xué)術(shù)界研究的熱點(diǎn)之一。3.2.7無(wú)線(xiàn)網(wǎng)絡(luò)安全領(lǐng)域與中心詞“無(wú)線(xiàn)”相關(guān)度最高的五個(gè)詞如下表所示:表3.10按照相關(guān)度進(jìn)行排名的相關(guān)詞語(yǔ)及其相似度相關(guān)度排名相關(guān)詞語(yǔ)相似度1傳感器0.76712WSN0.75893有線(xiàn)0.69544簇頭0.67845ZigBee0.6756“傳感器”“WSN”“有線(xiàn)”“簇頭”“ZigBee”都屬于無(wú)線(xiàn)網(wǎng)絡(luò)領(lǐng)域的相關(guān)內(nèi)容。傳感器是將現(xiàn)實(shí)生活的數(shù)據(jù)轉(zhuǎn)化信息不可或缺的一部分,目前日常生活的傳感器傳輸數(shù)據(jù)時(shí)為了美觀(guān)和方便一般采用無(wú)線(xiàn)傳輸。WSN是無(wú)線(xiàn)傳感網(wǎng)絡(luò)的英文縮寫(xiě),一般為分布式網(wǎng)絡(luò)。簇頭是無(wú)線(xiàn)網(wǎng)絡(luò)傳感器的重要組成部分。ZigBee又稱(chēng)紫蜂,適用于短距離,能耗低,對(duì)速度要求不高的一種無(wú)線(xiàn)網(wǎng)絡(luò)協(xié)議。相比于其他其他無(wú)線(xiàn)網(wǎng)絡(luò)協(xié)議,其在安全可靠性和速度能耗之間取得了較好的平衡,所以也成為網(wǎng)絡(luò)安全領(lǐng)域關(guān)注的重點(diǎn)。隨著便攜式移動(dòng)設(shè)備普及程度的提高,以往常用的有線(xiàn)網(wǎng)絡(luò)已經(jīng)無(wú)法滿(mǎn)足人們不受時(shí)間地點(diǎn)限制的通訊需求,無(wú)線(xiàn)網(wǎng)絡(luò)也橫空出世。由于無(wú)線(xiàn)網(wǎng)絡(luò)中最常見(jiàn)的協(xié)議IEEE802.11本身的安全性不高,導(dǎo)致很多因無(wú)線(xiàn)網(wǎng)絡(luò)安全問(wèn)題造成損失的事件層出不窮,為了提高無(wú)線(xiàn)網(wǎng)絡(luò)傳輸?shù)陌踩院唾|(zhì)量,一些學(xué)者對(duì)WEP協(xié)議進(jìn)行完善,也有不少學(xué)者提出了新的無(wú)線(xiàn)安全協(xié)議方案,比如分布式方案等。這也證明社會(huì)經(jīng)濟(jì)需求會(huì)指導(dǎo)研究熱點(diǎn)方向,而研究成果又會(huì)反過(guò)來(lái)推動(dòng)社會(huì)的進(jìn)步。4總結(jié)和展望4.1總結(jié)與創(chuàng)新本課題重點(diǎn)在于對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域研究熱點(diǎn)的主題識(shí)別和實(shí)現(xiàn),明確網(wǎng)絡(luò)安全在我國(guó)總體安全觀(guān)和新時(shí)代信息社會(huì)的重要地位,以中國(guó)知網(wǎng)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域在核心期刊上發(fā)表的文獻(xiàn)為數(shù)據(jù)庫(kù),以我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的研究文獻(xiàn)為重點(diǎn),為我國(guó)網(wǎng)絡(luò)安全領(lǐng)域治理和研究提供一定的理論支撐。在研究過(guò)程中難點(diǎn)在于對(duì)研究熱點(diǎn)的主題識(shí)別和實(shí)現(xiàn),關(guān)于主題識(shí)別,首先要解決的是如何進(jìn)行矩陣構(gòu)建和關(guān)系刻畫(huà),其次是用什么方法在矩陣和關(guān)系中找到主題,本文則是通過(guò)jieba分詞先對(duì)文本進(jìn)行分詞,之后構(gòu)建Word2vec模型,最后再使用K-means進(jìn)行研究熱點(diǎn)主題聚類(lèi),得到了我國(guó)網(wǎng)絡(luò)安全領(lǐng)域近三十年的研究熱點(diǎn)主題,分別是:認(rèn)證服務(wù)領(lǐng)域、機(jī)器學(xué)習(xí)領(lǐng)域、網(wǎng)絡(luò)攻防領(lǐng)域、社會(huì)治理領(lǐng)域、社會(huì)輿情領(lǐng)域、社會(huì)信息化領(lǐng)域和無(wú)線(xiàn)網(wǎng)絡(luò)安全領(lǐng)域這七個(gè)研究熱點(diǎn),通過(guò)準(zhǔn)確識(shí)別確定研究熱點(diǎn)主題,不僅對(duì)有利于了解我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的基本研究現(xiàn)狀,也能給有關(guān)個(gè)人和組織提供一定參考價(jià)值。本文創(chuàng)新點(diǎn)在于首先研究?jī)?nèi)容創(chuàng)新方面,以我國(guó)網(wǎng)絡(luò)安全領(lǐng)域?yàn)橹饕芯繉?duì)象,選取質(zhì)量較高的核心期刊發(fā)表文獻(xiàn)為數(shù)據(jù)庫(kù),可以更好地刻畫(huà)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的研究熱點(diǎn),同時(shí)根據(jù)我國(guó)有關(guān)政策和事件進(jìn)行分析,更貼合實(shí)際。其次研究方法創(chuàng)新方面,使用基于Word2vec模型的主題識(shí)別方法,可以更好地提高對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域研究熱點(diǎn)主題識(shí)別的準(zhǔn)確性。4.2不足與展望本文對(duì)我國(guó)網(wǎng)絡(luò)安全領(lǐng)域接近三十年來(lái)的研究熱點(diǎn)進(jìn)行了定量和定性的研究分析,但在研究過(guò)程中也存在不少不足之處:(1)分詞結(jié)果仍有改進(jìn)空間。由于本文涉及網(wǎng)絡(luò)安全領(lǐng)域,有很多行業(yè)專(zhuān)有名詞,同時(shí)又由于有些專(zhuān)有名詞中英結(jié)合或數(shù)字與文字結(jié)合,所以選擇停用詞和自定義詞典時(shí)需要人
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 樓頂?shù)跹b字體施工方案
- 教師節(jié)感恩作文
- 2025年度校園心理安全責(zé)任協(xié)議書(shū)
- 2025年度智能化支付解決方案與服務(wù)合同
- 二零二五年度實(shí)習(xí)教師實(shí)習(xí)崗位工作職責(zé)合同
- 二零二五年度能源合同履約金管理及能源節(jié)約措施
- 二零二五年度農(nóng)村房產(chǎn)轉(zhuǎn)讓合同(附帶農(nóng)村土地經(jīng)營(yíng)權(quán))
- 2025年度金融衍生品交易連帶責(zé)任保證合同
- 二零二五年度風(fēng)險(xiǎn)評(píng)估與風(fēng)險(xiǎn)控制合同
- 2025年度集體合同簽訂與產(chǎn)業(yè)工人隊(duì)伍建設(shè)
- 金融營(yíng)銷(xiāo)實(shí)務(wù) 習(xí)題及答案 安賀新
- 焊接工藝基礎(chǔ)知識(shí)培訓(xùn)課件
- 南通大學(xué)開(kāi)題報(bào)告模版
- DL∕T 1529-2016 配電自動(dòng)化終端設(shè)備檢測(cè)規(guī)程
- 健身房管理制度前臺(tái)范文
- 2024年廣東深圳市中考英語(yǔ)試卷試題真題及答案(精校打印版)
- CJJ12-2013 家用燃?xì)馊紵骶甙惭b及驗(yàn)收規(guī)程
- 2024天津工業(yè)職業(yè)學(xué)院教師招聘考試筆試試題
- QCT1067.5-2023汽車(chē)電線(xiàn)束和電器設(shè)備用連接器第5部分:設(shè)備連接器(插座)的型式和尺寸
- 合金固態(tài)相變?nèi)捉虒W(xué)課件
- 《研學(xué)旅行課程設(shè)計(jì)》課件-1研學(xué)課程資源選擇
評(píng)論
0/150
提交評(píng)論