自然語言處理技術與應用 試題A卷_第1頁
自然語言處理技術與應用 試題A卷_第2頁
自然語言處理技術與應用 試題A卷_第3頁
自然語言處理技術與應用 試題A卷_第4頁
自然語言處理技術與應用 試題A卷_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第1頁共4頁期末考試試題A卷(開卷)適用班級:人工智能2001/2002專業(yè):人工智能技術服務考試時長:120分鐘得分閱卷人一、選擇得分閱卷人1.自然語言處理中的句子級別的分析技術,可以大致分為()、句法分析、語義分析三個層面。A.詞法分析B.文法分析C.分詞D.語言分析2.相對于其他的編程語言,Python具有以下哪些優(yōu)勢()A.Python提供了大量的自然語言處理庫B.編程語法較復雜C..編程語法相對簡單D.具有很多數(shù)學科學相關的庫3.詞法分析,主要包括()、和詞性標注、命名實體識別三部分。A.英語分詞B.分詞技術C.漢語分詞D.語言分詞4.目前,中文分詞的難點不包括()A.分詞歧義消解B.錯別字、諧音字規(guī)范化C.未登錄詞的識別D.分詞問題5.采用jieba精確模式對“南京市長江大橋”進行分詞,得到的結果為:()A.南京\市長江大橋B.南京市/長江大橋C.南京/南京市/京市/市長/長江/長江大橋/大橋D.南京/京市/南京市/長江/大橋/長江大橋6.下面哪項不屬于LTP的主要模型:()A.SentenceSplitterB.SegmentorC.n元模型D.Postagger7.依存關系可以細分為不同的類型,表示兩個詞之間的具體句法關系。依存句法分析標注關系,以下關系類型和它的標注不正確的是()前置賓語(FOB)動補結構(CMP)介賓關系(POB)定中關系(ATD)以下有關計算機視覺的步驟中,哪個不屬于傳統(tǒng)方法()。A.圖像預處理B.特征提取C.特征篩選D.神經(jīng)卷積9.以下哪一個是不屬于三大特征抽取器()。A.CNNB.RNNC.HMMD.transformer類型10.以下那部分代碼是正確引用gensim模塊的()。A.fromgensimimportcorporaB.importnumpyasnpC.importgenismasgeD.importgensim11.下列哪種關于無監(jiān)督關鍵詞提取的說法是正確的()。A.基于詞的文檔位置的特征量化是屬于關鍵詞提取中有監(jiān)督算法的B.基于詞圖模型的關鍵詞抽取不用構建文檔的語言網(wǎng)絡圖C.基于文本統(tǒng)計特征方法是利用文檔中詞語的統(tǒng)計信息抽取文檔的關鍵詞D.基于主題模型認為,詞與文檔之間有直接的聯(lián)系12.關于TF-IDF算法說法不正確的是()。A.TF算法和IDF算法可以單獨使用B.IDF的大小與詞語的常見程度成正比C.TF算法權衡詞出現(xiàn)的頻率,不考慮詞語對文檔的區(qū)分能力D.TF-IDF算法,從詞頻、逆文檔頻率兩個角度對詞語的重要性進行衡量13.下列關于說法不正確的是()。A.DF值廣泛應用于大規(guī)模語料的特征降維B.計算出每個特征的信息增益后,就可以移除那些信息量較低的特征C.互信息是指根據(jù)特征與類別的關聯(lián)程度來計算特征與類別的相關度D.當對梁樣本平均數(shù)進行比較時,可以采用卡方檢驗14.基于機器學習的情感分析方法本質是一個分類問題,該方法使用的經(jīng)典分類模型不包括()。支持向量機樸素貝葉斯卡爾曼濾波最大熵模型15.自然語言理解的簡稱是什么?()。A.NLPB.ANNC.NLUD.APL得分閱卷人二、判斷題(對的打‘√’,錯的打‘×’得分閱卷人1.句法分析的主要任務是:識別出句子所包含的句法成分,以及這些成分之間的關系。()2.使用jieba進行分詞,需要導入jieba工具包。()3.Stanfordparser的底層是由python實現(xiàn)的。()4.re.match嘗試從字符串的起始位置匹配一個模式,如果起始位置匹配不成功的話,就返回none。()5.自然語言處理有兩個核心任務,一個是自然語言理解,另外一個是自然語言生成。()6.自然語言處理(NaturalLanguageProcessing,NLP)是計算機科學領域以及大數(shù)據(jù)領域的一個重要的研究方向。()7.基于規(guī)則的分詞方法是最早興起的分詞方法,主要是通過設立詞庫和規(guī)則,然后使用匹配的方法進行分詞。()8.命名實體識別(NER)的目的在于識別語料中人名、地名、組織機構名等命名實體。()9.條件隨機場(CRF)也是一種基于馬爾科夫思想的統(tǒng)計模型。之前的模型都假設每個狀態(tài)均只與它前面的狀態(tài)有關。()10.jieba分詞工具提供了詞性標注功能。jieba分詞是結合規(guī)則和統(tǒng)計的方式,也就是說同時使用詞典匹配和HMM。()得分閱卷人三、填空得分閱卷人1.自然語言處理的三個層面有:和、語義分析。2.根據(jù)句法結構的表示形式不同,最常見的句法分析任務可以分為以下三種:、依存句法分析以及深層文法句法分析。3.基于規(guī)則的分詞方法有:正向最大匹配法、和雙向最大匹配法。4..LTP是基于C++開發(fā)的,但是也提供了Python的封裝包——Pyltp。Pyltp的安裝直接使用pip進行安裝,在命令行輸入。5.句法分析的數(shù)據(jù)集是樹形標注結構,稱為。6.的結構沒有非終結點,詞與詞之間直接發(fā)生依存關系。7.卷積神經(jīng)網(wǎng)絡結構包括:、和。8.Word2vec主要包含兩個淺層的神經(jīng)網(wǎng)絡模型,分別是和。9.在使用TF-IDF算法提取關鍵詞時,為使候選詞標準化,TF值=,候選詞的IDF=,候選詞的TF-IDF=。10.PageRank在計算句子給它鏈接句的貢獻時,是通過計算來分配。11.特征工程一般包括、、三個部分。12..目前情感分析的方法主要分為三類,分別為、、。13.神經(jīng)網(wǎng)絡模型的復興使得深度學習在語音、圖像、文本處理得到了廣泛的應用,講深度學習應用在情感分析中,一般采用和結合的方法和。得分閱卷人四、綜合應用得分閱卷人(1)將以下內(nèi)容轉為txt文本:Icouldimaginehisgivingafriendalittlepinchofthelatestvegetablealkaloid,notoutofmalevolence,youunderstand,butsimplyoutofaspiritofinquiryinordertohaveanaccurateideaoftheeffects.(2分)對內(nèi)容進行分詞,統(tǒng)計文本中的所有詞語,進行獨熱編碼,得到每個詞的one-hot向量表示.(2分)(3)將句子進行文本向量化。(1分)得分閱卷人得分閱卷人使用TF-IDF算法完成對以下內(nèi)容實現(xiàn)關鍵詞的提?。赫雇?035年,我國將基本實現(xiàn)社會主義現(xiàn)代化。經(jīng)濟實力、科技實力、綜合國力將大幅躍升,經(jīng)濟總量和城鄉(xiāng)居民人均收入將再邁上新的大臺階,關鍵核心技術實現(xiàn)重大突破,進入創(chuàng)新型國家前列。基本實現(xiàn)新型工業(yè)化、信息化、城鎮(zhèn)化、農(nóng)業(yè)現(xiàn)代化,建成現(xiàn)代化經(jīng)濟體系。基本實現(xiàn)國家治理體系和治理能力現(xiàn)代化,人民平等參與、平等發(fā)展權利得到充分保障,基本建成法治國家、法治政府、法治社會。建成文化強國、教育強國、人才強國、體育強國、健康中國,國民素質和社會文明程度達到新高度,國家文化軟實力顯著增強。廣泛形成綠色生產(chǎn)生活方式,碳排放達峰后穩(wěn)中有降,生態(tài)環(huán)境根本好轉,美麗中國建設目標基本實現(xiàn)。形成對外開放新格局,參與國際經(jīng)濟合作和競爭新優(yōu)勢明顯增強。人均國內(nèi)生產(chǎn)總值達到中等發(fā)達國家水平,中等收入群體顯著擴大,基本公共服務實現(xiàn)均等化,城鄉(xiāng)區(qū)域發(fā)展差距和居民生活水平差距顯著縮小。平安中國建設達到更高水平,基本實現(xiàn)國防和軍隊現(xiàn)代化。人民生活更加美好,人的全面發(fā)展、全體人民共同富裕取得更為明顯的實質性進展。經(jīng)濟發(fā)展取得新成效。發(fā)展是解決我國一切問題的基礎和關鍵,發(fā)展必須堅持新發(fā)展理念,在質量效益明顯提升的基礎上實現(xiàn)經(jīng)濟持續(xù)健康發(fā)展,增長潛力充分發(fā)揮,國內(nèi)生產(chǎn)總值年均增長保持在合理區(qū)間、各年度視情提出,全員勞動生產(chǎn)率增長高于國內(nèi)生產(chǎn)總值增長,國內(nèi)市場更加強大,經(jīng)濟結構更加優(yōu)化,創(chuàng)新能力顯著提升,全社會研發(fā)經(jīng)費投入年均增長7%以上、力爭投入強度高于“十三五”時期實際,產(chǎn)業(yè)基礎高級化、產(chǎn)業(yè)鏈現(xiàn)代化水平明顯提高,農(nóng)業(yè)基礎更加穩(wěn)固,城鄉(xiāng)區(qū)域發(fā)展協(xié)調(diào)性明顯增強,常住人口城鎮(zhèn)化率提高到65%,現(xiàn)代化經(jīng)濟體系建設取得重大進展。得分閱卷人六、綜合應用題三得分閱卷人自定義函數(shù)get_content(),分別讀取data文件夾下neg和pos文件夾中的文件。《Python文本與語音應用設計》期末考試試題A卷答題紙適用班級:人工智能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論