版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2023年《人工智能》現代科技知識考
試題與答案
目錄簡介
一、單選題:共40題
二、多選題:共20題
三、判斷題:共26題
一、單選題
1、下列哪部分不是專家系統(tǒng)的組成部分?
A.用戶
B.綜合數據庫
C.推理機
D.知識庫
正確答案:A
2、下列哪個神經網絡結構會發(fā)生權重共享?
第1頁共32頁
A.卷積神經網絡
B.循環(huán)神經網絡
C.全連接神經網絡
D.A和B
正確答案:D
3、下列哪個不屬于常用的文本分類的特征選擇算法?
A.卡方檢驗值
B.互信息
C.信息增益
D.主成分分析
正確答案:D
4、下列哪個不是人工智能的技術應用領域?
A.搜索技術
B.數據挖掘
C.智能控制
第2頁共32頁
D.編譯原理
正確答案:D
5、Q(s,a)是指在給定狀態(tài)S的情況下,采取行動a之
后,后續(xù)的各個狀態(tài)所能得到的回報()。
A.總和
B.最大值
C.最小值
D.期望值
正確答案:D
6、數據科學家可能會同時使用多個算法(模型)進行
預測,并且最后把這些算法的結果集成起來進行最后的預測
(集成學習),以下對集成學習說法正確的是()。
A.單個模型之間有高相關性
B.單個模型之間有低相關性
C.在集成學習中使用“平均權重”而不是“投票”會比
第3頁共32頁
較好
D.單個模型都是用的一個算法
正確答案:B
7、以下哪種技術對于減少數據集的維度會更好?
A.刪除缺少值太多的列
B.刪除數據差異較大的列
C.刪除不同數據趨勢的列
D,都不是
正確答案:A
8、在強化學習過程中,學習率越大,表示采用新的嘗
試得到的結果比例越(),保持舊的結果的比例越()。
A.大,小
B.大,大
C.小,大
D.小,小
第4頁共32頁
正確答案:A
9、以下哪種方法不屬于特征選擇的標準方法?
A.嵌入
B.過濾
C.包裝
D.抽樣
正確答案:D
10、要想讓機器具有智能,必須讓機器具有知識。因此,
在人工智能中有一個研究領域,主要研究計算機如何自動獲
取知識和技能,實現自我完善,這門研究分支學科叫()。
A.專家系統(tǒng)
B.機器學習
C.神經網絡
D.模式識別
正確答案:B
第5頁共32頁
11、在一個神經網絡中,下面()方法可以用來處理過
擬合。
A.Dropout
B.分批歸一化(BatchNormalization)
C.正則化(Regularization)
D.都可以
正確答案:D
12、以下幾種模型方法屬于判別式模型的有()。1)混
合高斯模型2)條件隨機場模型3)區(qū)分度訓練4)隱馬爾科
夫模型
A.2,3
B.3,4
C.1,4
D.1,2
正確答案:A
13、神經網絡模型因受人類大腦的啟發(fā)而得名。神經網
絡由許多神經元組成,每個神經元接受一個輸入,對輸入進
行處理后給出一個輸出。請問下列關于神經元的描述中,哪
一項是正確的?
第6頁共32頁
A.每個神經元只有一個輸入和一個輸出
B.每個神經元有多個輸入和一個輸出
C.每個神經元有一個輸入和多個輸出
D.每個神經元有多個輸入和多個輸出
E、上述都正確
正確答案:E
14、生成對抗網絡像是一個博弈系統(tǒng),生成器生成偽造
的樣本,判別器判斷是真是假,我們理想的結果是()。
A.生成器產生的樣本大致相同
B.判別器高效的分辨生成器產生樣本的真假
C.判別器無法分辨生成器產生樣本的真假
D.生成器產生的樣本不盡相同
正確答案:C
15、已知:1)大腦是有很多個叫做神經元的東西構成,
神經網絡是對大腦的簡單的數學表達。2)每一個神經元都
有輸入、處理函數和輸出。3)神經元組合起來形成了網絡,
可以擬合任何函數。4)為了得到最佳的神經網絡,我們用
梯度下降方法不斷更新模型。給定上述關于神經網絡的描
述,()什么情況下神經網絡模型被稱為深度學習模型?
第7頁共32頁
A.加入更多層,使神經網絡的深度增加
B.有維度更高的數據
C.當這是一個圖形識別的問題時
D.以上都不正確
正確答案:A
16、梯度下降算法的正確步驟是什么?1)計算預測值
和真實值之間的誤差2)重復迭代,直至得到網絡權重的最
佳值3)把輸入傳入網絡,得到輸出值4)用隨機值初始化權
重和偏差5)對每一個產生誤差的神經元,調整相應的(權
重)值以減小誤差
A.1,2,3,4,5
B.5,4,3,2,1
C.3,2,1,5,4
D.4,3,1,5,2
正確答案:D
17、如果一個模型在測試集上偏差很大,方差很小,則
說明該模型()。
A.過擬合
B.可能過擬合可能欠擬合
第8頁共32頁
C.剛好擬合
D.欠擬合
正確答案:B
18、假如我們使用非線性可分的SVM目標函數作為最優(yōu)
化對象,我們怎么保證模型線性可分?
A.設C=I
B.設C=O
C.設C=無窮大
D.都不對
正確答案:C
19、下列哪項關于模型能力(指神經網絡模型能擬合復
雜函數的能力)的描述是正確的?
A.隱藏層層數增加,模型能力可能增加
B.Dropout的比例增加,模型能力必然增加
C.學習率增加,模型能力必然增加
D.都不正確
正確答案:A
20、輸入32X32的圖像,用大小5X5的卷積核做步長
為1的卷積計算,輸出圖像的大小是()。
第9頁共32頁
A.28×23
B.28×28
C.29×29
D.23×23
正確答案:B
21、我們想在大數據集上訓練決策樹,為了使訓練時間
更少,我們可以()。
A.增加樹的深度
B.增加學習率
C.減少樹的深度
D.減少樹的數量
正確答案:C
22、QTearning算法中,Q函數是()。
A.狀態(tài)-動作值函數
B.狀態(tài)函數
C.估值函數
D.獎勵函數
正確答案:A
23、語言模型的參數估計經常使用最大似然估計,面臨
第10頁共32頁
的一個問題是沒有出現的項概率為0,這樣會導致語言模型
的效果不好。為了解決這個問題,需要使用()。
A.平滑
B.去噪
C.隨機插值
D.增加白噪音
正確答案:A
24、關于LOgit回歸和SVM不正確的是()。
A.Logit回歸目標函數是最小化后驗概率
B.Logit回歸可以用于預測事件發(fā)生概率的大小
C.SVM目標是結構風險最小化
D.SVM可以有效避免模型過擬合
正確答案:A
25、機器翻譯屬于()領域的應用。
A.自然語言處理
B.搜索技術
C.專家系統(tǒng)
D.數據挖掘
正確答案:A
第11頁共32頁
26、下列不是SVM核函數的是()。
A.多項式核函數
B.Logistic核函數
C.徑向基核函數
D.Sigmoid核函數
正確答案:B
27、下面哪個決策邊界是神經網絡生成的?
A.A
B.B
C.C
D.D
E、以上都有
正確答案:E
28、假設在訓練中我們突然遇到了一個問題:在幾次循
環(huán)之后,誤差瞬間降低。你認為數據有問題,于是你畫出了
數據并且發(fā)現也許是數據的偏度過大造成了這個問題,你打
算怎么做來處理這個問題?
A.對數據作歸一化
B.對數據取對數變化
第12頁共32頁
C.對數據作主成分分析和歸一化
D.都不對
正確答案:C
29、對于神經網絡的說法,下面正確的是()。1)增加
神經網絡層數,可能會增加測試數據集的分類錯誤率2)減
少神經網絡層數,總是能減小測試數據集的分類錯誤率3)
增加神經網絡層數,總是能減小訓練數據集的分類錯誤率
A.1
B.1和3
C.1和2
D.2
正確答案:A
30、如果你正在處理文本數據,使用單詞嵌入(WOrd2vec)
表示使用的單詞。在單詞嵌入中,最終會有1000維。如果
想減小這個高維數據的維度,使得相似的詞在最鄰近的空間
中具有相似的含義。在這種情況下,你最有可能選擇以下哪
種算法?
A.t-SNE
B.PCA
C.LDA
第13頁共32頁
D.都不是
正確答案:A
31、當考慮某個具體問題時,你可能只有少量數據來解
決這個問題。不過幸運的是你有一個針對類似問題已經預先
訓練好的神經網絡。你可以用下面哪種方法來利用這個預先
訓練好的網絡?
A.保留最后一層,將其余層重新訓練
B.對新數據重新訓練整個模型
C.只對最后幾層進行調參
D.對每一層模型進行評估,選擇其中的少數來用
正確答案:C
32、在一個n維的空間中,最好的檢測離群點(OUtlier)
的方法是()。
A.作正態(tài)分布概率圖
B.作盒形圖
C.馬氏距離
D.作散點圖
正確答案:C
33、在大規(guī)模的語料中,挖掘詞的相關性是一個重要的
第14頁共32頁
問題。以下哪一個信息不能用于確定兩個詞的相關性?
A.互信息
B.最大熠
C.卡方檢驗
D.最大似然比
正確答案:B
34、基于統(tǒng)計的分詞方法為()。
A.正向最大匹配法
B.逆向最大匹配法
C.最少切分
D.條件隨機場
正確答案:D
35、請選擇下面可以應用隱馬爾科夫(HMM)模型的數
據集Oo
A.基因序列數據集
B.電影瀏覽數據集
C.股票市場數據集
D.所有以上
正確答案:D
第15頁共32頁
36、以P(W)表示詞條W的概率,假設已知P(南京)=0、
8,P(市長)=0、6,P(江大橋)=0、4,P(南京市)二0、
3,P(長江大橋)=0、5,在訓練語料中未出現的詞條概率
為Oo假設前后兩個詞的出現是獨立的,那么分詞結果就是
Oo
A.南京市*長江*大橋
B.南京*市長*江大橋
C.南京市長*江大橋
D.南京市*長江大橋
正確答案:B
37、在訓練神經網絡時,損失函數在最初的幾個epoch
時沒有下降,可能的原因是()。
A.學習率太低
B.正則參數太高
C.陷入局部最小值
D.以上都有可能
正確答案:A
38、以下屬于回歸算法的優(yōu)化指標是()。
A.召回率
第16頁共32頁
B.混淆矩陣
C.均方誤差
D.準確率
正確答案:C
39、假設你使用log-loss函數作為評估標準。下面這
些選項,哪些是對作為評估標準的log-loss的正確解釋?
(難度:★★★★★)
A.如果分類器對不正確分類結果的置信度高,log-loss
會對分類器作出懲罰
B.對一個特別的觀察而言,分類器為正確的分類結果分
配非常小的概率,然后對log-loss的相應分布會非常大
C.log-loss越低,模型越好
D.以上都是
正確答案:D
40、對于一個圖像識別問題(在一張照片里找出一只貓),
下面哪種神經網絡可以更好地解決這個問題?
A.循環(huán)神經網絡
B.感知機
C.多層感知機
第17頁共32頁
D.卷積神經網絡
正確答案:D
二、多選題
1、假設我們要解決一個二類分類問題,我們已經建立
好了模型,輸出是O或1,初始時設閾值為0、5,超過0、5
概率估計,就判別為1,否則就判別為0;如果我們現在用
另一個大于0、5的閾值,那么現在關于模型說法,正確的
是()θ
A.模型分類的召回率會降低或不變
B.模型分類的召回率會升高
C.模型分類準確率會升高或不變
D.模型分類準確率會降低
正確答案:AC
2、假定目標變量的類別非常不平衡,即主要類別占據
了訓練數據的99%o現在你的模型在測試集上表現為99%的
準確度。那么下面哪一項表述是正確的?
A.準確度并不適合于衡量不平衡類別問題
B.準確度適合于衡量不平衡類別問題
C.精確率和召回率適合于衡量不平衡類別問題
第18頁共32頁
D.精確率和召回率不適合于衡量不平衡類別問題
正確答案:AC
3、以下哪些激活函數容易產生梯度消失問題?
A.ReLU
B.Softplus
C.Tanh
D.Sigmoid
正確答案:CD
4、在粒子群算法中迭代過程的終止條件是什么?
A.算法不收斂
B.達到最大迭代次數
C.找到局部最優(yōu)解
D.全局最優(yōu)位置滿足最小界限
正確答案:BD
5、回歸模型中存在多重共線性,可以如何解決這個問
題?
A.去除這兩個共線性變量
B.我們可以先去除一個共線性變量
C.計算方差膨脹因子,采取相應措施
第19頁共32頁
D.為了避免損失信息,我們可以使用一些正則化方法,
比如嶺回歸和Iasso回歸
正確答案:BC
6、AlPhaGo/Zero主要用了下列哪些方法:(方
A.強化學習
B.殘差卷積神經網絡
C.蒙特卡洛樹搜索
D.循環(huán)神經網絡
正確答案:ABC
7、機器學習中Ll正則化和L2正則化的區(qū)別是?
A.使用Ll可以得到稀疏的權值
B.使用Ll可以得到平滑的權值
C.使用L2可以得到稀疏的權值
D.使用L2可以得到平滑的權值
正確答案:AD
8、強化學習包含哪些元素()。
A.Reward
B.Agent
C.State
第20頁共32頁
D.Action
正確答案:ABCD
9、知識圖譜中的數據類型分哪幾類?
A.通用數據類型
B.半結構化數據類型
C.結構化數據類型
D.非結構化數據類型
正確答案:BCD
10、在計算機視覺應用中,常用的圖像特征有()。
A.空間關系特征
B.形狀特征
C.紋理特征
D.顏色特征
正確答案:ABCD
11、有關數據增強的說法正確是哪些?
A.數據增強會增加樣本的個數,因此可能會減少過擬合
B.對于分類問題,數據增強是減少數據不平衡的一種方
法。
C.對于手寫體的識別,對樣本的反轉、旋轉、裁剪、變
第21頁共32頁
形和縮放等操作會提高神經網絡的識別效果
D.數據增強帶來了噪聲,因此一般會降低神經網絡模型
的效果
正確答案:ABC
12、下面哪些場景用循環(huán)神經網絡處理效果比較好?
A.自然語言處理
B.語音識別
C.圖像識別
D.人臉識別
正確答案:AB
13、在分類問題中,我們經常會遇到正負樣本數據量不
等的情況,比如正樣本為10萬條數據,負樣本只有1萬條數
據,以下最合適的處理方法是?
A.將負樣本重復10次,生成10萬樣本量,打亂順序參
與分類
B.直接進行分類,可以最大限度利用數據
C.從10萬正樣本中隨機抽取1萬參與分類
D.將負樣本每個權重設置為10,正樣本權重為1,參與
訓練過程
第22頁共32頁
正確答案:ACD
14、電影推薦系統(tǒng)是以下哪些的應用實例?
A.分類
B.聚類
C.強化學習
D.回歸
正確答案:ABC
15、人工智能的主要應用領域有()。
A.自然語言理解
B.數據庫的智能檢索
C.專家咨詢系統(tǒng)
D.感知問題
正確答案:ABCD
16、以下說法中正確的是()。
A.SVM對噪聲(如來自其他分布的噪聲樣本)魯棒
B.在AdaBoost算法中,所有被分錯的樣本的權重更新
比例相同
C.BoOSting和Bagging都是組合多個分類器投票的方法,
二者都是根據單個分類器的正確率決定其權重
第23頁共32頁
D.給定n個數據點,如果其中一半用于訓練,一般用于
測試,則訓練誤差和測試誤差之間的差別會隨著n的增加而
減少
正確答案:BD
17、變量選擇是用來選擇最好的判別器子集,如果要考
慮模型效率,我們應該做哪些變量選擇的考慮?
A.多個變量其實有相同的用處
B.變量對于模型的解釋有多大作用
C.特征攜帶的信息
D.交叉驗證
正確答案:ACD
18、如果以特征向量的相關系數作為模式相似性測度,
則影響聚類算法結果的主要因素有()。
A.已知類別樣本質量
B.分類準則
C.特征選取
D.量綱
正確答案:BC
19、下面屬于知識圖譜正確的三元組表示方式的是?
第24頁共32頁
A.實體一屬性一屬性值
B.實體1—實體2—實體3
C.實體一關系一屬性值
D.實體1—關系一實體2
正確答案:AD
20、下面哪些是基于核的機器學習算法?
A.最大期望算法
B.徑向基核函數
C.線性判別分析法
D.支持向量機
正確答案:BCD
三、判斷題
1、感知機的運作原理是邏輯判斷流程。
A.正確
B.錯誤
正確答案:B
2、邏輯回歸的損失函數是交叉端損失函數。
A.正確
第25頁共32頁
B.錯誤
正確答案:A
3、如果增加多層感知機的隱藏層層數,分類誤差便會
減小。
A.正確
B.錯誤
正確答案:B
4、在圖像處理中,采樣越細,像素越小,越能精確的
表現圖像。
A.正確
B.錯誤
正確答案:A
5、樣本輸入順序、聚類準則、初始類中心的選取都屬
于會影響基本K-均值算法的主要因素。
A.正確
B.錯誤
正確答案:B
6、語音識別指的是將音頻數據識別為文本數據。
A.正確
第26頁共32頁
B.錯誤
正確答案:A
7、邊緣檢測是將邊緣像素標識出來的一種圖像分割技
術。
A.正確
B.錯誤
正確答案:A
8、某個人、某個城市、某種植物在知識圖譜中都被稱
為實體。
A.正確
B.錯誤
正確答案:A
9、網格搜索是一種參數調節(jié)方法。
A.正確
B.錯誤
正確答案:A
10、生成對抗網絡可用于數據增強、語義分割、信息檢
索、圖像生成等多種場景。
A.正確
第27頁共32頁
B.錯誤
正確答案:A
11、線性回歸的損失函數中加入Ll正則項,此時該回
歸叫做LaSSO回歸。
A.正確
B.錯誤
正確答案:A
12、在隨機森林中,最終的集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024裝修合同樣填寫簡單裝修合同樣本
- 2024年婁桂與前配偶共同撫養(yǎng)子女合同
- 2024年度鮮花花藝設計合同
- 2024年度文化創(chuàng)意產品設計合同
- 2024年廢紙回收合同范本下載
- 2024年建筑工程木工長期勞務合同
- 2024年雙方協(xié)商一致停薪留職具體條款協(xié)議
- 課件彩虹2教學課件
- 2024年度貨物銷售合同標的:電子產品銷售
- 2024年度項目托管合同
- (2024版)大學本科新增專業(yè)《智能視覺工程》解讀
- 2023寺廟寺院品牌營銷全案
- 循環(huán)系統(tǒng)監(jiān)測-課件
- 企業(yè)反腐倡廉培訓課件
- 老舊樓加裝電梯方案
- 索道橋懸索橋施工方案樣本
- 醫(yī)療影像技術部門KPI設計
- 高分子職業(yè)生涯規(guī)劃
- 人工流產術健康宣教課件
- 老年高血壓管理指南
- ?;愤\輸安全檢測與監(jiān)控
評論
0/150
提交評論