《機器學(xué)習(xí)-Python實踐》試卷及答案 卷9_第1頁
《機器學(xué)習(xí)-Python實踐》試卷及答案 卷9_第2頁
《機器學(xué)習(xí)-Python實踐》試卷及答案 卷9_第3頁
《機器學(xué)習(xí)-Python實踐》試卷及答案 卷9_第4頁
《機器學(xué)習(xí)-Python實踐》試卷及答案 卷9_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1頁,共1頁一、單項選擇題(本大題共10小題,每題3分,共30分)試卷(試卷(學(xué)年第1學(xué)期)考試科目機器學(xué)習(xí)-Python實踐(A卷)適用專業(yè)班級(年級)得分命題人:審閱人:班級學(xué)號姓名考試科目裝訂線1、選擇Logistic回歸中的One-Vs-All方法中的哪個選項是真實的。()A我們需要在n類分類問題中適合n個模型B我們需要適合n-1個模型來分類為n個類C我們需要只適合1個模型來分類為n個類D這些都沒有2、假設(shè)對給定數(shù)據(jù)應(yīng)用了Logistic回歸模型,并獲得了訓(xùn)練精度X和測試精度Y?,F(xiàn)在要在同一數(shù)據(jù)中添加一些新特征,以下哪些是錯誤的選項。()注:假設(shè)剩余參數(shù)相同。A訓(xùn)練精度提高B訓(xùn)練準確度提高或保持不變C測試精度提高或保持不變3、假定特征F1可以取特定值:A、B、C、D、E和F,其代表著學(xué)生在大學(xué)所獲得的評分。在下面說法中哪一項是正確的?()A特征F1是名義變量(nominalvariable)的一個實例。B特征F1是有序變量(ordinalvariable)的一個實例。C該特征并不屬于以上的分類。D以上說法都正確。4、下面哪一項對梯度下降(GD)和隨機梯度下降(SGD)的描述是正確的?()1在GD和SGD中,每一次迭代中都是更新一組參數(shù)以最小化損失函數(shù)。2在SGD中,每一次迭代都需要遍歷訓(xùn)練集中的所有樣本以更新一次參數(shù)。3在GD中,每一次迭代需要使用整個訓(xùn)練集的數(shù)據(jù)更新一個參數(shù)。A只有1B只有2C只有3D都正確5、假定你正在處理類屬特征,并且沒有查看分類變量在測試集中的分 布?,F(xiàn)在你想將onehotencoding(OHE)應(yīng)用到類屬特征中。()那么在訓(xùn)練集中將OHE應(yīng)用到分類變量可能要面臨的困難是什么?A.分類變量所有的類別沒有全部出現(xiàn)在測試集中B.類別的頻率分布在訓(xùn)練集和測試集是不同的C.訓(xùn)練集和測試集通常會有一樣的分布D.A和B都正確6、假定你現(xiàn)在解決一個有著非常不平衡類別的分類問題,即主要類別 占據(jù)了訓(xùn)練數(shù)據(jù)的99%?,F(xiàn)在你的模型在測試集上表現(xiàn)為99%的準確度。 那么下面哪一項表述是正確的?()1準確度并不適合于衡量不平衡類別問題2準確度適合于衡量不平衡類別問題3精確率和召回率適合于衡量不平衡類別問題4精確率和召回率不適合于衡量不平衡類別問題A1and3B1and4C2and3D2and47、假設(shè)我們有一個數(shù)據(jù)集,在一個深度為6的決策樹的幫助下,它可 以使用100%的精確度被訓(xùn)練?,F(xiàn)在考慮一下兩點,并基于這兩點選擇正確 的選項。()注意:所有其他超參數(shù)是相同的,所有其他因子不受影響。1深度為4時將有高偏差和低方差2深度為4時將有低偏差和低方差A(yù)只有1B只有2C1和2D沒有一個8、與人類神經(jīng)元相比,人工神經(jīng)元的輸入類比于什么?()A.樹突B.軸突C.細胞核D.細胞膜9、與人類神經(jīng)元相比,人工神經(jīng)元的輸出類比于什么?()A.樹突B.軸突C.細胞核D.細胞膜10、以下關(guān)于感知器中的鏈接方式表示正確的是?()A.輸入層與隱藏層相連B.輸入層與輸出層相連C.隱藏層與細胞核相連D.輸入層與輸入層相連二、判斷題(本大題共10小題,每題1分,共10分)1、P(A|B)表示事件B已經(jīng)發(fā)生的前提下,事件A發(fā)生的概率,叫做事 件B發(fā)生下事件A的條件概率。()2、輸出變量為連續(xù)變量的預(yù)測問題是分類問題。()3、回歸及分類常用的評估指標都是準確率和召回率。()4、決策樹只用來分類。()5、一般來說,回歸不用在分類問題上,但也有特殊情況,邏輯回歸可 以用來解決0/1分類問題。()6、回歸問題與分類問題都有可能發(fā)生過擬合。()7、如果一個經(jīng)過訓(xùn)練的機器學(xué)習(xí)模型在測試集上達到100%的準確率, 這是否意味著該模型將在另外一個新的測試集上也能得到100%的準確率。 ()8、序列數(shù)據(jù)沒有時間戳。()9、定量屬性可以是整數(shù)值或者是連續(xù)值。()10、可視化技術(shù)對于分析的數(shù)據(jù)類型通常不是專用性的。()三、填空(本大題共10小題,每題3分,共30分)1、損失函數(shù)也叫或。2、已知坐標軸中兩點A(2,?2)B(?1,2),這兩點的曼哈頓距離(L1距離)是。3、算法利用信息增益進行特征的選擇,信息增益反映的是給定條件后不確定性減少的程度。4、表示在樣本集合中一個隨機選中的樣本被分錯的概率。5、基尼指數(shù)(基尼不純度)=*。6、歐式距離的特征是:、。7、一個表示一個單獨的數(shù),它不同于線性代數(shù)中研究的其他大部分對象(通常是多個數(shù)的數(shù)組)。8、AdaBoost迭代次數(shù)也就是數(shù)目不太好設(shè)定,可以使用交叉驗證來進行確定;數(shù)據(jù)不平衡導(dǎo)致分類精度下降。9、AdaBoost訓(xùn)練比較耗時,每次重新選擇最好切分點。10、聚類(Clustering)是指把相似的數(shù)據(jù)劃分到一起,具體劃分的時候并不關(guān)心這一類的標簽,目標就是把相似的數(shù)據(jù)聚合到一起,聚類是一種。四、簡答題(本大題共3小題,共30分)1、決策樹算法特點?2、預(yù)剪枝核心思想是?3、如果你已經(jīng)在完全相同的訓(xùn)練集上訓(xùn)練了五個不同的模型,并且它們都達到了95%的準確率,是否還有機會通過結(jié)合這些模型來獲得更好的結(jié)果?如果可以,該怎么做?如果不行,為什么??一、選擇題1.A 2.B 3.B 4.A 5.D 6.A 7.A 8.A 9.B 10.A二、判斷題1.對 2.錯 3.錯 4.錯 5.對 6.對 7.錯 8.對 9.對 10.錯 三、填空題1.代價函數(shù)目標函數(shù) 2.7 3.ID3 4.基尼指數(shù)(基尼不純度) 5.樣本被選中的概率樣本被分錯的概率 6.平移不變性旋轉(zhuǎn)不變性 7.標量 8.弱分類器 9.當前分類器 10.無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)方法四、簡答題1、答:優(yōu)點:計算復(fù)雜度不高,輸出結(jié)果易于理解,數(shù)據(jù)有缺失也能跑,可以處理不相關(guān)特征。缺點:容易過擬合。適用數(shù)據(jù)類型:數(shù)值型和標稱型。2、答:其中的核心思想就是,在每一次實際對結(jié)點進行進一步劃分之前,先采用驗證集的數(shù)據(jù)來驗證劃分是否能提高劃分的準確性。如果不能,就把結(jié)點標記為葉結(jié)點并退出進一步劃分;如果可以就繼續(xù)遞歸生成節(jié)點。3、答:如果你已經(jīng)訓(xùn)練了五個不同的模型,并且都達到了95%的精度,你可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論