


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、中國(guó)科學(xué)院大學(xué) 課程編號(hào):712008Z 試 題 專 用 紙 課程名稱:機(jī)器學(xué)習(xí) 任課教師:卿來(lái)云 姓名 學(xué)號(hào) 成績(jī) 一、基礎(chǔ)題(共36分)1、請(qǐng)描述極大似然估計(jì)MLE和最大后驗(yàn)估計(jì)MAP之間的區(qū)別。請(qǐng)解釋為什么MLE比MAP更容易過(guò)擬合。(10分)ABCy00100100110000111111100111012、在年度百花獎(jiǎng)評(píng)獎(jiǎng)揭曉之前,一位教授問(wèn)80個(gè)電影系的學(xué)生,誰(shuí)將分別獲得8個(gè)獎(jiǎng)項(xiàng)(如最佳導(dǎo)演、最佳男女主角等)。評(píng)獎(jiǎng)結(jié)果揭曉后,該教授計(jì)算每個(gè)學(xué)生的猜中率,同時(shí)也計(jì)算了所有80個(gè)學(xué)生投票的結(jié)果。他發(fā)現(xiàn)所有人投票結(jié)果幾乎比任何一個(gè)學(xué)生的結(jié)果正確率都高。這種提高是偶然的嗎?請(qǐng)解
2、釋原因。(10分)3、假設(shè)給定如右數(shù)據(jù)集,其中A、B、C為二值隨機(jī)變量,y為待預(yù)測(cè)的二值變量。(a) 對(duì)一個(gè)新的輸入A=0, B=0, C=1,樸素貝葉斯分類器將會(huì)怎樣預(yù)測(cè)y?(10分)(b) 假設(shè)你知道在給定類別的情況下A、B、C是獨(dú)立的隨機(jī)變量,那么其他分類器(如Logstic回歸、SVM分類器等)會(huì)比樸素貝葉斯分類器表現(xiàn)更好嗎?為什么?(注意:與上面給的數(shù)據(jù)集沒(méi)有關(guān)系。)(6分)二、回歸問(wèn)題。(共24分)現(xiàn)有N個(gè)訓(xùn)練樣本的數(shù)據(jù)集,其中為實(shí)數(shù)。1 我們首先用線性回歸擬合數(shù)據(jù)。為了測(cè)試我們的線性回歸模型,我們隨機(jī)選擇一些樣本作為訓(xùn)練樣本,剩余樣本作為測(cè)試樣本?,F(xiàn)在我們慢慢增加訓(xùn)練樣本的數(shù)目,
3、那么隨著訓(xùn)練樣本數(shù)目的增加,平均訓(xùn)練誤差和平均測(cè)試誤差將會(huì)如何變化?為什么?(6分)平均訓(xùn)練誤差:A、增加 B、減小平均測(cè)試誤差:A、增加 B、減小2 給定如下圖(a)所示數(shù)據(jù)。粗略看來(lái)這些數(shù)據(jù)不適合用線性回歸模型表示。因此我們采用如下模型: ,其中。假設(shè)我們采用極大似然估計(jì)w,請(qǐng)給出log似然函數(shù)并給出w的估計(jì)。(8分)3 給定如下圖(b)所示的數(shù)據(jù)。從圖中我們可以看出該數(shù)據(jù)集有一些噪聲,請(qǐng)?jiān)O(shè)計(jì)一個(gè)對(duì)噪聲魯棒的線性回歸模型,并簡(jiǎn)要分析該模型為什么能對(duì)噪聲魯棒。(10分)(a) (b)三、SVM分類。(第15題各4分,第6題5分,共25分)下圖為采用不同核函數(shù)或不同的松弛因子得到的SVM決策邊
4、界。但粗心的實(shí)驗(yàn)者忘記記錄每個(gè)圖形對(duì)應(yīng)的模型和參數(shù)了。請(qǐng)你幫忙給下面每個(gè)模型標(biāo)出正確的圖形。1、其中。2、其中。3、其中。4、其中。5、其中。6、考慮帶松弛因子的線性SVM分類器:下面有一些關(guān)于某些變量隨參數(shù)C的增大而變化的表述。如果表述總是成立,標(biāo)示“是”;如果表述總是不成立,標(biāo)示“否”;如果表述的正確性取決于C增大的具體情況,標(biāo)示“不一定”。 共 3 頁(yè) 第2 頁(yè)(1) 不會(huì)增大(2) 增大(3) 不會(huì)減小(4) 會(huì)有更多的訓(xùn)練樣本被分錯(cuò)(5) 間隔(Margin)不會(huì)增大四、一個(gè)初學(xué)機(jī)器學(xué)習(xí)的朋友對(duì)房?jī)r(jià)進(jìn)行預(yù)測(cè)。他在一個(gè)N=1000個(gè)房?jī)r(jià)數(shù)據(jù)的數(shù)據(jù)集上匹配了一個(gè)有533個(gè)參數(shù)的模型,該模型能解釋數(shù)據(jù)集上99%的變化。1、請(qǐng)問(wèn)該模型能很好地預(yù)測(cè)來(lái)年的房?jī)r(jià)嗎?簡(jiǎn)單解釋原因。(5分)2、如果上述模
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 機(jī)構(gòu)備選庫(kù)管理制度
- 機(jī)電工程系管理制度
- 材料及設(shè)備管理制度
- 村完善消防管理制度
- 村應(yīng)急倉(cāng)庫(kù)管理制度
- 村社區(qū)合同管理制度
- 村級(jí)網(wǎng)格長(zhǎng)管理制度
- 村集體大棚管理制度
- 校內(nèi)通勤車管理制度
- 校園讀書(shū)角管理制度
- 天棚簾施工方案
- 《積極心理學(xué)(第3版)》 課件 第4章 樂(lè)觀
- 戶外廣告牌施工方案
- 房屋買賣合同范本官方版模板電子版
- 傳統(tǒng)文化與生態(tài)文明建設(shè)智慧樹(shù)知到期末考試答案章節(jié)答案2024年云南大學(xué)
- YYT 0698.5-2009 最終滅菌醫(yī)療器械包裝材料 第5部分:透氣材料與塑料膜組成的可密封組合袋和卷材 要求和試驗(yàn)方法
- 廣東省佛山市南海區(qū)2021-2022學(xué)年八年級(jí)下學(xué)期期末數(shù)學(xué)試題
- 糖尿病家庭醫(yī)生:簽約講座計(jì)劃
- 呼吸衰竭診療規(guī)范
- MOOC 化工熱力學(xué)-鹽城師范學(xué)院 中國(guó)大學(xué)慕課答案
- (高清版)DZT 0064.88-2021 地下水質(zhì)分析方法第88部分:14C的測(cè)定合成苯-液體閃爍計(jì)數(shù)法
評(píng)論
0/150
提交評(píng)論