南開大學(xué)《數(shù)據(jù)科學(xué)導(dǎo)論》在線作業(yè)答卷_第1頁
南開大學(xué)《數(shù)據(jù)科學(xué)導(dǎo)論》在線作業(yè)答卷_第2頁
南開大學(xué)《數(shù)據(jù)科學(xué)導(dǎo)論》在線作業(yè)答卷_第3頁
南開大學(xué)《數(shù)據(jù)科學(xué)導(dǎo)論》在線作業(yè)答卷_第4頁
南開大學(xué)《數(shù)據(jù)科學(xué)導(dǎo)論》在線作業(yè)答卷_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、21秋學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)數(shù)據(jù)科學(xué)導(dǎo)論在線作業(yè)試卷總分:100 得分:100一、單選題 (共 20 道試題,共 40 分)根據(jù)映射關(guān)系的不同可以分為線性回歸和()。對數(shù)回歸非線性回歸邏輯回歸多元回歸答案:B2.在k近鄰法中,選擇較小的k值時,學(xué)習(xí)的“近似誤差”會(),“估計誤差”會()。減小,減小減小,增大增大,減小增大,增大答案:B3.我們需要對已生成的樹()進(jìn)行剪枝,將樹變得簡單,從而使它具有更好的泛化能力。自上而下自下而上自左而右自右而左答案:B4.對于k近鄰法,下列說法錯誤的是()。不具有顯式的學(xué)習(xí)過程適用于多分類任務(wù)k

2、值越大,分類效果越好通常采用多數(shù)表決的分類決策規(guī)則答案:C5.在回歸分析中,自變量為(),因變量為()。離散型變量,離散型變量連續(xù)型變量,離散型變量離散型變量,連續(xù)型變量連續(xù)型變量,連續(xù)型變量答案:D6.聚類是一種()。有監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)強(qiáng)化學(xué)習(xí)半監(jiān)督學(xué)習(xí)答案:B7.考慮下面的頻繁3-項集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定數(shù)據(jù)集中只有5個項,采用 合并策略,由候選產(chǎn)生過程得到4-項集不包含()1,2,3,41,2,3,51,2,4,51,3,4,5答案:C8.設(shè)X=1,2,3是頻繁項集,則可由X產(chǎn)生()個關(guān)聯(lián)規(guī)則。456

3、7答案:C9.以下哪個不是處理缺失值的方法()刪除記錄按照一定原則補(bǔ)充不處理隨意填寫答案:D10.在一元線性回歸中,通過最小二乘法求得的直線叫做回歸直線或()。最優(yōu)回歸線最優(yōu)分布線最優(yōu)預(yù)測線最佳分布線答案:A11.維克托?邁爾-舍恩伯格在大數(shù)據(jù)時代:生活、工作與思維的大變革一書中,持續(xù)強(qiáng)調(diào)了一個觀點:大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘( )K-meansBayes NetworkC4.5Apriori答案:D12.為了解決任何復(fù)雜的分類問題,使用的感知機(jī)結(jié)構(gòu)應(yīng)至少包

4、含()個隱含層。1234答案:B13.下列兩個變量之間的關(guān)系中,哪個是函數(shù)關(guān)系()。人的性別和他的身高人的工資與年齡正方形的面積和邊長溫度與濕度答案:C14.K-means聚類適用的數(shù)據(jù)類型是()。數(shù)值型數(shù)據(jù)字符型數(shù)據(jù)語音數(shù)據(jù)所有數(shù)據(jù)答案:A15.單層感知機(jī)擁有()層功能神經(jīng)元。一二三四答案:A16.在有統(tǒng)計學(xué)意義的前提下,標(biāo)準(zhǔn)化偏回歸系數(shù)的絕對值越大,說明相應(yīng)的自變量對y的作用()。越小越大無關(guān)不確定答案:B17.某商品的產(chǎn)量(X,件)與單位成本(Y,元/件)之間的回歸方程為Y=100-1.2X,這說明()。產(chǎn)量每增加一臺,單位成本增加100元產(chǎn)量每增加一臺,單位成本減少1.2元產(chǎn)量每增加一

5、臺,單位成本平均減少1.2元產(chǎn)量每增加一臺,單位平均增加100元答案:C18.下面不是分類的常用方法的有()K近鄰法樸素貝葉斯決策樹條件隨機(jī)場答案:D19.具有偏差和至少()個S型隱含層加上一個()輸出層的網(wǎng)絡(luò)能夠逼近任何有理數(shù)。1,線性2,線性1,非線性2,非線性答案:A20.數(shù)據(jù)庫中相關(guān)聯(lián)的兩張表都存儲了用戶的個人信息,但在用戶的個人信息發(fā)生改變時只更新了一張表中的數(shù)據(jù),這時兩張表中就有了不一致的數(shù)據(jù),這屬于()異常值缺失值不一致的值重復(fù)值答案:C二、多選題 (共 10 道試題,共 20 分)21.相關(guān)性的分類,按照相關(guān)的方向可以分為()。正相關(guān)負(fù)相關(guān)左相關(guān)右相關(guān)答案:AB22.系統(tǒng)日志收

6、集的基本特征有()高可用性高可靠性可擴(kuò)展性高效率答案:ABC23.聚類的主要方法有()。劃分聚類層次聚類密度聚類距離聚類答案:ABC24.K-means聚類中K值選取的方法是()。密度分類法手肘法大腿法隨機(jī)選取答案:AB25.多層感知機(jī)的學(xué)習(xí)過程包含()。信號的正向傳播信號的反向傳播誤差的正向傳播誤差的反向傳播答案:AD26.什么情況下結(jié)點不用劃分()當(dāng)前結(jié)點所包含的樣本全屬于同一類別當(dāng)前屬性集為空,或是所有樣本在所有屬性上取值相同當(dāng)前結(jié)點包含的樣本集為空還有子集不能被基本正確分類答案:ABC27.Apriori算法的計算復(fù)雜度受()影響。支持度閾值項數(shù)事務(wù)數(shù)事務(wù)平均寬度答案:ABCD28.層

7、次聚類的方法是()聚合方法分拆方法組合方法比較方法答案:AB29.k近鄰法的基本要素包括()。距離度量k值的選擇樣本大小分類決策規(guī)則答案:ABD30.距離度量中的距離可以是()歐式距離曼哈頓距離Lp距離Minkowski距離答案:ABCD三、判斷題 (共 20 道試題,共 40 分)31.貝葉斯定理是概率論中的一個結(jié)果,它與隨機(jī)變量的條件概率以及聯(lián)合概率分布 有關(guān)。答案:正確32.在樹的結(jié)構(gòu)中,特征越重要,就越遠(yuǎn)離根節(jié)點。答案:錯誤33.使用SVD方法進(jìn)行圖像壓縮不可以保留圖像的重要特征。答案:錯誤34.給定一個數(shù)據(jù)集,如果存在某個超平面S能夠?qū)?shù)據(jù)集的部分正實例點和負(fù)實例點正確的劃分到超平面

8、的兩側(cè),則稱該數(shù)據(jù)集是線性可分?jǐn)?shù)據(jù)集。答案:錯誤35.Pearson相關(guān)系數(shù)是判斷特征之間、以及特征和目標(biāo)變量之間線性相關(guān)關(guān)系的統(tǒng)計量。答案:正確36.探索性數(shù)據(jù)分析的特點是研究從原始數(shù)據(jù)入手,完全以實際數(shù)據(jù)為依據(jù)。答案:正確37.BFR聚類簇的坐標(biāo)可以與空間的坐標(biāo)保持一致。答案:錯誤38.決策樹還可以表示給定特征條件下類的條件概率分布,這一概率分布定義在特征空間的一個劃分上,將特征空間分為互不相交的單元或區(qū)域,并在每個單元定義一個類的概率分布就構(gòu)成了一個條件概率分布答案:正確39.當(dāng)特征為離散型時,可以使用信息增益作為評價統(tǒng)計量。答案:正確40.隨著特征維數(shù)的增加,樣本間區(qū)分度提高。答案:錯誤41.K-means算法采用貪心策略,通過迭代優(yōu)化來近似求解。答案:正確42.多元線性回歸模型中,標(biāo)準(zhǔn)化偏回歸系數(shù)沒有單位。答案:正確43.關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。答案:正確44.獲取數(shù)據(jù)為數(shù)據(jù)分析提供了素材和依據(jù),這里的數(shù)據(jù)只包括直接獲取的數(shù)據(jù)。答案:錯誤45.sigmoid函數(shù)屬于階躍函數(shù),是神經(jīng)網(wǎng)絡(luò)中常見的激活函數(shù)。答案:錯誤46.當(dāng)訓(xùn)練集較大的時候,標(biāo)準(zhǔn)BP算法通常會更快的獲得更好的解。答案:正確47

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論