大數(shù)據(jù)工程技術(shù)人員初級(jí)-理論試題及答案_第1頁
大數(shù)據(jù)工程技術(shù)人員初級(jí)-理論試題及答案_第2頁
大數(shù)據(jù)工程技術(shù)人員初級(jí)-理論試題及答案_第3頁
大數(shù)據(jù)工程技術(shù)人員初級(jí)-理論試題及答案_第4頁
大數(shù)據(jù)工程技術(shù)人員初級(jí)-理論試題及答案_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)工程技術(shù)人員初級(jí)——理論試題及答案1.下列哪個(gè)選項(xiàng)不屬于數(shù)據(jù)可視化的范疇()。A.科學(xué)可視化B.圖表可視化(正確答案)C.信息可視化D.可視化分析2.下列哪個(gè)選項(xiàng)不屬于最為常見的六種圖形()。A.餅圖B.條形圖C.樹圖(正確答案)D.柱狀圖3.下列()可視化圖表通常用顏色深淺表示數(shù)值大小A.柱狀圖B.熱力圖(正確答案)C.散點(diǎn)圖D.氣泡圖4.數(shù)據(jù)集合中出現(xiàn)次數(shù)最多的數(shù)值被稱為()A.平均數(shù)B.眾數(shù)(正確答案)C.中位數(shù)D.極差5.()指總體中的最大值與最小值的差,反映總體標(biāo)志值的差異范圍。A.極差(正確答案)B.方差C.標(biāo)準(zhǔn)差D.離散系數(shù)6.分析買家購買商品時(shí)產(chǎn)生流量和金額的各渠道情況需要細(xì)分()A.終端B.時(shí)間C.地區(qū)D.品類(正確答案)7.統(tǒng)計(jì)時(shí)間內(nèi)支付金額/支付買家數(shù)(或商品件數(shù)),衡量統(tǒng)計(jì)時(shí)間內(nèi)每位買家的消費(fèi)金額大小是()指標(biāo)A.支付金額(正確答案)B.買家數(shù)C.單價(jià)D.客單價(jià)8.平均停留時(shí)長和跳失率都是()的分析內(nèi)容A.交易分析B.流量分析(正確答案)C.訪客分析D.商品分析9.商品分析中的重點(diǎn)商品選擇可以借助()方法A.回歸分析B.相關(guān)分析C.漏斗分析D.ABC分類(正確答案)10.ABC分類中暢銷的、庫存周轉(zhuǎn)率高的高價(jià)值商品為()A.B類B.C類C.A類(正確答案)D.都不屬于11.流量質(zhì)量評(píng)估采用()作為衡量流量有效性的宏觀指標(biāo)A.訪客數(shù)B.轉(zhuǎn)化率(正確答案)C.瀏覽量D.瀏覽時(shí)長12.據(jù)WardMO(2010)的研究,超過()的人腦功能用于視覺信息的處理,視覺信息處理是人腦的最主要功能之一。A.30%B.50%(正確答案)C.70%D.40%13.當(dāng)前,市場(chǎng)上已經(jīng)出現(xiàn)了眾多的數(shù)據(jù)可視化軟件和工具,下面工具不是大數(shù)據(jù)可視化工具的是()。A.TableauB.DatawatchC.PlatforaD.Photoshop(正確答案)14.從宏觀角度看,數(shù)據(jù)可視化的功能不包括()。A.信息記錄B.信息的推理分析C.信息清洗(正確答案)D.信息傳播15.目前有多種成熟的知識(shí)可視化工具,下面()不屬于這類可視化工具。A.概念圖B.思維導(dǎo)圖C.認(rèn)知地圖D.趨勢(shì)圖(正確答案)16.可視化模型有助于理解可視化的具體過程,常用的可視化模型不包括A.循環(huán)模型B.分析模型C.遞進(jìn)模型(正確答案)D.順序模型17.人眼的視場(chǎng)是很寬的,垂直方向能超過80°,水平方向能超過()。A.180°B.170°C.160°(正確答案)D.150°18.雷達(dá)圖適用于()數(shù)據(jù),且每個(gè)維度必須可以排序。A.一維B.二維C.三維D.多維(正確答案)19.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()。A.數(shù)據(jù)共享B.數(shù)據(jù)完整性C.數(shù)據(jù)冗余很高(正確答案)D.數(shù)據(jù)獨(dú)立性高20.()是位于用戶與操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件,它屬于系統(tǒng)軟件,它為用戶或應(yīng)用程序提供訪問數(shù)據(jù)庫的方法。數(shù)據(jù)庫在建立、使用和維護(hù)時(shí)由其統(tǒng)一管理、統(tǒng)一控制。A.DBMS(正確答案)B.DBC.DBSD.DBA21.在SQL中,建立表用的命令是()。A.CREATE?SCHEMAB.CREATE?TABLE(正確答案)C.CREATE?VIEWD.CREATE?INDEX22.SQL的視圖是從()中導(dǎo)出的。A.基本表B.視圖C.基本表或視圖(正確答案)D.數(shù)據(jù)庫23.下列哪個(gè)不是sql數(shù)據(jù)庫文件的后綴()。A..mdfB..ldfC..tif(正確答案)D..ndf24.數(shù)據(jù)定義語言的縮寫詞為()。A.DDL(正確答案)B.DCLC.DMLD.DBL25.目前()數(shù)據(jù)庫系統(tǒng)已逐漸淘汰了網(wǎng)狀數(shù)據(jù)庫和層次數(shù)據(jù)庫,成為當(dāng)今最為流行的商用數(shù)據(jù)庫系統(tǒng)。A.關(guān)系(正確答案)B.面向?qū)ο驝.分布D.邏輯26.SQL語言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()。A.DELETE(正確答案)B.DROPC.CLEARD.REMORE27.在MS?SQL?Server中,關(guān)于數(shù)據(jù)庫的說法正確的()。A.一個(gè)數(shù)據(jù)庫可以不包含事務(wù)日志文件B.一個(gè)數(shù)據(jù)庫可以只包含一個(gè)事務(wù)日志文件和一個(gè)數(shù)據(jù)庫文件(正確答案)C.一個(gè)數(shù)據(jù)庫可以包含多個(gè)數(shù)據(jù)庫文件,但只能包含一個(gè)事務(wù)日志文件D.一個(gè)數(shù)據(jù)庫可以包含多個(gè)事務(wù)日志文件,但只能包含一個(gè)數(shù)據(jù)庫文件28.數(shù)據(jù)庫管理系統(tǒng)的英文縮寫是()。A.DBMS(正確答案)B.DBSC.DBAD.DB29.建立索引的目的是()。A.降低SQL?Server數(shù)據(jù)檢索的速度B.與SQL?Server數(shù)據(jù)檢索的速度無關(guān)C.加快數(shù)據(jù)庫的打開速度D.提高SQL?Server數(shù)據(jù)檢索的速度(正確答案)30.以下關(guān)于主鍵的描述正確的是()。A.標(biāo)識(shí)表中唯一的實(shí)體(正確答案)B.創(chuàng)建唯一的索引,允許空值C.只允許以表中第一字段建立D.表中允許有多個(gè)主鍵31.有關(guān)數(shù)據(jù)冗余說法錯(cuò)誤的是()。A.數(shù)據(jù)庫中,數(shù)據(jù)存在副本的現(xiàn)象,就是數(shù)據(jù)冗余B.通過分類存儲(chǔ),可以有效減少數(shù)據(jù)冗余,但是會(huì)增加數(shù)據(jù)查找的復(fù)雜性C.在數(shù)據(jù)庫設(shè)計(jì)階段,一定要盡最大可能避免數(shù)據(jù)冗余,最好做到無數(shù)據(jù)冗余。D.數(shù)據(jù)冗余通常是由于數(shù)據(jù)庫設(shè)計(jì)引起的。(正確答案)32.關(guān)于標(biāo)識(shí)列,以下說法正確的是()。A.使用sql語句插入數(shù)據(jù)時(shí),可以為標(biāo)識(shí)列指定要插入的值。B.設(shè)定標(biāo)識(shí)時(shí),必須同時(shí)指定標(biāo)識(shí)種子和標(biāo)識(shí)遞增量。(正確答案)C.若設(shè)定標(biāo)識(shí)時(shí),未指定標(biāo)識(shí)遞增量,D.只能把主鍵設(shè)定為標(biāo)識(shí)列。33.現(xiàn)有表user,字段:userid,username,?salary,?deptid,email;?表department,字段:deptid,?deptname;下面()應(yīng)采用檢查約束來實(shí)現(xiàn)。A.若department中不存在deptid為2的紀(jì)錄,則不允許在user表中插入deptid為2的數(shù)據(jù)行。B.若user表中已經(jīng)存在userid為10的記錄,則不允許在user表中再次插入userid為10的數(shù)據(jù)行。C.User表中的salary(薪水)值必須在1000元以上。(正確答案)D.若User表的email列允許為空,則向user表中插入數(shù)據(jù)時(shí),可以不輸入email值。34.以下不屬于企業(yè)管理器功能的是()。A.創(chuàng)建并管理所有數(shù)據(jù)庫、登陸、用戶、權(quán)限等。B.管理和執(zhí)行數(shù)據(jù)導(dǎo)入導(dǎo)出、數(shù)據(jù)庫備份等多項(xiàng)輔助功能。C.定義sql?server組。D.調(diào)試、執(zhí)行sql語句,?批處理和腳本。(正確答案)35.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在()步驟的任務(wù)。A.頻繁模式挖掘B.分類和預(yù)測(cè)C.數(shù)據(jù)預(yù)處理(正確答案)D.數(shù)據(jù)流挖掘36.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購買尿布,這種屬于數(shù)據(jù)挖掘的()問題。A.關(guān)聯(lián)規(guī)則發(fā)現(xiàn)(正確答案)B.聚類C.分類D.自然語言處理37.當(dāng)不知道數(shù)所帶標(biāo)簽時(shí),可以使用()技術(shù)位使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離。A.分類B.聚類(正確答案)C.關(guān)聯(lián)分析D.隱馬爾可夫鏈38.下面()屬于映射數(shù)據(jù)到新的空間的方法。A.傅里葉變換(正確答案)B.特征加權(quán)C.漸進(jìn)抽樣D.維歸約39.下列()不是專門用于可視化時(shí)間空間數(shù)據(jù)的技術(shù)。A.等高線圖B.餅圖(正確答案)C.曲面圖D.矢量場(chǎng)圖40.可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。A.決策樹、對(duì)數(shù)回歸、關(guān)聯(lián)模式B.K均值法、SOM神經(jīng)網(wǎng)絡(luò)C.Apriori算法、FP-Tree算法(正確答案)D.RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹41.下列()不是可視化交互方法。A.概覽+細(xì)節(jié)技術(shù)B.焦點(diǎn)+上下文技術(shù)C.概覽+縮放技術(shù)(正確答案)D.平移+縮放技術(shù)42.下列()屬于可視化交互設(shè)備。A.平板電腦B.觸摸屏C.立體眼鏡D.以上都是(正確答案)43.可視分析的運(yùn)行過程可看作是()的循環(huán)過程。A.“數(shù)據(jù)→知識(shí)→數(shù)據(jù)”(正確答案)B.“知識(shí)→知識(shí)→知識(shí)”C.“數(shù)據(jù)→數(shù)據(jù)→數(shù)據(jù)”D.“知識(shí)→數(shù)據(jù)→數(shù)據(jù)”44.與大數(shù)據(jù)密切相關(guān)的技術(shù)是()。A.藍(lán)牙B.云計(jì)算(正確答案)C.博弈論D.Wifi45.極坐標(biāo)圖形是使用()來繪制的。A.原點(diǎn)和半徑B.相角和距離(正確答案)C.橫縱坐標(biāo)D.原點(diǎn)和相角46.文本可視化流程是()A.原始文本–>文本信息挖掘–>視圖繪制–>人機(jī)交互。(正確答案)B.原始文本–>視圖繪制–>人機(jī)交互。C.原始文本–>文本信息挖掘–>人機(jī)交互。D.原始文本–>文本信息挖掘–>視圖繪制。47.下列屬于反映比例關(guān)系的可視化圖表的是()。A.旭日?qǐng)D(正確答案)B.散點(diǎn)圖C.熱力圖D.氣泡圖48.下列屬于數(shù)據(jù)收集內(nèi)部渠道的是()。

①客戶調(diào)查②專家與客戶訪談③專業(yè)調(diào)研機(jī)構(gòu)④內(nèi)部數(shù)據(jù)庫

A.①、②、④(正確答案)B.①、③、④C.①、②、③D.①、②、③、④49.作為電商企業(yè),以下()圖可以有效地提供不同商品的銷售和趨勢(shì)情況。A.餅圖B.分組直方圖C.氣泡圖D.條形圖和線圖的組合圖(正確答案)50.下列屬于基本圖表的是()。A.瀑布圖B.滑珠圖C.漏斗圖D.折線圖(正確答案)51.對(duì)于一個(gè)右偏的頻數(shù)分布,一般情況下()的值最大。A.中位數(shù)B.眾數(shù)C.算術(shù)平均數(shù)(正確答案)D.無法判斷52.散點(diǎn)圖是對(duì)成組的()數(shù)值進(jìn)行比較,氣泡圖是對(duì)()數(shù)值進(jìn)行比較。A.兩個(gè);兩個(gè)B.兩個(gè);三個(gè)(正確答案)C.三個(gè);兩個(gè)D.四個(gè);三個(gè)53.圖表操作以下個(gè)操作①選擇數(shù)據(jù)源②圖表布局③插入圖表,他們的正確順序是()。A.①②③B.①③②(正確答案)C.③①②D.②①③54.使用一下那種可視化工具不需要編程基礎(chǔ)()。A.D3.jsB.Tableau(正確答案)C.VegaD.Processing55.現(xiàn)有兩個(gè)數(shù)據(jù)(0,1,0,1,0)與(0,0,1,1,1),其中每個(gè)屬性為二元屬性類型,則它們的Jaccard相似系數(shù)為()。A.0.75(正確答案)B.0.6C.0.5D.0.2556.下面哪個(gè)選項(xiàng)不是表達(dá)維度的展現(xiàn)方式()。A.次序(正確答案)B.徑向C.螺旋形D.線性57.下面哪個(gè)維度表示事件組之間的關(guān)系()。A.布局維度(正確答案)B.表達(dá)維度C.比例維度D.隨機(jī)58.要展示多個(gè)文檔之間的主題相似性,以下哪類可視化技術(shù)較為合適()。A.圖結(jié)構(gòu)可視化,如節(jié)點(diǎn)連接圖B.空間數(shù)據(jù)可視化,如體繪制C.時(shí)序數(shù)據(jù)可視化,如主題河流D.高維數(shù)據(jù)可視化,如降維投影(正確答案)59.若有--個(gè)數(shù)據(jù)集,每個(gè)數(shù)據(jù)點(diǎn)有5個(gè)屬性,以下哪種可視化技術(shù)最適用于表示其屬性兩兩之簡(jiǎn)的相關(guān)性()。A.降維投影后使用二維散點(diǎn)圖進(jìn)行可視化B.像素圖C.散點(diǎn)圖矩陣(正確答案)D.平行坐標(biāo)系60.可視化可以將難以理解的原始數(shù)據(jù)變換成用戶可以理解的模式和特征,并顯示出來。依據(jù)可視化流程概念圖,在原始數(shù)據(jù)和可視化中間這一步驟是()。A.用戶感知B.數(shù)據(jù)分析C.數(shù)據(jù)采集D.數(shù)據(jù)處理和變換(正確答案)61.在TamaraMunzner提出的可視分析模型中,可視設(shè)計(jì)的whatwhyhow三個(gè)維度中的what指代的是()。A.可視化任務(wù)的抽象B.對(duì)于要被可視化的數(shù)據(jù)的抽象(正確答案)C.視覺編碼形式的設(shè)計(jì)D.可視化交互形式的設(shè)計(jì)62.可視化和其他數(shù)據(jù)分析處理方法最大的不同是用戶起到了關(guān)鍵作用,可視化映射后的結(jié)果只有通過()才能轉(zhuǎn)換成知識(shí)和靈感。A.可視化映射B.數(shù)據(jù)處理與變換C.用戶感知(正確答案)D.以上答案均不正確63.下列哪一個(gè)不屬于可視化三部曲()。A.可視化編碼映射B.視圖與交互設(shè)計(jì)C.可視化代碼實(shí)現(xiàn)(正確答案)D.可展示數(shù)據(jù)篩選64.顏色的視覺通道不包括()。A.飽和度B.色相/色調(diào)C.透明度D.美觀度(正確答案)65.可視化的輸入是()。A.數(shù)據(jù)(正確答案)B.代碼C.視覺形式D.語言66.可視化的輸出是()。A.數(shù)據(jù)B.代碼C.視覺形式(正確答案)D.語言67.哪句話可以說明可視化的作用()。A.一圖勝千言(正確答案)B.擲地有聲C.力透紙背D.畫龍點(diǎn)睛68.數(shù)據(jù)的維度指的是()。A.重要屬性的數(shù)量B.屬性值的大小C.屬性的數(shù)量(正確答案)D.樣本的數(shù)量69.以下關(guān)于統(tǒng)計(jì)的說法中,錯(cuò)誤的是()。A.統(tǒng)計(jì)學(xué)是關(guān)于收集、整理、分析數(shù)據(jù)和從數(shù)據(jù)中得出結(jié)論的科學(xué)B.描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)的作用只能分開發(fā)揮(正確答案)C.參數(shù)估計(jì)是利用樣本信息推斷總體特征D.描述統(tǒng)計(jì)的內(nèi)容包括如何用圖表或數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理和展示70.用組中值代表各組內(nèi)得一般水平得假定條件就是()。A.各組得次數(shù)均相等B.各組得組距均相等C.各組得變量值均相等D.各組次數(shù)在本組內(nèi)呈均勻分布(正確答案)71.RFM模型的R代表什么?()A.客戶最近一次交易時(shí)間的間隔(正確答案)B.客戶在最近一段時(shí)間內(nèi)交易的次數(shù)C.客戶在最近一段時(shí)間內(nèi)交易的金額D.客戶在最近一段時(shí)間內(nèi)交易的頻率72.多維數(shù)據(jù)模型中的鉆取主要指()。A.從細(xì)粒度數(shù)據(jù)向高層的聚合B.將匯總數(shù)據(jù)拆分到更細(xì)節(jié)的數(shù)據(jù)(正確答案)C.選擇維中特定的值進(jìn)行分析D.選擇維中特定的值進(jìn)行聚合73.數(shù)據(jù)分析的具體步驟為分析業(yè)務(wù)含義、制定分析計(jì)劃、拆分查詢數(shù)據(jù)、提煉業(yè)務(wù)洞察和()。A.提交報(bào)告B.反饋匯總C.產(chǎn)出業(yè)務(wù)決策(正確答案)D.以上都對(duì)74.上卷是鉆取的逆操作()。A.正確(正確答案)B.錯(cuò)誤C.不確定D.不相關(guān)75.蘋果手機(jī)的LOGO遵循了閉合性原則中的()。A.形狀閉合B.負(fù)形閉合(正確答案)C.經(jīng)驗(yàn)閉合D.截?cái)嚅]合76.OLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報(bào)表需求,它的技術(shù)核心是()。A.表B.維(正確答案)C.數(shù)據(jù)D.統(tǒng)計(jì)77.基于OLAP技術(shù)通過對(duì)數(shù)據(jù)進(jìn)行多層次、多階段的分析處理,獲得高度歸納的信息是()。A.多維數(shù)據(jù)分析(正確答案)B.多維標(biāo)度分析C.業(yè)務(wù)分析D.邏輯分析78.下述對(duì)維度成員的描述錯(cuò)誤的是()。A.維的一個(gè)取值稱為該維的一個(gè)維度成員(簡(jiǎn)稱維成員)B.如果一個(gè)維是多級(jí)別的,那么該維的維度成員是在不同維級(jí)別的取值的組合。C.銀行會(huì)給不同經(jīng)濟(jì)性質(zhì)的企業(yè)貸款,比如國有、集體等,若通過企業(yè)性質(zhì)的角度來分析貸款數(shù)據(jù),那么經(jīng)濟(jì)性質(zhì)就是維度成員(正確答案)D.考慮時(shí)間維具有日、月、年這3個(gè)級(jí)別,分別在日、月、年上各取一個(gè)值組合起來,就得到了時(shí)間維的一個(gè)維成員,即“某年某月某日”。79.PV和UV分別指的是()。A.訪客數(shù)和瀏覽量B.瀏覽量和訪客數(shù)(正確答案)C.瀏覽量和買家數(shù)D.買家數(shù)和瀏覽量80.下列哪個(gè)不是數(shù)據(jù)庫對(duì)象()。A.數(shù)據(jù)模型B.視圖C.表D.用戶(正確答案)1.運(yùn)用基于計(jì)算機(jī)的方法,包括新技術(shù),從而在數(shù)據(jù)中獲得有用知識(shí)的整個(gè)過程,就叫做數(shù)據(jù)挖掘。對(duì)(正確答案)錯(cuò)2.大數(shù)據(jù)往往可能蘊(yùn)含著豐富的規(guī)律和知識(shí),所以在大數(shù)據(jù)之上應(yīng)用數(shù)據(jù)挖掘就成了理所當(dāng)然的活動(dòng)了。對(duì)(正確答案)錯(cuò)3.1989年,術(shù)語“數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)”正式確立,即KDD。對(duì)(正確答案)錯(cuò)4.通過數(shù)據(jù)挖掘技術(shù),可以發(fā)現(xiàn)許多深層的、手工無法發(fā)現(xiàn)的規(guī)律,幫助企業(yè)在激烈的競(jìng)爭(zhēng)環(huán)境中,占有更多的先機(jī)。對(duì)(正確答案)錯(cuò)5.一般而言,數(shù)據(jù)倉庫應(yīng)先行建立完成,數(shù)據(jù)發(fā)掘才能有效率的進(jìn)行。對(duì)(正確答案)錯(cuò)6.Web數(shù)據(jù)挖掘是通過數(shù)據(jù)庫中的一些屬性來預(yù)測(cè)另一個(gè)屬性,它在驗(yàn)證用戶提出的假設(shè)過程中提取信息。對(duì)錯(cuò)(正確答案)7.與分類不同的是,回歸的輸出是離散的類別值,而分類的輸出是連續(xù)數(shù)值。對(duì)錯(cuò)(正確答案)8.近年來,隨著人工智能機(jī)器學(xué)習(xí)模式識(shí)別和數(shù)據(jù)挖掘等領(lǐng)域中傳統(tǒng)方法的不斷發(fā)展以及各種新方法新技術(shù)的不斷涌現(xiàn),分類方法得到了長足的發(fā)展。對(duì)(正確答案)錯(cuò)9.“根據(jù)客戶的消費(fèi)行為,把客戶分成三個(gè)類,第一個(gè)類的主要特征是……”,實(shí)際上這是一個(gè)分類問題。對(duì)錯(cuò)(正確答案)10.至今Apriori仍然作為聚類分析的經(jīng)典算法被廣泛討論。對(duì)錯(cuò)(正確答案)11.神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)中,一般分為“有教師學(xué)習(xí)”和“無教師學(xué)習(xí)”兩種。對(duì)(正確答案)錯(cuò)12.早期的數(shù)據(jù)挖掘工具采用命令行界面,而且文本格式的輸出也不夠直觀。對(duì)(正確答案)錯(cuò)13.k-Means聚類算法以相對(duì)距離作為相似度測(cè)度,它是求對(duì)應(yīng)某一初始聚類中心向量V最優(yōu)分類,使得評(píng)價(jià)指標(biāo)J最小。對(duì)錯(cuò)(正確答案)14.從混淆矩陣中,可以衍生出各種評(píng)價(jià)的指標(biāo)。錯(cuò)誤發(fā)現(xiàn)率(Falsediscoveryrate,F(xiàn)DR),表示在模型預(yù)測(cè)為正類的樣本中,真正的負(fù)類的樣本所占的比例。對(duì)(正確答案)錯(cuò)15.層次聚類方法的基本思想是:通過某種相似性測(cè)度計(jì)算節(jié)點(diǎn)之間的相似性,并按相似度由高到低排序,逐步重新連接個(gè)節(jié)點(diǎn)。()(答案:請(qǐng)?jiān)O(shè)置答案)15.層次聚類方法的基本思想是:通過某種相似性測(cè)度計(jì)算節(jié)點(diǎn)之間的相似性,并按相似度由高到低排序,逐步重新連接個(gè)節(jié)點(diǎn)。對(duì)(正確答案)錯(cuò)16.政府2.0、政府3.0,與政府以后的治理改革和服務(wù)型政府建設(shè)的目標(biāo)是完全不一致的。對(duì)錯(cuò)(正確答案)17.深度學(xué)習(xí)就是指Tensorflow框架。對(duì)錯(cuò)(正確答案)18.大數(shù)據(jù)的價(jià)值重在挖掘,目的在于從數(shù)據(jù)中獲取有用知識(shí)。對(duì)(正確答案)錯(cuò)19.簡(jiǎn)單隨機(jī)抽樣,是從總體N個(gè)對(duì)象中任意抽取n個(gè)對(duì)象作為樣本,最終以這些樣本作為調(diào)查對(duì)象。在抽取樣本時(shí),總體中每個(gè)對(duì)象被抽中為調(diào)查樣本的概率可能會(huì)有差19.簡(jiǎn)單隨機(jī)抽樣,是從總體N個(gè)對(duì)象中任意抽取n個(gè)對(duì)象作為樣本,最終以這些樣本作為調(diào)查對(duì)象。在抽取樣本時(shí),總體中每個(gè)對(duì)象被抽中為調(diào)查樣本的概率可能會(huì)有差異。對(duì)錯(cuò)(正確答案)20.維是人們觀察數(shù)據(jù)的特定角度,是考慮問題時(shí)的一類屬性。對(duì)(正確答案)錯(cuò)1、在進(jìn)行數(shù)據(jù)探索性分析時(shí),經(jīng)常使用各種可視化圖形的方式。請(qǐng)說明探索性分析的目標(biāo),以下幾種圖形的核心指令,以及各圖的主要功能。()答案解析:(1)條形圖

核心指令:plt.bar(x,y)(3分)

作用:用來表現(xiàn)類別數(shù)據(jù)的頻數(shù)分布(3分)

(2)箱線圖

核心指令:sns.boxplot(x,y,data)(4分)

作用:用來表現(xiàn)數(shù)值型數(shù)據(jù)的數(shù)據(jù)分布情況,如中位數(shù)、上四分位數(shù)、下四分位數(shù)、四分位距等。(4分)

(3)折線圖

核心指令:plt.plot(x,y)(3分)

作用:一般用來表現(xiàn)數(shù)據(jù)隨時(shí)間變化的趨勢(shì)。(3分)2、什么異常值分析?如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論