大數(shù)據(jù)工具應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年廣東金融學院_第1頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年廣東金融學院_第2頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年廣東金融學院_第3頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年廣東金融學院_第4頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年廣東金融學院_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

大數(shù)據(jù)工具應(yīng)用智慧樹知到期末考試答案+章節(jié)答案2024年廣東金融學院下列敘述錯誤的是()。

答案:邏輯回歸主要用于回歸分析關(guān)于DBSCAN聚類,下列選項中,()是正確的。

答案:DBSCAN聚類可以自動確定簇的數(shù)量時間序列操作的輸出結(jié)果,可能包括以下哪些內(nèi)容()。

答案:Evaluationontrainingdata;LinearRegressionModel;RunInformation.;FuturePredictionsfromendoftrainingdata.數(shù)據(jù)變換工作的手段主要有()。

答案:平滑聚集;數(shù)據(jù)概化;規(guī)范化隨機森林中可以采用各種決策樹算法,常見的決策樹算法有()。

答案:ID3;C4.5;CART當訓(xùn)練數(shù)據(jù)有限時,為了對模型性能進行無偏估計,我們常采用的方法有()。

答案:10折交叉驗證;5折交叉驗證使用EM聚類器對鳶尾花數(shù)據(jù)集(iris.arff)進行聚類,將簇數(shù)設(shè)置為3,其他參數(shù)保持默認值,忽略class屬性,選擇類別作為簇的評價標準并指定class,從結(jié)果中可知,下列選項中,()是正確的。

答案:模型的最大似然估計值是-2.055;未能正確聚類的實例數(shù)為14;第3個簇的實例數(shù)為36;第3個簇的先驗概率是0.25用來設(shè)計網(wǎng)絡(luò)爬蟲軟件的程序設(shè)計語言包括:()

答案:C/C++;Python;Java關(guān)于Weka概述錯誤的是()。

答案:Weka是只包含機器學習算法的數(shù)據(jù)挖掘工具

答案:100%以下哪種規(guī)則是一個好的有用的關(guān)聯(lián)規(guī)則()。

答案:一個具有高支持度和高置信度的關(guān)聯(lián)規(guī)則以天氣數(shù)據(jù)集(weather.numeric.arff)為例,要添加一列新的屬性叫“心情”,分類三類:好(good),不好(bad),一般(normal),利用AddUserFields過濾器步驟為()。

答案:Choose—filters—unsupervised—attribute--Adduserfields創(chuàng)建計算字段時,計算兩個日期之間的天數(shù)差,用到的函數(shù)是()。

答案:DATEDIFFWeka中刪除屬性使用的過濾器是()。

答案:Remove以下描述錯誤的是()。

答案:簇內(nèi)任意兩個實例之間應(yīng)該具有較高的相異度樹地圖在嵌套矩形中顯示數(shù)據(jù),定義樹圖結(jié)構(gòu)的()和定義單個矩形的大小或顏色的()。

答案:維度,度量擴展標識語言文件的后綴名是:()

答案:xml集的創(chuàng)建方式不包含:()。

答案:篩選ROC曲線中有幾個關(guān)鍵點,下面那種說法是錯誤的()。

答案:(TPR=0,FPR=1)表示理想模型目前廣泛使用的二維表格形式的數(shù)據(jù)庫屬于()。

答案:關(guān)系型數(shù)據(jù)庫統(tǒng)計圖的坐標軸包含在()區(qū)域中?

答案:數(shù)據(jù)區(qū)不屬于一個定量變量和一個定性變量的統(tǒng)計圖的是()。

答案:多變量箱線圖Visualize標簽頁中Jitter滑塊的功能是()。

答案:隨機移動圖中的所有點,使被遮擋的點可見使用DBSCAN聚類器對鳶尾花數(shù)據(jù)集(iris.arff)進行聚類,將epsilon參數(shù)設(shè)置為0.2,minPoints參數(shù)設(shè)置為5,忽略class屬性,下列選項中,()是錯誤。

答案:有兩個實例未能聚類以下哪個是摩爾定律在大數(shù)據(jù)領(lǐng)域的體現(xiàn):()。

答案:大約每18個月數(shù)據(jù)總量會翻倍神經(jīng)網(wǎng)絡(luò)中的節(jié)點代表什么()?

答案:激勵函數(shù)根據(jù)J48分類器訓(xùn)練天氣數(shù)據(jù)集(weather.nominal.arff)所生產(chǎn)的決策樹,當outlook=rainy;temperature=cool;humidity=high;windy=FALSE時,分類的結(jié)果是()。

答案:Yes使用M5P分類器訓(xùn)練數(shù)據(jù)集cpu.arff所生產(chǎn)的回歸模型中,下列敘述錯誤的是(

)。

答案:葉子節(jié)點括號中第二個數(shù)字代表到達該葉結(jié)點的實例個數(shù)以下描述正確的是()。

答案:邏輯回歸常應(yīng)用于經(jīng)濟預(yù)測、疾病自動診斷、點擊率預(yù)估以及推薦系統(tǒng)等任務(wù)中如果一個訓(xùn)練好的模型在測試集上有100%的準確率,這是不是意味著在一個新的數(shù)據(jù)集上,也會有同樣好的表現(xiàn)?()

答案:不對,依然有其他因素沒有考慮到,比如噪音數(shù)據(jù)參數(shù)的數(shù)據(jù)類型,錯誤的是()。

答案:時間滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則叫(

)。

答案:強關(guān)聯(lián)規(guī)則以下關(guān)于聚類描述錯誤的是()。

答案:聚類是將數(shù)據(jù)集中的實例聚集到某個預(yù)先已知的類別中八爪魚軟件除了可以進行本地采集以外,還可以進行()采集。

答案:自動云WEKA中編輯神經(jīng)網(wǎng)絡(luò)節(jié)點時,如果要想選擇多個節(jié)點,需要使用()?

答案:Ctrl鍵Tableau是一種()軟件,允許任何人連接到相應(yīng)的(),然后可視化并創(chuàng)建交互式的可共享儀表板。

答案:商業(yè)智能,數(shù)據(jù)twbx擴展在Tableau中表示()?

答案:它是一個表示TableauPackagedWorkbook的文件,其中.twb文件與數(shù)據(jù)源組合在一起決策樹的構(gòu)建主要是采用()度量方式,使得決策樹的每個分支節(jié)點所包含的樣本盡量屬于同一類別。

答案:信息熵Tableau默認給我們建立了圖形,我們可以選擇右上角的()區(qū),將已經(jīng)建立的示圖轉(zhuǎn)換為其它類型。

答案:智能顯示區(qū)以下屬于單個屬性評估器的是()。

答案:InfoGainAttributeEval;ReliefFAttributeEval;OneRAttributeEval關(guān)于隨機森林(RF)算法以下描述正確得是()。

答案:能處理高維度的數(shù)據(jù);隨機性的引入使得隨機森林不容易過擬合、有很好的抗噪聲能力;若隨機森林中的決策樹個數(shù)較多,訓(xùn)練時需要的空間和時間會較大;訓(xùn)練速度快,且容易實現(xiàn)并行化處理等關(guān)聯(lián)規(guī)則分析時可以采用以下哪些標準進行關(guān)聯(lián)規(guī)則的修剪。()。

答案:提升度;支持度;置信度;杠桿率關(guān)于UPPER函數(shù),下列選項中,()是錯誤的。

答案:降序取數(shù);返回上一行數(shù)據(jù);將數(shù)據(jù)前置;升序取數(shù)下面哪些是常用的序列分析預(yù)測模型()?

答案:組合自回歸移動平均;自回歸;移動平均;自回歸移動平均;自回歸求和移動平均Tableau地圖中對哪些字段對中國區(qū)有效()。

答案:省市/自治區(qū);國家地區(qū);城市決定神經(jīng)網(wǎng)絡(luò)輸出的元素有()

答案:網(wǎng)絡(luò)連接方式;連接權(quán)重;激勵函數(shù)在進行自動選擇屬性時,必須設(shè)立兩個對象,其中決定執(zhí)行什么風格的搜索的是下面的哪一個(

)。

答案:搜索方法觀察兩個數(shù)值變量是否存在線性關(guān)系的統(tǒng)計圖是()。

答案:散點圖FINDNTH(‘HELLO’,’L’,2),返回()。

答案:4八爪魚軟件的“自定義采集”工作方式下,需要在軟件里輸入一個()來作為采集的目標。

答案:網(wǎng)頁地址貝葉斯網(wǎng)絡(luò)中,節(jié)點需給出概率分布描述,對于隨機型隨機變量而言,可以用()的形式表示。

答案:條件概率密度函數(shù)以下屬于屬性空間的搜索方法的是()。

答案:BestFirst在weka軟件探索者界面中,利用Visualize標簽頁通過更改各個參數(shù)來進行數(shù)據(jù)集的可視化屬性設(shè)置后,需要單擊以下哪個按鈕,所有更改才會生效。()

答案:Update百度遷徙提供的熱門城市遷入遷出的數(shù)據(jù)來自于它的:()。

答案:百度地圖、百度導(dǎo)航下圖二類分類問題,“Δ”和“o”分別代表兩個不同的類別,使用k=1的K-NN算法,如果用僅拿出一個測試樣本的交叉驗證方法,交叉驗證的錯誤率是多少?()

答案:100%邏輯回歸模型的輸出是()。

答案:樣本的屬于某個分類的概率下列敘述錯誤的是()。

答案:SPSS公司商業(yè)數(shù)據(jù)挖掘產(chǎn)品Clementine是免費、開源軟件Logistic函數(shù)的值域是()。

答案:[0,1]能在輸出圖形中直接轉(zhuǎn)換馬賽克圖的是()。

答案:堆疊條形圖Weka中以玻璃數(shù)據(jù)集(glass.arff)為例,利用AddNoise過濾器向其中添加噪聲的步驟是()。

答案:Choose-filters-unsupervised-attribute-AddNoiseWeka中加載天氣數(shù)據(jù)集(weather.nominal.arff),打開IBk分類器。利用AddNoise過濾器向其中添加噪聲,將K-NN參數(shù)設(shè)置為5,將分類噪聲百分比Percent設(shè)置為30%。運行分類器,則以下描述錯誤的是()。

答案:類別屬性值為“no”的5個樣本有1個被錯誤分類一般而言,K-NN最近鄰方法在()的情況下效果較好?

答案:樣本較少但典型性好根據(jù)J48分類器訓(xùn)練鳶尾花數(shù)據(jù)集(iris.arff)所生產(chǎn)的決策樹,當sepallength=2.4;sepalwidth=4.0;petallength=5.3;petalwidth=1.8時,分類的結(jié)果是()。

答案:Iris-versicolor下列無監(jiān)督學習算法是()。

答案:k-meansWeka中運行SMO分類器,將PolyKernel多項式核函數(shù)的指數(shù)(Exponent)設(shè)置為1,則以下描述正確的是()。

答案:SVM為線性支持向量機Hadoop的數(shù)據(jù)是用()的形式來存放的。

答案:鍵值對在LinearRegression分類器訓(xùn)練數(shù)據(jù)集cpu.arff所生產(chǎn)的線性回歸方程中,變量MMAX的系數(shù)是()。

答案:0.0056貝葉斯網(wǎng)絡(luò)中節(jié)點之間的邊代表什么()?

答案:隨機關(guān)系通過特定的字符來進行數(shù)據(jù)項與數(shù)據(jù)項之間分隔的大數(shù)據(jù)文件格式通常被稱為:()

答案:csv字符分隔值文件J48分類器通常用于以下哪個方法中進行屬性的評估(

)。

答案:WrapperSubsetEval下面哪些應(yīng)用是時間序列的典型例子()?

答案:容量規(guī)劃;銷售預(yù)測;彩票常見的分類算法有()?

答案:SVM;隨機森林;邏輯回歸Arff文件中包括()標記。

答案:@relation;@data;@attributeIFSTARTWITH(‘三水區(qū)西南街道西門路23號’)THEN‘三水區(qū)’ELSE‘其他’END,返回()。

答案:三水區(qū)條形圖用于展示不同類別的數(shù)據(jù)時,類別是()的、較少的,而直方圖則是對此類別再進行()統(tǒng)計。

答案:離散,分組LEFT(‘WELLDONE’,4),返回()。

答案:WELLWeka中關(guān)于AddNoise過濾器描述正確的是()。

答案:只在遇到的首批數(shù)據(jù)中添加噪聲Sigmoid函數(shù)f(x)的梯度計算公式為()。

答案:f(x)(1-f(x))以下關(guān)于Weka時間序列分析描述錯誤的是()。

答案:Weka僅支持多元線性回歸的時間序列分析方法。邏輯回歸是采用()方法來調(diào)整模型參數(shù)。

答案:最大似然估計“圖形”菜單中能實現(xiàn)交互式作圖的功能是()。

答案:可視化圖形生成器大數(shù)據(jù)4V特點中的Velocity是指()。

答案:產(chǎn)生數(shù)據(jù)的速度快隨機森林采用()形成每個決策樹的訓(xùn)練集,即采用重采樣方法產(chǎn)生訓(xùn)練集。

答案:Baggging方法()是Tableau中的TDE文件。

答案:它指的是包含從外部源(如MSExcel,MSAccess或CSV文件)提取的數(shù)據(jù)的文件Tableau集成高效的接口,具有良好的擴展性下列選項中,這些接口包括()。

答案:R語言集成接口;數(shù)據(jù)提取API;JavaScriptAPI以下描述,()是正確的。

答案:Weka自帶若干個arff文件數(shù)據(jù)集,位于安裝目錄的data子目錄;Weka所處理的數(shù)據(jù)集是一個二維表,表格里的一個橫行稱作一個實例,相當于統(tǒng)計學中的一個樣本,或者數(shù)據(jù)庫中的一條記錄;十折交叉驗證使用了不同的訓(xùn)練數(shù)據(jù)集與測試數(shù)據(jù)集我們常用的微軟Office套件中的Excel數(shù)據(jù)庫軟件的數(shù)據(jù)庫文件格式后綴名是:()

答案:xls/xlsx獲取日期數(shù)據(jù)的年份,應(yīng)選擇函數(shù)()。

答案:DATEPART想在大數(shù)據(jù)集上訓(xùn)練決策樹,為了使用較少時間,可以()。

答案:減少樹的深度標記卡中,你可以拖動字段以控制標記屬性,如類型,(),大小,形狀,(),工具提示和詳細信息。

答案:顏色,標簽使用SMO分類器和LibSVM分類器對breast-cancer.arff分別進行分類,由其輸出的結(jié)果可知()。

答案:SMO相對誤差比LibSVM的相對誤差大LEN(‘TABLEAU’),返回()。

答案:7下列敘述正確的是()。

答案:Beyes網(wǎng)絡(luò)方法誕生于20世紀80年代在數(shù)據(jù)挖掘中,經(jīng)常會遇到代價敏感性學習。該方法主要是針對不同分類錯誤采用不同的懲罰力度的方法模型訓(xùn)練,常用于()的學習任務(wù)中。

答案:類別不平衡在第2題的事務(wù)數(shù)據(jù)集中,規(guī)則{牛奶,尿布}à{啤酒}的置信度是(

)。

答案:0.67DATEDIFF(‘MONTH’,#2008-09-01#,#2008-02-01#),返回()。

答案:5查準率(Precision)是衡量檢索系統(tǒng)拒受非相關(guān)信息的能力,其計算公式為()。

答案:TP/(TP+FP)以下屬于利用大數(shù)據(jù)技術(shù)進行關(guān)聯(lián)商品推薦的應(yīng)用是():

答案:京東App首頁根據(jù)搜索記錄展示商品廣告浮窗;淘寶App首頁根據(jù)消費記錄投放個性化商品廣告;微信在朋友圈根據(jù)用戶信息和好友關(guān)系投放廣告求極大似然函數(shù)估計值的一般步驟是()。

答案:求導(dǎo)數(shù);對似然函數(shù)取對數(shù),并整理;寫出似然函數(shù);優(yōu)化求解似然方程關(guān)于.arff文件,以下敘述正確的是()。

答案:@relation定義數(shù)據(jù)集名稱,@attribute定義屬性,@data之后呈現(xiàn)實例2011年麥肯錫研究院提出的大數(shù)據(jù)定義核心內(nèi)容是:()。

答案:大數(shù)據(jù)是指其大小超出了常規(guī)數(shù)據(jù)庫工具獲取、儲存、管理和分析能力的數(shù)據(jù)集神經(jīng)網(wǎng)絡(luò)中的節(jié)點之間的連接代表什么()?

答案:關(guān)系權(quán)重氣泡圖將數(shù)據(jù)顯示為圓形群集,每個氣泡表示()字段的一個取值,各個氣泡的大小及顏色代表了一個或兩個()的值。

答案:維度,度量Tableau創(chuàng)建的地圖不包括()。

答案:立體地圖下列關(guān)于Weka中Beyes網(wǎng)絡(luò)編輯器的說法不正確的是()。

答案:不支持將Bayes網(wǎng)絡(luò)導(dǎo)出為圖片。Weka中僅在訓(xùn)練數(shù)據(jù)中添加噪聲而測試數(shù)據(jù)不受影響的元學習器為()。

答案:FilteredClassifier直方圖的橫軸為對分析類別的(),橫軸寬度表示各組的組距,縱軸代表每級()數(shù)量的多少。

答案:分組,樣本隨機森林是一種()策略,將各個獨立決策樹產(chǎn)生預(yù)測結(jié)果進行合并。

答案:集成學習關(guān)于創(chuàng)建計算字段,屬于數(shù)字計算邏輯的是()。

答案:LOGROC曲線的全稱為受試者工作特征曲線,反映了受試者在特定刺激條件下,由于采用不同的判斷標準得出的不同結(jié)果的曲線。該曲線是以()為橫坐標。

答案:假陽率在模型的訓(xùn)練過程中,產(chǎn)生過擬合的主要原因有()。

答案:訓(xùn)練數(shù)據(jù)中的噪聲過大;訓(xùn)練數(shù)據(jù)偏少;模型過于復(fù)雜下列關(guān)于BP神經(jīng)網(wǎng)絡(luò)的描述,錯誤的是()。

答案:計算誤差輸出時按從輸出到輸入的方向進行如果選擇了單個屬性評估器,則需要使用以下哪個方法來搜索屬性。(

答案:Ranker下列哪些不是常見的激勵函數(shù)()?

答案:正弦函數(shù)Tableau中的儀表板是()。

答案:是多個工作表和一些對象如圖像、文本、網(wǎng)頁、等的組合。可以按照一定的方式對其進行組織布局,以便揭示數(shù)據(jù)的關(guān)系和內(nèi)涵什么是雙軸?正確的是()。

答案:可以使用雙軸比較多個度量,雙軸是彼此疊加的兩個獨立軸下列關(guān)于Weka神經(jīng)網(wǎng)絡(luò)的操作,錯誤的是(

)。

答案:神經(jīng)網(wǎng)絡(luò)可以不需要經(jīng)過訓(xùn)練,直接設(shè)置相應(yīng)參數(shù)即可進行分類應(yīng)用。以下哪項關(guān)于決策樹的說法是錯誤的()。

答案:決策樹的構(gòu)建是一種自下向上的歸納過程貝葉斯網(wǎng)絡(luò)編輯器界面支持打開已經(jīng)保存的貝葉斯網(wǎng)絡(luò)文件格式是()。

答案:ARFF;XMLBIF設(shè)有項目集X,X1是X的一個子集,則下列結(jié)論中成立的是(

)。

答案:如果X1是頻繁項集,則X也是頻繁項集;如果X是非頻繁項集,則X1也是非頻繁項集與條形圖相比,折線圖不僅可以表示數(shù)量的(),而且可以直觀地反映同一事物隨時間序列發(fā)展變化的()。

答案:多少,趨勢關(guān)于不同近鄰數(shù)量及噪聲對IBk的影響正確的是()。

答案:當添加的分類噪聲百分比較小(低于60%)時,增大k值會增加分類準確率;噪聲增加時,無論K值大小,分類準確率會下降;當添加的分類噪聲百分比較大時(大于60%)時,增大k值會降低分類準確率()是度量?

答案:度量是取決于一個或多個維度的值的字段,Tableau將包含數(shù)字(定量)信息的任何字段視為度量為了方便進行下一步的數(shù)據(jù)處理,網(wǎng)頁數(shù)據(jù)采集程序采集到的數(shù)據(jù)應(yīng)該盡量()。

答案:保存成較通用的文件格式Weka中加載數(shù)據(jù)后,運行SMO分類器,將PolyKernel多項式核函數(shù)的指數(shù)(Exponent)設(shè)置為2,則以下描述正確的是()。

答案:超平面表示為支持向量的函數(shù);SVM為非線性支持向量機邏輯回歸是屬于()。

答案:廣義線性模型以下是對單個屬性進行排名的方法是()。

答案:Ranker以下屬于關(guān)聯(lián)分析的是()。

答案:購物籃分析八爪魚軟件的自定義采集工作方式下,在“選擇您要采集的網(wǎng)頁類型”這一步如果選擇“列表和表格”,則說明頁面():

答案:結(jié)構(gòu)是表格狀的以下哪些方法不可以直接來對文本分類?

答案:K-means訓(xùn)練完SVM模型后,不是支持向量的那些樣本可以丟掉,也可以繼續(xù)分類。以上說法是否正確?()

答案:錯變量的測量尺度對創(chuàng)建圖形很重要,如果變量的測量尺度定義有誤,則可能無法生成相應(yīng)的圖形。

答案:對LTRIM(‘NICE’),返回()。

答案:NICE通過特定的字符來進行數(shù)據(jù)項與數(shù)據(jù)項之間分隔的大數(shù)據(jù)文件格式通常被稱為:。

答案:csv字符分隔值文件關(guān)于模型誤差,下列哪種說法是錯誤的()。

答案:模型的泛化誤差越小,表示模型出現(xiàn)過擬合的可能性越大下列說法錯誤的是()。

答案:Tableau不提供應(yīng)用編程接口關(guān)于數(shù)據(jù)可視化,以下說法正確的是(

)。

答案:Weka中數(shù)據(jù)集會被顯示為一個二維散點圖矩陣。;用戶對數(shù)據(jù)點著色時,如果選擇的是數(shù)值型屬性,則顯示彩色條;用戶對數(shù)據(jù)點著色時,如果選擇的是標稱型屬性,則顯示離散的著色創(chuàng)建儀表板,()都是對象范圍。

答案:擴展;圖象;網(wǎng)頁;文本;水平工作表版面的大小設(shè)置,包含()。

答案:適合寬度;標準;整個視圖;適合高度以下描述,()是正確的。

答案:Tableau能夠連接多種多數(shù)據(jù)源,輕松實現(xiàn)數(shù)據(jù)融合;用戶僅需要通過輕點鼠標和簡單拖放就可以通過Tableau迅速創(chuàng)建出智能、精美、直觀和具有強交互性的報表和儀表盤;Tableau通過內(nèi)存數(shù)據(jù)引擎,可以直接查詢外部數(shù)據(jù)庫同時動態(tài)的從數(shù)據(jù)倉庫抽取實時數(shù)據(jù),極Tableau大的提高了數(shù)據(jù)訪問和查詢效率制圖時右鍵添加注釋,()是可選項。

答案:區(qū)域;點;標記大數(shù)據(jù)工具處理的數(shù)據(jù)來源包括:()

答案:新搜集的網(wǎng)頁信息數(shù)據(jù);攝像頭捕獲的視頻信息數(shù)據(jù);物聯(lián)網(wǎng)傳感器產(chǎn)生的數(shù)據(jù);手機GPS位置信息;現(xiàn)有數(shù)據(jù)庫中的海量數(shù)據(jù)關(guān)于Tableau,下列選項中,()是正確的。

答案:Tableau可以用來實現(xiàn)交互的、可視化的分析和儀表板應(yīng)用,從而幫助我們快速地認識和理解數(shù)據(jù);Tableau是一款定位于數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)的商務(wù)智能展現(xiàn)工具;Tableau連續(xù)第6年在Gartner分析和商業(yè)智能魔力象限中蟬聯(lián)領(lǐng)導(dǎo)者殊榮關(guān)于神經(jīng)網(wǎng)絡(luò)的設(shè)置參數(shù),下列選項中,()是關(guān)鍵的。

答案:momentum;trainingTime;HiddenLayers;learningRate大數(shù)據(jù)分析四個方面的工作主要是:()。

答案:關(guān)聯(lián)規(guī)則挖掘;數(shù)據(jù)聚類;時間序列預(yù)測;數(shù)據(jù)分類要進行網(wǎng)頁內(nèi)容采集,可以使用的方法包括()。

答案:使用第三方的圖形化爬蟲工具;人工訪問整理數(shù)據(jù);使用高級語言編寫網(wǎng)絡(luò)爬蟲程序;使用網(wǎng)站提供的數(shù)據(jù)訪問接口貝葉斯網(wǎng)絡(luò)中的節(jié)點代表什么()?

答案:隨機過程使用SimpleKMeans聚類器對鳶尾花數(shù)據(jù)集(iris.arff)進行聚類,保持默認參數(shù),即3個簇以及歐氏距離。忽略class屬性,從結(jié)果中可知,下列選項中,()是錯誤。

答案:平方和誤差為5.998刪去cpu.arff數(shù)據(jù)文件中的CACH屬性后,使用M5P分類器構(gòu)建方案,在結(jié)果中,到達LM3的實例數(shù)有()個。

答案:23Tableau數(shù)據(jù)源"頁面通常由四個主要區(qū)域組成:左窗格,聯(lián)接區(qū)域,預(yù)覽區(qū)域和()區(qū)域。

答案:元數(shù)據(jù)目前主流電商網(wǎng)站搜索結(jié)果返回頁面的布局一般是:()

答案:表格型基于Hadoop技術(shù),用來存儲半結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫屬于()。

答案:非關(guān)系型數(shù)據(jù)庫參數(shù)是可在集、計算字段、篩選器中替換()的動態(tài)值,通過參數(shù),能夠?qū)崿F(xiàn)快速、簡便的交互。

答案:常量值關(guān)于極大似然估計,下列論述錯誤的是()。

答案:與最大后驗概率的含義相同工作簿是一個包含.twb擴展名的文件,其中包含一個或多個()(可能還包括儀表板和故事)。

答案:工作表集的常規(guī)創(chuàng)建方式不包含()。

答案:按字段關(guān)于支持向量機與邏輯回歸以下描述不正確的是()。

答案:邏輯回歸目標函數(shù)是最小化后驗概率在weka軟件探索者界面中,Visualize標簽頁可以幫助用戶可視化數(shù)據(jù),注意可視化的對象是(

)。

答案:數(shù)據(jù)集本身以下()不是Weka的數(shù)據(jù)類型?

答案:real關(guān)于組,以下敘述正確的是()。

答案:組是構(gòu)成更高級別類別的維度成員的組合Weka中加載鳶尾花數(shù)據(jù)集(iris.arff),iris數(shù)據(jù)包含三個類別值,運行SMO分類器()。

答案:三個二元SMO模型WEKA中選擇神經(jīng)網(wǎng)絡(luò)分類器操作時,應(yīng)該選擇()?

答案:functions條目下的MultilayerPerceptron分類器在麥肯錫研究院定義的“大數(shù)據(jù)”處理技術(shù)的四個環(huán)節(jié)中,處于基礎(chǔ)環(huán)節(jié)的是()。

答案:分析()是在Tableau中的導(dǎo)入所有數(shù)據(jù)功能?

答案:它將整個數(shù)據(jù)源作為提取導(dǎo)入到Tableau快速數(shù)據(jù)引擎中,并將其保存在工作簿中關(guān)于隨機森林,下列哪種說法是錯誤的()。

答案:森林中,樹之間的相關(guān)性越大,錯誤率越低折線圖是一種以折線的上升或下降來表示統(tǒng)計數(shù)量的增減變化()的統(tǒng)計圖,最適用于()序列的數(shù)據(jù)。

答案:趨勢,時間在進行自動選擇屬性時,必須設(shè)立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的哪一個()

答案:屬性評估器時間序列環(huán)境安裝后的文件目錄,不包含下列哪一個目錄()。

答案:sample-data將天氣數(shù)據(jù)集(weather.numeric.arff)的第二個屬性“temperature”離散為低溫(cool),中溫(mild),高溫(hot)三個等級,在使用“Descretize”過濾器時,參數(shù)“attributeIndices”應(yīng)設(shè)置為:()。

答案:2將多個數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來并統(tǒng)一存儲,這屬于()的工作。

答案:數(shù)據(jù)集成大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘()。

答案:Apriori加載LibSVM分類器后,為驗證該分類器性能,使用十折交叉驗證時應(yīng)選擇()。

答案:Cross-validation,將數(shù)據(jù)集分成十份,輪流將其中9份作為訓(xùn)練數(shù)據(jù),1份作為測試數(shù)據(jù),進行試驗故事是按照順序排列的()或()的組合??梢允褂脛?chuàng)建的故事,向用戶敘述某些事實或者以故事方式揭示各種事實之間的上下文事件發(fā)展的關(guān)系。

答案:工作表,儀表板不屬于表計算的函數(shù)是()。

答案:LEFT以下屬于非標準金融特征數(shù)據(jù)的是()。

答案:借款人月收入與月還款額之比及借款人循環(huán)信貸余額與每月收入的比SVM以下說法正確的是:()。

答案:既可以處理線性問題又可以處理非線性問題數(shù)據(jù)清理工作包括數(shù)據(jù)格式標準化、異常數(shù)據(jù)清除、數(shù)據(jù)錯誤糾正和()。

答案:重復(fù)數(shù)據(jù)清除Tableau將包含(),()信息的任何字段視為維度,這包括具有文本或日期值的任何字段。

答案:定性,類別某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?()

答案:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)AUC定義為ROC曲線與坐標軸圍成的面積,下列哪種說法是錯誤的()。

答案:當AUC為0時,表示分類模型能對所有樣本都能進行正確分類下面關(guān)于深度學習和神經(jīng)網(wǎng)絡(luò)的描述,正確的是:()。

答案:神經(jīng)網(wǎng)絡(luò)是深度學習的理論基礎(chǔ)。

答案:2431下圖中()超平面最有可能成為最優(yōu)分類器?

答案:H3在貝葉斯網(wǎng)絡(luò)編輯界面時,如果節(jié)點的名稱沒法完全顯示,需要從哪個菜單項進行調(diào)整?

答案:Tools|Layout用來進行網(wǎng)頁數(shù)據(jù)信息數(shù)據(jù)搜集的軟件一般稱為:()

答案:網(wǎng)絡(luò)爬蟲軟件以下關(guān)于數(shù)據(jù)分析的方法,正確的是()。

答案:數(shù)據(jù)分析的目的就是解決我們現(xiàn)實中的某個問題以下不屬于問題的有效性檢驗的是()。

答案:必要性檢驗以下不屬于初級數(shù)據(jù)分析方法的是()。

答案:回歸分析法一個好的統(tǒng)計圖需滿足的標準,不包括以下()。

答案:清楚當我們當前的維度不能很好地解釋我們的問題時,我們就需要對數(shù)據(jù)做一個運算,增加多一個指標。這屬于以下哪種思維方式()。

答案:增維對()的理解是數(shù)據(jù)分析的前提。

答案:業(yè)務(wù)對多種影響因素按其重要程度進行一定組合,先按第一組合選擇出較大范圍目標對象,再按第二組合對第一組合篩選出來的對象進一步縮小范圍,以此類推,得出最終目標對象。該描述是以下哪種數(shù)據(jù)分析方法的思想()。

答案:層層篩選法

答案:對照以下不屬于數(shù)據(jù)分析的作用的是()。

答案:數(shù)據(jù)分析有助于增加營銷開支以下數(shù)據(jù)和信息的說法,不正確的是()。

答案:數(shù)據(jù)對用戶來說是有價值的Logistic函數(shù)的定義域是()。

答案:(-INF,+INF)線性支持向量機的最大化間隔正確的描述是()。

答案:使用IBk分類器和SMO分類器對vote.arff分別進行分類,由其輸出的結(jié)果可知()。

答案:SMO對democrat和republican的分類正確率都比IBk大以下計算距離的公式中,計算歐氏距離的是()。

答案:以下描述錯誤的是()。

答案:SVM尋找具有最小邊緣的超平面,因此經(jīng)常被稱為最小邊緣分類器以下不是創(chuàng)建計算字段時的運算邏輯的是()。

答案:表結(jié)構(gòu)以下不屬于集的創(chuàng)建方式的是()。

答案:[分組]創(chuàng)建Tableau可以用來實現(xiàn)交互的、()的分析和儀表板應(yīng)用,從而幫助我們快速地認識和理解數(shù)據(jù)。

答案:可視化Tableau右邊數(shù)據(jù)目錄欄中,不能單擊右鍵創(chuàng)建參數(shù)的緯度是()。

答案:集關(guān)于數(shù)據(jù)分層描述錯誤的是()。

答案:數(shù)據(jù)分層可以實現(xiàn)向上鉆取Tableau是一款定位于數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)()展現(xiàn)工具。Tableau連續(xù)第6年在Gartner分析和商業(yè)智能魔力象限中蟬聯(lián)領(lǐng)導(dǎo)者殊榮。

答案:商務(wù)智能儀表板版面大小設(shè)計選項,()不屬于大小設(shè)計選項。

答案:自定義度量往往是()字段,度量是我們的指標。度量常常是連續(xù)的,連續(xù)的字段在圖表中形成軸.將其拖放到功能區(qū)時,Tableau默認會進行()。

答案:數(shù)值,聚合運算以下()不是Tableau的數(shù)據(jù)類型?

答案:Decimal貝葉斯網(wǎng)絡(luò)中,節(jié)點需給出概率分布描述,對于離散型隨機變量而言,可以用(

)的形式表示。

答案:條件概率表貝葉斯網(wǎng)絡(luò)中的節(jié)點代表(

)。

答案:隨機變量在貝葉斯網(wǎng)絡(luò)編輯界面時,如果節(jié)點的名稱沒法完全顯示,需要從(

)菜單項進行調(diào)整。

答案:Tools|Layout下面關(guān)于PackageManager安裝后的目錄說明不正確的是(

)。

答案:lib子目錄存放包所需要的說明文件神經(jīng)網(wǎng)絡(luò)中的節(jié)點代表(

)。

答案:激勵函數(shù)下面(

)不是反向傳播神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。

答案:計算層下列(

)不是常見的激勵函數(shù)。

答案:正弦函數(shù)WEKA中選擇神經(jīng)網(wǎng)絡(luò)分類器操作時,應(yīng)該選擇(

)。

答案:functions條目下的MultilayerPerceptron分類器貝葉斯網(wǎng)絡(luò)保存的文件格式是(

)。

答案:XMLBIF貝葉斯網(wǎng)絡(luò)中節(jié)點之間的邊代表(

)。

答案:隨機關(guān)系在進行自動選擇屬性時,必須設(shè)立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的(

)。

答案:屬性評估器某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的(

)問題。

答案:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)利用weka軟件進行數(shù)據(jù)可視化時,用戶可以選擇類別屬性對數(shù)據(jù)點著色,如果類別屬性是標稱型,則顯示為彩色條。

答案:錯給定關(guān)聯(lián)規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。

答案:錯以下屬于關(guān)聯(lián)分析的是(

)。

答案:購物籃分析以下屬于屬性空間的搜索方法的是(

)。

答案:BestFirstRanker方法既可以用于單個屬性評估器,又可以用于屬性子集評估器。

答案:錯支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標。

答案:對在weka軟件探索者界面中,利用Visualize標簽頁通過更改各個參數(shù)來進行數(shù)據(jù)集的可視化屬性設(shè)置后,需要單擊以下(

)按鈕,所有更改才會生效。

答案:Update大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下(

)算法直接挖掘。

答案:Apriori關(guān)于Weka的文件類型描述錯誤的是(

)。

答案:Weka可以打開文件格式有.arff、.csv、.xlsx以下(

)不是Weka的數(shù)據(jù)類型。

答案:decimal根據(jù)J48分類器訓(xùn)練weather.nominal.arff所生產(chǎn)的決策樹,當outlook

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論