CPDA考試真題與答案-4_第1頁
CPDA考試真題與答案-4_第2頁
CPDA考試真題與答案-4_第3頁
CPDA考試真題與答案-4_第4頁
CPDA考試真題與答案-4_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一、判斷題1.數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等。正確答案:√2.大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)有著本質(zhì)上的差別,因此之前處理數(shù)據(jù)的方法和軟件都不再適用,大數(shù)據(jù)分析有專用的軟件和方法。正確答案:×3.數(shù)據(jù)分析的核心是數(shù)據(jù),因此數(shù)據(jù)的獲取和處理十分關(guān)鍵。正確答案:×4.Apriori算法可用于分類預算。正確答案:×5.一組數(shù)據(jù)的眾數(shù)和中位數(shù)都是唯一的。正確答案:×6.資金的時間價值體現(xiàn)在資金會隨著時間而增值,如銀行存款會增加利息。正確答案:×7.莖葉圖不僅能夠反映數(shù)據(jù)的分布情況,還能顯示數(shù)據(jù)的原始信息。正確答案:√8.在多元回歸分析中,檢驗方程的擬合優(yōu)度用調(diào)整后的R的平方效果更好。正確答案:√9.在對不同項目進行風險衡量時,可以用標準差作為標準,標準差越大,方案風險水平越高。正確答案:×10.時間序列若無季節(jié)變動,則其各月(季)季節(jié)指數(shù)為0.正確答案:×11.一個硬幣擲10次,其中5次正面向上的概率是0.5。正確答案:×12.DBSCAN算法對異常值敏感,因此要在聚類前進行異常值分析。正確答案:×13.在假設(shè)檢驗中,當我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時,表示原假設(shè)是錯誤的。正確答案:×14.召回率(recall)指預測為正的樣本中實際為正的樣本所占比例。正確答案:×15.邏輯回歸只能用于二分類問題,即輸出只有兩種,分別代表兩個類別。正確答案:×二、單選題1.Apriori算法用下列哪個做項目集(Itemset)的篩選?A、最小信賴度(MinimumConfidence)B、最小支持度(MinimumSupport)C、交易編號(TransactionID)D、購買數(shù)量正確答案:B2.為調(diào)查我國城市女嬰出生體重:北方n1=5385,均數(shù)為3.08kg,標準差為0.53kg;南方n2=4896,均數(shù)為3.10kg,標準差為0.34kg,經(jīng)統(tǒng)計學檢驗,p=0.0034<0.01,這意味著()A、南方和北方女嬰出生體重的差別無統(tǒng)計學意義B、南方和北方女嬰出生體重差別很大C、由于P值太小,南方和北方女嬰出生體重差別無意義D、南方和北方女嬰出生體重差別有統(tǒng)計學意義但無實際意義正確答案:D3.預測分析中將原始數(shù)據(jù)分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集等,其中訓練數(shù)據(jù)集的作用在于()A、用于對模型的效果進行無偏的評估B、用于比較不同模型的預測準確度C、用于構(gòu)造預測模型D、用于選擇模型13.某公司在進行市場調(diào)研,以決定是否推出一款新產(chǎn)品。調(diào)研得出的結(jié)論是:出現(xiàn)有利結(jié)果的概率為60%,出現(xiàn)不利結(jié)果的概率為40%。如果結(jié)果有利,則產(chǎn)品成功的概率為70%;如果結(jié)果不利,則產(chǎn)品失敗的概率會

達到75%。如果產(chǎn)品成功,該公司預期年利潤將達到5000000元;如果產(chǎn)品失敗,該公司每年將損失2000000元。那么,這款新產(chǎn)品的年利潤期望值為()A、1500000元B、1640000元C、2000000元D、2650000元正確答案:B14.在類神經(jīng)網(wǎng)絡(luò)中計算誤差值的目的是()A、調(diào)整隱藏層個數(shù)B、調(diào)整輸入值C、調(diào)整權(quán)重(Weight)D、調(diào)整真實值正確答案:C15.某次英語考試的標準差為5.1分,考慮到這次考試的題目太難,評分時給每位應試者都加了10分,加分后成績的標準差是()A、10B、15.1C、5.1D、信息不足,無法計算。正確答案:C16.下列對C4.5算法的說法中不正確的是()A、每個節(jié)點的分支度只能為2B、使用gainratio作為節(jié)點分割的依據(jù)C、可以處理數(shù)值型態(tài)的字段D、可以處理空值的字段正確答案:A17.根據(jù)下表的混亂矩陣(ConfusionMatrix),可以得出屬性值YES的準確率(Precision)為()18.K-Means聚類法要求自變量之間不存在共線性,是因為()A、變量存在多重共線性時無法得到聚類結(jié)果。B、變量存在多重共線性時無法解釋聚類結(jié)果。C、變量存在多重共線性時,相關(guān)變量會在距離計算中占據(jù)很高的權(quán)重,從而對聚類結(jié)果有負面的影響。D、變量存在多重共線性時,得到的聚類結(jié)果是完全錯誤的。正確答案:C19.在多元回歸模型的檢驗中,目的是檢驗每一個自變量與因變量在指定顯著性水平下是否存在線性相關(guān)關(guān)系的是()A、r檢驗B、t檢驗C、F檢驗D、DW檢驗正確答案:B20.關(guān)于總體下列說法正確的是()A、總體中的單位數(shù)都是有限的B、對于有限總體只能進行全面調(diào)查C、對于無限總體只能進行非全面調(diào)查D、以上都不正確正確答案:C21.某企業(yè)報告期產(chǎn)量比基期增長了15%,生產(chǎn)費用增長了10%,則其產(chǎn)品單位成本降低了()A、33.33%B、95.65%C、5%D、4.35%正確答案:D22.當樣本容量充分大時,樣本估計量充分地靠近總體指標的可能性趨于1,稱為抽樣估計的()A、無偏性B、一致性C、有效性D、充分性正確答案:B23.下列直線回歸方程中,錯誤的是()24.在假設(shè)檢驗問題中,犯第一類錯誤的概率α的意義是()A、在H0不成立的條件下,經(jīng)檢驗H0被拒絕的概率B、在H0不成立的條件下,經(jīng)檢驗H0被接受的概率C、在H0成立的條件下,經(jīng)檢驗H0被拒絕的概率D、在H0成立的條件下,經(jīng)檢驗H0被接受的概率正確答案:C25.方差分析是一個()問題。A、假設(shè)檢驗B、參數(shù)估計C、隨機試驗D、參數(shù)檢驗正確答案:A26.如何以神經(jīng)網(wǎng)絡(luò)仿真邏輯回歸(LogisticRegression)?A、輸入層節(jié)點個數(shù)設(shè)定為2B、輸出層節(jié)點個數(shù)設(shè)定為2C、隱藏層節(jié)點個數(shù)設(shè)定為0D、隱藏層節(jié)點個數(shù)設(shè)定為1正確答案:C27.根據(jù)可決系數(shù)R^2與F統(tǒng)計量的關(guān)系可知,當R^2=1時,有()A、F=0B、F=1C、F=-1D、F=正確答案:D28.關(guān)于邏輯回歸分析(logisticregrssionmodle)說法正確的是()A、邏輯回歸的因變量為數(shù)值變量B、邏輯回歸的因變量為定性變量C、邏輯回歸的自變量是定性變量D、邏輯回歸的因變量只能有兩種取值正確答案:B29.對客戶的生命周期進行分類主要使用以下哪個方法?A、聚類分析B、判別分析C、邏輯回歸D、線性回歸正確答案:A30.在時間序列分析中,一般用循環(huán)變動指數(shù)(C%)來測定循環(huán)波動,()是計算C%的常用方法。A、移動平均法B、移動平均剔除法C、指數(shù)平滑法D、剩余法正確答案:D三、多選題1.用Excel可創(chuàng)建的圖表有()A、二維圖表B、三維圖表C、餅圖D、雷達圖正確答案:ABCD2.直線回歸方程(A、建立前提條件是現(xiàn)象之間具有較密切的線性相關(guān)關(guān)系B、關(guān)鍵在于確定方程中的參數(shù)a和bC、表明兩個相關(guān)變量間的數(shù)量變動關(guān)系D、可用來根據(jù)自變量值推算因變量值,并可進行回歸預測正確答案:ABCD3.箱線圖是用一組數(shù)據(jù)的五個順序統(tǒng)計量來描述數(shù)據(jù)的分布狀況的,這五個統(tǒng)計量是()A、中位數(shù)B、眾數(shù)C、四分位數(shù)D、最值E、算數(shù)平均數(shù)正確答案:ACD4.下列何者是類神經(jīng)網(wǎng)絡(luò)的缺點?A、無法得知最佳解B、模型準確度低C、知識結(jié)構(gòu)是隱性的,缺乏解釋能力D、訓練模型的時間長正確答案:ACD5.對于估計類模型,以下哪些統(tǒng)計量用于評價最合適?A、錯分類率B、極大似然數(shù)C、ROC統(tǒng)計量D、SBC正確答案:BD6.下列說法中不正確的是()A、任何兩個變量都具有相關(guān)關(guān)系B、人的知識與其年齡具有相關(guān)關(guān)系C、散點圖中各點的分散沒有任何規(guī)律D、根據(jù)散點圖求得的回歸直線方程都是有意義的正確答案:ACD7.利潤與現(xiàn)金流量的差異主要表現(xiàn)在()A、購置固定資產(chǎn)付出大量現(xiàn)金時不計入成本B、將固定資產(chǎn)的原值以折舊的形式記入成本時,不需要付出現(xiàn)金C、現(xiàn)金流量一般來說大于利潤D、計算利潤時不考慮墊支的流動資產(chǎn)的數(shù)量和回收的時間正確答案:ABD8.決策樹法分析問題的主要步驟包括()A、結(jié)構(gòu)化問題B、設(shè)計可能結(jié)果發(fā)生的概率C、設(shè)計結(jié)果的得益D、分析問題正確答案:ABCD9.促銷預算的方法主要有()A、量入為出法B、競爭對等法C、銷售比例法D、目標任務(wù)法正確答案:ABCD10.按購買行為細分的消費者市場要考慮消費者()等因素。A、消費者生活方式B、對商品的忠誠程度C、進入市場的程度D、對商品的購買數(shù)量正確答案:BCD11.小王是一個股市投資人,手上持有A、B、C、D、E五只股票,請問以下不屬于時間序列問題的有()A、透過A只股票過去一年來的股價走勢,預測明天A只股票的開盤價格B、將A、B、C、D、E五只股票區(qū)分為賺錢與賠錢兩個類別C、將A、B、C、D、E五只股票區(qū)分為甲、乙、丙三個群體D、透過A,C,D三只股票過去一年來的走勢,預測明天A只股票的開盤價格正確答案:BC12.常見的用于預測Y為分類變量的回歸方法有()A、伽瑪回歸B、泊松回歸C、Logistic回歸D、Probit回歸正確答案:CD13.對樣本進行聚類,通常采用的相似性統(tǒng)計量有()A、絕對距離B、歐式距離C、夾角余弦D、相關(guān)系數(shù)E、切比雪夫距離正確答案:ABE14.方差分析的一般步驟包括()A、建立原假設(shè)和備擇假設(shè)B、選擇顯著性水平C、選擇檢驗統(tǒng)計量D、給出判別準則正確答案:ABCD15.以下屬于機器學習的是()A、監(jiān)督式學習B、非監(jiān)督式學習C、半監(jiān)督式學習D、強化學習正確答案:ABCD16.Apriori算法的計算復雜度受()影響。A、支持度閥值B、項數(shù)(維度)C、事務(wù)數(shù)D、事務(wù)平均寬度正確答案:ABCD17.數(shù)據(jù)清理的目的是處理數(shù)據(jù)中的()A、空缺值B、噪聲數(shù)據(jù)C、不一致數(shù)據(jù)D、敏感數(shù)據(jù)正確答案:ABC18.OLAP系統(tǒng)和OLTP系統(tǒng)的主要區(qū)別包括()A、OLTP系統(tǒng)主要用于管理當前數(shù)據(jù),而OLAP系統(tǒng)主要存放的是歷史數(shù)據(jù)B、在數(shù)據(jù)的存取上,OLTP系統(tǒng)比OLAP系統(tǒng)有著更多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論