版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2024年數(shù)據(jù)分析師LevelII考試題庫
(含答案)
一、單選題
1.將原始數(shù)據(jù)進(jìn)行整合、變換、特征降維、缺失值處理是在以下哪個
步驟的任務(wù)
A、數(shù)據(jù)預(yù)處理
B、數(shù)據(jù)挖掘
C、分類和預(yù)測
D、模式發(fā)掘
參考答案:A
2.問卷測量通??梢詮膽B(tài)度測量、能力測量等角度測試用戶評分,一
般來說態(tài)度測量經(jīng)常使用的量表是哪一類?
A、哥特曼(guttman)量表
B、李克特5點測量量表
C、李克特3點測量量表
D、李克特9點測量量表
參考答案:B
3.假設(shè)我們使用Logistic.回歸模型分析n類分類問題,在這種情況
下,我們可以使用留一法(One-vs-rentmothoD.)。關(guān)于這個問題,下面
哪個選項是正確的
A、我們需要在n類分類問題中擬合n+1個模型
B、我們需要在n類分類問題中擬合1個模型
C、我們需要在n類分類問題中擬合n個模型
D、我們需要在n類分類問題中擬合nT個模型
參考答案:D
4.針對該公式y(tǒng)(t)=3xy(t-1)+2xy(t-3)是()階的時間序列
A、1
B、3
C、2
D、4
參考答案:B
5.在邏輯回歸輸出與目標(biāo)對比的情況下,以下評估指標(biāo)中哪一項不適
用?
A、均方誤差
B、AUC-ROC
C、Logloss
D、準(zhǔn)確度
參考答案:A
6.能夠用于總體估計的是
A、自愿抽樣
B、滾雪球抽樣
C、方便抽樣
D、系統(tǒng)抽樣
參考答案:D
7.某分析師希望通過聚類算法進(jìn)行欺詐分析,發(fā)現(xiàn)結(jié)果不是很理想。
下列方法中哪項不能為聚類效果帶來提升?
A、對變量進(jìn)行主成分分析
B、對變量進(jìn)行變量聚類
C、對變量進(jìn)行分箱處理
D、對變量進(jìn)行標(biāo)準(zhǔn)化
參考答案:C
8.在因子分析中,為了幫助解釋因子,可以使用()
A、因子負(fù)載
B、因子得分
C、因子旋轉(zhuǎn)
D、主成分分析
參考答案:C
9.以下哪種方法可以用于倉析面板數(shù)據(jù)
A、自回歸法(A.R)
B、移動平均值法(MA.)
C、隨機(jī)效應(yīng)法(RM)
D、差分法
參考答案:C
10.多元線性回歸中,檢驗異方差的方法是?
A、如果回歸擬合值與自變量相關(guān)則存在異方差
B、如果回歸殘差與因變量相關(guān)則存在異方差
C、如果回歸因變量與自變量相關(guān)則存在異方差
D、如果回歸殘差與自變量相關(guān)則存在異方差
參考答案:B
11.從兩個總體中獨立選取兩個樣本,兩個總體的方差未知,但是樣本
為大樣本,則兩個總體的平均值之差的估計需要用到
A、正態(tài)分布
B、卡方分布
C、F分布
D、t分布
參考答案:C
12.單因素方差分析中,計算F統(tǒng)計量,其分子與分母的自由度各為
A、r-n,n-r
B、n-r,r-l
C、r,n
D、r-l,n-r
參考答案:D
13.研究性別與是否失眠的相關(guān)性,可以用
A、偏度
B、卡方檢驗
C、F檢驗
D、T檢驗
參考答案:B
14.下面關(guān)于回歸分析,說法錯誤的是?
A、按照自變量和因變量的函數(shù)關(guān)系來分類,可以分為線性回歸分析和
非線性回歸分析
B、非線性回歸問題可以轉(zhuǎn)化為線性回歸
C、線性回歸對異常值不敏感
D、按照自變量和因變量的個數(shù)來分類,可分為一元回歸分析和多元回
歸分析
參考答案:C
15.主成分分析法的主要作用是
A、剔除異常值
B、控制變量
C、正則化
D、降維
參考答案:D
16.在推導(dǎo)線性回歸參數(shù)時,我們會做出以下哪些假設(shè)?(1)因變量y
和預(yù)測變量x之間的真實關(guān)系是線性的;(2)模型的誤差在統(tǒng)計意義
上是獨立的;⑶誤差通常分布是均值為0,且標(biāo)準(zhǔn)差為常數(shù);(4)預(yù)測
變量x是非隨機(jī)的,而且不存在測量誤差
A、1,2,3,4
B、1,2,3
C、1,3,4
D、1,2
參考答案:A
17.以下哪種情境更適合使用線性回歸?
A、考察廣告費對產(chǎn)品銷售量的影響
B、考察目標(biāo)客戶的行為規(guī)則,做出用戶畫像
C、考察五個城市居民的有效收入的差異是否顯著
D、考察哪些客戶最終是否購買產(chǎn)品
參考答案:A
18.以下哪個不是分群標(biāo)簽的用途?
A、服務(wù)于產(chǎn)品和服務(wù)匹配策略
B、定位客戶的需求
C、建立對客戶的洞察
D、解決工作的效率問題
參考答案:D
19.主成分分析的前提條件是各變量之間應(yīng)該滿足
A、低度相關(guān)
B、相互獨立
C、完全相關(guān)
D、高度相關(guān)
參考答案:A
20.某電商的年銷售量呈現(xiàn)Xt=0.72Xt-l+0.81Xt-2+et,則xt為()
A、ARIMA(n,m)
B、AR(n)
C、MA(m)
D、ARMA(n,m)
參考答案:B
21.用戶分層是在用戶管理時最常被使用的標(biāo)簽類型,其中RFM模型
是指()
A、投入、效率、產(chǎn)出
B、成交率、客流、客單價
C、首次購買時間、消費頻率、消費金額
D、最近購買時間、消費頻次、消費金額
參考答案:D
22.在方差分析中,多重比較的目的是通過配對比較來進(jìn)一步檢驗
A、哪兩個樣本均值之間有差異
B、哪兩個樣本方差之間有差異
C、哪兩個總體方差之間有差異
D、哪兩個總體均值之間有差異
參考答案:D
23.以下哪個不屬于根據(jù)麥肯錫問題分析方法中的分類:
A、問題解決型問題
B、追求理想型問題
C、恢復(fù)原狀型問題
D、防范潛在型問題
參考答案:A
24.時間序列MA(q)模型,其中q指的是()
A、時間序列的偏自相關(guān)系數(shù)是q階截尾的
B、時間序列的自相關(guān)系數(shù)是q階拖尾的
C、時間序列的偏自相關(guān)系數(shù)是q階拖尾的
D、時間序列的自相關(guān)系數(shù)是q階截尾的
參考答案:D
25.為了估計北京市使用華為品牌手機(jī)的市場占有率,在收集數(shù)據(jù)時,
最有可能采用的數(shù)據(jù)搜集方法是?
A、方便抽樣
B、配額抽樣
C、實驗
D、隨機(jī)抽樣
參考答案:D
26.以下哪個不屬于根據(jù)麥肯錫問題分析方法中的分類:
A、恢復(fù)原狀型問題
B、防范潛在型問題
C、問題解決型問題
D、追求理想型問題
參考答案:C
27.回歸模型猶如一列火車,引擎牽引的列車節(jié)箱數(shù)受速度、動力等因
素所限,并不能無限增加,否則這列火車會存在安全隱患,回歸也存在
這類由維度(列車節(jié)箱)所引起的安全問題,因此,在數(shù)據(jù)挖掘的場景
中,認(rèn)為自變量的維度最好不要超出15個,那么控制自變量個數(shù)的方
法主要是哪種?
A、因子分析
B、卡方分析
C、方差分析
D、相關(guān)分析
參考答案:A
28.關(guān)于K-MeA.ns算法,正確的描述是?
A、不能使用核函數(shù)
B、能找到任意形狀的聚類
C、初始值不同,最終結(jié)果可能不同
D、每次迭代的時間復(fù)雜度是0(n2),其中n是樣本數(shù)量
參考答案:C
29.一個一元線性回歸模型的判定系數(shù)R2=0.8,那么下列解釋中錯誤
的是()
A、在訓(xùn)練集中,因變量的估計精度上限為80%
B、自變量與因變量之間有著較強(qiáng)的線性關(guān)系
C、在因變量的變動中有80%是由自變量所決定的
D、因變量的變差中有80%的概率可以由自變量與因變量之間的線性
關(guān)系來解釋
參考答案:A
30.多元線性回歸中F檢驗的原假設(shè)是
A、所有回歸系數(shù)都等于預(yù)估值
B、所有回歸系數(shù)都不等于預(yù)估值
C、所有回歸系數(shù)都不等于0
D、所有回歸系數(shù)都等于0
參考答案:D
31.以下哪種方法可以用于分析面板數(shù)據(jù)
A、自回歸法(AR)
B、差分法
C、隨機(jī)效應(yīng)法(RM)
D、移動平均值法(MA)
參考答案:C
32.以下關(guān)于一元線性回歸分析y=bo+bix+s描述錯誤的是?
A、一元線性回歸中F檢驗的檢驗統(tǒng)計量與t檢驗是一致的
B、若用于預(yù)測的x數(shù)值與樣本中的自變量偏差很大,那么預(yù)測得到y(tǒng)
的可靠性也會降低
C、即便建立了一元線性回歸,也不能直接認(rèn)為x是y的原因
D、一元線性回歸中F檢驗的作用與t檢驗是一致的
參考答案:A
33.假設(shè)我們使用Logistic回歸模型分析類分類問題。在這種情況下,
我們可以使用留一法(One-vs-restmethod).關(guān)于這個問題,下面哪個
選項是正確的
A、我們需要在n類分類問題中擬合1個模型
B、我們需要在n類分類問題中擬合nT個模型
C、我們需要在n類分類問題中擬合n+1個模型
D、我們需要在n類分類問題中擬合n個模型
參考答案:B
34.對于一元線性回歸,回歸系數(shù)顯著性檢驗需要用到
A、Z檢驗
B、t檢驗
C、卡方檢驗
D、F檢驗
參考答案:B
35.有一款產(chǎn)品的重量標(biāo)準(zhǔn)為10克,現(xiàn)在分別用A和B兩個廠家來生
產(chǎn)這一產(chǎn)品,分別各隨機(jī)抽取50個樣品,A廠生產(chǎn)的樣本重量的標(biāo)準(zhǔn)
差為
0.01,B廠生產(chǎn)的樣本重量的標(biāo)準(zhǔn)差為
0.1,現(xiàn)在需要比較兩家廣商在產(chǎn)品重量指標(biāo)是否有顯著差異,我們應(yīng)
該選擇
A、單側(cè)t檢驗
B、雙側(cè)t檢驗
C、單側(cè)F檢驗
D、雙側(cè)F檢驗
參考答案:B
36.應(yīng)用回歸分析應(yīng)注意的問題,下面說法錯誤的是?
A、回歸分析的自變量選取要符合業(yè)務(wù)需要,選擇合適的數(shù)據(jù)資料
B、回歸分析的自變量必須是連續(xù)型數(shù)據(jù)
C、應(yīng)用回歸分析時,要注意時間窗口的一致性
D、因為回歸分析是研究自變量與因變量的因果關(guān)系,所以要注意孰因
孰果
參考答案:B
37.在進(jìn)行多元線性回歸分析時,對于變量較多的情況下,可以選擇變
量篩選方法,下列不正確的是
A、交叉驗證法
B、向后剔除法
C、向前選擇法
D、逐步法
參考答案:A
38.回歸分析中定義的
A、解釋變量和被解釋變量都為非隨機(jī)變量
B、解釋變量為非隨機(jī)變量,被解釋變量為隨機(jī)變量
C、解釋變量和被解釋變量都是隨機(jī)變量
D、解釋變量為隨機(jī)變量,被解釋變量為非隨機(jī)變量
參考答案:B
39.若線性規(guī)劃問題沒有可行解,可行解集是空集,則此問題()
A、沒有無界解
B、沒有無窮多最優(yōu)解
C、有無界解
D、沒有最優(yōu)解
參考答案:D
40.主成分分析的前提條件是各變量之間應(yīng)該滿足
A、低度相關(guān)
B、完全相關(guān)
C、相互獨立
D、高度相關(guān)
參考答案:A
41.在時間序列分析中,指數(shù)平滑法的平滑系數(shù)
A.的取值
A、越小越好
B、取值范圍在T到1之間
C、取值范圍在0到1之間
D、越大越好
參考答案:C
42.以下關(guān)于系統(tǒng)聚類的描述中,錯誤的是()
A、系統(tǒng)聚類也叫層次聚類
B、系統(tǒng)聚類適用于數(shù)據(jù)量非常大或者變量非常多的項目
C、系統(tǒng)聚類法通常分為自底向上和自頂向下
D、系統(tǒng)聚類的過程非常清楚,會形成類似樹狀的聚類圖譜,便于理解
和檢查
參考答案:B
43.下列關(guān)于主成分分析的表述不正確的有()
A、所確定的幾個主成分之間是高度相關(guān)的
B、所確定的幾個主成分之間是互不相關(guān)的
C、使用主成分分析方法的前提是原來的多個指標(biāo)之間是相關(guān)的
D、主成分分析的目的是尋找少數(shù)幾個主成分代表原來的多個指標(biāo)
參考答案:A
44.在系統(tǒng)聚類中,我們需要定義兩個類之間的距離,下列哪種方法能
夠緩解異常值對計算距離造成的影響?
A、離差平方和法
B、最短距離法
C、最長距離法
D、以上都不是
參考答案:A
45.多元線性回歸中,檢驗異方差的方法是?
A、如果回歸擬合值與自變量相關(guān)則存在異方差
B、如果回歸殘差與因變量相關(guān)則存在異方差
C、如果回歸殘差與自變量相關(guān)則存在異方差
D、如果回歸因變量與自變量相關(guān)則存在異方差
參考答案:C
46.多元線性回歸中檢驗的原假設(shè)是
A、對應(yīng)單個回歸系數(shù)等于0
B、對應(yīng)單個回歸系數(shù)不等于0
C、對應(yīng)單個回歸系數(shù)等于預(yù)估值
D、對應(yīng)單個回歸系數(shù)不等于預(yù)估值
參考答案:A
47.如果時間序列的各期增長量相等,
A、各期環(huán)比增長速度有升有降
B、環(huán)比增長速度逐期上升
C、各期的環(huán)比增長速度保持不變
D、環(huán)比增長速度逐期下降
參考答案:D
48.某電商的年銷售量呈現(xiàn)Xt=O.72Xt-l+0.81Xt-et,則xt為()
A、RIMA(n,m)
B、MA(m)
C、ARMA(n,m)
D、AR(n)
參考答案:D
49.方差分析的主要目的是判斷()
A、各樣本數(shù)據(jù)之間是否有顯著差異
B、分類型因變量對數(shù)值型自變量的影響是否顯著
C、分類型自變量對數(shù)值型因變量的影響是否顯著
D、各總體是否存在方差
參考答案:C
50.下面關(guān)于選擇何種機(jī)器學(xué)習(xí)建損思路,說法錯誤的是?
A、當(dāng)需要獲得特征與目標(biāo)間的關(guān)系時,需建立有監(jiān)督模型
B、當(dāng)需要獲得特征與特征間的關(guān)系時,需建立無監(jiān)督模型
C、在反欺詐領(lǐng)域,當(dāng)沒有反欺詐人群時,可用有監(jiān)督模型來識別用戶
D、在反欺詐領(lǐng)域,當(dāng)已知有欺詐觀測時,可用有監(jiān)督模型來識別用戶
參考答案:C
51.針對字段〃用戶姓名”,下列方法最適宜的是()
A、需要編碼為分類變量
B、需要編碼為數(shù)值變量
C、需要編碼為二分變量
D、需要編碼為字符變量
參考答案:D
52.研究職業(yè)與收入的相關(guān)性可以使用
A、F檢驗
B、方差分析
C、t檢驗
D、皮爾遜相關(guān)系數(shù)
參考答案:C
53.市場調(diào)查主要用于解決的問題是以下哪一類?
A、關(guān)聯(lián)問題
B、歸因問題
C、預(yù)測問題
D、細(xì)分問題
參考答案:D
54.績效考核問題中,不合理項的選擇是多選項,如果并不強(qiáng)調(diào)擇的個
數(shù),而強(qiáng)調(diào)選擇的題項,則使用的多選題編碼方式為?如下圖:項所示:
A、與項的設(shè)置相同
B、多重響應(yīng)的多分法
C、多重響應(yīng)的二分法
D、與開放題項的設(shè)置相同
參考答案:B
55.下面關(guān)于關(guān)系型數(shù)據(jù)庫描述錯誤的是?
A、RDBMS指的是關(guān)系型數(shù)據(jù)庫管理系統(tǒng),RDBMS中的數(shù)據(jù)存儲在被稱
為表(tables)的數(shù)據(jù)庫對象中
B、所有數(shù)據(jù)庫系統(tǒng)均要求在每條SQL命令的末端使用分號,否則會運
行報錯
C、SQL語言對大小寫不敏感
D、SQL是指結(jié)構(gòu)化查詢語句,是一種ANS的標(biāo)準(zhǔn)計算機(jī)語言
參考答案:B
56.以下哪個不屬于標(biāo)簽加工方式區(qū)分的分類?
A、行為標(biāo)簽
B、統(tǒng)計標(biāo)簽
C、模型標(biāo)簽
D、基礎(chǔ)標(biāo)簽
參考答案:A
57.建立模型,拆分?jǐn)?shù)據(jù)集為訓(xùn)練集和測試集的一般比例為?
A、5:5
B、7:3
C、9:1
D、6:4
參考答案:B
58.關(guān)于邏輯回歸分析說法正確的是
A、邏輯回歸中的因變量和自變量均為分類變量
B、邏輯回歸中因變量為分類變量
C、邏輯回歸中自變量為分類變量
D、邏輯回歸中,因變量和自變量均為連續(xù)型變量
參考答案:B
59.下列哪項不是主成分分析的推薦應(yīng)用?
A、作為線性回歸的替代算法:對于大多數(shù)學(xué)習(xí)應(yīng)用,主成分分析和線
性回歸給出了基本相似的結(jié)果
B、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),并用于監(jiān)督學(xué)習(xí)算法,能夠使監(jiān)督
學(xué)習(xí)算法運行得更快
C、數(shù)據(jù)可視化,減少輸入數(shù)據(jù)的維數(shù),能夠?qū)?shù)據(jù)在2D平面中進(jìn)行繪
制
D、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),使得數(shù)據(jù)占用更少的內(nèi)存/磁盤空
間
參考答案:A
60.關(guān)于用戶畫像的說法錯誤的是()
A、用戶標(biāo)簽必須描述客觀的事實
B、用戶畫像本質(zhì)上是應(yīng)用用戶標(biāo)簽做客群定位
C、用戶畫像的標(biāo)簽分為定量標(biāo)簽和定性標(biāo)簽
D、用戶畫像的應(yīng)用場景有:產(chǎn)品設(shè)計,營銷推薦,風(fēng)險控制等
參考答案:A
61.總體方差未知情形下,進(jìn)行兩個總體均值差的假設(shè)檢驗,首先會判
別
A、總體均值是否相等
B、樣本均值是否相等
C、總體方差是否相等
D、樣本方差是否相等
參考答案:C
62.在方差分析中,多重比較的目的是通過配對比較來進(jìn)一步檢驗()
A、哪兩個樣本方差之間有差異
B、哪兩個樣本均值之間有差異
C、哪兩個總體方差之間有差異
D、哪兩個總體均值之間有差異
參考答案:D
63.多元線性回歸y=b0+blxl+b2x2...+bnxn+8進(jìn)行線性關(guān)系檢驗時,
原假設(shè)是?
A、bo=bl=bn=0
B、bl=...=bn-0
C、bl..,bn中存在任意一個不為0
D、bO,bl..bn中存在任意一個不為0
參考答案:B
64.若你獲得數(shù)據(jù)分析需求,需要分析同一客群,產(chǎn)品改造對客戶是否
滿意是否有顯著差異,你可以使用什么方法?
A、單樣本T檢驗
B、獨立樣本T檢驗
C、配對樣本T檢驗
D、卡方檢驗
參考答案:C
65.下列對K-means聚類算法解釋正確的是()
A、不能自動識別類的個數(shù),隨機(jī)挑選初始點為中心點計算
B、能自動識別類的個數(shù),不是隨機(jī)挑選初始點為中心點計算
C、不能自動識別類的個數(shù),不是隨機(jī)挑選初始點為中心點計算
D、能自動識別類的個數(shù),隨機(jī)挑選初始點為中心點計算
參考答案:A
66.針對5WHY,以下表述不正確的是
A、只是單純地把Why重復(fù)5次以上是行不通的
B、隨著問為什么的推進(jìn),內(nèi)容必須變得更加具體、詳細(xì)
C、要避免一切抽象、模糊的表達(dá)方式
D、5W就是要思考5個為什么
參考答案:D
67.在一次年級考試中隨機(jī)抽取100名學(xué)生,并將數(shù)學(xué)成績分成五
段:50-69,70-89,90To9,110T29130T50它的頻率分布直方圖如下,
則該批學(xué)生中成績不低于90的人數(shù)是?
A、70
B、65
C、80
D、90
參考答案:B
68.對A.,B.兩個總體方差比進(jìn)行區(qū)間估計,在95%置信水平下,得到
的置信區(qū)間是(0.6,0.9),以下敘述正確的是()
A、如果希望降低估計誤差,可以增加樣本量
B、總體方差比應(yīng)該等于0.65
C、(0.6,0.9)覆蓋了總體方差比
D、提高置信水平,可以使得區(qū)間變小
參考答案:A
69.在系統(tǒng)聚類中R2是指()
A、組內(nèi)離差平方和除以組間離差平方和
B、組間均方除以總均方
C、組間離差平方和除以總離差平方和
D、組間離差平方和除以組內(nèi)離差平方和
參考答案:C
70.標(biāo)準(zhǔn)化殘差圖主要用于直觀地判斷
A、回歸模型的線性關(guān)系是否顯著
B、誤差項等方差的假定是否成立
C、誤差項服從正態(tài)分布的假定是否成立
D、回歸系數(shù)是否顯著
參考答案:C
71.變量之間的關(guān)系可以分為兩大類
A、函數(shù)關(guān)系與相關(guān)關(guān)系
B、簡單相關(guān)關(guān)系和復(fù)雜相關(guān)關(guān)系
C、線性相關(guān)關(guān)系和非線性相關(guān)關(guān)系
D、正相關(guān)關(guān)系和負(fù)相關(guān)關(guān)系
參考答案:A
72.關(guān)于K-means聚類算法的特點,下列說法錯誤的是()
A、K-means對于噪聲比較敏感
B、當(dāng)處理較大數(shù)據(jù)集時,無法保持可伸縮性和高效率
C、不能對變量進(jìn)行聚類
D、當(dāng)簇近似為正態(tài)分布時,效果較好
參考答案:C
73.在管理類魚骨圖中,“人”的因素一般放在哪個層次上?
A、大要因
B、中要因
C、孫要因
D、小要因
參考答案:A
74.用于描述數(shù)據(jù)的數(shù)據(jù)或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)的是?
A、主數(shù)據(jù)
B、元數(shù)據(jù)
C、數(shù)據(jù)元
D、交易數(shù)據(jù)
參考答案:B
75.當(dāng)一元線性回歸模型的殘差出現(xiàn)異方差時,可以嘗試哪項工作0
A、自變量做歸一化處理
B、對自變量做非線性變換
C、對因變量做線性變換
D、對自變量做線性變換
參考答案:B
76.某學(xué)校組織投籃比賽,在預(yù)賽中每個同學(xué)需要投籃100次,成績前
50%的將進(jìn)入決賽,現(xiàn)在小明一共投中了48次,他希望評估自己是否
有希望參加決賽,因此將他的成績與全校成績的0進(jìn)行比較是最合理
的。
A、平均數(shù)
B、中位數(shù)
C、眾數(shù)
D、四分位差
參考答案:B
77.正態(tài)曲線下,從均數(shù)到+0。的面積為
A、0.95
B、0.35
C、不確定,和標(biāo)準(zhǔn)差有關(guān)
D、0.5
參考答案:D
78.如果我們拿到一份數(shù)據(jù),直接對這組數(shù)據(jù)建模型肯定會造成一系
列的問題,因此是需要進(jìn)行預(yù)分析,而關(guān)于預(yù)分析描述錯誤的是?
A、數(shù)據(jù)維度本身比較多,容易產(chǎn)生高維災(zāi)難問題,因此需要進(jìn)行降維
B、數(shù)據(jù)可能會受到各種干擾,因此會產(chǎn)生各種誤差,需要進(jìn)行數(shù)據(jù)清
理
C、統(tǒng)計模型有很多假設(shè),這些假設(shè)需要滿足,因此需要做統(tǒng)計上的準(zhǔn)
備工作
D、統(tǒng)計模型有固定的數(shù)據(jù)清理流程,不建議改變
參考答案:D
79.下面關(guān)于主成分分析,說法錯誤的是?
A、將大量相關(guān)變量轉(zhuǎn)化成一組很少的不相關(guān)變量,這些無關(guān)變量稱為
主成分
B、主成分分析是一種數(shù)據(jù)降維技術(shù),能夠過濾掉不相關(guān)變量
C、主成分是變量的線性組合
D、使用P
C.A.可將30個相關(guān)的變量轉(zhuǎn)化為5個無關(guān)的變量,并且盡可能地保
留原始數(shù)據(jù)集的信息
參考答案:B
80.當(dāng)我們對一份數(shù)據(jù)進(jìn)行建模分析時,如果出現(xiàn)數(shù)據(jù)集變量數(shù)較多,
而對應(yīng)的樣本數(shù)相對較少的情況,下列哪種處理方法不能提升被型的
適用性:
A、主成分分析
B、樣本聚類
C、增加樣本量
D、變量聚類
參考答案:B
81.在二元線性回歸模型Yi=B.0+B.IXu+B.2X2i+ui中,B.1表示
A、當(dāng)xl不變時,x2每變動一個單位Y的平均變動
B、當(dāng)xl和x2都保持不變時,Y的平均變動
C、當(dāng)x2不變時,xl每變動一個單位Y的平均變動
D、當(dāng)xl和x2都變動一個單位時,Y的平均變動
參考答案:C
82.時間序列M
A.(q)模型,其中q指的是()
A、時間序列的偏自相關(guān)系數(shù)是q階拖尾的
B、時間序列的自相關(guān)系數(shù)是q階截尾的
C、時間序列的偏自相關(guān)系數(shù)是q階截尾的
D、時間序列的自相關(guān)系數(shù)是q階拖尾的
參考答案:B
83.以下關(guān)于一元線性回歸分析y=B.o+B.ix+描述錯誤的是?
A、一元線性回歸中F檢驗的作用與t檢驗是一致的
B、一元線性回歸中F檢驗的檢驗統(tǒng)計量與t檢驗是一致的
C、若用于預(yù)測的x數(shù)值與樣本中的自變量偏差很大,那么預(yù)測得到y(tǒng)
的可靠性也會降低
D、即便建立了一元線性回歸,也不能直接認(rèn)為x是y的原因
參考答案:B
84.若想要對一個電商企業(yè)的產(chǎn)品銷售狀況和銷售趨勢進(jìn)行數(shù)據(jù)可視
化,最佳的圖表表示方式為()
A、直方圖
B、條形圖和趨勢線組合圖
C、餅圖
D、氣泡圖
參考答案:B
85.如果x和Y在統(tǒng)計上獨立,則相關(guān)系數(shù)等于
A、0
B、00
C、-1
D、1
參考答案:A
86.以下哪個不是分群標(biāo)簽的用途?
A、定位客戶的需求
B、解決工作的效率問題
C、建立對客戶的洞察
D、服務(wù)于產(chǎn)品和服務(wù)匹配策略
參考答案:B
87.K-MeA.ns聚類法要求自變量之間不存在共線性的原因是()
A、變量存在多重共線性時無法解釋聚類結(jié)果
B、變量存在多重共線性時無法得到聚類結(jié)果
C、變量存在多重共線性時,得到的聚類結(jié)果是完全錯誤的
D、變量存在多重共線性時,相關(guān)變量會在距高計算中占據(jù)高的權(quán)重,
從而對聚類結(jié)果有負(fù)面的影響
參考答案:D
88.線性規(guī)劃問題若有最優(yōu)解,則一定可以在可行域的()上達(dá)到
A、內(nèi)點
B、外點
C、幾何點
D、頂點
參考答案:D
89.在方差分析中,檢驗統(tǒng)計量F是?
A、組間均方除以組內(nèi)均方
B、組間平方除以總平方和
C、組間平方和除以組內(nèi)平方和
D、組間均方除以總均方
參考答案:A
90.在方差分析中,檢驗統(tǒng)計量F是
A、組間均方除以總均方
B、組間均方除以組內(nèi)均方
C、組間平方除以總平方和
D、組間平方和除以組內(nèi)平方和
參考答案:B
91.對于因子分析說法錯誤的是
A、因子載荷絕對值越大代表相應(yīng)的公共因子表達(dá)變量的信息越少
B、所有公共因子的因子載荷和隨機(jī)因子的平方和越接近1,則說明因
子分析的效果越好
C、公共因子的方差貢獻(xiàn),即在所有變量中該公共因子的因子載荷的平
方和,可以衡量公共因子能提供多少信息
D、因子分析和主成分分析一樣,都是一種降維的統(tǒng)計方法
參考答案:A
92.對于邏輯回歸和SVM算法說法中不正確的是()
A、邏輯回歸可以用于預(yù)測事件發(fā)生概率的大小
B、SVM可以有效避免模型過擬合
C、邏輯回歸的目標(biāo)是最小化后驗概率
D、SVM的目標(biāo)是最小化結(jié)構(gòu)風(fēng)險
參考答案:C
93.關(guān)于系統(tǒng)聚類,下列說法正確的是?
A、系統(tǒng)聚類之前需要先給出各個類別的初始類中心
B、系統(tǒng)聚類之后,模型能給出唯一的分類別數(shù)量
C、系統(tǒng)聚類之后,類別數(shù)量需要參考聚類過程給出
D、系統(tǒng)聚類之前需要先給出聚類的數(shù)量
參考答案:C
94.下列哪項不是主成分分析的推薦應(yīng)用?
A、數(shù)據(jù)可視化:減少輸入數(shù)據(jù)的維數(shù),能夠?qū)?shù)據(jù)在2D.平面中進(jìn)行
繪制
B、作為線性回歸的替代算法,對于大多數(shù)學(xué)習(xí)應(yīng)用,主成分分析和線
性回歸給出了基本相似的結(jié)果
C、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),使得數(shù)據(jù)占用更少的內(nèi)存/磁盤空
間
D、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),并用于監(jiān)督學(xué)習(xí)算法,能夠使監(jiān)督
學(xué)習(xí)算法運行得更快
參考答案:B
95.針對字段〃用戶姓名”,下列方法最適宜的是?
A、需要編碼為數(shù)值變量
B、需要編碼為二分變量
C、需要編碼為分類變量
D、需要編碼為字符變量
參考答案:D
96.以下哪類不屬于分層標(biāo)簽?
A、RFM
B、VIP客戶級別
C、生命周期階段
D、家庭狀態(tài)
參考答案:D
97.線性規(guī)劃模型不包括下列()要素
A、約束條件
B、決策變量
C、目標(biāo)函數(shù)
D、狀態(tài)變量
參考答案:D
98.在對某個多元線性回歸模型的分析中,如果某自變量的VIF=1,這
說明()
A、此多元回歸模型的R2=0
B、此模型存在非常嚴(yán)重的共線性
C、此自變量與因變量不存在線性相關(guān)性
D、此自變量與其他自變量不存在線性相關(guān)性
參考答案:D
99.在因子分析中,為了幫助解釋因子,可以使用0
A、因子負(fù)載
B、主成分分析
C、因子旋轉(zhuǎn)
D、因子得分
參考答案:C
100.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們
的決定系數(shù)R方如下,其中擬合效果最好的模型是()
A、R方=0.98
B、R方=0.50
C、R方=0.25
D、R方=0.80
參考答案:A
101.已知某一元線性回歸模型的判定系數(shù)R2=0.64,則自變量與因變
量之間的相關(guān)系數(shù)為()
A、0.6
B、1.0
C、0.8
D、0.4
參考答案:C
102.某手機(jī)生產(chǎn)商希望研發(fā)一款新型的手機(jī)及配置選項,需要對全國
的目標(biāo)用戶進(jìn)行調(diào)研,項目時間為一個月,經(jīng)費20萬,請問此時使用
哪種調(diào)研方式比較合適?
A、問卷調(diào)查6000人
B、定性訪談20人+問卷調(diào)查300人
C、定性訪談500人
D、定性訪談200人+問卷調(diào)查200人
參考答案:B
103.問題理解階段事件還原工具是哪個?
A、關(guān)鍵事件
B、雷達(dá)圖
C、績效矩陣或嚴(yán)重度評估矩陣
D、流程圖
參考答案:D
104.市場調(diào)研的量表中,量表中所表示的只能是差距關(guān)系和順序關(guān)系,
不具備真正的零點的量表是?
A、順序量表
B、等距量表
C、類別量表
D、等比量表
參考答案:B
105.已知某公司的廣告投入和銷售業(yè)績復(fù)合y=564.23+0.59x(單位:
萬)的形式,下面說法正確的是?
A、投入產(chǎn)出比大于1
B、投入產(chǎn)出比小于1
C、若廣告每投入1萬元,銷售業(yè)績增加59萬元
D、如果沒有廣告投入,銷售業(yè)績?yōu)?64.23百萬元
參考答案:B
106.有關(guān)根因分析下列說法不正確的是?
A、異常事件嚴(yán)重度評估準(zhǔn)則可以用理解問題
B、根因分析最后一步是提出改善措施,消除根原因
C、頭腦風(fēng)暴法常用于找到問題最可能的原因
D、只能用5WHY分析法確定根原因
參考答案:D
107.當(dāng)我們對一份數(shù)據(jù)進(jìn)行建模分析時,如果出現(xiàn)數(shù)據(jù)集變較多,而
對應(yīng)的樣本數(shù)相對較少的情況,下列哪種處理方法不能提升模型的適
用性
A、變量聚類
B、增加樣本量
C、主成分分析
D、樣本聚類
參考答案:D
108.關(guān)于主成分分析的特點,理解錯誤的是
A、前幾個主成分的變異無法解釋原多元數(shù)據(jù)中的所有變異
B、如果原始變量不相關(guān),即協(xié)方差為0,則不需要做主成分分析
C、有多少個變量就會有多少個正交的主成分
D、主成分的變異之和等于原始變量的所有變異
參考答案:C
109.在建立線性回歸模型時,因變量與自變量之間非線性相關(guān),以下
做法正確的是?
A、剔除掉自變量的高杠桿點
B、對自變量進(jìn)行變量變換
C、剔除掉自變量的離群點
D、對因變量進(jìn)行變量變換
參考答案:B
110.關(guān)于混淆矩陣,下面說法錯誤的是?
A、預(yù)測為真,實際為假,標(biāo)記為FN(FA.IseNegA.tive)
B、召回度(reC.A.11)計算公式為TP/(TP+FN),表示真實為真中有多
少被預(yù)測正確
C、預(yù)測為真,實際為真,標(biāo)記為TP(TruePositive)
D、精準(zhǔn)度(precision)計算公式為TP/(TP+FP),表示預(yù)測為真中有
多少真實為真
參考答案:A
111.關(guān)于K-Means算法,正確的描述是
A、不能使用核函數(shù)
B、每次選代的時間復(fù)雜度是0(n2),其中n是樣本數(shù)量
C、能找到任意形狀的聚類
D、初始值不同,最終結(jié)果可能不同
參考答案:D
112.線性規(guī)劃問題是針對()求極值問題
A、約束
B、秩
C、目標(biāo)函數(shù)
D、決策變量
參考答案:C
113.在線性回歸分析中,當(dāng)發(fā)現(xiàn)自變量之間相關(guān)性較強(qiáng)時,可以采用
A、Lasso回歸
B、廣義線性回歸
C、非線性回歸
D、邏輯回歸
參考答案:A
114.在方差分析中,數(shù)據(jù)的誤差是用平方和來表示的。其中反映一個
各觀測值誤差大小的平方和稱為
A、水平項平方和
B、總平方和
C、組間平方和
D、組內(nèi)平方和
參考答案:D
115.樣本預(yù)設(shè)分類的情況下,通過樣本的現(xiàn)有特征對樣本進(jìn)行分類的
方法稱為()
A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
B、分類分析
C、描述性分析
D、聚類分析
參考答案:B
116.某客戶為欺詐的概率為0.6,則優(yōu)勢比為?
A、0.6
B、1.5
C、0.085416667
D、0.4
參考答案:B
117.線性規(guī)劃問題是針對()求極值問題
A、秩
B、目標(biāo)函數(shù)
C、約束
D、決策變量
參考答案:B
118.基于對未來的預(yù)測和在可選策略集上得到的行動方案,稱為
A、策略
B、信息
C、數(shù)據(jù)
D、知識
參考答案:A
119.以下說法不正確的是?
A、魚骨圖不只用于根原因定位,還用于分析對策
B、因果圖包括傳統(tǒng)魚骨圖和過程圖,但是都是以魚骨圖的形式體現(xiàn)的
C、對策型的魚骨圖魚頭在右,特性值通常以“如何提高?〃來寫
D、原因型魚骨圖的魚頭在右,特性值通常以“為什么?”來寫
參考答案:C
120.在數(shù)據(jù)庫設(shè)計的需求分析階段,一般采用()表示業(yè)務(wù)流程分析的
結(jié)果
A、數(shù)據(jù)流圖
B、程序結(jié)構(gòu)圖
C、E-R圖
D、程序框圖
參考答案:A
121.某商店為了計算商品的熱銷程度,可以通過計算商品的
A、偏度
B、平均數(shù)
C、眾數(shù)
D、加權(quán)平均數(shù)
參考答案:A
122.全國性大規(guī)模調(diào)查,通常需要多種抽樣方法,而多段集群抽樣
(muti-stageclustersampling)提供了多種整合技術(shù),據(jù)此說法正確
的是?
A、是指在第一個階段先抽出一部分集群,然后在下一階段選中的集群
中,再抽出一部分集群,到最后階段再抽取若干基本單元(最小單位)
B、大規(guī)模抽樣最多使用到兩階段抽樣,因為誤差無法控制
C、抽樣階段每增加一級,其抽樣誤差不變,因此最終對總體的估計與
簡單抽樣相同
D、如果是全國性調(diào)查的多段集群抽樣,其最小單元只能是行政區(qū)塊村,
不能是個人
參考答案:A
123.關(guān)于相關(guān)關(guān)系,下面說法正確的是?
A、相關(guān)關(guān)系必是因果關(guān)系,因果關(guān)系不一定是相關(guān)關(guān)系
B、完全不相關(guān)時,相關(guān)系數(shù)為0
C、從相關(guān)程度分為強(qiáng)相關(guān)和弱相關(guān)
D、相關(guān)關(guān)系按照方向分為線性相關(guān)和非線性相關(guān)
參考答案:B
124.5WHY分析法又被稱為
A、矩陣分析法
B、因果分析法
C、頭腦風(fēng)暴法
D、五問分析法
參考答案:D
125.在魚骨圖分析中,以下哪個是正確的?
A、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在大要因?qū)用?/p>
B、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在小要因?qū)用?/p>
C、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在中要因?qū)用?/p>
D、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在最未端原因
參考答案:D
126.根原因消除工具不包括哪個?
A、六項思考帽
B、價值樹模型
C、系統(tǒng)發(fā)明思想
D、創(chuàng)造性解決問題理論
參考答案:B
127.據(jù)研究發(fā)現(xiàn),身高服從正態(tài)分布。則在一次抽樣中,取到的身高小
于等于中位數(shù)的概率為()
A、0.05
B、小于50%
C、大于50%
D、0.5
參考答案:D
128.方差分析表中用于檢驗總體模型假設(shè)的統(tǒng)計量是()
A、F
B、SSE
C、SST
D、SSM
參考答案:A
129.當(dāng)時間序列的環(huán)比增長速度大體相同時,適宜擬合
A、直線
B、對數(shù)曲線
C、拋物線
D、指數(shù)曲線
參考答案:A
130.如果時間序列的各期增長量相等,則
A、各期的環(huán)比增長速度保持不變
B、環(huán)比增長速度逐期上升
C、環(huán)比增長速度逐期下降
D、各期環(huán)比增長速度有升有降
參考答案:C
131.研究性別與是否抽煙的相關(guān)性,可以用
A、卡方檢驗
B、皮爾遜相關(guān)系數(shù)
C、方差分析
D、t檢驗
參考答案:A
132.在假設(shè)檢驗問題中,原假設(shè)為H0,給定顯著水平為a,則正確的是
0
A、P(接受HO|HO正確)=a
B、P(接受HO|HO不正確)=『a
C、P(拒絕HO|HO正確)=a
D、P(拒絕HO|HO不正確)=1-a
參考答案:C
133.5WHY分析法又被稱為
A、矩陣分析法
B、頭腦風(fēng)景法
C、因果分析法
D、五問分析法
參考答案:D
134.相比獲得全市員工名單而言,獲取全市的企業(yè)名單會容易的多,
并以企業(yè)為單位隨機(jī)抽樣,重點調(diào)查某個企業(yè),這樣可以節(jié)省調(diào)研成
本,請問這是哪種抽樣方法?
A、分群抽樣(C.lustersA.mpling)
B、簡單隨機(jī)抽樣(simplerA.nD.omsA.mpling)
C、系統(tǒng)抽樣(systemA.tiC.sA.mpling)
D、分層隨機(jī)抽樣(strA.tifeD.rA.n
D.omsA.mpling)
參考答案:D
135.下列關(guān)于邏輯回歸的說法正確的是
A、邏輯回歸必須對缺失值做預(yù)處理
B、邏輯回歸比決策樹,更容易過度擬合
C、邏輯回歸要求自變量和目標(biāo)變量是線性關(guān)系
D、邏輯回歸只能做2值分類,不能直接做多值分類
參考答案:A
136.研究性別與是否抽煙的相關(guān)性,可以用()
A、方差分析
B、卡方檢驗
C、皮爾遜相關(guān)系數(shù)
D、檢驗
參考答案:B
137.如何才能盡快掌握5W方法
A、凡事都問幾個為什么
B、求教領(lǐng)導(dǎo)
C、邀請專家指導(dǎo)
D、參加培訓(xùn)
參考答案:A
138.K-Means聚類法要求自變量之間不存在共線性的原因是()
A、變量存在多重共線性時無法得到聚類結(jié)果
B、變量存在多重共線性時,相關(guān)變量會在距離計算中占據(jù)高的權(quán)重,
從而對聚類結(jié)果有負(fù)面的影響
C、變量存在多重共線性時,得到的聚類結(jié)果是完全錯誤的
D、變量存在多重共線性時無法解釋聚類結(jié)果
參考答案:B
139.以下哪個不是根原因分析中問題原因頭腦風(fēng)暴的技術(shù)和工具?
A、績效矩陣
B、是非矩陣
C、配對比較
D、名義群組技術(shù)
參考答案:A
140.按經(jīng)典假設(shè),線性回歸模型中的解釋變量應(yīng)是非隨機(jī)變量,且()
A、與隨機(jī)誤差項不相關(guān)
B、與被解釋變量不相關(guān)
C、與回歸值不相關(guān)
D、與殘差項不相關(guān)
參考答案:A
141.下列說法錯誤的是
A、若原問題有可行解,但目標(biāo)函數(shù)無界,其對偶問題無可行解
B、若原問題為mA.xZ=C.X,A.XsB.,x20,則對偶問題為
minW=YB.,YA,>=C.,Y>=0
C、任何線性規(guī)劃問題都有一個與之對應(yīng)的對偶問題
D、對偶問題無可行解時,其原問題的目標(biāo)函數(shù)無界
參考答案:D
142.對相同的數(shù)據(jù)進(jìn)行邏輯回歸時,會節(jié)省時間、提高精度的做法是?
A、降低學(xué)習(xí)率,減少迭代次數(shù)
B、增加學(xué)習(xí)率,減少迭代次數(shù)
C、降低學(xué)習(xí)率,增加選代次數(shù)
D、提高學(xué)習(xí)率,增加送代次數(shù)
參考答案:B
143.當(dāng)進(jìn)行因子分析時,KMO值在()范圍內(nèi),因子分析才是有效的
A、小于0
B、0.3-0.5
C、0-0.2
D、大于0.6
參考答案:D
144.根原因分析中解決方案實施階段包括哪些技術(shù)和工具?
A、精益價值樹和因果矩陣
B、力場分析和系統(tǒng)創(chuàng)新思維方法
C、精益價值樹和力場分析
D、因果矩陣和系統(tǒng)創(chuàng)新思維方法
參考答案:C
145.關(guān)于回歸分析和相關(guān)分析的區(qū)別和聯(lián)系,下面說法錯誤的是?
A、為了了解兩變量直線方向的密切程度,宜選用線性相關(guān)分析
B、回歸方程y=kx+b中的k表示兩變量間的相關(guān)程度
C、為了了解自變量對因變量的影響大小,宜選用線性回歸分析
D、相關(guān)分析看的是因果關(guān)系
參考答案:D
146.目前收集110份問卷,數(shù)據(jù)質(zhì)量控制良好,需要分析用戶推薦指
數(shù)(1T00評分)的影響因素,其中包括行為類6個指標(biāo)。請問一般使
用什么統(tǒng)計方法來解決這類歸因問題?
A、logisti
C.回歸模型
B、深層神經(jīng)網(wǎng)絡(luò)模型
C、結(jié)構(gòu)方程模型
D、線性回歸模型
參考答案:A
147.箱線圖的矩形中間的橫線表示的是這組數(shù)據(jù)的()
A、上四分位數(shù)
B、下四分位數(shù)
C、中位數(shù)
D、平均數(shù)
參考答案:C
148.檢驗兩個群體老年人口比例差,用
A、t檢驗
B、卡方檢驗
C、F檢驗
D、z檢驗
參考答案:D
149.多元線性回歸中F檢驗的原假設(shè)是?
A、所有回歸系數(shù)都等于0
B、所有回歸系數(shù)都等于預(yù)估值
C、所有回歸系數(shù)都不等于0
D、所有回歸系數(shù)都不等于預(yù)估值
參考答案:A
150.當(dāng)對多元線性回歸y=bn+bln+b2nt+—+bnxn+E,進(jìn)行線性關(guān)系檢
驗時,原假設(shè)可以設(shè)為0
A、bo,bl,...bn中在任意一個不為0
B、bl,……,bn中存在任意一個不為0
C、bl...-bn-0
D、b0=bl=...bn=0
參考答案:C
151.研究性別與是否失眠的相關(guān)性,可以用
A、偏度
B、卡方檢驗
C、t檢驗
D、F檢驗
參考答案:B
152.兩個變量y與x的回歸模型中,通常用R方來刻畫回歸的效果,
下列敘述正確的是0
A、R方越大,殘差平方和越大
B、R方越小,殘差平方和越小
c、R方與殘差平方和無關(guān)
D、R方越小,殘差平方和越大
參考答案:D
153.回歸分析中定義的
A、解釋變量和被解釋變量都是隨機(jī)變量
B、解釋變量和被解釋變量都為非隨機(jī)變量
C、解釋變量為隨機(jī)變量,被解釋變量為非隨機(jī)變量
D、解釋變量為非隨機(jī)變量,被解釋變量為隨機(jī)變量
參考答案:D
154,主成分分析需要考慮樣本的
A、協(xié)方差矩陣
B、方差
C、權(quán)重矩陣
D、關(guān)聯(lián)矩陣
參考答案:A
155.用于描述數(shù)據(jù)的數(shù)據(jù)或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)的是()
A、交易數(shù)據(jù)
B、數(shù)據(jù)元
C、主數(shù)據(jù)
D、元數(shù)據(jù)
參考答案:D
156.在線性回歸分析中,發(fā)現(xiàn)兩個變量之間存在正向線性相關(guān),則
pearson相關(guān)系數(shù)應(yīng):
A、r=0
B、r<0
C、r>0
D、r!=0
參考答案:C
157.對于數(shù)據(jù)倉庫的特點下列說法中錯誤的是?
A、將來自多個數(shù)據(jù)源的數(shù)據(jù)進(jìn)行整合
B、主要功能就是用來存儲數(shù)據(jù)的
C、數(shù)據(jù)倉庫一般支撐數(shù)據(jù)和修改
D、數(shù)據(jù)倉庫通過ETL將數(shù)據(jù)進(jìn)行清洗整合
參考答案:C
158.問題理解階段事件還原工具是哪個?
A、流程圖
B、雷達(dá)圖
C、關(guān)鍵事件
D、績效矩陣或嚴(yán)重度評估矩陣
參考答案:A
159.如果多元線性回歸模型中殘差不等于0,而是一個常數(shù),那么()
A、這個常數(shù)應(yīng)該包含在常數(shù)項
B、應(yīng)該去除常數(shù)項
C、型有效
D、應(yīng)該去除殘差項
參考答案:A
160.下面關(guān)于選擇何種機(jī)器學(xué)習(xí)建模思路,說法錯誤的是?
A、當(dāng)需要獲得特征與特征間的關(guān)系時,需建立無監(jiān)督模型
B、在反欺詐領(lǐng)域,當(dāng)已知有欺詐觀測時,可用有監(jiān)督模型來識別用戶
C、在反欺詐領(lǐng)域,當(dāng)沒有反欺詐人群時,可用有監(jiān)督模型來識別用戶
D、當(dāng)需要獲得特征與目標(biāo)間的關(guān)系時,需建立有監(jiān)督模型
參考答案:C
161.關(guān)于用戶畫像的說法錯誤的是0
A、用戶畫像的標(biāo)簽分為定量標(biāo)簽和定性標(biāo)簽
B、用戶畫像本質(zhì)上是應(yīng)用用戶標(biāo)簽做客群定位
C、用戶標(biāo)簽必須描述客觀的事實
D、用戶畫像的應(yīng)用場景有:產(chǎn)品設(shè)計,營銷推薦,風(fēng)險控制等
參考答案:C
162.關(guān)于下圖描述錯誤的是?
A、橫坐標(biāo)x和縱坐標(biāo)Y之間是正相關(guān)的
B、橫坐標(biāo)X和縱坐標(biāo)Y之間很大可能是非線性關(guān)系
C、分析兩者之間的關(guān)系可用邏輯回歸模型
D、這些散點中存在異常點
參考答案:C
163.統(tǒng)計軟件處理的數(shù)據(jù)類型通常包括文本型、數(shù)值型、日期型等格
式,那么分析師錄制數(shù)據(jù)時,通常以哪種錄入方式為主?
A、不進(jìn)行任何編碼,保持原始問卷格式,這樣可以保證原始信息不變
性
B、數(shù)值編碼后,保持協(xié)方差格式錄入,這種格式可以改善運行時間
C、文本編碼后,保持一行表示一條觀測數(shù)據(jù)
D、數(shù)值編碼后,保持一行表示一條觀測數(shù)據(jù)
參考答案:D
164.對于邏輯回歸和SVM算法,說法中不正確的是()
A、SVM的目標(biāo)是最小化結(jié)構(gòu)風(fēng)險
B、SVM可以有效避免模型過擬合
C、邏輯回歸可以用于預(yù)測事件發(fā)生概率的大小
D、邏輯回歸的目標(biāo)是最小化后驗概率
參考答案:D
165.移動平均法用于測定
A、季節(jié)趨勢
B、循環(huán)變動
C、長期趨勢
D、短期變化
參考答案:C
166.對于不平穩(wěn)的序列進(jìn)行時間序列分析可以
A、差分
B、微分
C、積分
D、不能使用
參考答案:A
167.一元線性回歸方程y=3+4x,當(dāng)x增加一個單位,以下哪個表述最
準(zhǔn)確?
A、y平均增加7個單位
B、y增加7個單位
C、y增加4個單位
D、y平均增加4個單位
參考答案:D
168.對一元線性回歸y=bO+blxl+e進(jìn)行F檢驗,其結(jié)果與對回歸系
數(shù)bl做t檢驗得到的結(jié)果()
A、相同
B、相反
C、無法確定
D、無關(guān)
參考答案:A
169.近因分析階段(現(xiàn)狀問題描述)不能使用的圖表類型是?
A、帕累托圖
B、折線圖
C、柱狀圖
D、雷達(dá)圖
參考答案:B
170.對于一元線性回歸,回歸系數(shù)顯著性檢驗需要用到
A、F檢驗
B、T檢驗
C、Z檢驗
D、卡方檢驗
參考答案:B
171.數(shù)據(jù)被稱為()的原材料
A、元數(shù)據(jù)
B、信息
C、知識
D、策略
參考答案:B
172.關(guān)于主成分分析的特點,理解錯誤的是
A、有多少個變量就會有多少個正交的主成分
B、前幾個主成分的變異無法解釋原多元數(shù)據(jù)中的所有變異
C、如果原始變量不相關(guān),即協(xié)方差為0,則不需要做主成分分析
D、主成分的變異之和等于原始變量的所有變異
參考答案:A
173.樣本預(yù)設(shè)分類的情況下,通過樣本的現(xiàn)有特征對樣本進(jìn)行分類的
方法稱為()
A、分類分析
B、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
C、聚類分析
D、描述性分析
參考答案:A
174.下列哪一項不屬于5W分析的注意事項
A、注意現(xiàn)象只記錄事實
B、先入為主
C、注意層和層間的相關(guān)性,不要跳步
D、避免找原因牽涉到了人的心理
參考答案:D
175.在假設(shè)檢驗問題中,原假設(shè)為H0,備擇假設(shè)為H1,則錯誤可以表
示為
A、p{接受HO|HO為真}
B、p{拒絕HO|HO為真}
C、p{接受H1|HO為真}
D、p{接受HO|H1為真}
參考答案:D
176.主成分分析算法認(rèn)為數(shù)據(jù)的信息是包含在()中
A、均值
B、極值
C、誤差
D、方差
參考答案:D
177.在時間序列分析中,指數(shù)平滑法的平滑系數(shù)a的取值()
A、取值范圍在0至U1之間
B、越大越好
C、取值范圍在T到1之間
D、越小越好
參考答案:A
178.以下哪個是快速聚類法
A、系統(tǒng)聚類法
B、層次聚類法
C、兩步聚類法
D、K-me
A.ns聚類法
參考答案:D
179.對某商品抽樣調(diào)查,抽取其中400個商品,其中98%的商品合格,
以下描述正確的是
A、整個商品的合格率為98%
B、整個商品的合格率大于98%
C、根據(jù)以上信息,我們不知道整個商品的合格率比值
D、整個商品的合格率小于98%
參考答案:C
180.如果多元線性回歸模型中殘差不等于0,而是一個常數(shù),那么()
A、模型有效
B、應(yīng)該去除常數(shù)項
C、這個常數(shù)應(yīng)該包含在常數(shù)項
D、應(yīng)該去除殘差項
參考答案:C
181.根據(jù)馬斯洛需求層次理論,其中最低層次是()
A、安全需要
B、地位和收入尊重需要
C、感情和歸屬需要
D、生理需要
參考答案:D
182.根原因分析的工具箱包括以下哪個數(shù)據(jù)近因分析階段的工具
A、根原因識別
B、問題原因頭腦風(fēng)暴、數(shù)據(jù)收集、數(shù)據(jù)分析
C、根原因消除
D、問題理解
參考答案:A
183.應(yīng)用回歸分析應(yīng)注意的問題,下面說法錯誤的是?
A、應(yīng)用回歸分析時,要注意時間窗口的一致性
B、因為回歸分析是研究自變量與因變量的因果關(guān)系,所以要注意孰因
孰果
C、回歸分析的自變量選取要符合業(yè)務(wù)需要,選擇合適的數(shù)據(jù)資料
D、回歸分析的自變量必須是連續(xù)型數(shù)據(jù)
參考答案:D
184.下列關(guān)于主成分分析的描述錯誤的是?()
A、是一類常用的針對連續(xù)變量的降維方法
B、我們一般保留的前k個主成分累計能夠解釋數(shù)據(jù)80%以上的變異
C、各主成分之間的方向夾角需要盡可能的大
D、我們一般保留的前k個主成分中最后一個主成分對應(yīng)的不應(yīng)小于
1
參考答案:C
185.多元線性回歸y=b0+blxl+b2x2+..+bnxn+&進(jìn)行線性關(guān)系檢驗時,
原假設(shè)是
A、bl=..bn=0
B、b0=bl=..=0
C、bl,..,bn中存在任意一個不為0
D、bO,bl,..,bn中存在任意一個不為0
參考答案:A
186.下面關(guān)于回歸分析,說法錯誤的是?
A、線性回歸對異常值不敏感
B、按照自變量和因變量的函數(shù)關(guān)系來分類,可以分為線性回歸分析和
非線性回歸分析
C、按照自變量和因變量的個數(shù)來分類,可分為一元回歸分析和多元回
歸分析
D、非線性回歸問題可以轉(zhuǎn)化為線性回歸
參考答案:A
187.在進(jìn)行多元線性回歸模型的分析中,如果自變量的VIF=1,這說明
0
A、此自變量與其他自變量不存在線性相關(guān)性
B、此多元回歸模型的R2=0
C、此模型存在非常嚴(yán)重的共線性
D、此自變量與因變量不存在線性相關(guān)性
參考答案:A
188.若線性規(guī)劃問題沒有可行解,可行解集是空集,則此問題0
A、沒有最優(yōu)解
B、有無界解
C、沒有無窮多最優(yōu)解
D、有無界解(重復(fù)選項)
參考答案:A
189.統(tǒng)計分析涉及高維運算,因此需要對高維空間中的數(shù)據(jù)結(jié)構(gòu)進(jìn)行
探索,以發(fā)現(xiàn)其內(nèi)部的模式,但高維探索特別困難,所以因子分析可以
將高維空間進(jìn)行降維,然后探索其內(nèi)部結(jié)構(gòu)。下面有關(guān)因子分析說法
錯誤的是?
A、因子分析與主成分分析都是數(shù)據(jù)降維的主要手段
B、數(shù)據(jù)結(jié)構(gòu)探索是因子分析功能之一
C、降維是因子分析的功能之一
D、因子分析在探索問題上,常用于效度分析
參考答案:B
190.兩個隨機(jī)變量的線性相關(guān)系數(shù)為0,說明
A、兩個變量線性無關(guān)
B、兩個變量獨立
C、至少有一個變量是0
D、兩個變量無關(guān)
參考答案:A
191.某奶茶店為了預(yù)測每天訂單數(shù),建立了一個線性回歸模型,其中
有一個自變量為天氣類型(分類變量),分為晴、陰、雨、雪等4種類
型,請問如何處理這種變量?
A、直接作為自變量使用
B、設(shè)置啞變量
C、剔除變量
D、變量標(biāo)準(zhǔn)化
參考答案:B
192.對于因子分析說法錯誤的是
A、因子分析和主成分分析一樣,都是一種降維的統(tǒng)計方法
B、所有公共因子的因子載荷和隨機(jī)因子的平方和越接近1,則說明因
子分析的效果越好
C、因子載荷絕對值越大代表相應(yīng)的公共因子表達(dá)變量的信息越少
D、公共因子的方差貢獻(xiàn),即在所有變量中該公共因子的因子載荷的平
方和,可以衡量公共因子能提供多少信息
參考答案:C
193.以下說法不正確的是?
A、對策型的魚骨圖魚頭在右,特性值通常以〃如何提高〃來寫
B、魚骨圖不只用于根原因定位,還用于分析對策
C、因果圖包括傳統(tǒng)魚骨圖和過程圖,但是都是以魚骨圖的形式體現(xiàn)的
D、原因型魚骨圖的魚頭在右,特性值通常以〃為什么〃來寫
參考答案:A
194.某分析師希望通過聚類算法進(jìn)行欺詐分析,發(fā)現(xiàn)結(jié)果不是很理想。
下列方法中哪項不能為聚類效果帶來提升?
A、對變量進(jìn)行變量聚類
B、對變量進(jìn)行標(biāo)準(zhǔn)化
C、對變量進(jìn)行主成分分析
D、對變量進(jìn)行分箱處理
參考答案:D
195.市場調(diào)研的量表中,量表中所表示的只能是差距關(guān)系和順序關(guān)系,
不具備真正的零點的量表是()
A、等比量表
B、等距量表
C、類別量表
D、順序量表
參考答案:B
196.檢驗兩個群體老年人口比例差,用()
A、Z檢驗
B、t檢驗
C、F檢驗
D、卡方檢驗
參考答案:A
197.在系統(tǒng)聚類中R2是指()
A、組內(nèi)離差平方和除以總離差平方和
B、組內(nèi)離差平方和除以組間離差平方和
C、組間離差平方和除以總離差平方和
D、組間離差平方和除以組內(nèi)離差平方和
參考答案:C
198.在進(jìn)行策劃時,按照一定的程序進(jìn)行精準(zhǔn)營銷策劃的方法是
A、程序法
B、案例法
C、計劃法
D、模型法
參考答案:A
199.在進(jìn)行策劃時,按照一定的程序進(jìn)行精準(zhǔn)營銷策劃的方法是
A、程序法
B、計劃法
C、模型法
D、案例法
參考答案:A
200.數(shù)據(jù)被稱為()的原材料
A、信息
B、策略
C、元數(shù)據(jù)
D、知識
參考答案:A
二.多選題
1.回歸分析中多重共線性的處理方法有
A、逐步回歸
B、變量標(biāo)準(zhǔn)化
C、工具變量
D、嶺回歸
參考答案:AD
2.因果圖的分析要點有哪些?
A、如果某種原因可同時歸屬于兩種或兩種以上因素,請以關(guān)聯(lián)性最強(qiáng)
者為準(zhǔn)
B、腦力激蕩時,應(yīng)盡可能多而全地找出所有可能原因,而不僅限于自
己能完全掌控或正在執(zhí)行的內(nèi)容,對人的原因,宜從行動而非思想態(tài)
度面著手分析
C、大要因必須用中性詞描述(不說明好壞),中、小要因必須使用價值
判斷(如??不良)
D、確定大要因時,現(xiàn)場作業(yè)一般從“人、機(jī)、料、法、環(huán)〃著手,管理
類問題一般從〃人、事、時、地、物〃層別,應(yīng)視具體情況決定
參考答案:ABCD
3.反映回歸直線擬合優(yōu)度的指標(biāo)有()
A、樣本決定系數(shù)
B、回歸系數(shù)
C、相關(guān)系數(shù)
D、剩余變差(或殘差平方和)
參考答案:ACD
4.下列屬于線性回歸假設(shè)的是()
A、解釋變量之間不能強(qiáng)線性相關(guān)
B、解釋變量和被解釋變量之間存在線性關(guān)系
C、抗動項獨立同分布
D、解釋變量和擾動項不能相關(guān)
參考答案:CD
5.線性規(guī)劃模型包括的要素有()
A、環(huán)境變量
B、目標(biāo)函數(shù)
C、決策變量
D、狀態(tài)變量
參考答案:BC
6.多元線性回歸中,內(nèi)生性的解決方法有?
A、變量別除
B、聯(lián)立方程
C、工具變量
D、變量轉(zhuǎn)換
參考答案:ACD
7.以下屬于線性回歸基本假設(shè)的有
A、誤差項£相互獨立
B、誤差項E服從正態(tài)分布
C、誤差項e的期望等于1
D、誤差項e的方差等于1
參考答案:AB
8.根原因分析中問題理解的常用工具包括()
A、雷達(dá)圖
B、關(guān)鍵事件
C、績效矩陣
D、流程圖
參考答案:ABCD
9.現(xiàn)希望獲得某地區(qū)32所小學(xué)中,所有學(xué)生的數(shù)學(xué)成績狀況,總?cè)藬?shù)
為6800名,但項目費用有限,前提限定了抽樣樣本不能超過600個,
通過調(diào)查發(fā)現(xiàn),全市小學(xué)分成3個地區(qū)(根據(jù)師資、人口等因素),學(xué)生
人數(shù)分別為1700,2266,2834,并且平均調(diào)查費用比為5,2:1,預(yù)調(diào)查
樣本標(biāo)準(zhǔn)差為12、8、14(分別對應(yīng)地區(qū)一三三),下列選項說法不正確
的是0
A、需要分群抽樣和簡單抽樣兩項計算才能完成樣本搜集工作
B、分層抽樣技術(shù)可以完成樣本搜集工作
C、可以使用簡單隨機(jī)抽樣技術(shù)完成樣本搜集工作
D、使用系統(tǒng)抽樣技術(shù)完成樣本搜集工作
參考答案:ACD
10.在層次聚類中,可以用來定義兩個類之間距離的方法有
A、離差平方和法
B、中間距離法
C、最短距離法
D、類平均距離法
參考答案:ABCD
11.因果圖的分析要點有哪些?
A、確定大要因時,現(xiàn)場作業(yè)一般從〃人、機(jī)、料、法、環(huán)〃著手,管理類
問題一般從〃人、事、時、地、物〃層別,應(yīng)視具體情況決定
B、腦力激蕩時,應(yīng)盡可能多而全地找出所有可能原因,而不僅限于自
己能完全掌控或正在執(zhí)行的內(nèi)容,對人的原因,宜從行動而非思想態(tài)
度面著手分析
C、大要因必須用中性詞描述(不說明好壞),中、小要因必須使用價值
判斷(如、.?不良)
D、如果某種原因可同時歸屬于兩種或兩種以上因素,請以關(guān)聯(lián)性最強(qiáng)
者為準(zhǔn)
參考答案:ABCD
12.給定獨立同分布的隨機(jī)變量,期望為u,方差為o2當(dāng)樣本容量趨近
于無窮時,以下正確的是
A、樣本均值的分布與n有關(guān)
B、樣本的平均值的分布近似服從正態(tài)分布
C、樣本的均值也是隨機(jī)變量
D、樣本的均值也是隨機(jī)變量樣本的平均值趨近于H?
參考答案:BCD
13.RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段,以下
屬于RFM模型分析指標(biāo)的是()
A、消費金額
B、消費趨勢
C、消費頻率
D、最近一次消費
參考答案:ACD
14.線性規(guī)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 年度腎上腺皮質(zhì)激素類藥產(chǎn)業(yè)分析報告
- 2025年個人購房合同(含房屋保險服務(wù))
- 2025年度高速公路隧道照明安裝與維護(hù)合同模板3篇
- 二零二五年度高品質(zhì)抹灰施工班組勞務(wù)分包協(xié)議3篇
- 2025年度個人入股合作協(xié)議書范本:航空航天股權(quán)投資協(xié)議3篇
- 2025年度有機(jī)茶園種植與產(chǎn)品銷售合作協(xié)議范本4篇
- 網(wǎng)絡(luò)教育課程設(shè)計
- 2024版新房購買中介合作協(xié)議
- 2025年度地震測繪安全監(jiān)測合同3篇
- 2025年旅游景區(qū)車位租賃與旅游產(chǎn)品銷售合同4篇
- T-SDLPA 0001-2024 研究型病房建設(shè)和配置標(biāo)準(zhǔn)
- (人教PEP2024版)英語一年級上冊Unit 1 教學(xué)課件(新教材)
- 全國職業(yè)院校技能大賽高職組(市政管線(道)數(shù)字化施工賽項)考試題庫(含答案)
- 2024胃腸間質(zhì)瘤(GIST)診療指南更新解讀 2
- 光儲電站儲能系統(tǒng)調(diào)試方案
- 2024年二級建造師繼續(xù)教育題庫及答案(500題)
- 小學(xué)數(shù)學(xué)二年級100以內(nèi)連加連減口算題
- 建設(shè)單位如何做好項目管理
- 三年級上遞等式計算400題
- 一次性餐具配送投標(biāo)方案
- 《中華民族多元一體格局》
評論
0/150
提交評論