2024年數(shù)據(jù)分析師LevelⅡ考試題庫(含答案)_第1頁
2024年數(shù)據(jù)分析師LevelⅡ考試題庫(含答案)_第2頁
2024年數(shù)據(jù)分析師LevelⅡ考試題庫(含答案)_第3頁
2024年數(shù)據(jù)分析師LevelⅡ考試題庫(含答案)_第4頁
2024年數(shù)據(jù)分析師LevelⅡ考試題庫(含答案)_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2024年數(shù)據(jù)分析師LevelII考試題庫

(含答案)

一、單選題

1.將原始數(shù)據(jù)進(jìn)行整合、變換、特征降維、缺失值處理是在以下哪個

步驟的任務(wù)

A、數(shù)據(jù)預(yù)處理

B、數(shù)據(jù)挖掘

C、分類和預(yù)測

D、模式發(fā)掘

參考答案:A

2.問卷測量通??梢詮膽B(tài)度測量、能力測量等角度測試用戶評分,一

般來說態(tài)度測量經(jīng)常使用的量表是哪一類?

A、哥特曼(guttman)量表

B、李克特5點測量量表

C、李克特3點測量量表

D、李克特9點測量量表

參考答案:B

3.假設(shè)我們使用Logistic.回歸模型分析n類分類問題,在這種情況

下,我們可以使用留一法(One-vs-rentmothoD.)。關(guān)于這個問題,下面

哪個選項是正確的

A、我們需要在n類分類問題中擬合n+1個模型

B、我們需要在n類分類問題中擬合1個模型

C、我們需要在n類分類問題中擬合n個模型

D、我們需要在n類分類問題中擬合nT個模型

參考答案:D

4.針對該公式y(tǒng)(t)=3xy(t-1)+2xy(t-3)是()階的時間序列

A、1

B、3

C、2

D、4

參考答案:B

5.在邏輯回歸輸出與目標(biāo)對比的情況下,以下評估指標(biāo)中哪一項不適

用?

A、均方誤差

B、AUC-ROC

C、Logloss

D、準(zhǔn)確度

參考答案:A

6.能夠用于總體估計的是

A、自愿抽樣

B、滾雪球抽樣

C、方便抽樣

D、系統(tǒng)抽樣

參考答案:D

7.某分析師希望通過聚類算法進(jìn)行欺詐分析,發(fā)現(xiàn)結(jié)果不是很理想。

下列方法中哪項不能為聚類效果帶來提升?

A、對變量進(jìn)行主成分分析

B、對變量進(jìn)行變量聚類

C、對變量進(jìn)行分箱處理

D、對變量進(jìn)行標(biāo)準(zhǔn)化

參考答案:C

8.在因子分析中,為了幫助解釋因子,可以使用()

A、因子負(fù)載

B、因子得分

C、因子旋轉(zhuǎn)

D、主成分分析

參考答案:C

9.以下哪種方法可以用于倉析面板數(shù)據(jù)

A、自回歸法(A.R)

B、移動平均值法(MA.)

C、隨機(jī)效應(yīng)法(RM)

D、差分法

參考答案:C

10.多元線性回歸中,檢驗異方差的方法是?

A、如果回歸擬合值與自變量相關(guān)則存在異方差

B、如果回歸殘差與因變量相關(guān)則存在異方差

C、如果回歸因變量與自變量相關(guān)則存在異方差

D、如果回歸殘差與自變量相關(guān)則存在異方差

參考答案:B

11.從兩個總體中獨立選取兩個樣本,兩個總體的方差未知,但是樣本

為大樣本,則兩個總體的平均值之差的估計需要用到

A、正態(tài)分布

B、卡方分布

C、F分布

D、t分布

參考答案:C

12.單因素方差分析中,計算F統(tǒng)計量,其分子與分母的自由度各為

A、r-n,n-r

B、n-r,r-l

C、r,n

D、r-l,n-r

參考答案:D

13.研究性別與是否失眠的相關(guān)性,可以用

A、偏度

B、卡方檢驗

C、F檢驗

D、T檢驗

參考答案:B

14.下面關(guān)于回歸分析,說法錯誤的是?

A、按照自變量和因變量的函數(shù)關(guān)系來分類,可以分為線性回歸分析和

非線性回歸分析

B、非線性回歸問題可以轉(zhuǎn)化為線性回歸

C、線性回歸對異常值不敏感

D、按照自變量和因變量的個數(shù)來分類,可分為一元回歸分析和多元回

歸分析

參考答案:C

15.主成分分析法的主要作用是

A、剔除異常值

B、控制變量

C、正則化

D、降維

參考答案:D

16.在推導(dǎo)線性回歸參數(shù)時,我們會做出以下哪些假設(shè)?(1)因變量y

和預(yù)測變量x之間的真實關(guān)系是線性的;(2)模型的誤差在統(tǒng)計意義

上是獨立的;⑶誤差通常分布是均值為0,且標(biāo)準(zhǔn)差為常數(shù);(4)預(yù)測

變量x是非隨機(jī)的,而且不存在測量誤差

A、1,2,3,4

B、1,2,3

C、1,3,4

D、1,2

參考答案:A

17.以下哪種情境更適合使用線性回歸?

A、考察廣告費對產(chǎn)品銷售量的影響

B、考察目標(biāo)客戶的行為規(guī)則,做出用戶畫像

C、考察五個城市居民的有效收入的差異是否顯著

D、考察哪些客戶最終是否購買產(chǎn)品

參考答案:A

18.以下哪個不是分群標(biāo)簽的用途?

A、服務(wù)于產(chǎn)品和服務(wù)匹配策略

B、定位客戶的需求

C、建立對客戶的洞察

D、解決工作的效率問題

參考答案:D

19.主成分分析的前提條件是各變量之間應(yīng)該滿足

A、低度相關(guān)

B、相互獨立

C、完全相關(guān)

D、高度相關(guān)

參考答案:A

20.某電商的年銷售量呈現(xiàn)Xt=0.72Xt-l+0.81Xt-2+et,則xt為()

A、ARIMA(n,m)

B、AR(n)

C、MA(m)

D、ARMA(n,m)

參考答案:B

21.用戶分層是在用戶管理時最常被使用的標(biāo)簽類型,其中RFM模型

是指()

A、投入、效率、產(chǎn)出

B、成交率、客流、客單價

C、首次購買時間、消費頻率、消費金額

D、最近購買時間、消費頻次、消費金額

參考答案:D

22.在方差分析中,多重比較的目的是通過配對比較來進(jìn)一步檢驗

A、哪兩個樣本均值之間有差異

B、哪兩個樣本方差之間有差異

C、哪兩個總體方差之間有差異

D、哪兩個總體均值之間有差異

參考答案:D

23.以下哪個不屬于根據(jù)麥肯錫問題分析方法中的分類:

A、問題解決型問題

B、追求理想型問題

C、恢復(fù)原狀型問題

D、防范潛在型問題

參考答案:A

24.時間序列MA(q)模型,其中q指的是()

A、時間序列的偏自相關(guān)系數(shù)是q階截尾的

B、時間序列的自相關(guān)系數(shù)是q階拖尾的

C、時間序列的偏自相關(guān)系數(shù)是q階拖尾的

D、時間序列的自相關(guān)系數(shù)是q階截尾的

參考答案:D

25.為了估計北京市使用華為品牌手機(jī)的市場占有率,在收集數(shù)據(jù)時,

最有可能采用的數(shù)據(jù)搜集方法是?

A、方便抽樣

B、配額抽樣

C、實驗

D、隨機(jī)抽樣

參考答案:D

26.以下哪個不屬于根據(jù)麥肯錫問題分析方法中的分類:

A、恢復(fù)原狀型問題

B、防范潛在型問題

C、問題解決型問題

D、追求理想型問題

參考答案:C

27.回歸模型猶如一列火車,引擎牽引的列車節(jié)箱數(shù)受速度、動力等因

素所限,并不能無限增加,否則這列火車會存在安全隱患,回歸也存在

這類由維度(列車節(jié)箱)所引起的安全問題,因此,在數(shù)據(jù)挖掘的場景

中,認(rèn)為自變量的維度最好不要超出15個,那么控制自變量個數(shù)的方

法主要是哪種?

A、因子分析

B、卡方分析

C、方差分析

D、相關(guān)分析

參考答案:A

28.關(guān)于K-MeA.ns算法,正確的描述是?

A、不能使用核函數(shù)

B、能找到任意形狀的聚類

C、初始值不同,最終結(jié)果可能不同

D、每次迭代的時間復(fù)雜度是0(n2),其中n是樣本數(shù)量

參考答案:C

29.一個一元線性回歸模型的判定系數(shù)R2=0.8,那么下列解釋中錯誤

的是()

A、在訓(xùn)練集中,因變量的估計精度上限為80%

B、自變量與因變量之間有著較強(qiáng)的線性關(guān)系

C、在因變量的變動中有80%是由自變量所決定的

D、因變量的變差中有80%的概率可以由自變量與因變量之間的線性

關(guān)系來解釋

參考答案:A

30.多元線性回歸中F檢驗的原假設(shè)是

A、所有回歸系數(shù)都等于預(yù)估值

B、所有回歸系數(shù)都不等于預(yù)估值

C、所有回歸系數(shù)都不等于0

D、所有回歸系數(shù)都等于0

參考答案:D

31.以下哪種方法可以用于分析面板數(shù)據(jù)

A、自回歸法(AR)

B、差分法

C、隨機(jī)效應(yīng)法(RM)

D、移動平均值法(MA)

參考答案:C

32.以下關(guān)于一元線性回歸分析y=bo+bix+s描述錯誤的是?

A、一元線性回歸中F檢驗的檢驗統(tǒng)計量與t檢驗是一致的

B、若用于預(yù)測的x數(shù)值與樣本中的自變量偏差很大,那么預(yù)測得到y(tǒng)

的可靠性也會降低

C、即便建立了一元線性回歸,也不能直接認(rèn)為x是y的原因

D、一元線性回歸中F檢驗的作用與t檢驗是一致的

參考答案:A

33.假設(shè)我們使用Logistic回歸模型分析類分類問題。在這種情況下,

我們可以使用留一法(One-vs-restmethod).關(guān)于這個問題,下面哪個

選項是正確的

A、我們需要在n類分類問題中擬合1個模型

B、我們需要在n類分類問題中擬合nT個模型

C、我們需要在n類分類問題中擬合n+1個模型

D、我們需要在n類分類問題中擬合n個模型

參考答案:B

34.對于一元線性回歸,回歸系數(shù)顯著性檢驗需要用到

A、Z檢驗

B、t檢驗

C、卡方檢驗

D、F檢驗

參考答案:B

35.有一款產(chǎn)品的重量標(biāo)準(zhǔn)為10克,現(xiàn)在分別用A和B兩個廠家來生

產(chǎn)這一產(chǎn)品,分別各隨機(jī)抽取50個樣品,A廠生產(chǎn)的樣本重量的標(biāo)準(zhǔn)

差為

0.01,B廠生產(chǎn)的樣本重量的標(biāo)準(zhǔn)差為

0.1,現(xiàn)在需要比較兩家廣商在產(chǎn)品重量指標(biāo)是否有顯著差異,我們應(yīng)

該選擇

A、單側(cè)t檢驗

B、雙側(cè)t檢驗

C、單側(cè)F檢驗

D、雙側(cè)F檢驗

參考答案:B

36.應(yīng)用回歸分析應(yīng)注意的問題,下面說法錯誤的是?

A、回歸分析的自變量選取要符合業(yè)務(wù)需要,選擇合適的數(shù)據(jù)資料

B、回歸分析的自變量必須是連續(xù)型數(shù)據(jù)

C、應(yīng)用回歸分析時,要注意時間窗口的一致性

D、因為回歸分析是研究自變量與因變量的因果關(guān)系,所以要注意孰因

孰果

參考答案:B

37.在進(jìn)行多元線性回歸分析時,對于變量較多的情況下,可以選擇變

量篩選方法,下列不正確的是

A、交叉驗證法

B、向后剔除法

C、向前選擇法

D、逐步法

參考答案:A

38.回歸分析中定義的

A、解釋變量和被解釋變量都為非隨機(jī)變量

B、解釋變量為非隨機(jī)變量,被解釋變量為隨機(jī)變量

C、解釋變量和被解釋變量都是隨機(jī)變量

D、解釋變量為隨機(jī)變量,被解釋變量為非隨機(jī)變量

參考答案:B

39.若線性規(guī)劃問題沒有可行解,可行解集是空集,則此問題()

A、沒有無界解

B、沒有無窮多最優(yōu)解

C、有無界解

D、沒有最優(yōu)解

參考答案:D

40.主成分分析的前提條件是各變量之間應(yīng)該滿足

A、低度相關(guān)

B、完全相關(guān)

C、相互獨立

D、高度相關(guān)

參考答案:A

41.在時間序列分析中,指數(shù)平滑法的平滑系數(shù)

A.的取值

A、越小越好

B、取值范圍在T到1之間

C、取值范圍在0到1之間

D、越大越好

參考答案:C

42.以下關(guān)于系統(tǒng)聚類的描述中,錯誤的是()

A、系統(tǒng)聚類也叫層次聚類

B、系統(tǒng)聚類適用于數(shù)據(jù)量非常大或者變量非常多的項目

C、系統(tǒng)聚類法通常分為自底向上和自頂向下

D、系統(tǒng)聚類的過程非常清楚,會形成類似樹狀的聚類圖譜,便于理解

和檢查

參考答案:B

43.下列關(guān)于主成分分析的表述不正確的有()

A、所確定的幾個主成分之間是高度相關(guān)的

B、所確定的幾個主成分之間是互不相關(guān)的

C、使用主成分分析方法的前提是原來的多個指標(biāo)之間是相關(guān)的

D、主成分分析的目的是尋找少數(shù)幾個主成分代表原來的多個指標(biāo)

參考答案:A

44.在系統(tǒng)聚類中,我們需要定義兩個類之間的距離,下列哪種方法能

夠緩解異常值對計算距離造成的影響?

A、離差平方和法

B、最短距離法

C、最長距離法

D、以上都不是

參考答案:A

45.多元線性回歸中,檢驗異方差的方法是?

A、如果回歸擬合值與自變量相關(guān)則存在異方差

B、如果回歸殘差與因變量相關(guān)則存在異方差

C、如果回歸殘差與自變量相關(guān)則存在異方差

D、如果回歸因變量與自變量相關(guān)則存在異方差

參考答案:C

46.多元線性回歸中檢驗的原假設(shè)是

A、對應(yīng)單個回歸系數(shù)等于0

B、對應(yīng)單個回歸系數(shù)不等于0

C、對應(yīng)單個回歸系數(shù)等于預(yù)估值

D、對應(yīng)單個回歸系數(shù)不等于預(yù)估值

參考答案:A

47.如果時間序列的各期增長量相等,

A、各期環(huán)比增長速度有升有降

B、環(huán)比增長速度逐期上升

C、各期的環(huán)比增長速度保持不變

D、環(huán)比增長速度逐期下降

參考答案:D

48.某電商的年銷售量呈現(xiàn)Xt=O.72Xt-l+0.81Xt-et,則xt為()

A、RIMA(n,m)

B、MA(m)

C、ARMA(n,m)

D、AR(n)

參考答案:D

49.方差分析的主要目的是判斷()

A、各樣本數(shù)據(jù)之間是否有顯著差異

B、分類型因變量對數(shù)值型自變量的影響是否顯著

C、分類型自變量對數(shù)值型因變量的影響是否顯著

D、各總體是否存在方差

參考答案:C

50.下面關(guān)于選擇何種機(jī)器學(xué)習(xí)建損思路,說法錯誤的是?

A、當(dāng)需要獲得特征與目標(biāo)間的關(guān)系時,需建立有監(jiān)督模型

B、當(dāng)需要獲得特征與特征間的關(guān)系時,需建立無監(jiān)督模型

C、在反欺詐領(lǐng)域,當(dāng)沒有反欺詐人群時,可用有監(jiān)督模型來識別用戶

D、在反欺詐領(lǐng)域,當(dāng)已知有欺詐觀測時,可用有監(jiān)督模型來識別用戶

參考答案:C

51.針對字段〃用戶姓名”,下列方法最適宜的是()

A、需要編碼為分類變量

B、需要編碼為數(shù)值變量

C、需要編碼為二分變量

D、需要編碼為字符變量

參考答案:D

52.研究職業(yè)與收入的相關(guān)性可以使用

A、F檢驗

B、方差分析

C、t檢驗

D、皮爾遜相關(guān)系數(shù)

參考答案:C

53.市場調(diào)查主要用于解決的問題是以下哪一類?

A、關(guān)聯(lián)問題

B、歸因問題

C、預(yù)測問題

D、細(xì)分問題

參考答案:D

54.績效考核問題中,不合理項的選擇是多選項,如果并不強(qiáng)調(diào)擇的個

數(shù),而強(qiáng)調(diào)選擇的題項,則使用的多選題編碼方式為?如下圖:項所示:

A、與項的設(shè)置相同

B、多重響應(yīng)的多分法

C、多重響應(yīng)的二分法

D、與開放題項的設(shè)置相同

參考答案:B

55.下面關(guān)于關(guān)系型數(shù)據(jù)庫描述錯誤的是?

A、RDBMS指的是關(guān)系型數(shù)據(jù)庫管理系統(tǒng),RDBMS中的數(shù)據(jù)存儲在被稱

為表(tables)的數(shù)據(jù)庫對象中

B、所有數(shù)據(jù)庫系統(tǒng)均要求在每條SQL命令的末端使用分號,否則會運

行報錯

C、SQL語言對大小寫不敏感

D、SQL是指結(jié)構(gòu)化查詢語句,是一種ANS的標(biāo)準(zhǔn)計算機(jī)語言

參考答案:B

56.以下哪個不屬于標(biāo)簽加工方式區(qū)分的分類?

A、行為標(biāo)簽

B、統(tǒng)計標(biāo)簽

C、模型標(biāo)簽

D、基礎(chǔ)標(biāo)簽

參考答案:A

57.建立模型,拆分?jǐn)?shù)據(jù)集為訓(xùn)練集和測試集的一般比例為?

A、5:5

B、7:3

C、9:1

D、6:4

參考答案:B

58.關(guān)于邏輯回歸分析說法正確的是

A、邏輯回歸中的因變量和自變量均為分類變量

B、邏輯回歸中因變量為分類變量

C、邏輯回歸中自變量為分類變量

D、邏輯回歸中,因變量和自變量均為連續(xù)型變量

參考答案:B

59.下列哪項不是主成分分析的推薦應(yīng)用?

A、作為線性回歸的替代算法:對于大多數(shù)學(xué)習(xí)應(yīng)用,主成分分析和線

性回歸給出了基本相似的結(jié)果

B、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),并用于監(jiān)督學(xué)習(xí)算法,能夠使監(jiān)督

學(xué)習(xí)算法運行得更快

C、數(shù)據(jù)可視化,減少輸入數(shù)據(jù)的維數(shù),能夠?qū)?shù)據(jù)在2D平面中進(jìn)行繪

D、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),使得數(shù)據(jù)占用更少的內(nèi)存/磁盤空

參考答案:A

60.關(guān)于用戶畫像的說法錯誤的是()

A、用戶標(biāo)簽必須描述客觀的事實

B、用戶畫像本質(zhì)上是應(yīng)用用戶標(biāo)簽做客群定位

C、用戶畫像的標(biāo)簽分為定量標(biāo)簽和定性標(biāo)簽

D、用戶畫像的應(yīng)用場景有:產(chǎn)品設(shè)計,營銷推薦,風(fēng)險控制等

參考答案:A

61.總體方差未知情形下,進(jìn)行兩個總體均值差的假設(shè)檢驗,首先會判

A、總體均值是否相等

B、樣本均值是否相等

C、總體方差是否相等

D、樣本方差是否相等

參考答案:C

62.在方差分析中,多重比較的目的是通過配對比較來進(jìn)一步檢驗()

A、哪兩個樣本方差之間有差異

B、哪兩個樣本均值之間有差異

C、哪兩個總體方差之間有差異

D、哪兩個總體均值之間有差異

參考答案:D

63.多元線性回歸y=b0+blxl+b2x2...+bnxn+8進(jìn)行線性關(guān)系檢驗時,

原假設(shè)是?

A、bo=bl=bn=0

B、bl=...=bn-0

C、bl..,bn中存在任意一個不為0

D、bO,bl..bn中存在任意一個不為0

參考答案:B

64.若你獲得數(shù)據(jù)分析需求,需要分析同一客群,產(chǎn)品改造對客戶是否

滿意是否有顯著差異,你可以使用什么方法?

A、單樣本T檢驗

B、獨立樣本T檢驗

C、配對樣本T檢驗

D、卡方檢驗

參考答案:C

65.下列對K-means聚類算法解釋正確的是()

A、不能自動識別類的個數(shù),隨機(jī)挑選初始點為中心點計算

B、能自動識別類的個數(shù),不是隨機(jī)挑選初始點為中心點計算

C、不能自動識別類的個數(shù),不是隨機(jī)挑選初始點為中心點計算

D、能自動識別類的個數(shù),隨機(jī)挑選初始點為中心點計算

參考答案:A

66.針對5WHY,以下表述不正確的是

A、只是單純地把Why重復(fù)5次以上是行不通的

B、隨著問為什么的推進(jìn),內(nèi)容必須變得更加具體、詳細(xì)

C、要避免一切抽象、模糊的表達(dá)方式

D、5W就是要思考5個為什么

參考答案:D

67.在一次年級考試中隨機(jī)抽取100名學(xué)生,并將數(shù)學(xué)成績分成五

段:50-69,70-89,90To9,110T29130T50它的頻率分布直方圖如下,

則該批學(xué)生中成績不低于90的人數(shù)是?

A、70

B、65

C、80

D、90

參考答案:B

68.對A.,B.兩個總體方差比進(jìn)行區(qū)間估計,在95%置信水平下,得到

的置信區(qū)間是(0.6,0.9),以下敘述正確的是()

A、如果希望降低估計誤差,可以增加樣本量

B、總體方差比應(yīng)該等于0.65

C、(0.6,0.9)覆蓋了總體方差比

D、提高置信水平,可以使得區(qū)間變小

參考答案:A

69.在系統(tǒng)聚類中R2是指()

A、組內(nèi)離差平方和除以組間離差平方和

B、組間均方除以總均方

C、組間離差平方和除以總離差平方和

D、組間離差平方和除以組內(nèi)離差平方和

參考答案:C

70.標(biāo)準(zhǔn)化殘差圖主要用于直觀地判斷

A、回歸模型的線性關(guān)系是否顯著

B、誤差項等方差的假定是否成立

C、誤差項服從正態(tài)分布的假定是否成立

D、回歸系數(shù)是否顯著

參考答案:C

71.變量之間的關(guān)系可以分為兩大類

A、函數(shù)關(guān)系與相關(guān)關(guān)系

B、簡單相關(guān)關(guān)系和復(fù)雜相關(guān)關(guān)系

C、線性相關(guān)關(guān)系和非線性相關(guān)關(guān)系

D、正相關(guān)關(guān)系和負(fù)相關(guān)關(guān)系

參考答案:A

72.關(guān)于K-means聚類算法的特點,下列說法錯誤的是()

A、K-means對于噪聲比較敏感

B、當(dāng)處理較大數(shù)據(jù)集時,無法保持可伸縮性和高效率

C、不能對變量進(jìn)行聚類

D、當(dāng)簇近似為正態(tài)分布時,效果較好

參考答案:C

73.在管理類魚骨圖中,“人”的因素一般放在哪個層次上?

A、大要因

B、中要因

C、孫要因

D、小要因

參考答案:A

74.用于描述數(shù)據(jù)的數(shù)據(jù)或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)的是?

A、主數(shù)據(jù)

B、元數(shù)據(jù)

C、數(shù)據(jù)元

D、交易數(shù)據(jù)

參考答案:B

75.當(dāng)一元線性回歸模型的殘差出現(xiàn)異方差時,可以嘗試哪項工作0

A、自變量做歸一化處理

B、對自變量做非線性變換

C、對因變量做線性變換

D、對自變量做線性變換

參考答案:B

76.某學(xué)校組織投籃比賽,在預(yù)賽中每個同學(xué)需要投籃100次,成績前

50%的將進(jìn)入決賽,現(xiàn)在小明一共投中了48次,他希望評估自己是否

有希望參加決賽,因此將他的成績與全校成績的0進(jìn)行比較是最合理

的。

A、平均數(shù)

B、中位數(shù)

C、眾數(shù)

D、四分位差

參考答案:B

77.正態(tài)曲線下,從均數(shù)到+0。的面積為

A、0.95

B、0.35

C、不確定,和標(biāo)準(zhǔn)差有關(guān)

D、0.5

參考答案:D

78.如果我們拿到一份數(shù)據(jù),直接對這組數(shù)據(jù)建模型肯定會造成一系

列的問題,因此是需要進(jìn)行預(yù)分析,而關(guān)于預(yù)分析描述錯誤的是?

A、數(shù)據(jù)維度本身比較多,容易產(chǎn)生高維災(zāi)難問題,因此需要進(jìn)行降維

B、數(shù)據(jù)可能會受到各種干擾,因此會產(chǎn)生各種誤差,需要進(jìn)行數(shù)據(jù)清

C、統(tǒng)計模型有很多假設(shè),這些假設(shè)需要滿足,因此需要做統(tǒng)計上的準(zhǔn)

備工作

D、統(tǒng)計模型有固定的數(shù)據(jù)清理流程,不建議改變

參考答案:D

79.下面關(guān)于主成分分析,說法錯誤的是?

A、將大量相關(guān)變量轉(zhuǎn)化成一組很少的不相關(guān)變量,這些無關(guān)變量稱為

主成分

B、主成分分析是一種數(shù)據(jù)降維技術(shù),能夠過濾掉不相關(guān)變量

C、主成分是變量的線性組合

D、使用P

C.A.可將30個相關(guān)的變量轉(zhuǎn)化為5個無關(guān)的變量,并且盡可能地保

留原始數(shù)據(jù)集的信息

參考答案:B

80.當(dāng)我們對一份數(shù)據(jù)進(jìn)行建模分析時,如果出現(xiàn)數(shù)據(jù)集變量數(shù)較多,

而對應(yīng)的樣本數(shù)相對較少的情況,下列哪種處理方法不能提升被型的

適用性:

A、主成分分析

B、樣本聚類

C、增加樣本量

D、變量聚類

參考答案:B

81.在二元線性回歸模型Yi=B.0+B.IXu+B.2X2i+ui中,B.1表示

A、當(dāng)xl不變時,x2每變動一個單位Y的平均變動

B、當(dāng)xl和x2都保持不變時,Y的平均變動

C、當(dāng)x2不變時,xl每變動一個單位Y的平均變動

D、當(dāng)xl和x2都變動一個單位時,Y的平均變動

參考答案:C

82.時間序列M

A.(q)模型,其中q指的是()

A、時間序列的偏自相關(guān)系數(shù)是q階拖尾的

B、時間序列的自相關(guān)系數(shù)是q階截尾的

C、時間序列的偏自相關(guān)系數(shù)是q階截尾的

D、時間序列的自相關(guān)系數(shù)是q階拖尾的

參考答案:B

83.以下關(guān)于一元線性回歸分析y=B.o+B.ix+描述錯誤的是?

A、一元線性回歸中F檢驗的作用與t檢驗是一致的

B、一元線性回歸中F檢驗的檢驗統(tǒng)計量與t檢驗是一致的

C、若用于預(yù)測的x數(shù)值與樣本中的自變量偏差很大,那么預(yù)測得到y(tǒng)

的可靠性也會降低

D、即便建立了一元線性回歸,也不能直接認(rèn)為x是y的原因

參考答案:B

84.若想要對一個電商企業(yè)的產(chǎn)品銷售狀況和銷售趨勢進(jìn)行數(shù)據(jù)可視

化,最佳的圖表表示方式為()

A、直方圖

B、條形圖和趨勢線組合圖

C、餅圖

D、氣泡圖

參考答案:B

85.如果x和Y在統(tǒng)計上獨立,則相關(guān)系數(shù)等于

A、0

B、00

C、-1

D、1

參考答案:A

86.以下哪個不是分群標(biāo)簽的用途?

A、定位客戶的需求

B、解決工作的效率問題

C、建立對客戶的洞察

D、服務(wù)于產(chǎn)品和服務(wù)匹配策略

參考答案:B

87.K-MeA.ns聚類法要求自變量之間不存在共線性的原因是()

A、變量存在多重共線性時無法解釋聚類結(jié)果

B、變量存在多重共線性時無法得到聚類結(jié)果

C、變量存在多重共線性時,得到的聚類結(jié)果是完全錯誤的

D、變量存在多重共線性時,相關(guān)變量會在距高計算中占據(jù)高的權(quán)重,

從而對聚類結(jié)果有負(fù)面的影響

參考答案:D

88.線性規(guī)劃問題若有最優(yōu)解,則一定可以在可行域的()上達(dá)到

A、內(nèi)點

B、外點

C、幾何點

D、頂點

參考答案:D

89.在方差分析中,檢驗統(tǒng)計量F是?

A、組間均方除以組內(nèi)均方

B、組間平方除以總平方和

C、組間平方和除以組內(nèi)平方和

D、組間均方除以總均方

參考答案:A

90.在方差分析中,檢驗統(tǒng)計量F是

A、組間均方除以總均方

B、組間均方除以組內(nèi)均方

C、組間平方除以總平方和

D、組間平方和除以組內(nèi)平方和

參考答案:B

91.對于因子分析說法錯誤的是

A、因子載荷絕對值越大代表相應(yīng)的公共因子表達(dá)變量的信息越少

B、所有公共因子的因子載荷和隨機(jī)因子的平方和越接近1,則說明因

子分析的效果越好

C、公共因子的方差貢獻(xiàn),即在所有變量中該公共因子的因子載荷的平

方和,可以衡量公共因子能提供多少信息

D、因子分析和主成分分析一樣,都是一種降維的統(tǒng)計方法

參考答案:A

92.對于邏輯回歸和SVM算法說法中不正確的是()

A、邏輯回歸可以用于預(yù)測事件發(fā)生概率的大小

B、SVM可以有效避免模型過擬合

C、邏輯回歸的目標(biāo)是最小化后驗概率

D、SVM的目標(biāo)是最小化結(jié)構(gòu)風(fēng)險

參考答案:C

93.關(guān)于系統(tǒng)聚類,下列說法正確的是?

A、系統(tǒng)聚類之前需要先給出各個類別的初始類中心

B、系統(tǒng)聚類之后,模型能給出唯一的分類別數(shù)量

C、系統(tǒng)聚類之后,類別數(shù)量需要參考聚類過程給出

D、系統(tǒng)聚類之前需要先給出聚類的數(shù)量

參考答案:C

94.下列哪項不是主成分分析的推薦應(yīng)用?

A、數(shù)據(jù)可視化:減少輸入數(shù)據(jù)的維數(shù),能夠?qū)?shù)據(jù)在2D.平面中進(jìn)行

繪制

B、作為線性回歸的替代算法,對于大多數(shù)學(xué)習(xí)應(yīng)用,主成分分析和線

性回歸給出了基本相似的結(jié)果

C、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),使得數(shù)據(jù)占用更少的內(nèi)存/磁盤空

D、數(shù)據(jù)壓縮:減少輸入數(shù)據(jù)的維數(shù),并用于監(jiān)督學(xué)習(xí)算法,能夠使監(jiān)督

學(xué)習(xí)算法運行得更快

參考答案:B

95.針對字段〃用戶姓名”,下列方法最適宜的是?

A、需要編碼為數(shù)值變量

B、需要編碼為二分變量

C、需要編碼為分類變量

D、需要編碼為字符變量

參考答案:D

96.以下哪類不屬于分層標(biāo)簽?

A、RFM

B、VIP客戶級別

C、生命周期階段

D、家庭狀態(tài)

參考答案:D

97.線性規(guī)劃模型不包括下列()要素

A、約束條件

B、決策變量

C、目標(biāo)函數(shù)

D、狀態(tài)變量

參考答案:D

98.在對某個多元線性回歸模型的分析中,如果某自變量的VIF=1,這

說明()

A、此多元回歸模型的R2=0

B、此模型存在非常嚴(yán)重的共線性

C、此自變量與因變量不存在線性相關(guān)性

D、此自變量與其他自變量不存在線性相關(guān)性

參考答案:D

99.在因子分析中,為了幫助解釋因子,可以使用0

A、因子負(fù)載

B、主成分分析

C、因子旋轉(zhuǎn)

D、因子得分

參考答案:C

100.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們

的決定系數(shù)R方如下,其中擬合效果最好的模型是()

A、R方=0.98

B、R方=0.50

C、R方=0.25

D、R方=0.80

參考答案:A

101.已知某一元線性回歸模型的判定系數(shù)R2=0.64,則自變量與因變

量之間的相關(guān)系數(shù)為()

A、0.6

B、1.0

C、0.8

D、0.4

參考答案:C

102.某手機(jī)生產(chǎn)商希望研發(fā)一款新型的手機(jī)及配置選項,需要對全國

的目標(biāo)用戶進(jìn)行調(diào)研,項目時間為一個月,經(jīng)費20萬,請問此時使用

哪種調(diào)研方式比較合適?

A、問卷調(diào)查6000人

B、定性訪談20人+問卷調(diào)查300人

C、定性訪談500人

D、定性訪談200人+問卷調(diào)查200人

參考答案:B

103.問題理解階段事件還原工具是哪個?

A、關(guān)鍵事件

B、雷達(dá)圖

C、績效矩陣或嚴(yán)重度評估矩陣

D、流程圖

參考答案:D

104.市場調(diào)研的量表中,量表中所表示的只能是差距關(guān)系和順序關(guān)系,

不具備真正的零點的量表是?

A、順序量表

B、等距量表

C、類別量表

D、等比量表

參考答案:B

105.已知某公司的廣告投入和銷售業(yè)績復(fù)合y=564.23+0.59x(單位:

萬)的形式,下面說法正確的是?

A、投入產(chǎn)出比大于1

B、投入產(chǎn)出比小于1

C、若廣告每投入1萬元,銷售業(yè)績增加59萬元

D、如果沒有廣告投入,銷售業(yè)績?yōu)?64.23百萬元

參考答案:B

106.有關(guān)根因分析下列說法不正確的是?

A、異常事件嚴(yán)重度評估準(zhǔn)則可以用理解問題

B、根因分析最后一步是提出改善措施,消除根原因

C、頭腦風(fēng)暴法常用于找到問題最可能的原因

D、只能用5WHY分析法確定根原因

參考答案:D

107.當(dāng)我們對一份數(shù)據(jù)進(jìn)行建模分析時,如果出現(xiàn)數(shù)據(jù)集變較多,而

對應(yīng)的樣本數(shù)相對較少的情況,下列哪種處理方法不能提升模型的適

用性

A、變量聚類

B、增加樣本量

C、主成分分析

D、樣本聚類

參考答案:D

108.關(guān)于主成分分析的特點,理解錯誤的是

A、前幾個主成分的變異無法解釋原多元數(shù)據(jù)中的所有變異

B、如果原始變量不相關(guān),即協(xié)方差為0,則不需要做主成分分析

C、有多少個變量就會有多少個正交的主成分

D、主成分的變異之和等于原始變量的所有變異

參考答案:C

109.在建立線性回歸模型時,因變量與自變量之間非線性相關(guān),以下

做法正確的是?

A、剔除掉自變量的高杠桿點

B、對自變量進(jìn)行變量變換

C、剔除掉自變量的離群點

D、對因變量進(jìn)行變量變換

參考答案:B

110.關(guān)于混淆矩陣,下面說法錯誤的是?

A、預(yù)測為真,實際為假,標(biāo)記為FN(FA.IseNegA.tive)

B、召回度(reC.A.11)計算公式為TP/(TP+FN),表示真實為真中有多

少被預(yù)測正確

C、預(yù)測為真,實際為真,標(biāo)記為TP(TruePositive)

D、精準(zhǔn)度(precision)計算公式為TP/(TP+FP),表示預(yù)測為真中有

多少真實為真

參考答案:A

111.關(guān)于K-Means算法,正確的描述是

A、不能使用核函數(shù)

B、每次選代的時間復(fù)雜度是0(n2),其中n是樣本數(shù)量

C、能找到任意形狀的聚類

D、初始值不同,最終結(jié)果可能不同

參考答案:D

112.線性規(guī)劃問題是針對()求極值問題

A、約束

B、秩

C、目標(biāo)函數(shù)

D、決策變量

參考答案:C

113.在線性回歸分析中,當(dāng)發(fā)現(xiàn)自變量之間相關(guān)性較強(qiáng)時,可以采用

A、Lasso回歸

B、廣義線性回歸

C、非線性回歸

D、邏輯回歸

參考答案:A

114.在方差分析中,數(shù)據(jù)的誤差是用平方和來表示的。其中反映一個

各觀測值誤差大小的平方和稱為

A、水平項平方和

B、總平方和

C、組間平方和

D、組內(nèi)平方和

參考答案:D

115.樣本預(yù)設(shè)分類的情況下,通過樣本的現(xiàn)有特征對樣本進(jìn)行分類的

方法稱為()

A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

B、分類分析

C、描述性分析

D、聚類分析

參考答案:B

116.某客戶為欺詐的概率為0.6,則優(yōu)勢比為?

A、0.6

B、1.5

C、0.085416667

D、0.4

參考答案:B

117.線性規(guī)劃問題是針對()求極值問題

A、秩

B、目標(biāo)函數(shù)

C、約束

D、決策變量

參考答案:B

118.基于對未來的預(yù)測和在可選策略集上得到的行動方案,稱為

A、策略

B、信息

C、數(shù)據(jù)

D、知識

參考答案:A

119.以下說法不正確的是?

A、魚骨圖不只用于根原因定位,還用于分析對策

B、因果圖包括傳統(tǒng)魚骨圖和過程圖,但是都是以魚骨圖的形式體現(xiàn)的

C、對策型的魚骨圖魚頭在右,特性值通常以“如何提高?〃來寫

D、原因型魚骨圖的魚頭在右,特性值通常以“為什么?”來寫

參考答案:C

120.在數(shù)據(jù)庫設(shè)計的需求分析階段,一般采用()表示業(yè)務(wù)流程分析的

結(jié)果

A、數(shù)據(jù)流圖

B、程序結(jié)構(gòu)圖

C、E-R圖

D、程序框圖

參考答案:A

121.某商店為了計算商品的熱銷程度,可以通過計算商品的

A、偏度

B、平均數(shù)

C、眾數(shù)

D、加權(quán)平均數(shù)

參考答案:A

122.全國性大規(guī)模調(diào)查,通常需要多種抽樣方法,而多段集群抽樣

(muti-stageclustersampling)提供了多種整合技術(shù),據(jù)此說法正確

的是?

A、是指在第一個階段先抽出一部分集群,然后在下一階段選中的集群

中,再抽出一部分集群,到最后階段再抽取若干基本單元(最小單位)

B、大規(guī)模抽樣最多使用到兩階段抽樣,因為誤差無法控制

C、抽樣階段每增加一級,其抽樣誤差不變,因此最終對總體的估計與

簡單抽樣相同

D、如果是全國性調(diào)查的多段集群抽樣,其最小單元只能是行政區(qū)塊村,

不能是個人

參考答案:A

123.關(guān)于相關(guān)關(guān)系,下面說法正確的是?

A、相關(guān)關(guān)系必是因果關(guān)系,因果關(guān)系不一定是相關(guān)關(guān)系

B、完全不相關(guān)時,相關(guān)系數(shù)為0

C、從相關(guān)程度分為強(qiáng)相關(guān)和弱相關(guān)

D、相關(guān)關(guān)系按照方向分為線性相關(guān)和非線性相關(guān)

參考答案:B

124.5WHY分析法又被稱為

A、矩陣分析法

B、因果分析法

C、頭腦風(fēng)暴法

D、五問分析法

參考答案:D

125.在魚骨圖分析中,以下哪個是正確的?

A、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在大要因?qū)用?/p>

B、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在小要因?qū)用?/p>

C、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在中要因?qū)用?/p>

D、選取重要原因時,不要超過7項,且應(yīng)標(biāo)識在最未端原因

參考答案:D

126.根原因消除工具不包括哪個?

A、六項思考帽

B、價值樹模型

C、系統(tǒng)發(fā)明思想

D、創(chuàng)造性解決問題理論

參考答案:B

127.據(jù)研究發(fā)現(xiàn),身高服從正態(tài)分布。則在一次抽樣中,取到的身高小

于等于中位數(shù)的概率為()

A、0.05

B、小于50%

C、大于50%

D、0.5

參考答案:D

128.方差分析表中用于檢驗總體模型假設(shè)的統(tǒng)計量是()

A、F

B、SSE

C、SST

D、SSM

參考答案:A

129.當(dāng)時間序列的環(huán)比增長速度大體相同時,適宜擬合

A、直線

B、對數(shù)曲線

C、拋物線

D、指數(shù)曲線

參考答案:A

130.如果時間序列的各期增長量相等,則

A、各期的環(huán)比增長速度保持不變

B、環(huán)比增長速度逐期上升

C、環(huán)比增長速度逐期下降

D、各期環(huán)比增長速度有升有降

參考答案:C

131.研究性別與是否抽煙的相關(guān)性,可以用

A、卡方檢驗

B、皮爾遜相關(guān)系數(shù)

C、方差分析

D、t檢驗

參考答案:A

132.在假設(shè)檢驗問題中,原假設(shè)為H0,給定顯著水平為a,則正確的是

0

A、P(接受HO|HO正確)=a

B、P(接受HO|HO不正確)=『a

C、P(拒絕HO|HO正確)=a

D、P(拒絕HO|HO不正確)=1-a

參考答案:C

133.5WHY分析法又被稱為

A、矩陣分析法

B、頭腦風(fēng)景法

C、因果分析法

D、五問分析法

參考答案:D

134.相比獲得全市員工名單而言,獲取全市的企業(yè)名單會容易的多,

并以企業(yè)為單位隨機(jī)抽樣,重點調(diào)查某個企業(yè),這樣可以節(jié)省調(diào)研成

本,請問這是哪種抽樣方法?

A、分群抽樣(C.lustersA.mpling)

B、簡單隨機(jī)抽樣(simplerA.nD.omsA.mpling)

C、系統(tǒng)抽樣(systemA.tiC.sA.mpling)

D、分層隨機(jī)抽樣(strA.tifeD.rA.n

D.omsA.mpling)

參考答案:D

135.下列關(guān)于邏輯回歸的說法正確的是

A、邏輯回歸必須對缺失值做預(yù)處理

B、邏輯回歸比決策樹,更容易過度擬合

C、邏輯回歸要求自變量和目標(biāo)變量是線性關(guān)系

D、邏輯回歸只能做2值分類,不能直接做多值分類

參考答案:A

136.研究性別與是否抽煙的相關(guān)性,可以用()

A、方差分析

B、卡方檢驗

C、皮爾遜相關(guān)系數(shù)

D、檢驗

參考答案:B

137.如何才能盡快掌握5W方法

A、凡事都問幾個為什么

B、求教領(lǐng)導(dǎo)

C、邀請專家指導(dǎo)

D、參加培訓(xùn)

參考答案:A

138.K-Means聚類法要求自變量之間不存在共線性的原因是()

A、變量存在多重共線性時無法得到聚類結(jié)果

B、變量存在多重共線性時,相關(guān)變量會在距離計算中占據(jù)高的權(quán)重,

從而對聚類結(jié)果有負(fù)面的影響

C、變量存在多重共線性時,得到的聚類結(jié)果是完全錯誤的

D、變量存在多重共線性時無法解釋聚類結(jié)果

參考答案:B

139.以下哪個不是根原因分析中問題原因頭腦風(fēng)暴的技術(shù)和工具?

A、績效矩陣

B、是非矩陣

C、配對比較

D、名義群組技術(shù)

參考答案:A

140.按經(jīng)典假設(shè),線性回歸模型中的解釋變量應(yīng)是非隨機(jī)變量,且()

A、與隨機(jī)誤差項不相關(guān)

B、與被解釋變量不相關(guān)

C、與回歸值不相關(guān)

D、與殘差項不相關(guān)

參考答案:A

141.下列說法錯誤的是

A、若原問題有可行解,但目標(biāo)函數(shù)無界,其對偶問題無可行解

B、若原問題為mA.xZ=C.X,A.XsB.,x20,則對偶問題為

minW=YB.,YA,>=C.,Y>=0

C、任何線性規(guī)劃問題都有一個與之對應(yīng)的對偶問題

D、對偶問題無可行解時,其原問題的目標(biāo)函數(shù)無界

參考答案:D

142.對相同的數(shù)據(jù)進(jìn)行邏輯回歸時,會節(jié)省時間、提高精度的做法是?

A、降低學(xué)習(xí)率,減少迭代次數(shù)

B、增加學(xué)習(xí)率,減少迭代次數(shù)

C、降低學(xué)習(xí)率,增加選代次數(shù)

D、提高學(xué)習(xí)率,增加送代次數(shù)

參考答案:B

143.當(dāng)進(jìn)行因子分析時,KMO值在()范圍內(nèi),因子分析才是有效的

A、小于0

B、0.3-0.5

C、0-0.2

D、大于0.6

參考答案:D

144.根原因分析中解決方案實施階段包括哪些技術(shù)和工具?

A、精益價值樹和因果矩陣

B、力場分析和系統(tǒng)創(chuàng)新思維方法

C、精益價值樹和力場分析

D、因果矩陣和系統(tǒng)創(chuàng)新思維方法

參考答案:C

145.關(guān)于回歸分析和相關(guān)分析的區(qū)別和聯(lián)系,下面說法錯誤的是?

A、為了了解兩變量直線方向的密切程度,宜選用線性相關(guān)分析

B、回歸方程y=kx+b中的k表示兩變量間的相關(guān)程度

C、為了了解自變量對因變量的影響大小,宜選用線性回歸分析

D、相關(guān)分析看的是因果關(guān)系

參考答案:D

146.目前收集110份問卷,數(shù)據(jù)質(zhì)量控制良好,需要分析用戶推薦指

數(shù)(1T00評分)的影響因素,其中包括行為類6個指標(biāo)。請問一般使

用什么統(tǒng)計方法來解決這類歸因問題?

A、logisti

C.回歸模型

B、深層神經(jīng)網(wǎng)絡(luò)模型

C、結(jié)構(gòu)方程模型

D、線性回歸模型

參考答案:A

147.箱線圖的矩形中間的橫線表示的是這組數(shù)據(jù)的()

A、上四分位數(shù)

B、下四分位數(shù)

C、中位數(shù)

D、平均數(shù)

參考答案:C

148.檢驗兩個群體老年人口比例差,用

A、t檢驗

B、卡方檢驗

C、F檢驗

D、z檢驗

參考答案:D

149.多元線性回歸中F檢驗的原假設(shè)是?

A、所有回歸系數(shù)都等于0

B、所有回歸系數(shù)都等于預(yù)估值

C、所有回歸系數(shù)都不等于0

D、所有回歸系數(shù)都不等于預(yù)估值

參考答案:A

150.當(dāng)對多元線性回歸y=bn+bln+b2nt+—+bnxn+E,進(jìn)行線性關(guān)系檢

驗時,原假設(shè)可以設(shè)為0

A、bo,bl,...bn中在任意一個不為0

B、bl,……,bn中存在任意一個不為0

C、bl...-bn-0

D、b0=bl=...bn=0

參考答案:C

151.研究性別與是否失眠的相關(guān)性,可以用

A、偏度

B、卡方檢驗

C、t檢驗

D、F檢驗

參考答案:B

152.兩個變量y與x的回歸模型中,通常用R方來刻畫回歸的效果,

下列敘述正確的是0

A、R方越大,殘差平方和越大

B、R方越小,殘差平方和越小

c、R方與殘差平方和無關(guān)

D、R方越小,殘差平方和越大

參考答案:D

153.回歸分析中定義的

A、解釋變量和被解釋變量都是隨機(jī)變量

B、解釋變量和被解釋變量都為非隨機(jī)變量

C、解釋變量為隨機(jī)變量,被解釋變量為非隨機(jī)變量

D、解釋變量為非隨機(jī)變量,被解釋變量為隨機(jī)變量

參考答案:D

154,主成分分析需要考慮樣本的

A、協(xié)方差矩陣

B、方差

C、權(quán)重矩陣

D、關(guān)聯(lián)矩陣

參考答案:A

155.用于描述數(shù)據(jù)的數(shù)據(jù)或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)的是()

A、交易數(shù)據(jù)

B、數(shù)據(jù)元

C、主數(shù)據(jù)

D、元數(shù)據(jù)

參考答案:D

156.在線性回歸分析中,發(fā)現(xiàn)兩個變量之間存在正向線性相關(guān),則

pearson相關(guān)系數(shù)應(yīng):

A、r=0

B、r<0

C、r>0

D、r!=0

參考答案:C

157.對于數(shù)據(jù)倉庫的特點下列說法中錯誤的是?

A、將來自多個數(shù)據(jù)源的數(shù)據(jù)進(jìn)行整合

B、主要功能就是用來存儲數(shù)據(jù)的

C、數(shù)據(jù)倉庫一般支撐數(shù)據(jù)和修改

D、數(shù)據(jù)倉庫通過ETL將數(shù)據(jù)進(jìn)行清洗整合

參考答案:C

158.問題理解階段事件還原工具是哪個?

A、流程圖

B、雷達(dá)圖

C、關(guān)鍵事件

D、績效矩陣或嚴(yán)重度評估矩陣

參考答案:A

159.如果多元線性回歸模型中殘差不等于0,而是一個常數(shù),那么()

A、這個常數(shù)應(yīng)該包含在常數(shù)項

B、應(yīng)該去除常數(shù)項

C、型有效

D、應(yīng)該去除殘差項

參考答案:A

160.下面關(guān)于選擇何種機(jī)器學(xué)習(xí)建模思路,說法錯誤的是?

A、當(dāng)需要獲得特征與特征間的關(guān)系時,需建立無監(jiān)督模型

B、在反欺詐領(lǐng)域,當(dāng)已知有欺詐觀測時,可用有監(jiān)督模型來識別用戶

C、在反欺詐領(lǐng)域,當(dāng)沒有反欺詐人群時,可用有監(jiān)督模型來識別用戶

D、當(dāng)需要獲得特征與目標(biāo)間的關(guān)系時,需建立有監(jiān)督模型

參考答案:C

161.關(guān)于用戶畫像的說法錯誤的是0

A、用戶畫像的標(biāo)簽分為定量標(biāo)簽和定性標(biāo)簽

B、用戶畫像本質(zhì)上是應(yīng)用用戶標(biāo)簽做客群定位

C、用戶標(biāo)簽必須描述客觀的事實

D、用戶畫像的應(yīng)用場景有:產(chǎn)品設(shè)計,營銷推薦,風(fēng)險控制等

參考答案:C

162.關(guān)于下圖描述錯誤的是?

A、橫坐標(biāo)x和縱坐標(biāo)Y之間是正相關(guān)的

B、橫坐標(biāo)X和縱坐標(biāo)Y之間很大可能是非線性關(guān)系

C、分析兩者之間的關(guān)系可用邏輯回歸模型

D、這些散點中存在異常點

參考答案:C

163.統(tǒng)計軟件處理的數(shù)據(jù)類型通常包括文本型、數(shù)值型、日期型等格

式,那么分析師錄制數(shù)據(jù)時,通常以哪種錄入方式為主?

A、不進(jìn)行任何編碼,保持原始問卷格式,這樣可以保證原始信息不變

B、數(shù)值編碼后,保持協(xié)方差格式錄入,這種格式可以改善運行時間

C、文本編碼后,保持一行表示一條觀測數(shù)據(jù)

D、數(shù)值編碼后,保持一行表示一條觀測數(shù)據(jù)

參考答案:D

164.對于邏輯回歸和SVM算法,說法中不正確的是()

A、SVM的目標(biāo)是最小化結(jié)構(gòu)風(fēng)險

B、SVM可以有效避免模型過擬合

C、邏輯回歸可以用于預(yù)測事件發(fā)生概率的大小

D、邏輯回歸的目標(biāo)是最小化后驗概率

參考答案:D

165.移動平均法用于測定

A、季節(jié)趨勢

B、循環(huán)變動

C、長期趨勢

D、短期變化

參考答案:C

166.對于不平穩(wěn)的序列進(jìn)行時間序列分析可以

A、差分

B、微分

C、積分

D、不能使用

參考答案:A

167.一元線性回歸方程y=3+4x,當(dāng)x增加一個單位,以下哪個表述最

準(zhǔn)確?

A、y平均增加7個單位

B、y增加7個單位

C、y增加4個單位

D、y平均增加4個單位

參考答案:D

168.對一元線性回歸y=bO+blxl+e進(jìn)行F檢驗,其結(jié)果與對回歸系

數(shù)bl做t檢驗得到的結(jié)果()

A、相同

B、相反

C、無法確定

D、無關(guān)

參考答案:A

169.近因分析階段(現(xiàn)狀問題描述)不能使用的圖表類型是?

A、帕累托圖

B、折線圖

C、柱狀圖

D、雷達(dá)圖

參考答案:B

170.對于一元線性回歸,回歸系數(shù)顯著性檢驗需要用到

A、F檢驗

B、T檢驗

C、Z檢驗

D、卡方檢驗

參考答案:B

171.數(shù)據(jù)被稱為()的原材料

A、元數(shù)據(jù)

B、信息

C、知識

D、策略

參考答案:B

172.關(guān)于主成分分析的特點,理解錯誤的是

A、有多少個變量就會有多少個正交的主成分

B、前幾個主成分的變異無法解釋原多元數(shù)據(jù)中的所有變異

C、如果原始變量不相關(guān),即協(xié)方差為0,則不需要做主成分分析

D、主成分的變異之和等于原始變量的所有變異

參考答案:A

173.樣本預(yù)設(shè)分類的情況下,通過樣本的現(xiàn)有特征對樣本進(jìn)行分類的

方法稱為()

A、分類分析

B、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

C、聚類分析

D、描述性分析

參考答案:A

174.下列哪一項不屬于5W分析的注意事項

A、注意現(xiàn)象只記錄事實

B、先入為主

C、注意層和層間的相關(guān)性,不要跳步

D、避免找原因牽涉到了人的心理

參考答案:D

175.在假設(shè)檢驗問題中,原假設(shè)為H0,備擇假設(shè)為H1,則錯誤可以表

示為

A、p{接受HO|HO為真}

B、p{拒絕HO|HO為真}

C、p{接受H1|HO為真}

D、p{接受HO|H1為真}

參考答案:D

176.主成分分析算法認(rèn)為數(shù)據(jù)的信息是包含在()中

A、均值

B、極值

C、誤差

D、方差

參考答案:D

177.在時間序列分析中,指數(shù)平滑法的平滑系數(shù)a的取值()

A、取值范圍在0至U1之間

B、越大越好

C、取值范圍在T到1之間

D、越小越好

參考答案:A

178.以下哪個是快速聚類法

A、系統(tǒng)聚類法

B、層次聚類法

C、兩步聚類法

D、K-me

A.ns聚類法

參考答案:D

179.對某商品抽樣調(diào)查,抽取其中400個商品,其中98%的商品合格,

以下描述正確的是

A、整個商品的合格率為98%

B、整個商品的合格率大于98%

C、根據(jù)以上信息,我們不知道整個商品的合格率比值

D、整個商品的合格率小于98%

參考答案:C

180.如果多元線性回歸模型中殘差不等于0,而是一個常數(shù),那么()

A、模型有效

B、應(yīng)該去除常數(shù)項

C、這個常數(shù)應(yīng)該包含在常數(shù)項

D、應(yīng)該去除殘差項

參考答案:C

181.根據(jù)馬斯洛需求層次理論,其中最低層次是()

A、安全需要

B、地位和收入尊重需要

C、感情和歸屬需要

D、生理需要

參考答案:D

182.根原因分析的工具箱包括以下哪個數(shù)據(jù)近因分析階段的工具

A、根原因識別

B、問題原因頭腦風(fēng)暴、數(shù)據(jù)收集、數(shù)據(jù)分析

C、根原因消除

D、問題理解

參考答案:A

183.應(yīng)用回歸分析應(yīng)注意的問題,下面說法錯誤的是?

A、應(yīng)用回歸分析時,要注意時間窗口的一致性

B、因為回歸分析是研究自變量與因變量的因果關(guān)系,所以要注意孰因

孰果

C、回歸分析的自變量選取要符合業(yè)務(wù)需要,選擇合適的數(shù)據(jù)資料

D、回歸分析的自變量必須是連續(xù)型數(shù)據(jù)

參考答案:D

184.下列關(guān)于主成分分析的描述錯誤的是?()

A、是一類常用的針對連續(xù)變量的降維方法

B、我們一般保留的前k個主成分累計能夠解釋數(shù)據(jù)80%以上的變異

C、各主成分之間的方向夾角需要盡可能的大

D、我們一般保留的前k個主成分中最后一個主成分對應(yīng)的不應(yīng)小于

1

參考答案:C

185.多元線性回歸y=b0+blxl+b2x2+..+bnxn+&進(jìn)行線性關(guān)系檢驗時,

原假設(shè)是

A、bl=..bn=0

B、b0=bl=..=0

C、bl,..,bn中存在任意一個不為0

D、bO,bl,..,bn中存在任意一個不為0

參考答案:A

186.下面關(guān)于回歸分析,說法錯誤的是?

A、線性回歸對異常值不敏感

B、按照自變量和因變量的函數(shù)關(guān)系來分類,可以分為線性回歸分析和

非線性回歸分析

C、按照自變量和因變量的個數(shù)來分類,可分為一元回歸分析和多元回

歸分析

D、非線性回歸問題可以轉(zhuǎn)化為線性回歸

參考答案:A

187.在進(jìn)行多元線性回歸模型的分析中,如果自變量的VIF=1,這說明

0

A、此自變量與其他自變量不存在線性相關(guān)性

B、此多元回歸模型的R2=0

C、此模型存在非常嚴(yán)重的共線性

D、此自變量與因變量不存在線性相關(guān)性

參考答案:A

188.若線性規(guī)劃問題沒有可行解,可行解集是空集,則此問題0

A、沒有最優(yōu)解

B、有無界解

C、沒有無窮多最優(yōu)解

D、有無界解(重復(fù)選項)

參考答案:A

189.統(tǒng)計分析涉及高維運算,因此需要對高維空間中的數(shù)據(jù)結(jié)構(gòu)進(jìn)行

探索,以發(fā)現(xiàn)其內(nèi)部的模式,但高維探索特別困難,所以因子分析可以

將高維空間進(jìn)行降維,然后探索其內(nèi)部結(jié)構(gòu)。下面有關(guān)因子分析說法

錯誤的是?

A、因子分析與主成分分析都是數(shù)據(jù)降維的主要手段

B、數(shù)據(jù)結(jié)構(gòu)探索是因子分析功能之一

C、降維是因子分析的功能之一

D、因子分析在探索問題上,常用于效度分析

參考答案:B

190.兩個隨機(jī)變量的線性相關(guān)系數(shù)為0,說明

A、兩個變量線性無關(guān)

B、兩個變量獨立

C、至少有一個變量是0

D、兩個變量無關(guān)

參考答案:A

191.某奶茶店為了預(yù)測每天訂單數(shù),建立了一個線性回歸模型,其中

有一個自變量為天氣類型(分類變量),分為晴、陰、雨、雪等4種類

型,請問如何處理這種變量?

A、直接作為自變量使用

B、設(shè)置啞變量

C、剔除變量

D、變量標(biāo)準(zhǔn)化

參考答案:B

192.對于因子分析說法錯誤的是

A、因子分析和主成分分析一樣,都是一種降維的統(tǒng)計方法

B、所有公共因子的因子載荷和隨機(jī)因子的平方和越接近1,則說明因

子分析的效果越好

C、因子載荷絕對值越大代表相應(yīng)的公共因子表達(dá)變量的信息越少

D、公共因子的方差貢獻(xiàn),即在所有變量中該公共因子的因子載荷的平

方和,可以衡量公共因子能提供多少信息

參考答案:C

193.以下說法不正確的是?

A、對策型的魚骨圖魚頭在右,特性值通常以〃如何提高〃來寫

B、魚骨圖不只用于根原因定位,還用于分析對策

C、因果圖包括傳統(tǒng)魚骨圖和過程圖,但是都是以魚骨圖的形式體現(xiàn)的

D、原因型魚骨圖的魚頭在右,特性值通常以〃為什么〃來寫

參考答案:A

194.某分析師希望通過聚類算法進(jìn)行欺詐分析,發(fā)現(xiàn)結(jié)果不是很理想。

下列方法中哪項不能為聚類效果帶來提升?

A、對變量進(jìn)行變量聚類

B、對變量進(jìn)行標(biāo)準(zhǔn)化

C、對變量進(jìn)行主成分分析

D、對變量進(jìn)行分箱處理

參考答案:D

195.市場調(diào)研的量表中,量表中所表示的只能是差距關(guān)系和順序關(guān)系,

不具備真正的零點的量表是()

A、等比量表

B、等距量表

C、類別量表

D、順序量表

參考答案:B

196.檢驗兩個群體老年人口比例差,用()

A、Z檢驗

B、t檢驗

C、F檢驗

D、卡方檢驗

參考答案:A

197.在系統(tǒng)聚類中R2是指()

A、組內(nèi)離差平方和除以總離差平方和

B、組內(nèi)離差平方和除以組間離差平方和

C、組間離差平方和除以總離差平方和

D、組間離差平方和除以組內(nèi)離差平方和

參考答案:C

198.在進(jìn)行策劃時,按照一定的程序進(jìn)行精準(zhǔn)營銷策劃的方法是

A、程序法

B、案例法

C、計劃法

D、模型法

參考答案:A

199.在進(jìn)行策劃時,按照一定的程序進(jìn)行精準(zhǔn)營銷策劃的方法是

A、程序法

B、計劃法

C、模型法

D、案例法

參考答案:A

200.數(shù)據(jù)被稱為()的原材料

A、信息

B、策略

C、元數(shù)據(jù)

D、知識

參考答案:A

二.多選題

1.回歸分析中多重共線性的處理方法有

A、逐步回歸

B、變量標(biāo)準(zhǔn)化

C、工具變量

D、嶺回歸

參考答案:AD

2.因果圖的分析要點有哪些?

A、如果某種原因可同時歸屬于兩種或兩種以上因素,請以關(guān)聯(lián)性最強(qiáng)

者為準(zhǔn)

B、腦力激蕩時,應(yīng)盡可能多而全地找出所有可能原因,而不僅限于自

己能完全掌控或正在執(zhí)行的內(nèi)容,對人的原因,宜從行動而非思想態(tài)

度面著手分析

C、大要因必須用中性詞描述(不說明好壞),中、小要因必須使用價值

判斷(如??不良)

D、確定大要因時,現(xiàn)場作業(yè)一般從“人、機(jī)、料、法、環(huán)〃著手,管理

類問題一般從〃人、事、時、地、物〃層別,應(yīng)視具體情況決定

參考答案:ABCD

3.反映回歸直線擬合優(yōu)度的指標(biāo)有()

A、樣本決定系數(shù)

B、回歸系數(shù)

C、相關(guān)系數(shù)

D、剩余變差(或殘差平方和)

參考答案:ACD

4.下列屬于線性回歸假設(shè)的是()

A、解釋變量之間不能強(qiáng)線性相關(guān)

B、解釋變量和被解釋變量之間存在線性關(guān)系

C、抗動項獨立同分布

D、解釋變量和擾動項不能相關(guān)

參考答案:CD

5.線性規(guī)劃模型包括的要素有()

A、環(huán)境變量

B、目標(biāo)函數(shù)

C、決策變量

D、狀態(tài)變量

參考答案:BC

6.多元線性回歸中,內(nèi)生性的解決方法有?

A、變量別除

B、聯(lián)立方程

C、工具變量

D、變量轉(zhuǎn)換

參考答案:ACD

7.以下屬于線性回歸基本假設(shè)的有

A、誤差項£相互獨立

B、誤差項E服從正態(tài)分布

C、誤差項e的期望等于1

D、誤差項e的方差等于1

參考答案:AB

8.根原因分析中問題理解的常用工具包括()

A、雷達(dá)圖

B、關(guān)鍵事件

C、績效矩陣

D、流程圖

參考答案:ABCD

9.現(xiàn)希望獲得某地區(qū)32所小學(xué)中,所有學(xué)生的數(shù)學(xué)成績狀況,總?cè)藬?shù)

為6800名,但項目費用有限,前提限定了抽樣樣本不能超過600個,

通過調(diào)查發(fā)現(xiàn),全市小學(xué)分成3個地區(qū)(根據(jù)師資、人口等因素),學(xué)生

人數(shù)分別為1700,2266,2834,并且平均調(diào)查費用比為5,2:1,預(yù)調(diào)查

樣本標(biāo)準(zhǔn)差為12、8、14(分別對應(yīng)地區(qū)一三三),下列選項說法不正確

的是0

A、需要分群抽樣和簡單抽樣兩項計算才能完成樣本搜集工作

B、分層抽樣技術(shù)可以完成樣本搜集工作

C、可以使用簡單隨機(jī)抽樣技術(shù)完成樣本搜集工作

D、使用系統(tǒng)抽樣技術(shù)完成樣本搜集工作

參考答案:ACD

10.在層次聚類中,可以用來定義兩個類之間距離的方法有

A、離差平方和法

B、中間距離法

C、最短距離法

D、類平均距離法

參考答案:ABCD

11.因果圖的分析要點有哪些?

A、確定大要因時,現(xiàn)場作業(yè)一般從〃人、機(jī)、料、法、環(huán)〃著手,管理類

問題一般從〃人、事、時、地、物〃層別,應(yīng)視具體情況決定

B、腦力激蕩時,應(yīng)盡可能多而全地找出所有可能原因,而不僅限于自

己能完全掌控或正在執(zhí)行的內(nèi)容,對人的原因,宜從行動而非思想態(tài)

度面著手分析

C、大要因必須用中性詞描述(不說明好壞),中、小要因必須使用價值

判斷(如、.?不良)

D、如果某種原因可同時歸屬于兩種或兩種以上因素,請以關(guān)聯(lián)性最強(qiáng)

者為準(zhǔn)

參考答案:ABCD

12.給定獨立同分布的隨機(jī)變量,期望為u,方差為o2當(dāng)樣本容量趨近

于無窮時,以下正確的是

A、樣本均值的分布與n有關(guān)

B、樣本的平均值的分布近似服從正態(tài)分布

C、樣本的均值也是隨機(jī)變量

D、樣本的均值也是隨機(jī)變量樣本的平均值趨近于H?

參考答案:BCD

13.RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段,以下

屬于RFM模型分析指標(biāo)的是()

A、消費金額

B、消費趨勢

C、消費頻率

D、最近一次消費

參考答案:ACD

14.線性規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論