大數(shù)據(jù)分析與應(yīng)用知到章節(jié)答案智慧樹2023年西安理工大學(xué)_第1頁
大數(shù)據(jù)分析與應(yīng)用知到章節(jié)答案智慧樹2023年西安理工大學(xué)_第2頁
大數(shù)據(jù)分析與應(yīng)用知到章節(jié)答案智慧樹2023年西安理工大學(xué)_第3頁
大數(shù)據(jù)分析與應(yīng)用知到章節(jié)答案智慧樹2023年西安理工大學(xué)_第4頁
大數(shù)據(jù)分析與應(yīng)用知到章節(jié)答案智慧樹2023年西安理工大學(xué)_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)分析與應(yīng)用知到章節(jié)測試答案智慧樹2023年最新西安理工大學(xué)第一章測試

大數(shù)據(jù)泛指巨量的()。

參考答案:

數(shù)據(jù)集

數(shù)據(jù)分析指的是用適當(dāng)?shù)模ǎκ占瘉淼拇罅繑?shù)據(jù)進(jìn)行分析,提取有用信息并形成結(jié)論。

參考答案:

統(tǒng)計(jì)分析方法

瀏覽數(shù)據(jù)這一步驟可以通過對大數(shù)據(jù)進(jìn)行()來實(shí)現(xiàn)。

參考答案:

可視化

Gartner將大數(shù)據(jù)定義為是需要新處理模式才能具有更強(qiáng)的()以及高增長率和多樣化的信息資產(chǎn)。

參考答案:

流程優(yōu)化能力

;決策力

;洞察發(fā)現(xiàn)力

我們通常用“4V”來反映大數(shù)據(jù)的特點(diǎn),4V是指()。

參考答案:

Velocity

;Variety

大數(shù)據(jù)分析可以應(yīng)用在那些領(lǐng)域()。

參考答案:

醫(yī)療衛(wèi)生領(lǐng)域

;農(nóng)業(yè)領(lǐng)域

;商業(yè)領(lǐng)域

;交通運(yùn)輸領(lǐng)域

大數(shù)據(jù)分析的過程包括()。

參考答案:

數(shù)據(jù)準(zhǔn)備

;數(shù)據(jù)理解

數(shù)據(jù)只要有足夠的規(guī)模就可以稱為大數(shù)據(jù)。()

參考答案:

大數(shù)據(jù)分析是大數(shù)據(jù)到知識,再到信息的關(guān)鍵步驟。()

參考答案:

錯(cuò)

大數(shù)據(jù)分析模型用于描述數(shù)據(jù)之間的關(guān)系。如確定自變量、因變量,進(jìn)而通過聚類、回歸等方法確定其關(guān)系。()

參考答案:

第二章測試

數(shù)據(jù)倉庫的定義于哪一年提出()。

參考答案:

1991

符合選擇建立數(shù)據(jù)倉庫平臺的公認(rèn)標(biāo)準(zhǔn)的是()。

參考答案:

數(shù)據(jù)庫對大數(shù)據(jù)量的支持能力

建立數(shù)據(jù)倉庫的首要步驟是()。

參考答案:

確認(rèn)主題

數(shù)據(jù)倉庫的數(shù)據(jù)模型進(jìn)行邏輯建模的分析角度是()。

參考答案:

業(yè)務(wù)分析

建立數(shù)據(jù)倉庫的選擇平臺是()。

參考答案:

建模工具

;分析工具

;數(shù)據(jù)庫

建立數(shù)據(jù)倉庫的步驟是()。

參考答案:

確認(rèn)主題

;數(shù)據(jù)傳輸

;選擇平臺

;數(shù)據(jù)清洗

符合多維度數(shù)據(jù)模型構(gòu)成的是()。

參考答案:

事實(shí)表

;維度表

屬于衡量業(yè)務(wù)性能指標(biāo)的是()。

參考答案:

銷售額

;銷售量

數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型是一維結(jié)構(gòu)的數(shù)據(jù)視圖。()

參考答案:

錯(cuò)

元數(shù)據(jù)是對數(shù)據(jù)倉庫中數(shù)據(jù)的描述信息。()

參考答案:

第三章測試

下列哪項(xiàng)屬于隨機(jī)抽樣的缺點(diǎn)?()

參考答案:

樣本中個(gè)體數(shù)量過多,效率低下

整群抽樣中將總體各單位歸并成若干個(gè)()的集合,成為群,然后以群為單位抽取樣本。

參考答案:

互不交叉,互不重復(fù)

數(shù)據(jù)抽樣和過濾的相似之處是它們的目的都是為了減少要處理的數(shù)據(jù)量。()

參考答案:

以下哪種方法適用于原始數(shù)據(jù)的取值范圍已經(jīng)確定的情況?()

參考答案:

0-1標(biāo)準(zhǔn)化

數(shù)據(jù)有那些性質(zhì)?()

參考答案:

精確性

;時(shí)效性

;一致性

;完整性

數(shù)據(jù)缺陷有哪些類型?()

參考答案:

噪聲數(shù)據(jù)

;非規(guī)范化數(shù)據(jù)

;缺失數(shù)據(jù)

先將總體的觀察按某一順序號分為n個(gè)部分,再從每一部分各抽取一定數(shù)量的觀察組成樣本,屬于哪種抽樣方式?()

參考答案:

系統(tǒng)抽樣

數(shù)據(jù)清洗浪費(fèi)時(shí)間,是沒有意義的。()

參考答案:

錯(cuò)

數(shù)據(jù)標(biāo)準(zhǔn)化就是為了方便數(shù)據(jù)的下一步處理,而對數(shù)據(jù)進(jìn)行的等比例縮放。()

參考答案:

下列屬于邏輯錯(cuò)誤清洗的是()

參考答案:

去重

;去除不合理值

;修正矛盾內(nèi)容

第四章測試

關(guān)于經(jīng)濟(jì)計(jì)量模型進(jìn)行預(yù)測出現(xiàn)誤差的原因,正確的說法是()。

參考答案:

既有隨機(jī)因素,又有系統(tǒng)因素

在多元線性回歸模型中,若某個(gè)解釋變量對其余解釋變量的判定系數(shù)接近于1,則表明模型中存在()。

參考答案:

多重共線性

Logistic回歸系數(shù)與優(yōu)勢比OR的關(guān)系為()。

參考答案:

其他三個(gè)選項(xiàng)均正確

Logistic回歸可用于()。

參考答案:

其他三個(gè)選項(xiàng)均正確

Logistic回歸中自變量如為多分類變量,宜將其按啞變量處理,與其他變量進(jìn)行變量篩選時(shí)可用()。

參考答案:

應(yīng)將幾個(gè)啞變量作為一個(gè)因素,整體進(jìn)出回歸方程

在由n=30的一組樣本估計(jì)的、包含3個(gè)解釋變量的線性回歸模型中,計(jì)算得多重決定系數(shù)為0.8500,則調(diào)整后的多重決定系數(shù)為()。

參考答案:

0.8327

半對數(shù)模型中,參數(shù)1的含義是()。

參考答案:

X的相對變化,引起Y的期望值絕對量變化

回歸變差,或回歸平方和是指()。

參考答案:

被解釋變量的總變差與剩余變差之差

;解釋變量變動所引起的被解釋變量的變差

;被解釋變量的回歸值與平均值的離差平方和

剩余變差是指()。

參考答案:

隨機(jī)因素影響所引起的被解釋變量的變差解釋變量的實(shí)際值與平均值的離差平方和

;被解釋變量的變差中,回歸方程不能做出解釋的部分

;被解釋變量的總變差與回歸平方和之差

;被解釋變量的實(shí)際值與回歸值的離差平方和

參數(shù)的估計(jì)量具備有效性是指()。

參考答案:

Var()為最小

第五章測試

以下不屬于數(shù)據(jù)挖掘軟件的是()

參考答案:

ApacheSpark;

購物籃分析中,數(shù)據(jù)是以()的形式呈現(xiàn)

參考答案:

不對稱二元變量;

一個(gè)關(guān)聯(lián)規(guī)則同時(shí)滿足最小支持度和最小置信度,我們稱之為()

參考答案:

強(qiáng)規(guī)則;

在回歸與相關(guān)分析中,因變量值隨自變量值的增大(減?。┒鴾p?。ㄔ龃螅┑默F(xiàn)象叫做()

參考答案:

負(fù)相關(guān);

給定關(guān)聯(lián)規(guī)則A-B,意味著:若A發(fā)生,B也會發(fā)生。()

參考答案:

錯(cuò)

不滿足給定評價(jià)度量的關(guān)聯(lián)規(guī)則是無趣的()

參考答案:

錯(cuò)

頻繁閉項(xiàng)集可用來無損壓縮頻繁項(xiàng)集。()

參考答案:

下面購物籃能夠提取的最大項(xiàng)集和最小項(xiàng)集的數(shù)量是多少()。ID購買項(xiàng):1.牛奶,啤酒、2.面包,黃油,牛奶、3.牛奶,尿布,餅干、4.面包,黃油,餅干、5.啤酒,餅干,尿布、6.牛奶,尿布,面包,黃油、7.面包,黃油,尿布、8.啤酒,尿布、9.牛奶,尿布,面包,黃油、10.啤酒,餅干

參考答案:

3;

;4;

關(guān)聯(lián)規(guī)則的評價(jià)度量主要有()

參考答案:

置信度;

;支持度;

關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有()

參考答案:

關(guān)聯(lián)規(guī)則;

;項(xiàng)集;

第六章測試

樸素貝葉斯算法是貝葉斯算法中最簡單的一個(gè)算法,假設(shè)它里邊的各個(gè)類條件是()。

參考答案:

獨(dú)立的

關(guān)于樸素貝葉斯算法,下列說法正確的是()。

參考答案:

假設(shè)樣本各屬性之間是相互獨(dú)立的

隨機(jī)森林的訓(xùn)練過程分為?()。

參考答案:

投票過程

;生長過程

影響隨機(jī)森林分類性能的主要因素()。

參考答案:

森林中決策樹的相關(guān)度

;單顆決策樹的分類強(qiáng)度

隨機(jī)森林結(jié)合策略有哪些?()。

參考答案:

投票法

;加權(quán)平均法

;簡單平均法

人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括?()。

參考答案:

輸入層

;輸出層

;隱含層

單層神經(jīng)網(wǎng)絡(luò)有幾層?()。

參考答案:

2

神經(jīng)網(wǎng)絡(luò)的各層之間的初始參數(shù)是如何設(shè)定的?()。

參考答案:

隨機(jī)產(chǎn)生

深度學(xué)習(xí)模型有哪些?()。

參考答案:

深度神經(jīng)網(wǎng)絡(luò)

;卷積神經(jīng)網(wǎng)絡(luò)

;循環(huán)神經(jīng)網(wǎng)絡(luò)

;生成-對抗神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)模型構(gòu)思來源于對人腦的模擬。()

參考答案:

第七章測試

聚類分析是將樣品或變量按照它們在性質(zhì)上的什么進(jìn)行分類的()。

參考答案:

親疏程度

哪個(gè)方法不是類間距離的度量方法()。

參考答案:

歐式距離

閔可夫斯基距離λ可以取哪些值()。

參考答案:

其他三個(gè)選項(xiàng)均正確

關(guān)于聚類分析下列說法正確的是()。

參考答案:

系統(tǒng)幾類并不適合數(shù)據(jù)量很大的情形

;K-means屬于無監(jiān)督分類

根據(jù)簇之間的關(guān)系,聚類分析可以分為()。

參考答案:

重疊聚類

;劃分型聚類

;層次型聚類

哪些屬性可以通過取值的差來衡量相異度()。

參考答案:

比率屬性

;區(qū)間屬性

聚類與分類一樣,具有預(yù)測功能。()

參考答案:

錯(cuò)

K-Means算法需要用初始隨機(jī)種子點(diǎn)來做,不同起點(diǎn)結(jié)果不同,可能導(dǎo)致算法陷入局部最優(yōu)。()

參考答案:

DBSCAN是基于密度的噪聲應(yīng)用空間聚類。()

參考答案:

緊密度和分離度是聚類分析評價(jià)的兩個(gè)原則。()

參考答案:

第八章測試

待定系數(shù)a稱為灰色作用量()。

參考答案:

錯(cuò)

馬爾科夫過程是具有馬爾科夫性質(zhì)的離散隨機(jī)過程。()。

參考答案:

在馬爾科夫過程中,在給定當(dāng)前信息或知識時(shí),過去對于預(yù)測未來是有關(guān)的。()。

參考答案:

錯(cuò)

馬爾科夫分析法是研究隨機(jī)事件變化趨勢的一種方法。()。

參考答案:

預(yù)測分析的基本思路為:列出并分析現(xiàn)有數(shù)據(jù)-尋找計(jì)算手段-得出結(jié)論。()。

參考答案:

預(yù)測的方法可以分為定性預(yù)測方法和定量預(yù)測方法。()。

參考答案:

在諸多的灰色模型中,哪種模型最常用?()。

參考答案:

GM(1,1)

馬爾科夫性中,n+1時(shí)刻的狀態(tài)的條件概率只依存哪種時(shí)刻的狀態(tài)()。

參考答案:

n

以下哪幾點(diǎn)是預(yù)測分析的關(guān)鍵點(diǎn)()。

參考答案:

數(shù)據(jù)在時(shí)間上的持續(xù)性

;數(shù)據(jù)的數(shù)量

;數(shù)據(jù)的全面性

預(yù)測分析主要對以下哪些方面的作用()。

參考答案:

成本控制

;決策管理

;績效管理

;自適應(yīng)管理

第九章測試

基于聚類的離群點(diǎn)檢測可以分為幾類?()。

參考答案:

兩類;

基于聚類的離群點(diǎn)檢測有什么缺點(diǎn)?()。

參考答案:

產(chǎn)生的離群點(diǎn)集非常依賴所用的簇的個(gè)數(shù);

基于密度的離群點(diǎn)檢測優(yōu)點(diǎn)是?()。

參考答案:

可以處理擁有不同密度區(qū)域的數(shù)據(jù)集;

在基于聚類的離群點(diǎn)檢測中,對象是否被認(rèn)為是離群點(diǎn)可能高度依賴于簇的個(gè)數(shù)。()

參考答案:

基于聚類的離群點(diǎn)分析方法,在已有聚類結(jié)果的基礎(chǔ)上,計(jì)算量小,效率高,但是它的有效性也非常依賴聚類的結(jié)果。()

參考答案:

對于基于原型的聚類,評估對象屬于簇的程度主要有兩種方法:一是度量對象到簇原型的距離,二是考慮到簇具有不同的密度,可以度量簇到原型的相對距離。()

參考答案:

對于基于距離的離群點(diǎn)分析方法,其基本思想是一個(gè)對象如果遠(yuǎn)離大部分其它對象,那么它是離群的。()

參考答案:

基于距離的離群點(diǎn)分析可以處理多維數(shù)據(jù)。()

參考答案:

當(dāng)數(shù)據(jù)集包含不同密度的區(qū)域時(shí),基于距離的離群點(diǎn)檢測方法不能很好地識別離群點(diǎn)。()

參考答案:

基于距離的離群點(diǎn)檢測方案簡單,不必知道數(shù)據(jù)的分布,計(jì)算量大。()

參考答案:

錯(cuò)

第十章測試

用于提取主題的文本分析方法包括()。

參考答案:

PLDA

;PLSA

;LDA

;LSA

可以通過詞匯來判斷文檔之間的相似度。()

參考答案:

以下哪些屬于文本分析模型?()

參考答案:

TF-IDF

;統(tǒng)計(jì)語言模型

;TextRank

;主題模型

中文分詞的難點(diǎn)是什么?()

參考答案:

規(guī)范問題

;歧義問題

;未登錄詞問題

;計(jì)算問題

詞的同義和多義現(xiàn)象是文本分析中存在的問題。()

參考答案:

詞嵌入方法將詞表示為數(shù)值向量。()

參考答案:

主題抽取使得文本的處理大大簡化。()

參考答案:

某詞的IDF值越高,說明該詞越不常見。()

參考答案:

網(wǎng)絡(luò)上的信息錯(cuò)綜復(fù)雜,沒有辦法對文本進(jìn)行分析。()

參考答案:

錯(cuò)

基于統(tǒng)計(jì)的方法使用句子出現(xiàn)的概率對句子的合理性進(jìn)行評估。()

參考答案:

第十一章測試

基于物品的方法適用于用戶數(shù)量大大超過物品數(shù)量,且物品數(shù)量相對穩(wěn)定,不必頻繁更新的場景。()。

參考答案:

基于用戶的方法適用于物品數(shù)量巨大且頻繁更新的場景。()。

參考答案:

基于產(chǎn)品的協(xié)同過濾算法的主要優(yōu)點(diǎn)是計(jì)算量小,可以離線計(jì)算()。

參考答案:

收集用戶信息的行為記錄模塊負(fù)責(zé)記錄用戶的喜好行為。()。

參考答案:

多樣性描述推薦系統(tǒng)對物品長尾的發(fā)掘能力。(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論