大數(shù)據(jù)分析與應用知到章節(jié)答案智慧樹2023年西安理工大學_第1頁
大數(shù)據(jù)分析與應用知到章節(jié)答案智慧樹2023年西安理工大學_第2頁
大數(shù)據(jù)分析與應用知到章節(jié)答案智慧樹2023年西安理工大學_第3頁
大數(shù)據(jù)分析與應用知到章節(jié)答案智慧樹2023年西安理工大學_第4頁
大數(shù)據(jù)分析與應用知到章節(jié)答案智慧樹2023年西安理工大學_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

實用文檔大數(shù)據(jù)分析與應用知到章節(jié)測試答案智慧樹2023年最新西安理工大學第一章測試

大數(shù)據(jù)泛指巨量的()。

參考答案:

數(shù)據(jù)集

數(shù)據(jù)分析指的是用適當?shù)模ǎκ占瘉淼拇罅繑?shù)據(jù)進行分析,提取有用信息并形成結論。

參考答案:

統(tǒng)計分析方法

瀏覽數(shù)據(jù)這一步驟可以通過對大數(shù)據(jù)進行()來實現(xiàn)。

參考答案:

可視化

Gartner將大數(shù)據(jù)定義為是需要新處理模式才能具有更強的()以及高增長率和多樣化的信息資產(chǎn)。

參考答案:

流程優(yōu)化能力

;決策力

;洞察發(fā)現(xiàn)力

我們通常用“4V”來反映大數(shù)據(jù)的特點,4V是指()。

參考答案:

Velocity

;Variety

大數(shù)據(jù)分析可以應用在那些領域()。

參考答案:

醫(yī)療衛(wèi)生領域

;農(nóng)業(yè)領域

;商業(yè)領域

;交通運輸領域

大數(shù)據(jù)分析的過程包括()。

參考答案:

數(shù)據(jù)準備

;數(shù)據(jù)理解

數(shù)據(jù)只要有足夠的規(guī)模就可以稱為大數(shù)據(jù)。()

參考答案:

大數(shù)據(jù)分析是大數(shù)據(jù)到知識,再到信息的關鍵步驟。()

參考答案:

大數(shù)據(jù)分析模型用于描述數(shù)據(jù)之間的關系。如確定自變量、因變量,進而通過聚類、回歸等方法確定其關系。()

參考答案:

第二章測試

數(shù)據(jù)倉庫的定義于哪一年提出()。

參考答案:

1991

符合選擇建立數(shù)據(jù)倉庫平臺的公認標準的是()。

參考答案:

數(shù)據(jù)庫對大數(shù)據(jù)量的支持能力

建立數(shù)據(jù)倉庫的首要步驟是()。

參考答案:

確認主題

數(shù)據(jù)倉庫的數(shù)據(jù)模型進行邏輯建模的分析角度是()。

參考答案:

業(yè)務分析

建立數(shù)據(jù)倉庫的選擇平臺是()。

參考答案:

建模工具

;分析工具

;數(shù)據(jù)庫

建立數(shù)據(jù)倉庫的步驟是()。

參考答案:

確認主題

;數(shù)據(jù)傳輸

;選擇平臺

;數(shù)據(jù)清洗

符合多維度數(shù)據(jù)模型構成的是()。

參考答案:

事實表

;維度表

屬于衡量業(yè)務性能指標的是()。

參考答案:

銷售額

;銷售量

數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型是一維結構的數(shù)據(jù)視圖。()

參考答案:

元數(shù)據(jù)是對數(shù)據(jù)倉庫中數(shù)據(jù)的描述信息。()

參考答案:

第三章測試

下列哪項屬于隨機抽樣的缺點?()

參考答案:

樣本中個體數(shù)量過多,效率低下

整群抽樣中將總體各單位歸并成若干個()的集合,成為群,然后以群為單位抽取樣本。

參考答案:

互不交叉,互不重復

數(shù)據(jù)抽樣和過濾的相似之處是它們的目的都是為了減少要處理的數(shù)據(jù)量。()

參考答案:

以下哪種方法適用于原始數(shù)據(jù)的取值范圍已經(jīng)確定的情況?()

參考答案:

0-1標準化

數(shù)據(jù)有那些性質(zhì)?()

參考答案:

精確性

;時效性

;一致性

;完整性

數(shù)據(jù)缺陷有哪些類型?()

參考答案:

噪聲數(shù)據(jù)

;非規(guī)范化數(shù)據(jù)

;缺失數(shù)據(jù)

先將總體的觀察按某一順序號分為n個部分,再從每一部分各抽取一定數(shù)量的觀察組成樣本,屬于哪種抽樣方式?()

參考答案:

系統(tǒng)抽樣

數(shù)據(jù)清洗浪費時間,是沒有意義的。()

參考答案:

數(shù)據(jù)標準化就是為了方便數(shù)據(jù)的下一步處理,而對數(shù)據(jù)進行的等比例縮放。()

參考答案:

下列屬于邏輯錯誤清洗的是()

參考答案:

去重

;去除不合理值

;修正矛盾內(nèi)容

第四章測試

關于經(jīng)濟計量模型進行預測出現(xiàn)誤差的原因,正確的說法是()。

參考答案:

既有隨機因素,又有系統(tǒng)因素

在多元線性回歸模型中,若某個解釋變量對其余解釋變量的判定系數(shù)接近于1,則表明模型中存在()。

參考答案:

多重共線性

Logistic回歸系數(shù)與優(yōu)勢比OR的關系為()。

參考答案:

其他三個選項均正確

Logistic回歸可用于()。

參考答案:

其他三個選項均正確

Logistic回歸中自變量如為多分類變量,宜將其按啞變量處理,與其他變量進行變量篩選時可用()。

參考答案:

應將幾個啞變量作為一個因素,整體進出回歸方程

在由n=30的一組樣本估計的、包含3個解釋變量的線性回歸模型中,計算得多重決定系數(shù)為0.8500,則調(diào)整后的多重決定系數(shù)為()。

參考答案:

0.8327

半對數(shù)模型中,參數(shù)1的含義是()。

參考答案:

X的相對變化,引起Y的期望值絕對量變化

回歸變差,或回歸平方和是指()。

參考答案:

被解釋變量的總變差與剩余變差之差

;解釋變量變動所引起的被解釋變量的變差

;被解釋變量的回歸值與平均值的離差平方和

剩余變差是指()。

參考答案:

隨機因素影響所引起的被解釋變量的變差解釋變量的實際值與平均值的離差平方和

;被解釋變量的變差中,回歸方程不能做出解釋的部分

;被解釋變量的總變差與回歸平方和之差

;被解釋變量的實際值與回歸值的離差平方和

參數(shù)的估計量具備有效性是指()。

參考答案:

Var()為最小

第五章測試

以下不屬于數(shù)據(jù)挖掘軟件的是()

參考答案:

ApacheSpark;

購物籃分析中,數(shù)據(jù)是以()的形式呈現(xiàn)

參考答案:

不對稱二元變量;

一個關聯(lián)規(guī)則同時滿足最小支持度和最小置信度,我們稱之為()

參考答案:

強規(guī)則;

在回歸與相關分析中,因變量值隨自變量值的增大(減?。┒鴾p小(增大)的現(xiàn)象叫做()

參考答案:

負相關;

給定關聯(lián)規(guī)則A-B,意味著:若A發(fā)生,B也會發(fā)生。()

參考答案:

不滿足給定評價度量的關聯(lián)規(guī)則是無趣的()

參考答案:

頻繁閉項集可用來無損壓縮頻繁項集。()

參考答案:

下面購物籃能夠提取的最大項集和最小項集的數(shù)量是多少()。ID購買項:1.牛奶,啤酒、2.面包,黃油,牛奶、3.牛奶,尿布,餅干、4.面包,黃油,餅干、5.啤酒,餅干,尿布、6.牛奶,尿布,面包,黃油、7.面包,黃油,尿布、8.啤酒,尿布、9.牛奶,尿布,面包,黃油、10.啤酒,餅干

參考答案:

3;

;4;

關聯(lián)規(guī)則的評價度量主要有()

參考答案:

置信度;

;支持度;

關聯(lián)分析中表示關聯(lián)關系的方法主要有()

參考答案:

關聯(lián)規(guī)則;

;項集;

第六章測試

樸素貝葉斯算法是貝葉斯算法中最簡單的一個算法,假設它里邊的各個類條件是()。

參考答案:

獨立的

關于樸素貝葉斯算法,下列說法正確的是()。

參考答案:

假設樣本各屬性之間是相互獨立的

隨機森林的訓練過程分為?()。

參考答案:

投票過程

;生長過程

影響隨機森林分類性能的主要因素()。

參考答案:

森林中決策樹的相關度

;單顆決策樹的分類強度

隨機森林結合策略有哪些?()。

參考答案:

投票法

;加權平均法

;簡單平均法

人工神經(jīng)網(wǎng)絡的結構包括?()。

參考答案:

輸入層

;輸出層

;隱含層

單層神經(jīng)網(wǎng)絡有幾層?()。

參考答案:

2

神經(jīng)網(wǎng)絡的各層之間的初始參數(shù)是如何設定的?()。

參考答案:

隨機產(chǎn)生

深度學習模型有哪些?()。

參考答案:

深度神經(jīng)網(wǎng)絡

;卷積神經(jīng)網(wǎng)絡

;循環(huán)神經(jīng)網(wǎng)絡

;生成-對抗神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)絡模型構思來源于對人腦的模擬。()

參考答案:

第七章測試

聚類分析是將樣品或變量按照它們在性質(zhì)上的什么進行分類的()。

參考答案:

親疏程度

哪個方法不是類間距離的度量方法()。

參考答案:

歐式距離

閔可夫斯基距離λ可以取哪些值()。

參考答案:

其他三個選項均正確

關于聚類分析下列說法正確的是()。

參考答案:

系統(tǒng)幾類并不適合數(shù)據(jù)量很大的情形

;K-means屬于無監(jiān)督分類

根據(jù)簇之間的關系,聚類分析可以分為()。

參考答案:

重疊聚類

;劃分型聚類

;層次型聚類

哪些屬性可以通過取值的差來衡量相異度()。

參考答案:

比率屬性

;區(qū)間屬性

聚類與分類一樣,具有預測功能。()

參考答案:

K-Means算法需要用初始隨機種子點來做,不同起點結果不同,可能導致算法陷入局部最優(yōu)。()

參考答案:

DBSCAN是基于密度的噪聲應用空間聚類。()

參考答案:

緊密度和分離度是聚類分析評價的兩個原則。()

參考答案:

第八章測試

待定系數(shù)a稱為灰色作用量()。

參考答案:

馬爾科夫過程是具有馬爾科夫性質(zhì)的離散隨機過程。()。

參考答案:

在馬爾科夫過程中,在給定當前信息或知識時,過去對于預測未來是有關的。()。

參考答案:

馬爾科夫分析法是研究隨機事件變化趨勢的一種方法。()。

參考答案:

預測分析的基本思路為:列出并分析現(xiàn)有數(shù)據(jù)-尋找計算手段-得出結論。()。

參考答案:

預測的方法可以分為定性預測方法和定量預測方法。()。

參考答案:

在諸多的灰色模型中,哪種模型最常用?()。

參考答案:

GM(1,1)

馬爾科夫性中,n+1時刻的狀態(tài)的條件概率只依存哪種時刻的狀態(tài)()。

參考答案:

n

以下哪幾點是預測分析的關鍵點()。

參考答案:

數(shù)據(jù)在時間上的持續(xù)性

;數(shù)據(jù)的數(shù)量

;數(shù)據(jù)的全面性

預測分析主要對以下哪些方面的作用()。

參考答案:

成本控制

;決策管理

;績效管理

;自適應管理

第九章測試

基于聚類的離群點檢測可以分為幾類?()。

參考答案:

兩類;

基于聚類的離群點檢測有什么缺點?()。

參考答案:

產(chǎn)生的離群點集非常依賴所用的簇的個數(shù);

基于密度的離群點檢測優(yōu)點是?()。

參考答案:

可以處理擁有不同密度區(qū)域的數(shù)據(jù)集;

在基于聚類的離群點檢測中,對象是否被認為是離群點可能高度依賴于簇的個數(shù)。()

參考答案:

基于聚類的離群點分析方法,在已有聚類結果的基礎上,計算量小,效率高,但是它的有效性也非常依賴聚類的結果。()

參考答案:

對于基于原型的聚類,評估對象屬于簇的程度主要有兩種方法:一是度量對象到簇原型的距離,二是考慮到簇具有不同的密度,可以度量簇到原型的相對距離。()

參考答案:

對于基于距離的離群點分析方法,其基本思想是一個對象如果遠離大部分其它對象,那么它是離群的。()

參考答案:

基于距離的離群點分析可以處理多維數(shù)據(jù)。()

參考答案:

當數(shù)據(jù)集包含不同密度的區(qū)域時,基于距離的離群點檢測方法不能很好地識別離群點。()

參考答案:

基于距離的離群點檢測方案簡單,不必知道數(shù)據(jù)的分布,計算量大。()

參考答案:

第十章測試

用于提取主題的文本分析方法包括()。

參考答案:

PLDA

;PLSA

;LDA

;LSA

可以通過詞匯來判斷文檔之間的相似度。()

參考答案:

以下哪些屬于文本分析模型?()

參考答案:

TF-IDF

;統(tǒng)計語言模型

;TextRank

;主題模型

中文分詞的難點是什么?()

參考答案:

規(guī)范問題

;歧義問題

;未登錄詞問題

;計算問題

詞的同義和多義現(xiàn)象是文本分析中存在的問題。()

參考答案:

詞嵌入方法將詞表示為數(shù)值向量。()

參考答案:

主題抽取使得文本的處理大大簡化。()

參考答案:

某詞的IDF值越高,說明該詞越不常見。()

參考答案:

網(wǎng)絡上的信息錯綜復雜,沒有辦法對文本進行分析。()

參考答案:

基于統(tǒng)計的方法使用句子出現(xiàn)的概率對句子的合理性進行評估。()

參考答案:

第十一章測試

基于物品的方法適用于用戶數(shù)量大大超過物品數(shù)量,且物品數(shù)量相對穩(wěn)定,不必頻繁更新的場景。()。

參考答案:

基于用戶的方法適用于物品數(shù)量巨大且頻繁更新的場景。()。

參考答案:

基于產(chǎn)品的協(xié)同過濾算法的主要優(yōu)點是計算量小,可以離線計算()。

參考答案:

收集用戶信息的行為記錄模塊負責記錄用戶的喜好行為。()。

參考答案:

多樣性描述推薦系統(tǒng)對物品長尾的發(fā)掘能力。(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論