農(nóng)業(yè)大數(shù)據(jù)智慧樹知到期末考試答案章節(jié)答案2024年山東農(nóng)業(yè)工程學院_第1頁
農(nóng)業(yè)大數(shù)據(jù)智慧樹知到期末考試答案章節(jié)答案2024年山東農(nóng)業(yè)工程學院_第2頁
農(nóng)業(yè)大數(shù)據(jù)智慧樹知到期末考試答案章節(jié)答案2024年山東農(nóng)業(yè)工程學院_第3頁
農(nóng)業(yè)大數(shù)據(jù)智慧樹知到期末考試答案章節(jié)答案2024年山東農(nóng)業(yè)工程學院_第4頁
免費預覽已結束,剩余5頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

農(nóng)業(yè)大數(shù)據(jù)智慧樹知到期末考試答案+章節(jié)答案2024年山東農(nóng)業(yè)工程學院噪聲和偽像是數(shù)據(jù)錯誤這一相同表述的兩種叫法。()

答案:錯對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,移去或者減少這些樣本對分類結果沒有影響。()

答案:對分類模型的誤差大致分為兩種:訓練誤差(trainingerror)和泛化誤差(generalizationerror)。()

答案:對當今世界四大趨勢指的是經(jīng)濟全球化、全球城市化、全球信息化、信息智慧化。()

答案:對數(shù)據(jù)倉庫系統(tǒng)的組成部分包括數(shù)據(jù)倉庫,倉庫管理,數(shù)據(jù)抽取,分析工具等四個部分。()

答案:錯聚類分析可以看作是一種非監(jiān)督的分類。()

答案:對尋找模式和規(guī)則主要是對數(shù)據(jù)進行干擾,使其符合某種規(guī)則以及模式。()

答案:錯從點作為個體簇開始,每一步合并兩個最接近的簇,這是一種分裂的層次聚類方法。(錯)40.DBSCAN是相對抗噪聲的,并且能夠處理任意形狀和大小的簇。(對)73、Hadoop支持數(shù)據(jù)的隨機讀寫。()

答案:錯HBase對于空(NULL)的列,不需要占用存儲空間。()

答案:對關聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則。()

答案:錯大數(shù)據(jù)人才整體上需要具備()等核心知識。

答案:數(shù)學與統(tǒng)計知識###在特定業(yè)務領域的知識###計算機相關知識當前,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點是()。

答案:增速很快###多產(chǎn)業(yè)交叉融合###規(guī)模較大大數(shù)據(jù)的應用能夠實現(xiàn)一場新的革命,提高綜合管理水平的原因是()。

答案:從粗放化管理走向精細化管理###從單兵作戰(zhàn)走向聯(lián)合共享型管理###從被動反應走向主動預見型管理###從柜臺式管理走向全天候管理簡單隨機抽樣,是從總體N個對象中任意抽取n個對象作為樣本,最終以這些樣本作為調查對象。在抽取樣本時,總體中每個對象被抽中為調查樣本的概率可能會有差異。()

答案:錯云計算就是軟件在云端無所不在、無限強大的計算,也叫網(wǎng)絡化計算或網(wǎng)格計算。()

答案:對用于分類的離散化方法之間的根本區(qū)別在于是否使用類信息。()

答案:對Secondarynamenode就是namenode出現(xiàn)問題時的備用節(jié)點。()

答案:錯在評價不平衡類問題分類的度量方法有()幾種。

答案:真正率(turepositiverate,TPR)###F1度量###召回率(recall)###精度(precision)DSS主要是基于數(shù)據(jù)倉庫.聯(lián)機數(shù)據(jù)分析和數(shù)據(jù)挖掘技術的應用。()

答案:對數(shù)據(jù)挖掘的預測建模任務主要包括哪幾大類問題?()

答案:分類###回歸云計算的特點包括()幾個方面。

答案:高性價比###服務可租用###服務可計算如下那些不是基于規(guī)則分類器的特點()。

答案:無法被用來產(chǎn)生更易于解釋的描述性模型###規(guī)則集的表達能力遠不如決策樹好傳統(tǒng)數(shù)據(jù)密集型行業(yè)積極探索和布局大數(shù)據(jù)應用的表現(xiàn)是()。

答案:提高分析挖掘能力###實現(xiàn)科學決策與運營###打通多源跨域數(shù)據(jù)非頻繁模式包括()

答案:其支持度小于閾值###對異常數(shù)據(jù)項敏感Apriori算法的計算復雜度受()影響。

答案:事務數(shù)###項數(shù)(維度)###事務平均寬度###支持度閥值下列關于數(shù)據(jù)生命周期管理的核心認識中,正確的是()。

答案:數(shù)據(jù)從產(chǎn)生到被刪除銷毀的過程中,具有多個不同的數(shù)據(jù)存在階段###在不同的數(shù)據(jù)存在階段,數(shù)據(jù)的價值是不同的###根據(jù)數(shù)據(jù)價值的不同應該對數(shù)據(jù)采取不同的管理策略以下屬于聚類算法的是()。

答案:Jarvis-Patrick(JP)###DBSCAN###K均值下面哪些屬于可視化高維數(shù)據(jù)技術()

答案:Chernoff臉###平行坐標系###矩陣###星形坐標以下屬于分類器評價或比較尺度的有:()

答案:計算復雜度###預測準確度###模型描述的簡潔度數(shù)據(jù)再利用的意義在于()。

答案:利用數(shù)據(jù)可擴展性拓寬業(yè)務領域###挖掘數(shù)據(jù)的潛在價值###數(shù)據(jù)重組的創(chuàng)新價值考慮兩隊之間的足球比賽:隊0和隊1。假設65%的比賽隊0勝出,剩余的比賽隊1獲勝。隊0獲勝的比賽中只有30%是在隊1的主場,而隊1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為()。

答案:0.4678一個對象的離群點得分是該對象周圍密度的逆,這是基于()的離群點定義。

答案:密度關于數(shù)據(jù)創(chuàng)新,下列說法正確的是()

答案:數(shù)據(jù)只有開放價值才能得到真正釋放。HBase數(shù)據(jù)庫的BlockCache緩存的數(shù)據(jù)塊中,哪一項不一定能提高效率。()

答案:HFileindex大數(shù)據(jù)的起源是()。

答案:互聯(lián)網(wǎng)考慮這么一種情況:一個對象碰巧與另一個對象相對接近,但屬于不同的類,因為這兩個對象一般不會共享許多近鄰,所以應該選擇()的相似度計算方法。

答案:共享最近鄰以下是哪一個聚類算法的算法流程:①構造k-最近鄰圖。②使用多層圖劃分算法劃分圖。③repeat:合并關于相對互連性和相對接近性而言,最好地保持簇的自相似性的簇。④until:不再有可以合并的簇。()。

答案:Chameleon關于混合模型聚類算法的優(yōu)缺點,下面說法正確的是()。

答案:混合模型比K均值或模糊c均值更一般,因為它可以使用各種類型的分布。以下不屬于“智慧地球”六大行動方案的是(

)

答案:智慧的教育假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使用按箱平均值平滑方法對上述數(shù)據(jù)進行平滑,箱的深度為3。第二個箱子值為:()

答案:18.3在基本K均值算法里,當鄰近度函數(shù)采用()的時候,合適的質心是簇中各點的中位數(shù)。

答案:曼哈頓距離OLAP技術的核心是:()

答案:多維分析;HDFS的是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,默認的最基本的存儲單位是64M,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的讀寫任務是()。

答案:一次寫入,多次讀寫大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行(

)。

答案:專業(yè)化處理以下哪個聚類算法不是屬于基于原型的聚類()。

答案:CLIQUE支撐大數(shù)據(jù)業(yè)務的基礎是()。

答案:數(shù)據(jù)應用下面關于數(shù)據(jù)粒度的描述不正確的是:()

答案:數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高;以下哪些分類方法可以較好地避免樣本的不平衡問題()?

答案:KNN下列關于普查的缺點的說法中,正確的是(

)。

答案:工作量較大,容易導致調查內容有限、產(chǎn)生重復和遺漏現(xiàn)象在數(shù)據(jù)生命周期管理實踐中,()是執(zhí)行方法。

答案:數(shù)據(jù)管理和維護購物籃分析的結果會對商品在賣場中的陳列產(chǎn)生重大的影響,由于很多具有相關性的商品屬于不同的部門管理,因此必然會產(chǎn)生商品的交叉陳列問題。()

答案:對從數(shù)據(jù)中多角度挖掘分析得到的出行趨勢,將對()產(chǎn)生強有力的支撐。例如,根據(jù)數(shù)據(jù)分析,上海限外政策后,城市高峰期擁堵延時指數(shù)總體下降了約3%

答案:城市交通治理政策高德路況信息有多個數(shù)據(jù)來源,其中()的占比最高。

答案:UGC公眾數(shù)據(jù)道路的擁堵延時指數(shù)越高表示該道路擁堵時更加耗時。()

答案:對所謂的購物籃分析(MarketBasketAnalysis)就是通過這些購物籃子所顯示的信息來研究顧客的購買行為。()

答案:對高德地圖根據(jù)在線與離線的不同需要,采用兩套不同的框架對數(shù)據(jù)進行處理和挖掘,即Spark/Storm模式的離線數(shù)據(jù)處理系統(tǒng)和Map/Reduce的在線數(shù)據(jù)處理系統(tǒng)。()

答案:錯回龍觀是北京較大的居住社區(qū)之一,常住人口約達30萬人。它附近高峰期造成交通擁堵的主要原因是大量通勤需求與單一路線中有限的車流容量存在較大落差。()

答案:對UGC數(shù)據(jù)通過與出租車、物流以及長途客運等行業(yè)合作,以置換和購買的方式,獲得相關行業(yè)車輛的GPS數(shù)據(jù)。()

答案:錯高德地圖的大數(shù)據(jù)處理與挖掘平臺采用層狀搭建結構。其底層為實時日志采集,主要通過Flume工具將諸如定位、導航、開放平臺等生產(chǎn)服務器上產(chǎn)生的日志導入Hadoop的分布式文件存儲系統(tǒng)HDFS上。()

答案:對SAP和農(nóng)夫山泉開始共同開發(fā)基于“飲用水”這個產(chǎn)業(yè)形態(tài)中,最為重要的數(shù)據(jù)場景是()。

答案:運輸環(huán)境分析由于數(shù)據(jù)非結構化,格式的統(tǒng)一和數(shù)據(jù)類型的整理,以及數(shù)據(jù)錯誤和遺漏的處理都是需要大量人力和時間投人,所以數(shù)據(jù)采集工作這一步驟是最復雜繁瑣的一項工作。()

答案:錯植物養(yǎng)分供給的盈虧對葉片形態(tài)含量有明顯的影響,通過遙感植被指數(shù)與不同營養(yǎng)素(N、P、K、Ca、Mg等)數(shù)學模型,可估測作物營養(yǎng)素供給狀態(tài)。()

答案:錯GIS是(),它不僅能夠管理各類屬性的海量數(shù)據(jù),更主要的是能夠實現(xiàn)對空間數(shù)據(jù)深人處理分析。

答案:地理信息系統(tǒng)從生產(chǎn)端入手,借助大數(shù)據(jù)技術使農(nóng)產(chǎn)品生產(chǎn)端的生產(chǎn)變得可預測,才是最終解決農(nóng)產(chǎn)品價格過度波動問題的關鍵,這需要對需求端進行精準預測。()

答案:對運用大數(shù)據(jù)技術的強大信息收集和分析功能,可以跨行業(yè)跨平臺的收集各類信息,并進行分析處理,可以完善期貨市場參與者對不同類信息收集和分析能力的不足,對于優(yōu)化期貨市場價格形成機制具有重要意義。()

答案:對依賴于大數(shù)據(jù)技術的精確農(nóng)業(yè),需要各類準確的基礎數(shù)據(jù),包括如()

答案:作物生長過程的動態(tài)數(shù)據(jù)###生長環(huán)境數(shù)據(jù)###基礎空間數(shù)據(jù)實現(xiàn)流通環(huán)節(jié)各個主體的()是農(nóng)產(chǎn)品物流體系完善的一個前提條件,建立合理的利益分配機制是農(nóng)產(chǎn)品流通體系建設的內在要求和核心。

答案:利益平衡原則大數(shù)據(jù)分析方式的基本步驟和基本思路如下:第一步,數(shù)據(jù)收集過程。第二步,數(shù)據(jù)清洗和整理工作。第三步,()。

答案:數(shù)據(jù)分析和模型的選擇對于大數(shù)據(jù)技術在農(nóng)產(chǎn)品生產(chǎn)環(huán)節(jié)的運用,主要的目標就是使農(nóng)產(chǎn)品產(chǎn)量具有可預測性和可控性。()

答案:對農(nóng)產(chǎn)品物流體系的完善具有重要意義,根本原因是農(nóng)產(chǎn)品流通作為農(nóng)產(chǎn)品價值實現(xiàn)的中間環(huán)節(jié),鏈接著農(nóng)產(chǎn)品的生產(chǎn)端和需求端,是農(nóng)產(chǎn)品市場價值實現(xiàn)的不可或缺環(huán)節(jié)。()

答案:對關于Python內存管理,下列說法錯誤的是()。

答案:變量無須先創(chuàng)建和賦值而直接使用列表的元素可以修改,但元組的元素不能修改。()

答案:對在Python中____表示空類型()。

答案:None語句:menu=(1,2,3,4,5)print(menu[1:3])輸出的結果為()

答案:2,3在自然語言處理中,把句子拆分成一個個詞語的過程被稱為()。

答案:分詞以下不屬于數(shù)據(jù)分析時用到的方法是()

答案:高低分析利用歷史數(shù)據(jù)預測公司將來的股價?!皩儆跀?shù)據(jù)挖掘任務范疇。

答案:對下列描述中哪一項屬于數(shù)據(jù)挖掘任務?

答案:根據(jù)顧客喜好擺放商品位置交叉分析是基于()橫向地組合交叉。

答案:不同維度下列關于分類和聚類的描述中正確的是?

答案:分類是有指導的學習,聚類是無指導的學習數(shù)據(jù)挖掘的主要任務是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)則,從而能更好的完成描述數(shù)據(jù)、預測數(shù)據(jù)等任務。

答案:對()不是NoSQL特征。

答案:需要預定義模式以下哪個不屬于大數(shù)據(jù)庫的是()。

答案:虛擬化技術以下()是圖數(shù)據(jù)庫產(chǎn)品。

答案:Neo4J以下()不是NoSQL數(shù)據(jù)庫。

答案:MySQL為了在Hbase中確定一個具體數(shù)據(jù),需要()個參數(shù)。。

答案:4所謂數(shù)據(jù)的中心化是指數(shù)據(jù)集中的各項數(shù)據(jù)減去數(shù)據(jù)集的方差。()

答案:錯當缺失數(shù)據(jù)較少時直接刪除相應樣本,刪除缺失數(shù)據(jù)樣本,其前提是缺失數(shù)據(jù)的比例較少,而且缺失數(shù)據(jù)是隨機出現(xiàn)的,這樣刪除缺失數(shù)據(jù)后對分析結果影響不大。()

答案:對關于缺失數(shù)據(jù)處理,()是不合適的。

答案:決策樹Python爬蟲架構主要由五個部分組成,分別是搜索引擎、調度器、URL管理器、網(wǎng)頁下載器和網(wǎng)頁解析器。()

答案:錯數(shù)據(jù)采集工具不包括()。

答案:HBase按()分,把數(shù)據(jù)采集分類為靜態(tài)數(shù)據(jù)采集、低頻數(shù)據(jù)采集和高頻數(shù)據(jù)采集。

答案:采集頻率異常值(離群點)是指測量數(shù)據(jù)中的隨機錯誤或偏差造成其偏離均值的孤立點。在數(shù)據(jù)處理中,異常值不會極大地影響回歸或分類的效果。()

答案:錯從數(shù)據(jù)的加工程度對數(shù)據(jù)進行了分類,以下不屬于該分類的是()。

答案:半結構化數(shù)據(jù)在HDFS中,元數(shù)據(jù)保存在()。

答案:NameNodeHDFS一般拓撲結構中,由NameNode、DataNode和SecondaryNameNode組成,其中,NameNode的個數(shù)為()。

答案:1Hadoop生態(tài)系統(tǒng)中負責計算模式管理和調度器模塊名稱是()。

答案:YARN在關于Hadoop的敘述中,“Hadoop按塊存儲和處理數(shù)據(jù)的能力值得人們信賴。因為它假設計算元素和存儲會失敗,因此它維護多個工作數(shù)據(jù)副本,確保能針對失敗的節(jié)點重新分布處理?!睂儆冢ǎ?。

答案:高可靠性以下關于HDFS存儲數(shù)據(jù)策略的敘述中錯誤的是()。

答案:第一個副本放置在一臺磁盤不太滿、CPU不太忙的節(jié)節(jié)點上大數(shù)據(jù)為云計算提供了技術基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論