




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)采集與處理-題庫(kù)帶答案1( )是指對(duì)客觀事件記錄的符號(hào),是對(duì)客觀事物的性質(zhì)、狀態(tài)及相互關(guān)系等進(jìn)行記的物理符號(hào)或這些物理符號(hào)的組合。A、數(shù)據(jù)B、字段C、記錄D、大數(shù)據(jù)答案:A2、在數(shù)據(jù)表中,表的“列”稱為( )A、數(shù)據(jù)B、字段C、記錄D、大數(shù)據(jù)答案:B3、在數(shù)據(jù)表中,表的“行”稱為( )A、數(shù)據(jù)B、字段C、記錄D、大數(shù)據(jù)答案:C4、數(shù)據(jù)表是由行(記錄)和列(字段)構(gòu)成,因此也稱( )A、數(shù)據(jù)B、二維表C、表格D、大數(shù)據(jù)答案:B5、大數(shù)據(jù)具有以下特征A、大容量、多種類、高速度B、復(fù)雜性、高價(jià)值C、可變性、真實(shí)性D、以上都是答案:D6、數(shù)據(jù)的獲取途徑有( )A、產(chǎn)品自有數(shù)據(jù)B、調(diào)查問(wèn)卷C、互聯(lián)網(wǎng)數(shù)據(jù)導(dǎo)入D、從別人數(shù)據(jù)庫(kù)竊取答案:ABC7、8、9、10、Excel是按照數(shù)據(jù)結(jié)構(gòu)來(lái)組織,存儲(chǔ)和管理數(shù)據(jù)的倉(cāng)庫(kù)。1112、商務(wù)數(shù)據(jù)包括( )A、電子商務(wù)平臺(tái)的基礎(chǔ)數(shù)據(jù)B、電子商務(wù)專業(yè)網(wǎng)站的研究數(shù)據(jù)C、電子商務(wù)媒體報(bào)道D、評(píng)論數(shù)據(jù)ABCD13、商品數(shù)據(jù)一般包括()A、商品分類B、商品價(jià)格C、商品展示D、商品評(píng)價(jià)答案:ABC14、15、16、新聞網(wǎng)站有( )A、騰訊網(wǎng)B、百度貼吧C、鳳凰網(wǎng)D、博客答案:AC17、社交網(wǎng)站有( )A、騰訊網(wǎng)B、百度貼吧C、鳳凰網(wǎng)D、博客答案:BD18、商務(wù)數(shù)據(jù)可用于多種行業(yè)( )A、制造業(yè)B、金融業(yè)C、個(gè)人娛樂(lè)D、餐飲行業(yè)答案:ABCD19、20、21、商務(wù)數(shù)據(jù)的來(lái)源包括( )A、電子商務(wù)平臺(tái)B、社交平臺(tái)C、O2OD、個(gè)人數(shù)據(jù)答ABC22、B2B是企業(yè)對(duì)企業(yè)之間通過(guò)互聯(lián)網(wǎng)進(jìn)行產(chǎn)品、服務(wù)及信息的交換。答案:正確23、B2C是個(gè)人對(duì)企業(yè)開展的電子商務(wù)活動(dòng)。答案:錯(cuò)誤24、下列常用的B2C平臺(tái)有( )A、阿里巴巴B、京東C、唯品會(huì)D、亞馬遜答案:BCD25、C2C()A、阿里巴巴B、咸魚C、淘寶D、eBay答案:BCD26、社交電商指基于社交關(guān)系、利用互聯(lián)網(wǎng)社交媒介實(shí)現(xiàn)電子商務(wù)中的流量獲取、商品推廣和交易等其中一個(gè)或多個(gè)環(huán)節(jié),產(chǎn)生間接或直接交易行為的在線經(jīng)營(yíng)活動(dòng)。27、28、社交分享電商主要包括( )A、拼多多B、微信C、蘑菇街D、微博答29、O2O電商模式是線上引流線下消費(fèi)模式。30、O2O數(shù)據(jù)主要有O2O31、數(shù)據(jù)采集又稱數(shù)據(jù)獲取,是利用設(shè)備或技術(shù)手段從現(xiàn)實(shí)環(huán)境及網(wǎng)絡(luò)獲取數(shù)據(jù)并放入系統(tǒng)內(nèi)部進(jìn)行使用。32、大多數(shù)互聯(lián)網(wǎng)頁(yè)編寫都是用HTML語(yǔ)言。33、電子商務(wù)數(shù)據(jù)主要?dú)w類為( )A、文本B、圖片C、視頻D、音頻答案:ABC34、配置一種采集任務(wù)可以采集多個(gè)數(shù)據(jù)源。答案:錯(cuò)誤35、防采集措施有( )A、封IPB、驗(yàn)證碼識(shí)別C、登錄D、不允許打開網(wǎng)頁(yè)答案:ABC36、常見的采集方法包括web爬蟲采集和API接口采集。37、Web38、通用網(wǎng)絡(luò)爬蟲基本工作流程包含( )A、打開瀏覽器B、抓取網(wǎng)頁(yè)C、數(shù)據(jù)存儲(chǔ)D、預(yù)處理答案:BCD39、調(diào)用網(wǎng)站自身提供的應(yīng)用程序編程接口,可以實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)采集。答案:正確40、數(shù)據(jù)的存儲(chǔ)方式有( )A、ExcelB、CSVC、數(shù)據(jù)庫(kù)D、Python答案:ABC41、42、43、數(shù)據(jù)采集工具不能爬取學(xué)術(shù)信息。答案:錯(cuò)誤44、常見的爬蟲語(yǔ)言有( )A、HTMLB、PythonC、JavaD、PHP答案:BCD45、Python46、47、48、49、數(shù)據(jù)采集器不能采集以下哪種數(shù)據(jù)( )ABCDD50、哪種不是數(shù)據(jù)采集器A、Python爬蟲B、八爪魚采集器C、火車頭采集器D、后羿采集器答案:A51、52、53、54、5556、57、58、59、60單個(gè)網(wǎng)頁(yè)上有很多相同鏈接點(diǎn)擊鏈接后進(jìn)入 再進(jìn)行詳情頁(yè)數(shù)據(jù)采集。答案:詳情頁(yè);61、當(dāng)配置好任務(wù),進(jìn)行數(shù)據(jù)采集是, 即用自己的本地電腦進(jìn)行據(jù)采集。答案:?jiǎn)?dòng)本地采集;62、如果想使用云服務(wù)集群進(jìn)行采集,可以選擇答案:?jiǎn)?dòng)云采集;63、數(shù)據(jù)導(dǎo)出可以導(dǎo)出的文件類型為( )A、ExcelB、csvC、HTMLDMySqlABCD64、65、URL循環(huán)是通過(guò)使用多個(gè)URL地址進(jìn)行數(shù)據(jù)采集。答案:正確66、循環(huán)采集包括( )A、URL循環(huán)B、文本循環(huán)C、單個(gè)元素循環(huán)D、隨機(jī)循環(huán)答案:ABC67、采集京東商品詳情頁(yè)數(shù)據(jù),字段可任意。要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:解析:68、分頁(yè)循環(huán)采集是指把一頁(yè)數(shù)據(jù)分成多頁(yè)進(jìn)行采集。69、70、點(diǎn)擊頁(yè)面上的“下一頁(yè)”按鈕翻頁(yè),是最常見的翻頁(yè)方式。71、72、登錄采集分 登錄采集和 登錄采集。答案:賬號(hào)密碼;Cookie;73、使用登錄采集時(shí),輸入賬號(hào)密碼需要用到 模塊。答案:輸入文字;74、采集器無(wú)法識(shí)別驗(yàn)證碼。答案:錯(cuò)誤75、 登錄利用瀏覽器中的緩存設(shè)置緩存了當(dāng)前的個(gè)網(wǎng)頁(yè)狀態(tài),可以快速進(jìn)入當(dāng)前狀態(tài)的頁(yè)面。答案:Cookie;76、Cookie登錄的方式不需要輸入賬號(hào)和密碼,直接打開網(wǎng)頁(yè)就是登錄狀態(tài)。答案:正確77、Cookie登錄中Cookie長(zhǎng)期存在,所以是登錄采集中,最方便的采集方式。答案:錯(cuò)誤78、使用簡(jiǎn)易模式采集任意網(wǎng)站數(shù)據(jù)要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:解析:79、使用單頁(yè)采集模式,采集任意一個(gè)網(wǎng)頁(yè)的數(shù)據(jù)要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:解析:80、ajax即 、異步更新的一種腳本技術(shù)。答案:延時(shí)加載;81、ajax可以通過(guò)在后臺(tái)與服務(wù)器進(jìn)行少量數(shù)據(jù)交換,可以重新加載整個(gè)網(wǎng)頁(yè)。答案:錯(cuò)誤82、使用ajax技術(shù)的網(wǎng)頁(yè),點(diǎn)擊網(wǎng)頁(yè)中某個(gè)按鈕或下拉頁(yè)面,網(wǎng)址一般不發(fā)生改變,網(wǎng)址欄不出現(xiàn)加載狀態(tài),但網(wǎng)頁(yè)局部有新的數(shù)據(jù)加載出來(lái),有所變化。答案:正確83、Ajax()A、ajax點(diǎn)擊B、ajax翻頁(yè)C、ajax滾動(dòng)D、定位答案:ABC84、Ajax點(diǎn)擊可以對(duì)一個(gè)按鈕進(jìn)行多次點(diǎn)擊。答案:錯(cuò)誤85、如果設(shè)置了ajax技術(shù)的網(wǎng)頁(yè),在采集設(shè)置時(shí),沒(méi)有勾選ajax加載,則不能進(jìn)行采集。答案:錯(cuò)誤86、Ajax滾動(dòng)包括( )A、直接滾動(dòng)到底部B、動(dòng)到下一行C、滾動(dòng)到下一頁(yè)D、向下滾動(dòng)一屏答案:AD87XPath答案:正確88、XPath語(yǔ)言,也稱為HTML路徑語(yǔ)言。答案:錯(cuò)誤89、XPath語(yǔ)言由 、 、、內(nèi)容構(gòu)成。答案:名稱;位置;屬性;90、 被設(shè)計(jì)用來(lái)顯示網(wǎng)頁(yè)數(shù)據(jù), 就是用來(lái)在HTML中定位元素的。答案:HTML;XPath;91、HTML稱為超文本標(biāo)記語(yǔ)言。答案:正確92、 是構(gòu)成網(wǎng)頁(yè)的基本元素答案:節(jié)點(diǎn);93、節(jié)點(diǎn)有多種類型,分別是( )A、元素、屬性、文本B、命名空間、處理指令C、注釋、文檔節(jié)點(diǎn)D、屬性值A(chǔ)BC94、節(jié)點(diǎn)關(guān)系是指節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系,通過(guò)包含與被包含關(guān)系區(qū)分。答案:正確95、 是對(duì)于節(jié)點(diǎn)的描述性語(yǔ)句,用來(lái)選取指定節(jié)點(diǎn)。答案:路徑表達(dá)式;96XPath中, 表示不論該元素在Html中的任何位置,均選該元素。答案://;97、XPath中, 用于選擇某一元素的子元素,不能跨多層關(guān)系進(jìn)行擇答案:/;98、XPath中, 用來(lái)表示屬性,需寫在屬性前方答案:@;9XPath中, 選取父元素,其中。 選取元素身,其中表示元素自身。答案:/..;/.;100、XPath中, 選取某元素下的所有子元素答案:/*;101、XPath中, 選取某元素下的所有后代元素答案://*;102、XPath中, 用來(lái)查找某個(gè)特定的節(jié)點(diǎn)或包含某個(gè)指定的值的節(jié)點(diǎn)答案:謂語(yǔ);103、XPath中,謂語(yǔ)對(duì)元素的 、 及 做限制,只符合限制的元素,使用中括號(hào)]”表示。答案:位置;屬性;內(nèi)容;104、XPath中,Text()函數(shù),主要功能為選中指定文本內(nèi)容的元素。答案:正確105、XPath中,contains(參數(shù)1,參數(shù)2),主要功能為選中參數(shù)1中包含參數(shù)2中內(nèi)容的元素。106、XPath中,last(),主要功能為選中同胞元素中最后一位的元素。107、XPath中,position(),主要功能為描述元素在同胞元素中的位置。108、哪些行業(yè)需要用到數(shù)據(jù)采集()A、企業(yè)B、政府C、金融D、教育ABCD109、110、個(gè)人進(jìn)行數(shù)據(jù)采集是,主要用于()A、網(wǎng)頁(yè)信息收集B、商務(wù)數(shù)據(jù)采集C、市場(chǎng)數(shù)據(jù)采集D、社會(huì)公開信息答案:AB111提供數(shù)據(jù)層面的支持。112、113、數(shù)據(jù)的質(zhì)量因素包括 、 、 、 、 可信性和可解釋性答案:準(zhǔn)確性;完整性;一致性;時(shí)效性;相關(guān)性;114、數(shù)據(jù)的質(zhì)量問(wèn)題從采集的角度劃分,可分為( )A、準(zhǔn)確性B、完整性C、一致性D、時(shí)效性答案:ABC115、數(shù)據(jù)的質(zhì)量問(wèn)題從應(yīng)用的角度劃分,可分為( )A、準(zhǔn)確性B、相關(guān)性C、時(shí)效性D、可信性答案:BC116、數(shù)據(jù)的質(zhì)量問(wèn)題從用戶使用的角度劃分,可分為()ABCDCD117、準(zhǔn)確性是指數(shù)據(jù)是否正確的,數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中的值是否對(duì)應(yīng)于真實(shí)世界的值。答案:正確118某用戶在使用支付寶綁定銀行卡時(shí),網(wǎng)站要求驗(yàn)證用戶的真實(shí)姓名和身份證號(hào)碼。時(shí)要求采集的數(shù)據(jù)必須有( )A、準(zhǔn)確性B、完整性C、一致性D、相關(guān)性答案:A119、數(shù)據(jù)質(zhì)量完整性是指信息具有一個(gè)實(shí)體描述的所有必需的部分答案:正確120記錄都丟失。121的,表示數(shù)據(jù)有相等的值和相同的含義。122、123、124、數(shù)據(jù)質(zhì)量的可信性由三個(gè)因素決定:數(shù)據(jù)來(lái)源的權(quán)威性、數(shù)據(jù)的規(guī)范性、數(shù)據(jù)產(chǎn)生的時(shí)間。125、126、4()A、數(shù)據(jù)清理B、數(shù)據(jù)集成C、數(shù)據(jù)變換D、數(shù)據(jù)歸約答案:ABCD127、由于操作員重復(fù)錄入,并發(fā)處理等不規(guī)范的操作,導(dǎo)致產(chǎn)生不完整,不準(zhǔn)確的,無(wú)效的數(shù)據(jù)也可以用在數(shù)據(jù)分析里。128、129處理空缺值的基本方法有6130、131、132、133、134、135、處理噪聲數(shù)據(jù)可以使用( )方法。A、分箱法B、回歸法C、聚類D、忽略元組答案:ABC136訪問(wèn)這些數(shù)據(jù)源。答案:正確137、數(shù)據(jù)集成的方法有()A、聯(lián)邦數(shù)據(jù)庫(kù)B、中間件集成C、數(shù)據(jù)倉(cāng)庫(kù)D、聚類答案:ABC138、數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)集成最常用的方法答案:正確139、數(shù)據(jù)倉(cāng)庫(kù)來(lái)集成數(shù)據(jù)時(shí)需要處理的問(wèn)題包括( )A、實(shí)體識(shí)別B、冗余C、相關(guān)分析D、數(shù)據(jù)沖突和檢測(cè)ABCD140、141、數(shù)據(jù)規(guī)約就是為了壓縮數(shù)據(jù)量,幫助從原有龐大數(shù)據(jù)集中獲得一個(gè)精簡(jiǎn)的數(shù)據(jù)集合,并使這一精簡(jiǎn)數(shù)據(jù)集保持原有數(shù)據(jù)集的完整性。答案:正確142、數(shù)據(jù)規(guī)約的策略有( )A、維歸約B、C、D、ABC143、主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)答案:正確144、屬性子集選擇,主要用于檢測(cè)并刪除不相關(guān)、弱相關(guān)或冗余的屬性。目的是找出最小屬性集,使得數(shù)據(jù)類的概率分布盡可能地接近使用所有屬性得到的原分布答案:正確145、數(shù)量規(guī)約中有參數(shù)的方法一般使用( )A、回歸B、對(duì)數(shù)的線性模型C、直方圖D、聚類答案:AB146、數(shù)量規(guī)約中無(wú)參數(shù)的方法一般使用( )A、直方圖B、聚類C、抽樣D、數(shù)據(jù)立方體聚集答案:ABCD147能更有效。答案:正確148、數(shù)據(jù)變換的方法有很多種,包括光滑、屬性構(gòu)造、聚集、數(shù)據(jù)規(guī)范化、數(shù)據(jù)離散化、概念分層等答案:正確149、數(shù)據(jù)規(guī)范化包括( )A、最大-最小規(guī)范化B、零-均值規(guī)范化C、小數(shù)定標(biāo)規(guī)范化D、數(shù)據(jù)離散化答案:ABC使用簡(jiǎn)易模式采集任意網(wǎng)站數(shù)據(jù)要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:151、ETL,全稱為Extraction-Transformation-Loading,中文名為數(shù)據(jù)抽取、轉(zhuǎn)換和加載。答案:正確152、安裝kettle,必須先安裝jdk(java的運(yùn)行環(huán)境)。答案:正確153、安裝jdk之后需要配置環(huán)境變量才能使用。答案:正確154、ETL是Kettle的一種工具。答案:錯(cuò)誤155、( )是轉(zhuǎn)換里的基本組成部分。它是一個(gè)圖形化的組件,可以通過(guò)配置步驟的數(shù),使得它完成相應(yīng)的功能。A、步驟B、跳C、注釋D、轉(zhuǎn)換答案:A156、Kettle中的( )定義了一個(gè)單向通道,允許數(shù)據(jù)從一個(gè)步驟向另一個(gè)步驟流動(dòng)。A、步驟B、跳C、注釋D、轉(zhuǎn)換答案:B157、csv、txt文件等都屬于文本文件。答案:正確158、Excel的數(shù)據(jù)可分為結(jié)構(gòu)化的表格數(shù)據(jù)和非結(jié)構(gòu)化的表格數(shù)據(jù)。答案:正確159、Excel()A、辦公軟件B、開發(fā)軟件C、操作系統(tǒng)軟件D、數(shù)據(jù)庫(kù)答案:A160、Excel文件在kettle中可使用( )步驟,進(jìn)行excel的輸入輸A、excel輸入B、excel輸C、MicrosoftExcel輸D、MicrosoftExcel輸入答案:ABC16tl輸 ”步驟則可以設(shè)置l7文件或l7版本的文件的輸 。答案:正確16、l輸 ”步驟,僅能輸l7版本的文件。答案:正確163、JSON(JavaScriptObjectNotation,JS對(duì)象簡(jiǎn)譜)是一種輕量級(jí)的數(shù)據(jù)交換格式。答案:正確164、JSON核心概念包括( )A、數(shù)組B、對(duì)象C、屬性D、路徑答案:ABC165、JsonPath表達(dá)式通常是用來(lái)路徑檢索或設(shè)置Json的。答案:正確166、JsonPath表達(dá)式有兩種表示方法,分別是( )A、點(diǎn)記法B、括號(hào)記法C、逗號(hào)記法D、操作符記法答案:AB167、XML指可擴(kuò)展標(biāo)記語(yǔ)言(EXtensibleMarkupXML儲(chǔ)數(shù)據(jù)。答案:正確168、XPathXML(XMLPathLanguage),它是一種用來(lái)確定XML部分位置的語(yǔ)言。169、170、MySQL數(shù)據(jù)的連接參數(shù)與Oracle的連接參數(shù)是完全相同的。171、172、數(shù)據(jù)庫(kù)連接步驟中在列表里可以選擇可用的訪問(wèn)方式有( )A、JDBC連接B、ODBC數(shù)據(jù)源C、JNDI數(shù)據(jù)源DOracleOCI答案:ABCD173、數(shù)據(jù)庫(kù)連接時(shí),一般連接參數(shù)包括( )A、主機(jī)名B、C、端口號(hào)D、用戶名和密碼答案:ABCD174175、Kettle176、常用的轉(zhuǎn)換步驟一般在()A、轉(zhuǎn)換目錄B、腳本目錄C、校驗(yàn)?zāi)夸汥、輸出目錄答案:ABC177、字符串做剪切的功能,該步驟需要在剪切字符串版面添加需要剪切的( )A、字符串字段(輸入流字段B、輸出字段(輸出流字段)C、剪切的起始位置D、剪切的結(jié)束位置答案:ABCD178、字符串替換(Replaceinstring)步驟對(duì)字符串做查找替換。答案:正確179、字符串操作功能包括( )A、首尾去除空白字符B、大小寫C、數(shù)字移除/提取D、刪除特殊字符答案:ABCD180、能使用正則表達(dá)式的是()A、字符串剪切B、字符串替換C、字符串操作D、以上都不行答案:B181、拆分字段成多行(Splitfiledto里有一個(gè)新的字段,由拆分后的子字符串填充。答案:正確182、拆分字段(SplitFields)根據(jù)分隔符將輸入的一個(gè)字段拆分成多個(gè)字段。答案:正確183、合并字段(ConcatFields)將多個(gè)字段用分隔符連接起來(lái)輸出到一個(gè)新的字段。答案:正確184、字段選擇(Selectvalues)可以對(duì)輸入流的字段做選擇、刪除、重命名等操作,還可以更改字段的數(shù)據(jù)類型和精度等。答案:正確185、字段選擇(Selectvalues)有( )3個(gè)選項(xiàng)卡。A、選擇和修改B、移除C、D、替換答案:ABC186、計(jì)算器步驟是一個(gè)函數(shù)集合來(lái)創(chuàng)建新的字段,還可以設(shè)置字段是否移除(段187、內(nèi)存等值查詢188、189、重復(fù)數(shù)據(jù)產(chǎn)生原因有( )A、錄入出錯(cuò)B、C、數(shù)據(jù)縮寫D、硬件設(shè)備出錯(cuò)答案:ABC190、不完全重復(fù)數(shù)據(jù),客觀上表示現(xiàn)實(shí)世界中的同一實(shí)體,但由于表達(dá)方式不同或拼寫錯(cuò)誤等原因,導(dǎo)致數(shù)據(jù)存在了多條重復(fù)記錄。191、192、193的值來(lái)判斷是否重復(fù)的。194、195、作業(yè)的組成包括( )A、B、C、注釋D、輸入答案:ABC196、作業(yè)項(xiàng)結(jié)果有兩個(gè)作用,一是決定作業(yè)的執(zhí)行路徑,二是向下一個(gè)作業(yè)項(xiàng)傳遞一個(gè)結(jié)果對(duì)象。答案:正確197、作業(yè)跳是作業(yè)項(xiàng)之間的連接線,定義了作業(yè)的執(zhí)行路徑。答案:正確198、在Kettle里,作業(yè)是使用一種回溯算法來(lái)執(zhí)行作業(yè)里所有作業(yè)項(xiàng)的。199、200、201、$202、數(shù)據(jù)的質(zhì)量因素包括 、 、 、 、 可信性和可解釋性答案:準(zhǔn)確性;完整性;一致性;時(shí)效性;相關(guān)性;203、數(shù)據(jù)的質(zhì)量問(wèn)題從采集的角度劃分,可分為( )A、準(zhǔn)確性B、完整性C、一致性D、時(shí)效性答案:ABC204、數(shù)據(jù)的質(zhì)量問(wèn)題從應(yīng)用的角度劃分,可分為( )A、準(zhǔn)確性B、相關(guān)性C、時(shí)效性D、可信性答案:BC205、數(shù)據(jù)的質(zhì)量問(wèn)題從用戶使用的角度劃分,可分為()ABCDCD206、準(zhǔn)確性是指數(shù)據(jù)是否正確的,數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中的值是否對(duì)應(yīng)于真實(shí)世界的值。答案:正確207某用戶在使用支付寶綁定銀行卡時(shí),網(wǎng)站要求驗(yàn)證用戶的真實(shí)姓名和身份證號(hào)碼。時(shí)要求采集的數(shù)據(jù)必須有( )A、準(zhǔn)確性B、完整性C、一致性D、相關(guān)性答案:A208、數(shù)據(jù)質(zhì)量完整性是指信息具有一個(gè)實(shí)體描述的所有必需的部分答案:正確209記錄都丟失。210的,表示數(shù)據(jù)有相等的值和相同的含義。211、212、213、數(shù)據(jù)質(zhì)量的可信性由三個(gè)因素決定:數(shù)據(jù)來(lái)源的權(quán)威性、數(shù)據(jù)的規(guī)范性、數(shù)據(jù)產(chǎn)生的時(shí)間。答案:正確214、數(shù)據(jù)質(zhì)量的可解釋性,也稱為可讀性,是指數(shù)據(jù)被人理解的難易程度答案:正確215、4()A、數(shù)據(jù)清理B、數(shù)據(jù)集成C、數(shù)據(jù)變換D、數(shù)據(jù)歸約答案:ABCD216、由于操作員重復(fù)錄入,并發(fā)處理等不規(guī)范的操作,導(dǎo)致產(chǎn)生不完整,不準(zhǔn)確的,無(wú)效的數(shù)據(jù)也可以用在數(shù)據(jù)分析里。217、218處理空缺值的基本方法有6219、220、221、222、223、224、處理噪聲數(shù)據(jù)可以使用( )方法。A、分箱法B、回歸法C、聚類D、忽略元組答案:ABC225訪問(wèn)這些數(shù)據(jù)源。答案:正確226、數(shù)據(jù)集成的方法有()A、聯(lián)邦數(shù)據(jù)庫(kù)B、中間件集成C、數(shù)據(jù)倉(cāng)庫(kù)D、聚類答案:ABC227、數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)集成最常用的方法答案:正確228、數(shù)據(jù)倉(cāng)庫(kù)來(lái)集成數(shù)據(jù)時(shí)需要處理的問(wèn)題包括( )A、實(shí)體識(shí)別B、冗余C、相關(guān)分析D、數(shù)據(jù)沖突和檢測(cè)ABCD229、230、數(shù)據(jù)規(guī)約就是為了壓縮數(shù)據(jù)量,幫助從原有龐大數(shù)據(jù)集中獲得一個(gè)精簡(jiǎn)的數(shù)據(jù)集合,并使這一精簡(jiǎn)數(shù)據(jù)集保持原有數(shù)據(jù)集的完整性。答案:正確231、數(shù)據(jù)規(guī)約的策略有( )A、維歸約B、C、D、ABC232、主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)答案:正確233、屬性子集選擇,主要用于檢測(cè)并刪除不相關(guān)、弱相關(guān)或冗余的屬性。目的是找出最小屬性集,使得數(shù)據(jù)類的概率分布盡可能地接近使用所有屬性得到的原分布答案:正確234、數(shù)量規(guī)約中有參數(shù)的方法一般使用( )A、回歸B、對(duì)數(shù)的線性模型C、直方圖D、聚類答案:AB235、數(shù)量規(guī)約中無(wú)參數(shù)的方法一般使用( )A、直方圖B、聚類C、抽樣D、數(shù)據(jù)立方體聚集答案:ABCD236能更有效。答案:正確237、數(shù)據(jù)變換的方法有很多種,包括光滑、屬性構(gòu)造、聚集、數(shù)據(jù)規(guī)范化、數(shù)據(jù)離散化、概念分層等答案:正確238、數(shù)據(jù)規(guī)范化包括( )A、最大-最小規(guī)范化B、零-均值規(guī)范化C、小數(shù)定標(biāo)規(guī)范化D、數(shù)據(jù)離散化答案:ABC239、ETL,全稱為Extraction-Transformation-Loading,中文名為數(shù)據(jù)抽取、轉(zhuǎn)換和加載。答案:正確240、安裝kettle,必須先安裝jdk(java的運(yùn)行環(huán)境)。答案:正確241、安裝jdk之后需要配置環(huán)境變量才能使用。答案:正確242、ETL是Kettle的一種工具。答案:錯(cuò)誤243、( )是轉(zhuǎn)換里的基本組成部分。它是一個(gè)圖形化的組件,可以通過(guò)配置步驟的數(shù),使得它完成相應(yīng)的功能。A、步驟B、跳C、注釋D、轉(zhuǎn)換答案:A244、Kettle中的( )定義了一個(gè)單向通道,允許數(shù)據(jù)從一個(gè)步驟向另一個(gè)步驟流動(dòng)。A、步驟B、跳C、注釋D、轉(zhuǎn)換答案:B245、csv、txt文件等都屬于文本文件。答案:正確246、Excel的數(shù)據(jù)可分為結(jié)構(gòu)化的表格數(shù)據(jù)和非結(jié)構(gòu)化的表格數(shù)據(jù)。答案:正確247、Excel()A、辦公軟件B、開發(fā)軟件C、操作系統(tǒng)軟件D、數(shù)據(jù)庫(kù)答案:A248、Excel文件在kettle中可使用( )步驟,進(jìn)行excel的輸入輸A、excel輸入B、excel輸C、MicrosoftExcel輸D、MicrosoftExcel輸入答案:ABC24tl輸 ”步驟則可以設(shè)置l7文件或l7版本的文件的輸 。答案:正確25、l輸 ”步驟,僅能輸l7版本的文件。答案:正確251、JSON(JavaScriptObjectNotation,JS對(duì)象簡(jiǎn)譜)是一種輕量級(jí)的數(shù)據(jù)交換格式。答案:正確252、JSON核心概念包括( )A、數(shù)組B、對(duì)象C、屬性D、路徑答案:ABC253、JsonPath表達(dá)式通常是用來(lái)路徑檢索或設(shè)置Json的。答案:正確254、JsonPath表達(dá)式有兩種表示方法,分別是( )A、點(diǎn)記法B、括號(hào)記法C、逗號(hào)記法D、操作符記法答案:AB255、XML指可擴(kuò)展標(biāo)記語(yǔ)言(EXtensibleMarkupXML儲(chǔ)數(shù)據(jù)。答案:正確256、XPathXML(XMLPathLanguage),它是一種用來(lái)確定XML部分位置的語(yǔ)言。257、258、MySQL數(shù)據(jù)的連接參數(shù)與Oracle的連接參數(shù)是完全相同的。259、260、數(shù)據(jù)庫(kù)連接步驟中在列表里可以選擇可用的訪問(wèn)方式有( )A、JDBC連接B、ODBC數(shù)據(jù)源C、JNDI數(shù)據(jù)源DOracleOCI答案:ABCD261、數(shù)據(jù)庫(kù)連接時(shí),一般連接參數(shù)包括( )A、主機(jī)名B、數(shù)據(jù)庫(kù)名C、端口號(hào)D、用戶名和密碼答案:ABCD262263、Kettle264、常用的轉(zhuǎn)換步驟一般在()A、轉(zhuǎn)換目錄B、腳本目錄C、校驗(yàn)?zāi)夸汥、輸出目錄答案:ABC265、字符串做剪切的功能,該步驟需要在剪切字符串版面添加需要剪切的( )A、字符串字段(輸入流字段B、輸出字段(輸出流字段)C、剪切的起始位置D、剪切的結(jié)束位置答案:ABCD266、字符串替換(Replaceinstring)步驟對(duì)字符串做查找替換。答案:正確267、字符串操作功能包括( )A、首尾去除空白字符B、大小寫C、數(shù)字移除/提取D、刪除特殊字符答案:ABCD268、能使用正則表達(dá)式的是()A、字符串剪切B、字符串替換C、字符串操作D、以上都不行答案:B269、拆分字段成多行(Splitfiledto里有一個(gè)新的字段,由拆分后的子字符串填充。答案:正確270、拆分字段(SplitFields)根據(jù)分隔符將輸入的一個(gè)字段拆分成多個(gè)字段。答案:正確271、合并字段(ConcatFields)將多個(gè)字段用分隔符連接起來(lái)輸出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45216-2025危險(xiǎn)貨物自反應(yīng)物質(zhì)和有機(jī)過(guò)氧化物包裝件爆燃試驗(yàn)方法
- 共用墻合同范本
- 兼職防疫保安合同范本
- 出售吊車合同范例
- 加裝電梯托管合同范本
- 光伏銷售質(zhì)保合同范本
- 單位二手房交易合同范本
- 勞動(dòng)合同范例 河南
- 買賣交易正規(guī)合同范本
- 個(gè)人買賣住房合同范本
- 樂(lè)沛LOTSPLAY德國(guó)HABA邏輯思維課程介紹手冊(cè)
- 高中化學(xué)人教版一輪復(fù)習(xí)-晶體結(jié)構(gòu)與性質(zhì)(復(fù)習(xí)課件)
- GB/T 22919.3-2008水產(chǎn)配合飼料第3部分:鱸魚配合飼料
- 劉半農(nóng)《教我如何不想她》課件
- 前行第07節(jié)課(僅供參考)課件
- 船舶涂裝課件
- 界面砂漿檢測(cè)報(bào)告
- 浙江鞋業(yè)出口貿(mào)易研究
- (完整版)環(huán)境科學(xué)與工程-專業(yè)英語(yǔ)詞匯
- 中考形容詞副詞專題復(fù)習(xí)市公開課一等獎(jiǎng)省名師優(yōu)質(zhì)課賽課一等獎(jiǎng)?wù)n件
- 甲醛優(yōu)質(zhì)課件
評(píng)論
0/150
提交評(píng)論