數據分析師歷年考試真題試題庫(含答案)_第1頁
數據分析師歷年考試真題試題庫(含答案)_第2頁
數據分析師歷年考試真題試題庫(含答案)_第3頁
數據分析師歷年考試真題試題庫(含答案)_第4頁
數據分析師歷年考試真題試題庫(含答案)_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE1數據分析師歷年考試真題試題庫(含答案)一、單選題1.數據分析挖掘平臺的使用對象是____。A、總行的數據分析師B、總行及所有一級分行的數據分析師C、總行及境內一級分行的數據分析師D、總行及境內一級二級分行的數據分析師答案:C2.按照農業(yè)銀行數據安全管理的有關規(guī)定(《數據安全管理辦法》(試行)),使用境外機構采集和管理的數據,應符合_,經境外機構或總行系統(tǒng)主管部門同意??傂信c境外機構簽有協(xié)議的,遵照協(xié)議約定執(zhí)行A、境外機構屬地法規(guī)及監(jiān)管要求B、境外機構屬地法規(guī)C、境外機構屬地監(jiān)管要求D、境外機構屬地監(jiān)管要求及境外監(jiān)管要求答案:A3.SQL關于多表聯結查詢,以下____描述是錯誤的。A、外聯結查詢返回的結果集行數可能大于所有符合聯結條件的結果集行數B、多表聯結查詢必須使用到JOIN關鍵字C、內聯結查詢返回的結果是:所有符合聯結條件的數據D、在WHERE子句中指定聯結條件可以實現內聯結查詢答案:B4.從無重復記錄的teacher表中選出姓李的老師數量,下列語句正確的是____A、selectcount(*)fromteacherwheretnamelike'李%';B、selectcount(*)fromteacherwheretnamelike'%李';C、selectcount(*)fromteacherwheretrim(tname)='李%';D、selectcount(*)fromteacherwheretrim(tname)like'%李';答案:A5.SQL的聚集函數COUNT、SUM、MIN、MAX、AVG不允許出現在查詢語句的____子句中A、SELECTB、HAVINGC、GROUPBYD、WHERE答案:C6.下列執(zhí)行數據的刪除語句在運行時不會產生錯誤信息的選項是____。A、Delete*FromAWhereB='6'B、DeleteFromAWhereB='6'C、DeleteAWhereB='6'D、eleteASetB='6'答案:B7.在提交完數據使用申請后,平臺管理員將提交的申請轉至對應的___。A、項目負責人B、審批負責人C、項目管理員D、對口業(yè)務負責人答案:C8.由商業(yè)銀行經營、管理及其他行為或外部事件導致利益相關方對商業(yè)銀行負面評價的風險,指的是____A、市場風險B、操作風險C、信用風險D、聲譽風險答案:D9.數據庫的作用包括____A、存儲數據B、檢索數據C、生成新的數據D、以上全對答案:D10.在數據分析挖掘平臺Woody的筆記本(Notebook)中,以下哪種操作可以建立一個三級標題A、在一個Markdown單元格中輸入1.1.1heading并執(zhí)行B、在一個Markdown單元格中輸入#heading并執(zhí)行C、在一個Raw單元格中輸入1.1.1heading并執(zhí)行D、在一個Raw單元格中輸入#heading并執(zhí)行答案:B11.由于某一國家或地區(qū)的經濟、政治、社會文化及事件,導致該國家或地區(qū)借款人或債務人沒有能力或者拒絕償付商業(yè)銀行債務,指的是____A、市場風險B、操作風險C、國別風險D、信用風險答案:C12.相關系數為負數表明兩個隨機變量____A、負相關B、正相關C、不相關D、以上都不對答案:A13.以下哪個選項不是數據分析師的必備技能?A、懂業(yè)務B、懂數據C、熟悉機器學習D、熟悉CSS答案:D14.我行的數據管理原則是____A、最小化授權原則B、數據分級管理、敏感數據脫敏、數據使用授權C、數據誰使用、安全誰負責、責任誰承擔D、安全第一,服務第二答案:C15.執(zhí)行單行sql語句的Woody內建魔術命令是____A、%%sqlB、%sqlC、%sqlstrD、%magic答案:B16.在GBase中,刪除數據表時應使用下列哪組關鍵字:A、selecttoB、deletefromC、insertintoD、eletein答案:B17.支持關系模型的數據庫系統(tǒng)是____A、網狀數據庫B、層次數據庫系統(tǒng)C、關系數據庫系統(tǒng)D、以上均支持答案:C18.根據是否需要標注數據,機器學習方法可以分為有監(jiān)督學習和無監(jiān)督學習。有監(jiān)督學習中的訓練集用于______。A、定量評價機器學習性能B、估算模型C、驗證模型D、定性評價機器學習性能答案:B19.假設x=np.array([1,2,3,4,5]),那么np.any(x<3)的結果是?A、rray([1,2])B、12C、FALSED、TRUE答案:D20.Woody平臺點擊那個按鈕可以進入指定項目?A、打開B、成員C、授權D、以上都不是答案:A21.數據分析挖掘可應用于哪些方面?A、產品營銷B、決策支持C、風險管理D、以上全是答案:D22.____是指為實現特定業(yè)務目標,通過對數據的探索和挖掘,揭示數據背后的業(yè)務規(guī)律,為業(yè)務經營和管理決策提供支持的項目。A、應用研發(fā)類項目B、數據分析項目C、科技研究類項目D、工程實施類項目答案:B23.SQL增加表的記錄數使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:B24.在mole中的SQL節(jié)點上,可通過何種sql語句對數據集進行操作?A、Transact-SQLB、PL/SQLC、k-sqlD、Sparksql答案:D25.SQL僅去除字符串中最右側的空格的函數是____A、RTRIM(str)B、LTRIM(str)C、TRIM(str)D、以上都可以答案:A26.在GBase中,對數據求和時應使用下列哪個函數:A、SUMB、AVGC、MAXD、MIN答案:A27.Woody平臺,執(zhí)行什么命令,安裝指定的包A、!piplistB、!piplist-oC、!pipinstallSomePackageD、以上都不行答案:C28.Python中,下列選項哪個是正確的if語句____A、ifa>=22:B、ifa>=22C、if(a>=22)D、if(a=>22)答案:A29.按照“貸款五級分類法”,不良貸款是指____。A、損失類貸款B、可疑類、損失類貸款C、次級類、可疑類、損失類貸款D、關注類、次級類、可疑類、損失類貸款答案:C30.分析全渠道交易量,柜面、掌銀、ATM、POS等重點渠道交易特征,數據分析挖掘在____方面的應用。A、風險管理B、產品營銷C、決策支持D、客戶管理答案:C31.在數據分析挖掘平臺Woody的筆記本(Notebook)中,若使用Python執(zhí)行多行SQL語句,可以采用哪個魔術命令?A、%sqlB、%%sqlC、%df2dbD、%%excel2db答案:B32.下列哪個選項是pandas索引器?A、lineB、ilocC、olumnsD、values答案:B33.在項目的___階段,可以結合時間維度、空間維度來盡可能多地設計特征,后續(xù)基于算法來篩選出有效特征。A、特征降維B、特征選擇C、數據清洗D、特征設計答案:D34.數據分析挖掘流程的第一步是什么?A、數據收集B、數據處理C、明確分析目的和思路D、構建模型答案:C35.在GBase中,使用alter語句修改數據表時,修改一列的名稱要用到的關鍵字是:A、dropB、changeC、modifyD、rename答案:B36.農業(yè)銀行正在推進的數字化轉型再造一個農業(yè)銀行的戰(zhàn)略堅持以____為中心。A、客戶B、數據C、業(yè)務D、發(fā)展答案:A37.我行的數據管理原則遵循的原則是?A、數據誰使用、安全誰負責、責任誰承擔B、隨意使用C、無管理原則D、共用承擔答案:A38.SQL增加表的列數使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:A39.SQL從groupby分組的結果集中再次用條件表達式進行篩選的子句是____A、FROMB、ORDERBYC、HAVINGD、WHERE答案:C40.SQL中,使用客戶信息表CUST_INFO中的出生日期BIRTH字段更新為當前(2020年)年齡,應該使用的命令是____A、UPDATESETBIRTHWITH2020-BIRTHB、REPLACEBIRTHWITH2020-BIRTHC、UPDATECUST_INFOSETBIRTH=2020-BIRTHD、UPDATECUST_INFOBIRTHWITH2020-BIRTH答案:C41.在處理特征縮放時,如果x是一個獨立的特征值(即某個數據點中的特征值),需要用到這個特征在整個數據集中的最小值和最大值,這種方法一般也被稱為什么?A、min-max縮放B、特征標準化C、特征方差縮放D、l2歸一化答案:A42.____是Spark集成的機器學習庫。A、HadoopB、igTableC、MahoutD、MLlib答案:D43.(一)找到缺失值(二)分析缺失值在整體樣本中的分布占比(三)決定采用哪種缺失值處理方法。將以上序號描述的是缺失值的處理思路,正確的排序是?A、三一二B、三二一C、一二三D、一三二答案:C44.以下哪項不是我行數據標準中的數據項標準內容__A、業(yè)務屬性B、指標屬性C、技術屬性D、管理屬性答案:B45.在GBase中,對數據求最小值時應使用下列哪個函數:A、SUMB、AVGC、MAXD、MIN答案:D46.在數據分析挖掘平臺Woody項目列表頁面不能執(zhí)行以下哪種操作?A、打開項目B、查看項目成員C、管理項目成員D、數據授權答案:D47.為加快數據分析師隊伍的建設,總行啟動。____A、星星計劃B、跟班學習C、樹苗計劃D、繁星計劃答案:D48.某超市研究銷售紀錄數據后發(fā)現,買啤酒的人很大概率也會購買尿布,這種屬于數據分析的哪類問題?A、關聯規(guī)則發(fā)現B、聚類C、分類D、自然語言處理答案:A49.____組織開展外部數據應用的后評價。A、數據需求部門B、客戶部門C、技術實施部門D、數據管理部門答案:D50.XGBoost包中的____函數可以得到每個特征的特征重要度。A、feature_importanceB、f_importanceC、importanceD、feature_importances_答案:A51.下面哪個不屬于關系完整性約束條件?A、關系完整性B、實體完整性C、參照完整性D、用戶定義完整性答案:A52.KS是模型評價的區(qū)分度指標,KS指標計算公式是____A、KS=max(TPR-FPR)B、KS=min(TPR-FPR)C、KS=mean(TPR-FPR)D、KS=median(TPR-FPR)答案:A53.對公集市()加工基礎指標數據,包括同比環(huán)比指標,均值,并按照賬戶、客戶、機構、產品等重要維度進行分類匯總。A、緩沖層B、中間層C、應用層D、基礎層答案:B54.數據控制語言的縮寫是____A、DDLB、DMLC、DCLD、BL答案:C55.數據質量管理以什么為載體和基本單元____。A、報表B、指標C、信息系統(tǒng)D、數據表答案:C56.假設data=pd.series([0.25,0.5,0.75,1.0]),則data[1:3]的結果是?A、[0.25,0.5,0.75]B、[0.5,0.75]C、10.520.75D、[0.5,0.75,1.0]答案:C57.____應建立外部數據檔案庫,對立項材料、數據需求、合同協(xié)議、驗收報告、應用評價等文本進行存檔管理。A、數據管理部門B、法律合規(guī)部門C、客戶部門D、技術實施部門答案:A58.識別農戶貸款中擔保人替農戶還款等行為里潛藏的操作風險,屬于數據分析在____方面的應用。A、風險管理B、產品營銷C、決策支持D、客戶管理答案:A59.在GBase中,使用drop語句刪除數據表時,使用___關鍵字,可以防止由于數據庫不存在而報錯。A、ifexistsB、existsC、havingD、ifexisting答案:A60.SQL使用GROUPBY完成分組后,利用____對分組結果進行排序。A、ORDERB、SORTBYC、SORTD、ORDERBY答案:D61.用于刪除結果集中重復的行地關鍵詞是?A、LLB、DISTINCTC、HAVINGD、NULL答案:B62.假設x1表示數組array([5,0,3,3,7,9]),在切片獲取時,x1[:4]獲取的子數組是?A、rray([5,0,3])B、Array([5,0,3,3])C、Array([0,3,3])D、Array([3,7,9])答案:B63.python中,mean、std等聚合函數屬于哪個庫。A、seabornB、numpyC、sklearnD、xgboost答案:B64.mole中數據探查可在____節(jié)點上進行。A、未執(zhí)行節(jié)點B、執(zhí)行成功節(jié)點C、正在執(zhí)行的節(jié)點D、執(zhí)行錯誤的節(jié)點答案:B65.非結構化數據一般存儲為____的數據格式。A、字符B、二進制C、數值D、十進制答案:B66.____是平衡銀行流動性和盈利性的優(yōu)良工具。A、貸款業(yè)務B、債券投資C、現金資產D、存款業(yè)務答案:B67.外部數據引入過程中的數據出行,要按照____原則,采取一定的安全保密措施。A、穩(wěn)定可靠B、合法合規(guī)C、最小必要D、權威近源答案:C68.數據分析挖掘平臺數據遵循____的原則實施分級管理。A、最大化授權B、自主化授權C、精準化授權D、最小化授權答案:D69.熟悉行業(yè)知識、公司業(yè)務及流程,最好有自己獨到的見解,指的是成為一名合格數據分析師的哪個前提?A、懂業(yè)務B、懂數據C、懂建模D、懂管理答案:A70.在GBase中,對數據求和時應使用下列哪個函數:A、SUMB、AVGC、MAXD、MIN答案:A71.噪聲數據會對模型訓練產生影響,哪個選項不是常用的處理噪聲數據的方法?A、數據分箱B、調整學習率C、數據聚類D、人工檢查答案:B72.下列選項哪個不是繪圖的庫?A、NumPyB、SeabornC、MatplotlibD、pyecharts答案:A73.我行數據中臺建設的核心內容是打造以______為基礎的“內容+管理+服務”的一體化平臺。A、數據倉庫B、業(yè)務C、分析平臺D、大數據平臺答案:D74.____是主管業(yè)務數據的業(yè)務審批部門和數據分析項目的需求申請部門。A、信息管理部B、項目申請部門C、科技部門D、信息管理部或科技部門答案:B75.指標______是對指標數據結果范圍的描述,具體包含機構范圍、指標幣種、數據頻度、業(yè)務維度。A、基本信息B、統(tǒng)計信息C、口徑信息D、管理信息答案:B76.數據挖掘平臺Woody工具里,執(zhí)行什么命令,列出已安裝的包?A、!piplistB、!piplist-oC、!pipinstallSomePackageD、以上都不行答案:A77.Python中,字符串s=abc,那么執(zhí)行表達式s+d后,輸出結果為____A、bcB、abcdC、abc+dD、報錯答案:B78.SQL是一種____語言A、函數型B、高級算法C、關系數據庫D、人工智能答案:C79.在數據分析挖掘平臺Woody的筆記本(Notebook)中,如何操作完成Python與R內核的切換?A、Kernel->InterruptB、Kernel->RestartC、Kernel->ChangekernelD、Kernel->Shutdown答案:C80.由于很多模型對缺失值有容忍度或靈活的處理方法,可以采用不處理對待缺失值。以下哪個模型可以實現這個功能?A、邏輯回歸B、聚類算法C、冒泡算法D、決策樹答案:D81.SQL中,下列哪個函數不屬于聚集函數:A、RIGHT()B、MIN()C、MAX()D、SUM()答案:A82.當SQL查詢獲得的結果較多時,可以使用____語句顯示少數幾條數據A、WHEREB、HAVINGC、LIMITD、GROUPBY答案:C83.DataFrame的屬性有哪些?A、intB、dataC、indexD、columns答案:C84.Python中,下列哪段代碼能夠正確的讀取一個文件?____A、f=open(test.txt,read)B、f=open(r,test.txt)C、f=open(test.txt,r)D、f=open(read,test.txt)答案:C85.Python中,下列選項哪個是正確的while循環(huán)語句____A、whileloopa<10B、whilea<10:C、whilea<10D、whileloopa<10:答案:B86.在文獻中,屬性、維度(dimension)、特征(feature)、變量(variate)、因子(factor)都可以互換的使用。以上哪一個,一般用在數據倉庫中。A、維度(dimension)B、特征(feature)C、變量(variate)D、因子(factor)答案:A87.____是IFAR系統(tǒng)各項賬務數據、報告數據組織的基本單位。A、報告主體B、賬務主體C、核算主體D、會計主體答案:D88.在數據分析挖掘平臺的管理中,下列不是總行信息管理部的職責的是____。A、制訂數據分析項目管理相關規(guī)章制度和標準規(guī)范,健全項目管理機制B、制定數據安全策略,負責平臺數據安全和合規(guī)管理C、負責數據分析挖掘平臺及分析挖掘工具的資源保障、運維及監(jiān)控D、負責組織平臺的應用推廣工作答案:C89.____是指通過具有已知值的變量來預測其他變量的值。A、關聯B、回歸C、聚類D、分類答案:B90.下面哪個是Tanh函數的表達式A、f(x)=1/(1+exp(-x))B、f(x)=max(0,x)C、f(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x))D、f(x)=exp(-x)/(1+exp(-x))答案:C91.數據分析項目結項或終止后,____在數據分析挖掘平臺中實施項目歸檔、用戶和數據權限回收等工作。A、超級管理員B、平臺管理員C、項目管理員D、分析用戶答案:B92.SQL語言中,條件年齡BETWEEN15AND35表示年齡在15至35之間,且____A、包括15和35歲B、不包括15和35歲C、包括15但不包括35歲D、包括35但不包括15歲答案:A93.SQL表示男副教授的表達式為A、職稱='副教授'OR性別='男'B、職稱='副教授'AND性別='男'C、BETWEEN'副教授'AND'男'D、IN('副教授','男')答案:B94.Python語言中一些已經被賦予特定意義的單詞,如and、while、for等,叫做____A、關鍵字B、預留字C、預置字D、預置詞答案:A95.HDFS是一套____框架。A、分布式計算B、分布式文件存儲C、分布式數據庫D、機器學習答案:B96.Python中,下列哪個關鍵字是用于給if語句添加其他條件語句的____A、elseifB、elseifC、elifD、以上都不是答案:C97.Python中,表達式9//2的值為:____A、2B、3C、4D、5答案:B98.在開展數據分析項目的過程中,關于敏感數據的使用,說法正確的是____A、歸口管理部門審批即可B、隨意使用C、須經主管業(yè)務數據的業(yè)務審批部門和歸口管理部門聯合審批D、主管業(yè)務數據的業(yè)務部門審批即可答案:C99.數據控制語言的縮寫是____A、DDLB、DMLC、DCLD、BL答案:C100.在GBase中,在處理文本字符串時,可以同時去除兩端的空格的關鍵字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:A101.數據分析挖掘平臺的____指平臺已注冊用戶,包括數據分析師和項目相關分析人員,負責數據分析項目實施工作。A、平臺管理員B、業(yè)務審批員C、項目管理員D、分析師用戶答案:D102.在mole模型列表界面中,當用戶希望將已有的模型導入時,導入的文本為____格式。A、htmlB、jsonC、svD、xml答案:B103.如果使用填充法處理缺失值,以下哪種方法不是正確的處理方式?A、隨機填充B、統(tǒng)計法填充C、模型填充D、專家經驗補全答案:A104.在Python中不滿足條件返回True,滿足條件則返回False的邏輯運算符是____A、orB、notC、elseD、and答案:B105.在mole中,以下何種節(jié)點用來計算兩個父節(jié)點輸出的差集?A、UnionB、SubstractC、MapD、FlatMap答案:B106.GBASE不支持的字符型為____。A、CHARB、VARCHARC、TEXTD、STRING答案:D107.什么顏色狀態(tài)下的文件才可以進行移動操作?A、綠色B、灰色C、紅色D、黑色答案:B108.DB、DBS和DBMS三者的關系是____A、DB包括DBMS和DBSB、DBS包括DB和DBMSC、DBMS包括DBS和DBD、BS、DB和DBMS三者互不相關答案:B109.____的每一個分量必須是一個不可分的數據項A、概念B、屬性C、關系D、元組答案:C110.下列哪一個命令可以刪除sle數據庫的tb_name表____A、deletefromtb_nameB、deletefromsle.tb_nameC、droptabletb_nameD、rop*fromsle.tb_name答案:C111.對于圖像識別問題(比如識別照片中的貓),哪種神經網絡模型結構更適合解決這類問題____A、多層感知器B、卷積神經網絡C、循環(huán)神經網絡D、BP神經網絡答案:B112.下列選項中,Python變量賦值正確的是____A、vara=2B、inta=2C、a=2D、variablea=2答案:C113.SQL語言中,刪除一個表的命令是?A、DELETEB、DROPC、LEARD、REMOVE答案:B114.defmax(a,b):ifa>b:returnaelse:returnb能成功調用該Python函數的語句是____A、max(,5)B、max(-1)C、max(5,-1)D、max(5,-1,3)答案:C115.不能擅自變更有明確限制性約定的數據使用目的、范圍及方式,如有必要超出約定范圍,應當另行取得________的授權A、數據主體B、外部數據提供方C、數據需求部門D、技術實施部門答案:A116.SQL語句,在關聯數據量較大的表,或者需要重復關聯多張數據表后進行匯總加工時,可以考慮____提升查詢效率。A、新建復制表B、多表內連接C、新建臨時表D、多表外連接答案:C117.根據一定的標準把一群對象劃分成若干個組,組內對象之間具有很高的相似度,而不同組的對象之間存在顯著差異的分析方法屬于____。A、預測建模B、聚類分析C、關聯分析D、異常檢測答案:B118.支持關系模型的數據庫系統(tǒng)是____A、網狀數據庫B、層次數據庫系統(tǒng)C、關系數據庫系統(tǒng)D、以上均支持答案:C119.銀行簽發(fā),承諾自己在見票時無條件支付確定的金額給收款人或者持票人,指的是____。A、銀行匯票B、商業(yè)匯票C、銀行本票D、支票答案:C120.刪除數據表時可以使用下列哪種語句:A、select語句B、create語句C、insert語句D、rop語句答案:D121.根據是否需要標注數據,機器學習方法可以分為有監(jiān)督學習和無監(jiān)督學習。有監(jiān)督學習中的訓練集用于______。A、定量評價機器學習性能B、估算模型C、驗證模型D、定性評價機器學習性能答案:B122.某超市研究銷售紀錄數據后發(fā)現,買啤酒的人很大概率也會購買尿布,這種屬于數據分析的哪類問題?A、關聯規(guī)則發(fā)現B、聚類C、分類D、自然語言處理答案:A123.SQL語句,如果列為主鍵,以下執(zhí)行效率最高的是____A、count(列名)B、count(1)C、ount(*)D、全部答案:A124.業(yè)務部門下載并填寫____申請使用數據分析挖掘平臺的普通數據。A、《數據分析挖掘平臺用戶申請表》B、《數據分析挖掘平臺數據申請表》C、《關于申請使用數據分析挖掘平臺數據的函》D、《關于申請導出數據分析挖掘平臺數據的函》答案:B125.在Python中,字符串使用____定義A、一對單引號B、一對雙引號C、一對單引號或一對雙引號都可以D、以上都不對答案:C126.Python語句中一般以____作為語句的結束符A、新的一行B、分號C、句號D、逗號答案:A127.在mole中,以下關于節(jié)點的表述不正確的是____A、節(jié)點就是一系列算子B、節(jié)點是HDFS文件,只能用來保存數據C、不同的節(jié)點代表著不同的計算模式D、在節(jié)點上輸入一個數據集合計算后得到一個新集合答案:B128.下列屬于無監(jiān)督學習的是______。A、k-meansB、SVMC、最大熵D、CRF答案:A129.對于已經通過模型驗證且可以落地應用的模型,由____組織開展模型的業(yè)務應用。A、總行信息科技部B、研發(fā)中心C、項目申請部門D、總行辦公室答案:C130.假設x=np.array([1,2,3,4,5]),那么np.any(x<8)的結果是?A、rray([1,2,3,4,5])B、5C、FALSED、TRUE答案:D131.GBASE創(chuàng)建分布表,指定表中某一列為哈希列(Hash列)的語句是____A、HASHBYcolumn_nameB、DISTRIBUTEDBYcolumn_nameC、DISTRIBUTINGBYcolumn_nameD、HASHEDBYcolumn_name答案:B132.既可滿足企業(yè)貿易往來的結匯、售匯需求,也可供市場參與者進行投資或投機的交易活動是____。A、外匯交易B、貴金屬交易C、期貨交易D、股票交易答案:A133.在GBase中,在處理文本字符串時,可以同時去除兩端的空格的關鍵字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:A134.在Markdown單元格中,通過什么符號,可以生成指向URL的超鏈接?A、()B、[]C、{}D、<>答案:B135.下面屬于有監(jiān)督學習的是?A、數據統(tǒng)計B、分類C、聚類D、關聯分析答案:B136.概念模型,也稱信息模型,是按____的觀點來對數據和信息建模,主要用于數據庫設計。A、計算機系統(tǒng)B、現實世界C、數據D、用戶答案:D137.在神經網絡中,如果我們用了一個過大的學習率會發(fā)生什么____。A、神經網絡會收斂B、神經網絡不會收斂C、都有可能D、都不對答案:B138.訓練誤差非常小,泛化誤差特別大,這種現象稱之為什么?A、過擬合B、欠擬合C、完美擬合D、隨機擬合答案:A139.在數據分析挖掘平臺Woody中,在以下哪個頁面中可以啟用插件?A、FilesB、RunningC、lustersD、Nbextensions答案:D140.GBASE中,復制table_nameB的表結構來創(chuàng)建表table_nameA語句是____A、CREATETABLEtable_nameALIKEtable_nameB;B、CREATETABLEtable_nameBLIKEtable_nameA;C、REATETABLEtable_nameAFROMtable_nameB;D、CREATETABLEtable_nameBFROMtable_nameA;答案:A141.SQL聚集函數中不包括下列哪個選項:A、MAX()B、COUNT()C、LEFT()D、AVG()答案:C142.下面哪個聚合函數可以計算分位數?()A、meanB、quantileC、ountD、prod答案:B143.在數據分析挖掘平臺Woody的筆記本(Notebook)中,假設已經使用Python語言定義好函數add_numbers(a,b),那么執(zhí)行add_numbers??的效果是以下哪個A、顯示函數的概要信息B、顯示函數的源代碼C、調試函數D、執(zhí)行報錯答案:B144.為銀監(jiān)會標準化等監(jiān)管報送等上層應用提供基礎數據,支撐我行大部分監(jiān)管報送和內管指標的數據集市是____A、監(jiān)管統(tǒng)計數據集市B、運營數據集市C、風險數據集市D、內控數據集市答案:A145.預測客戶未來資產變化情況,指導客戶經理尋找潛在目標客戶,預防客戶流失,屬于數據分析在____方面的應用。A、風險管理B、產品營銷C、決策支持D、客戶管理答案:D146.數據分析挖掘平臺Woody環(huán)境采用GBase作為后臺數據庫,與傳統(tǒng)關系型數據庫不同,該數據庫采用的存儲方式是____。A、行存儲B、列存儲C、二維表存儲D、鍵值存儲答案:B147.在統(tǒng)計學中,下列哪個常用概率分布是連續(xù)分布?A、0-1分布B、二項分布C、正態(tài)分布D、泊松分布答案:C148.python語言,以下語句正確的是____A、frompandasimportsvmB、fromnumpyimportsvmC、fromsklearnimportsvmD、fromxgboostimportsvm答案:C149.下面屬于聚類算法的是____。A、K-meansB、XGBoostC、AprioriD、RandomForest答案:A150.在進行數據分析項目時,肯定會在數據分析挖掘平臺上申請權限、使用數據,所以在申請數據使用前,一定要充分了解我行的___A、數據加密算法B、數據管理原則C、數據授權步驟D、數據刪除規(guī)定答案:B151.在文獻中,屬性、維度(dimension)、特征(feature)、變量(variate)、因子(factor)都可以互換的使用。以上哪一個,一般用在機器學習領域中。A、維度(dimension)B、特征(feature)C、變量(variate)D、因子(factor)答案:B152.Python中,下列選項哪個是正確的if語句____A、ifa>=22:B、ifa>=22C、if(a>=22)D、if(a=>22)答案:A153.DataFrame屬于python的哪個包。A、pandasB、numpyC、sklearnD、xgboost答案:A154.由商業(yè)銀行經營、管理及其他行為或外部事件導致利益相關方對商業(yè)銀行負面評價的風險,指的是____A、市場風險B、操作風險C、信用風險D、聲譽風險答案:D155.若要“查詢選修了C門以上課程的學生的學號”,則正確的SQL語句是A、selects_idfromSCgroupbys_idwherecount(*)>CB、selects_idfromSCgroupbys_idhavingcount(*)>CC、selects_idfromSCwherecount(*)>Corderbys_idD、selects_idfromSChavingcount(*)>C答案:B156.使用alter語句修改數據表時,修改一列的名稱要用到的關鍵字是:A、ropB、changeC、modifyD、rename答案:B157.在命令行中,Python提示符____就是鍵入代碼的地方,按下Enter即可執(zhí)行。A、>>>B、[]C、(D、)答案:A158.SQL更新表中的已有數據的值使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:C159.分析全渠道交易量,柜面、掌銀、ATM、POS等重點渠道交易特征,數據分析挖掘在____方面的應用。A、風險管理B、產品營銷C、決策支持D、客戶管理答案:C160.數據資產視圖可以解決的問題有____A、有什么數據資產B、數據資產在哪里C、數據資產能怎么用D、以上都對答案:D161.下面不屬于boosting算法的是____。A、GBDTB、XGBoostC、LightGBMD、RandomForest答案:D162.XGBoost包中的____函數可以得到每個特征的特征重要度。A、feature_importanceB、f_importanceC、importanceD、feature_importances_答案:A163.在命令行中,Python提示符____就是鍵入代碼的地方,按下Enter即可執(zhí)行。A、>>>B、[]C、(D、)答案:A164.____的單條數據在一段時間區(qū)間內有效,一般采用起始日期startdate和截止日期enddate描述該條數據生效時點和失效時點。A、明細表B、切片表C、拉鏈表D、時間表答案:C165.數據清洗在提升數據質量中扮演十分重要的角色,以下哪個選項不是因為數據清洗的作用?A、處理數據重復B、處理噪聲數據C、處理離群點數據D、處理字符型數據為整數型答案:D166.數據分析挖掘平臺Woody底層使用哪種數據庫來存儲分析數據____A、OracleB、SybaseC、MySQLD、Gbase答案:D167.DML,即DataManipulationLanguage,指的是____。A、數據操縱語言B、數據修改語言C、數據控制語言D、數據定義語言答案:A多選題1.以下常用的連續(xù)分布有____A、二項分布B、指數分布C、正態(tài)分布D、泊松分布答案:BC2.在Python中,標識符的命令規(guī)則包括A、可以以數字開頭B、可以下劃線開頭C、除了開頭,其他部分可以由字母、數字或下劃線組成D、可以字母開頭答案:BCD3.下面屬于圖的基本概念的是____。A、度B、路徑C、連通D、詞袋答案:ABC4.信用評分模型按照信貸整個生命周期,可分為哪三種類型A、申請評分B、行為評分C、催收評分D、交易評分答案:ABC5.關于GBDT與XGBoost的區(qū)別,下列選項中描述正確的是:____A、GBDT是機器學習算法,XGBoost是該算法的工程實現。B、GBDT采用CART作為基分類器,XGBoost支持多種類型的基分類器,比如線性分類器。C、GBDT在模型訓練時只使用了代價函數的一階導數信息,XGBoost對代價函數進行了二階泰勒展開,可以同時使用一階和二階導數。D、GBDT在每輪迭代時使用全部的數據,XGBoost則采用了與隨機森林相似的策略,支持對數據進行采樣。答案:ABCD6.Customers1與Customers2表結構一致,以下SQL語句正確的有____A、SELECTcust_nameFROMCustomers1UNIONSELECTcust_nameFROMCustomers2B、SELECTcust_contactFROMCustomers1UNIONSELECTcust_name,cust_contactFROMCustomers2C、SELECT*FROMCustomers1UNIONSELECT*FROMCustomers2D、SELECTcust_nameFROMCustomers1UNIONSELECT*FROMCustomers2答案:AC7.標簽板塊不包括:____。A、零售B、對公C、賬戶D、商戶答案:ABD8.Python嵌套就是一條語句里面還有另一條語句,以下正確的是____A、for中不能還有forB、while中不能還有whileC、for中可以有whileD、while中可以有for答案:CD9.GBASE表級組合壓縮方式為____A、(0,0)B、(1,0)C、(1,3)D、(5,5)答案:ACD10.下列那些機器學習算法使用了Boosting學習方法思想?A、隨機森林B、AdaboostC、GBDTD、XGBoost答案:BCD11.分析報告編制過程中“迭代完善”步驟的工作內容包括:A、團隊根據數據情況和業(yè)務趨勢討論分析報告B、迭代完善報告框架C、迭代數據分析D、迭代報告完善答案:ABCD12.SQL是一種專門用來與數據庫溝通的語言,集____功能于一體。A、數據建模B、數據操縱C、數據定義D、數據控制答案:BCD13.以下哪些問題適合使用深度學習模型?A、圖片識別B、語音識別C、計算機視覺D、機器翻譯答案:ABCD14.下面____選項屬于樹類算法?A、GBDTB、XGBoostC、LightGBMD、Adaboost答案:ABCD15.我行數據中臺的邏輯框架中,會從以下幾個方面進行建設。A、聚焦業(yè)務管理流程,迭代優(yōu)化業(yè)務中臺。B、匯聚打通全域數據,推進數據資產化。C、強化數據資產管理,提升數據供給效能。D、打造通用數據服務,快速賦能業(yè)務應用。答案:BCD16.以下的操作,會過濾空值的是____A、count(cid)B、count(distinctcid)C、ount(name)D、count(*)答案:ABC17.分析報告的工作步驟包括明確報告目的、報告框架、____、報告校稿及交付等步驟。A、數據分析B、報告初稿C、迭代完善D、報告圖形化展示答案:ABCD18.知識圖譜可以應用的領域包括A、反欺詐B、大數據風控C、推薦系統(tǒng)D、聊天機器人答案:ABCD19.F1分數是的以下哪些選項的加權調和平均____A、精確率B、召回率C、TPRD、FPR答案:AB20.以下哪些屬于商業(yè)銀行的中間業(yè)務____A、擔保業(yè)務B、貸款業(yè)務C、承諾業(yè)務D、借款業(yè)務答案:AC21.《中國農業(yè)銀行數據安全管理辦法(試行)》將數據安全類別劃分為____等。A、客戶數據B、業(yè)務數據C、管理數據D、監(jiān)管數據答案:ABCD22.所謂嵌套,就是一條語句里面還有另一條語句,Python語言允許____A、for中還有forB、while中還有whileC、for中有whileD、while中有for答案:ABCD23.傳統(tǒng)的統(tǒng)計方法都比較抽象和深奧,一般人難于掌握,EDA(探索性數據分析)則更強調____與____。A、直觀B、數據可視化C、假設檢驗D、數學公式答案:AB24.常見的能夠自動處理缺失值的模型包括____。A、XGBoostB、決策樹C、線性回歸D、邏輯回歸答案:AB25.調整超參數的方法有那些。A、手動調參B、網格搜索C、隨機搜索D、自動超參數優(yōu)化方法答案:ABCD26.在數據分析挖掘平臺Woody項目中,可以新建選項中的哪些____A、Python筆記本(Notebook)B、文本文件(TextFile)C、文件夾(Folder)D、R筆記本(Notebook)答案:ABCD27.根據《中國農業(yè)銀行數據分析師管理辦法》,數據分析師的主要崗位職責包括。A、參與制定數據分析項目年度計劃,參與數據分析項目業(yè)務需求研制和需求評審B、牽頭或參與實施數據分析項目,開展數據分析挖掘模型建設C、對數據分析挖掘模型進行驗證,并根據驗證結果對模型進行優(yōu)化、完善D、模型驗證不屬于數據分析師的職責,應該由業(yè)務人員完成答案:ABC28.業(yè)務部門可按需申請數據分析挖掘平臺的數據使用權限,并對其獲取數據的哪些數據處理行為承擔安全保密責任?A、查詢B、使用C、下載D、傳輸及銷毀答案:ABCD29.EDA的特點有三個:____A、讓數據說話B、分析方法靈活C、簡單直觀D、需要前提假設答案:ABC30.特征x=[0,0,1,1,2,2,2,2,3,3,3,3,4],則特征x的眾數為____。A、0B、2C、3D、1答案:BC31.線上信貸產品的主要特征是____A、普惠化B、移動化C、智能化D、場景化答案:ABCD32.《中國農業(yè)銀行數據安全管理辦法(試行)》將數據安全類別劃分為____等。A、客戶數據B、業(yè)務數據C、管理數據D、監(jiān)管數據答案:ABCD33.按照“貸款五級分類法”,不良貸款包括____A、關注B、次級C、可疑D、損失答案:BCD34.數據分析挖掘平臺包含哪些工具?A、WoodyB、MoleC、SASD、Linux答案:AB35.數據質量管理的目標包括____。A、持續(xù)提升數據質量B、確保信息數據合法合規(guī)C、促進數據應用價值的充分發(fā)揮D、直接創(chuàng)造利潤答案:ABC36.IFAR會計期間是根據會計制度的規(guī)定和管理核算的需要,對經濟業(yè)務活動的會計核算、分期結算賬目和編制財務會計報告一個周期的規(guī)定。包括標準____。A、月B、季度C、半年D、年度答案:ABCD37.常用的數據可視化方法有____圖、____圖、____圖、____圖等。A、概率密度圖B、箱形圖C、餅圖D、散點圖答案:ABCD38.指標規(guī)范內容包含指標的_______A、基本信息B、統(tǒng)計信息C、口徑信息D、管理信息答案:ABCD39.以下符合個人集市定位的是____A、個人客戶統(tǒng)一視圖B、應用數據服務支撐C、數據挖掘分析支撐D、標簽庫建設答案:ABCD40.以下敘述正確的是____。A、目標變量(標簽)是離散值,稱為分類任務B、目標變量(標簽)是連續(xù)值,稱為回歸任務C、垃圾郵件識別屬于回歸任務D、預測房屋價格屬于回歸任務答案:ABD41.Python中,a="hello",b="python",下列選項中屬于正確字符串運算的是____A、[1:4]B、a*2C、hinaD、a+b答案:ABCD42.數據庫系統(tǒng)的組成部分包括哪些A、數據庫B、數據庫管理系統(tǒng)C、應用程序D、數據庫管理員答案:ABCD43.用于衡量連續(xù)數據的中心趨勢的統(tǒng)計量有。____A、均值B、中位數C、眾數D、方差答案:ABC44.在mole中,以下何種節(jié)點可以對兩個數據集進行聯接?A、reduceB、joinC、leftjoinD、map答案:BC45.以下哪些是我行的線上信貸產品?A、網捷貸B、隨薪貸C、助業(yè)快e貸D、房抵貸答案:AC46.以下哪些方法用于處理數據缺失問題?A、統(tǒng)計法填充B、模型填充C、真值轉換法D、專家補全答案:ABCD47.下列關于模型評估的說法,正確的有____A、評價模型的好壞只看KS值、AUC等參數就夠了B、評價模型的好壞,也需要從業(yè)務角度評價模型是否符合業(yè)務邏輯C、對于機器學習模型的評價,要參考模型特征的可解釋性D、如果模型在訓練集的表現很好,但在測試集結果一般,說明模型存在過擬合的問題,需要修正答案:BCD48.監(jiān)督學習基本等價于數據挖掘的預測任務,以下哪些數據監(jiān)督學習?A、分類B、回歸C、聚類D、數據統(tǒng)計答案:AB49.挑選入模變量要考慮的因素有____。A、變量之間的相關性B、變量是否容易生成和使用C、變量的強壯性D、變量在業(yè)務上的可解釋性答案:ABCD50.根據農業(yè)銀行員工行為守則,關于勤勉盡職的要求有____A、員工應具備崗位任職資格或能力,熟練掌握業(yè)務技能并樹立終身學習理念,與時俱進,提升素質。B、員工應恪守制度要求和辦事程序,勤奮努力,嚴謹審慎,精益求精,盡職盡責。C、員工應科學管理時間,提高工作效率。D、員工崗位變動或離職,應按規(guī)定妥善交接工作,遵守脫密和競業(yè)限制約定,不得擅自帶走所在機構的財物、工作資料和客戶資源。答案:ABCD51.個人客戶營銷與管理系統(tǒng)的主要功能包括A、工作平臺B、客戶畫像C、營銷管理D、客戶管理答案:ABCD52.數據集常將多個數據源中的數據結合成、存放在一個一致的數據存儲,需要考慮可能產生問題?A、過擬合問題B、冗余問題C、數據排序D、數據值的沖突答案:BD53.總行數據分析師應在數據應用過程中發(fā)現____等數據問題,推動各領域數據治理。A、數據缺失B、數據不準確C、數據不一致D、數據不整合答案:ABCD54.數據挖掘平臺目前提供的分析工具有____A、WoodyB、MoleC、SASD、Tableau答案:ABC55.對于模型部署評審環(huán)節(jié),需要從角度進行評審?(包括但不限于)A、部署方案B、時間計劃C、部署風險D、部署風險的應對建議答案:ABCD56.分類問題的主要評價指標有____A、準確率B、精確率C、召回率D、F1值答案:ABCD57.下面關于邏輯運算符的優(yōu)先級,哪一個說法是正確的?A、邏輯運算符AND和OR可以用來連接多個查詢條件B、AND的優(yōu)先級低于ORC、小括號()可以改變優(yōu)先級D、多個邏輯運算符,優(yōu)先級從左至右依次增高答案:AC58.統(tǒng)一指標庫建設的總體思路是____。A、數據圖表化B、指標平鋪化C、報表指標化D、指標層次化答案:CD59.下面____選項屬于樹類算法?A、ID3B、C4.5C、ART決策樹D、隨機森林答案:ABCD60.按照貸款期限,貸款可劃分為____?A、短期貸款B、信用貸款C、擔保貸款D、中長期貸款答案:AD61.以下哪類存款在存入時不約定存期?A、整存整取B、零存整取C、定活兩便D、通知存款答案:CD62.常見的半結構化數據有____。A、XMLB、JSONC、音頻D、文檔答案:AB63.以下哪些是分布式計算框架?A、MapReduceB、SparkC、PythonD、R答案:AB64.在Woody開展數據分析項目的過程中,可以通過下列哪些方式查詢數據表信息?A、Woody的放大鏡B、數據資產視圖C、showcreatetable命令D、數據服務目錄答案:ABCD65.大數據平臺數據應用方式包括____。A、各類數據集市B、注冊用戶查詢C、分析挖掘平臺D、數據臨時提取答案:ACD66.我行數據標準按照針對的對象分為____和____兩類。A、數據項標準B、指標規(guī)范C、技術屬性D、管理屬性答案:AB67.完整的公共集市數據服務需求研制流程,包含以下____環(huán)節(jié)。A、需求意向B、需求研制C、需求評審D、需求交付答案:ABCD68.下列哪些選項不是pandas索引器?A、locB、ilocC、olumnsD、values答案:CD69.在二分類任務中,根據真實類別與分類模型預測類別的組合,可以將預測結果分為______。A、真正例B、假正例C、真負例D、假負例答案:ABCD70.按照《巴塞爾協(xié)議》規(guī)定,銀行的三大風險主要是____A、市場風險B、操作風險C、信用風險D、流動性風險答案:ABC71.XGBoost模型在通常待調的參數有____。A、學習輪數B、樹的深度C、正則項系數D、學習率答案:ABCD72.對公集市的模型分為____A、緩沖層B、中間層C、應用層D、基礎層答案:ABC73.在數據分析挖掘平臺Woody的筆記本(Notebook)中,使用Markdown單元格可以實現哪些功能____A、定義目錄級別B、編輯超鏈接C、編輯LaTeX數學公式D、執(zhí)行Python代碼答案:ABC74.以下屬于圖的基本概念的是____A、度B、路徑C、連通D、詞袋答案:ABC75.報表需求響應實施流程包括____。A、需求描述B、需求評審C、報表實施D、報表投產驗收答案:ABCD76.下列關于協(xié)方差的說法中正確的有____A、如果兩個變量相互獨立,那么它們的協(xié)方差為零。B、如果兩個變量的協(xié)方差不為零,那么它們一定是相關的。C、如果兩個變量協(xié)方差為零,它們之間一定沒有線性關系。D、雖然兩個變量不相互獨立,但是協(xié)方差有可能是零。答案:ABCD77.下列關于統(tǒng)計學知識的表述中正確的有:A、在統(tǒng)計學中,用概率分布(probabilitydistribution)來描述隨機變量或一簇隨機變量在每一個可能取到的狀態(tài)的可能性大小。B、在統(tǒng)計學中,我們描述概率分布(probabilitydistribution)的方式取決于隨機變量是連續(xù)的還是離散的。C、在統(tǒng)計學中,我們用概率密度函數(probabilitydensityfunction或pdf)描述連續(xù)型隨機變量在每一個可能取到的狀態(tài)的可能性大小。D、在統(tǒng)計學中,我們用概率質量函數(probabilitymassfunction或pmf)可以描述離散型隨機變量在每一個可能取到的狀態(tài)的可能性大小。答案:ABCD78.下列選項中,屬于Python合法標識符的是____A、breakB、123_yearC、_age_30D、Year_123答案:CD79.以下哪些不屬于數據分析模型場景范疇?A、應對內外部審計場景B、監(jiān)管檢查場景C、司法檢查場景D、日常業(yè)務經營管理報表需求答案:ABCD80.在Python中,標識符的命令規(guī)則包括A、可以以數字開頭B、可以下劃線開頭C、除了開頭,其他部分可以由字母、數字或下劃線組成D、可以字母開頭答案:BCD81.對于敏感數據數據需求,業(yè)務部門填寫《關于申請使用數據分析挖掘平臺數據的函》,通過部室商辦簽報向哪兩個部門提交申請?A、業(yè)務審批部門B、人資資源部門C、歸口管理部門D、檔案管理部門答案:AC82.以下哪些選項不是數據分析類項目的主要應用場景?A、信用卡分期精準營銷B、應急提數C、IT系統(tǒng)投產前數據測試D、反欺詐關系圖譜答案:BC83.Python函數的組成部分有____A、函數名B、形參列表C、函數體D、返回值答案:ABCD84.下面屬于自然語言處理基本概念的是____。A、分詞B、詞性標注C、命名實體識別D、句法分析答案:ABCD85.以下哪些是集成學習方法?A、XGBoostB、LightGBMC、AprioriD、GBDT答案:ABD86.在CNN中,池化層的作用主要有A、降低數據的尺寸B、減小參數數量C、擴大感受視野D、增大參數數量答案:ABC87.____屬于非結構化數據。A、文檔B、圖片C、視頻D、數據庫表格答案:ABC88.下列選項中屬于python繪圖工具的有哪些?A、scikit-learnB、matplotlibC、NumPyD、seaborn答案:BD89.下列關于數據安全面臨的挑戰(zhàn)的說法中,正確的有:A、數據量爆發(fā)式增長加大了數據泄露風險B、數據應用越來越靈活提升了事故發(fā)生概率C、大數據技術帶來新的安全威脅,大數據分析使黑客的攻擊更加精準D、數據安全保密的法律和政策日益嚴格答案:ABCD90.我行數據服務體系建設要實現的內容包括____。A、標準統(tǒng)一化B、加工自動化C、數據共享化D、服務多元化答案:ABCD91.DataFrame的屬性有哪些?A、intB、dataC、indexD、columns答案:CD92.以下那些屬于特征衍生的操作?A、將特征進行one-hot編碼B、特征間進行加減乘除C、補充特征缺失值D、將特征進行標準化答案:AB93.數據分析挖掘流程不包括哪些?A、基層調查B、數據收集C、構建模型和模型評估D、分析師培養(yǎng)答案:AD94.以下哪些是集成學習方法?A、XGBoostB、LightGBMC、AprioriD、GBDT答案:ABD95.商業(yè)銀行向中央銀行借款有哪兩種途徑?A、貼現B、貸款C、再貼現D、再貸款答案:CD96.根據《中國農業(yè)銀行總行數據分析類項目管理實施細則》,數據分析項為____提供支持A、業(yè)務經營B、管理決策C、監(jiān)管檢查D、司法檢查答案:AB97.下列選項中,屬于Python合法標識符的是____A、gb123B、_nameC、2BD、break答案:AB98.標簽中心的主要數據來源包括:()。A、公共集市B、分行集市C、AI運行中心D、數據挖掘平臺答案:ABCD99.以下屬于社區(qū)發(fā)現的算法的是____A、標簽傳播法B、Girvan-Newman算法C、kNN算法D、派系過濾CPM算法答案:ABD100.在mole的隨機森林模型中,在分類問題中的輸出采用以下何種方式來得到?A、簡單多數投票法B、單顆樹輸出結果的簡單平均C、后一棵樹將前一顆樹的殘差作為輸入D、利用模型的負梯度值進行多輪迭代答案:AB101.數據分析挖掘平臺敏感數據的使用須經____和____聯合審批。A、主管業(yè)務數據的審批部門B、平臺歸口管理部門C、科技部門D、各一級分行答案:AB102.常見的半結構化數據有____。A、XMLB、JSONC、音頻D、文檔答案:AB103.數據分析項目實施管理除了數據準備和分析成果應用,還包括哪些活動____A、數據探查B、分析建模C、分析成果驗證D、模型驗證答案:ABC104.數據預處理階段不包括____A、模型調參B、特征重要性排序C、異常值處理D、缺失值處理答案:AB105.在數據分析挖掘平臺Woody的筆記本(Notebook)中,可以執(zhí)行哪些內核(kernel)操作?A、中斷(Interrupt)B、重啟(Restart)C、切換(Changekernel)D、暫停(Pause)答案:ABC106.操作數據區(qū)(ODS),采用標準化的流程和規(guī)則,對源系統(tǒng)數據進行哪些操作?A、加載B、清洗C、轉換D、匯總答案:ABC107.數據分析挖掘是非常有價值的,它在銀行業(yè)的應用體現在哪些方面?A、信用卡的審批額度B、識別貸款業(yè)務中潛藏的操作風險C、貴賓客戶的流失預測D、掌銀對消費者的產品推薦答案:ABCD108.以下屬于回歸分析的是____。A、房屋價格預測B、信用卡違約預測C、股票價格預測D、垃圾郵件識別答案:AC109.SQL中,下列哪些函數屬于聚集函數:A、RIGHT()B、LEFT()C、MAX()D、SUM()答案:CD110.Customers1與Customers2表結構一致,以下SQL語句正確的有____A、SELECTcust_nameFROMCustomers1UNIONSELECTcust_nameFROMCustomers2B、SELECTcust_contactFROMCustomers1UNIONSELECTcust_name,cust_contactFROMCustomers2C、SELECT*FROMCustomers1UNIONSELECT*FROMCustomers2D、SELECTcust_nameFROMCustomers1UNIONSELECT*FROMCustomers2答案:AC111.通常可以使用以下那些量來計算多個聯系型特征之間的關系?A、協(xié)方差B、相關系數C、方差D、四分位數答案:AB112.在以下場景中,哪些場景會產生數據質量問題?A、前臺工作人員為了省事,將所有用戶年紀都輸入為30歲B、在采集數據時,客戶不愿意告知某些數據項,導致該數據項缺失C、客戶填寫家庭住址時使用虛假地址D、由于時效性,系統(tǒng)中的手機號客戶已不再使用答案:ABCD113.在客戶營銷管理領域,鑒于對公客戶及個人客戶兩方面在數量級別、管理方式、營銷策略以及客戶拓展方面有較大的不同,分別建設了__數據集市和__數據集市。A、運營B、監(jiān)管C、個人D、對公答案:CD114.下列選項中不屬于回歸算法的是______。A、線性回歸B、邏輯回歸C、隨機森林D、支持向量機答案:BCD115.農戶小額貸款。農戶小額貸款是對農戶家庭內單個成員發(fā)放的小額自然人貸款,可用于哪些方面?A、農戶生產經營B、農戶消費C、農戶購買住房D、農戶購買股票答案:AB116.數據中臺的匯聚整合能力,可以一定程度上解決導致數據孤島的問題;提純加工能力,可以加深對數據的理解,通過統(tǒng)一的數據標準和質量體系,形成標準數據資產體系;服務可視化能力,可以支持數據資產場景化能力的快速輸出,以響應客戶的動態(tài)需求。A、數據匯聚整合B、數據提純加工C、數據服務可視化D、數據價值變現答案:ABC117.常見的特征衍生方式有哪些?A、特征擴展B、自動衍生C、合成特征D、特征組合答案:ABCD118.在數據分析挖掘平臺Woody的筆記本(Notebook)中,有以下哪幾種類型的單元格____A、CodeB、OutputC、MarkdownD、RawNBConvert答案:ACD119.項目申請部門提出數據分析項目需求意向,需求意向包括____等內容。A、背景意義B、業(yè)務目標C、需求交付時間D、期望項目實施周期答案:ABCD120.數據管理框架包含的內容有:A、數據域B、管理域C、服務域D、管理流程和機制域答案:ABCD121.以下哪些屬于numpy中的聚合函數?A、sumB、minC、maxD、mean答案:ABCD122.商業(yè)銀行的性質包括____A、以追求利潤為目標B、以金融資產和負債為對象C、綜合性、多功能D、金融企業(yè)答案:ABCD123.哪些是大數據平臺典型的數據類型____A、拉鏈表B、明細表C、拼接表D、切片表答案:ABD124.可以用來描述中心趨勢的度量有____A、均值B、中位數C、眾數D、方差答案:ABC125.以下是我行數據標準體系構建策略內容的有________A、長短規(guī)劃結合B、剛柔實施配套C、通過實踐檢查D、適時處置提高答案:ABCD126.以下哪些是個人客戶敏感數據?()A、婚姻信息B、地址信息C、教育信息D、工作信息答案:ABCD127.在數據探查的過程中,主要針對____等情況進行探查。A、數據分布B、數據準確性C、數據相關性D、數據缺失答案:ABCD128.在二分類任務中,根據真實類別與分類模型預測類別的組合,可以將預測結果分為。______A、真正例B、假正例C、真負例D、假負例答案:ABCD129.SQL語句,以下語句不會導致全表掃描的是.A、selectidfromtwheresubstring(name,1,3)='cif'B、selectidfromtwherenamelike'cif%'C、selectidfromtable_1wherenum=10ornum=20D、selectidfromtwherecreatedate>='2005-11-30'andcreatedate<'2005-12-1'答案:BD130.在數據分析挖掘平臺Woody的筆記本(Notebook)中,單元格的輸出(Output)可以是選項中的哪些____A、數字B、文本C、表格D、圖片答案:ABCD131.商業(yè)銀行不可以從事下列哪些業(yè)務____A、代理收付款項及代理保險業(yè)務B、房地產投資C、證券經營D、汽車租賃答案:BCD132.Python中,a="hello",b="python",下列選項中屬于正確字符串運算的是____A、[1:4]B、a*2C、hinaD、a+b答案:ABCD133.下列選項中用于NumPy數組排序的是?A、np.sort()B、np.argsort()C、np.sorted()D、np.argsorted()答案:AB判斷題1.在SQL中,查詢滿足條件的元組可以通過WHERE子句實現。A、正確B、錯誤答案:A2.在開展數據分析項目的初期,申請數據時必須一次性提交所有數據表的申請,后期不可增補需求。A、正確B、錯誤答案:B3.日期和時間型的數據類型主要包括DATE、DATETIME、TIME、TIMEST四種。A、正確B、錯誤答案:A4.模型上線后,需要進行投產后驗證、監(jiān)控及運維等事項。A、正確B、錯誤答案:A5.SQL語句,MIN()返回指定列的最小值,且忽略列值為NULL的行。A、正確B、錯誤答案:A6.Gbase數據庫采用行存儲方式A、正確B、錯誤答案:B7.眾數是數據集中出現最頻繁的數值??赡茏罡哳l率對于多個不同值,導致出現多個眾數,具有一個眾數的數據集合分別稱為單峰,具有兩個或更多眾數的數據集稱為多峰。A、正確B、錯誤答案:A8.SQL語句,使用like進行模糊查詢時,select*fromtablewhereusernamelike‘xu%’會導致全表掃描A、正確B、錯誤答案:B9.SQL比較運算可用于數字和字符串上A、正確B、錯誤答案:A10.機器學習是人工智能的一個分支。A、正確B、錯誤答案:A11.預測性數據挖掘包括分類、回歸及時間序列等。A、正確B、錯誤答案:A12.Python中,可以使用if作為變量名。A、正確B、錯誤答案:B13.信息管理部是主管業(yè)務數據的業(yè)務審批部門和數據分析項目的需求申請部門。A、正確B、錯誤答案:B14.數據挖掘過程只是技術部門的職責,業(yè)務部門無需參與。A、正確B、錯誤答案:B15.公共集市需求意向階段,如果各方對技術實現路徑有爭議,需通過研發(fā)中心架構辦協(xié)調確定技術方案。A、正確B、錯誤答案:A16.視圖是一種虛表,不存放實際的數據值A、正確B、錯誤答案:A17.SQL語句,一個表和它自身關聯稱為自連接。A、正確B、錯誤答案:A18.在風險識別領域,相比于精確率,我們更應該關心召回率。A、正確B、錯誤答案:A19.E-R模型是最常用的概念模型A、正確B、錯誤答案:A20.在深度學習中,添加dropout往往是改善神經網絡性能的有效方法。A、正確B、錯誤答案:A21.大數據平臺基礎數據區(qū)采用標準化的流程和規(guī)則,對源系統(tǒng)數據進行清洗、轉換和加載,盡量保持業(yè)務數據原貌。A、正確B、錯誤答案:B22.在NumPy一維數組中通過中括號指定索引獲取第i個值。A、正確B、錯誤答案:A23.SQL語句,ORDERBY語句中可以通過設定DESC,依據某列降序排列A、正確B、錯誤答案:A24.數據分析挖掘的目的是把隱藏在一大批看似雜亂無章的數據中的有價值的信息進行整合并提煉出來,找出所研究對象的內在規(guī)律。A、正確B、錯誤答案:A25.分行數據集市是面向分行應用,由總行、分行共同開發(fā),基于總行大數據平臺,建設架構統(tǒng)一、模型統(tǒng)一、運維統(tǒng)一的基礎數據服務云。A、正確B、錯誤答案:A26.SQL語句,xbetweenyandz等同于x>yandx<zA、正確B、錯誤答案:B27.集成學習研究的核心是如何產生并結合“好而不同”的個體學習器。A、正確B、錯誤答案:A28.為提升數據存儲以及檢索的有效性,數據分析過程中產生的大數據量的臨時表建議采取哈希分布表的模式。A、正確B、錯誤答案:A29.聚類是把整個數據庫分成不同的群組,它的目的是使群與群之間的差別明顯,而同一個群之間的數據盡量相似。A、正確B、錯誤答案:A30.SQL語句,考慮到建表效率,創(chuàng)建臨時表(尤其在插入數據量較大時)應避免采用createtabletable_nameselect..fromsource_table的方式A、正確B、錯誤答案:A31.分析報告明確目標后,首先應編制“報告框架”,并細化每部分的分析要點和分析思路,結合業(yè)務發(fā)展方向和問題提出數據需求。A、正確B、錯誤答案:A32.SQL當一個表所有行都被DELECT語句刪除后,該表也同時被刪除了A、正確B、錯誤答案:B33.SQL為了獲得表中多個列的平均值,可以僅使用一個AVG()函數。A、正確B、錯誤答案:B34.數據挖掘平臺是高效的計算平臺,所以編寫SQL語句時完全不需要考慮性能問題。A、正確B、錯誤答案:B35.Python中,定義函數時,如果沒有顯式地返回值,那么它會返回None。A、正確B、錯誤答案:A36.數據標準中的指標是本行日常業(yè)務開展過程中產生的基礎性明細數據。A、正確B、錯誤答案:B37.select*fromtable_1whereusernamelike'yue%';會進行全表掃描。A、正確B、錯誤答案:B38.在選擇理財精準營銷模型時,由于前期產品剛上市,未積累購買產品的客戶樣本,可以先基于業(yè)務規(guī)則模型篩選潛在客戶,后期基于積累樣本使用機器學習模型,進一步篩選高潛力精準客群,提高營銷轉化率。A、正確B、錯誤答案:A39.眾數是數據集中出現最頻繁的數值。A、正確B、錯誤答案:A40.商業(yè)銀行除了對股東和客戶負責之外,還必須對整個社會負責。A、正確B、錯誤答案:A41.SQL語句,!=和<>都代表不等于A、正確B、錯誤答案:A42.在mole中,特征轉化節(jié)點的數據分桶函數用來對數據進行分段處理。A、正確B、錯誤答案:A43.我國商業(yè)銀行所發(fā)行的金融債券,是在全國銀行間債券市場上發(fā)行和交易的。A、正確B、錯誤答案:A44.Pythonwhile語句用于循環(huán)執(zhí)行滿足判斷條件的語句,直至條件不滿足時退出循環(huán)。A、正確B、錯誤答案:A45.在不違反合同協(xié)議的前提下,應盡可能實現外部數據的行內存儲與跨領域共享。A、正確B、錯誤答案:A46.數據質量管理的原則是“誰的系統(tǒng)誰管理、誰的業(yè)務誰負責”。A、正確B、錯誤答案:A47.SQL語句的truncate會刪除表中所有記錄,并且將重新設置所有的索引,不會記錄日志,所以執(zhí)行速度很快,但不能通過rollback撤消操作。A、正確B、錯誤答案:A48.Plot.bar()函數繪制的是柱狀圖。A、正確B、錯誤答案:A49.SQL語句,聚合函數COUNT(*)計算空值。A、正確B、錯誤答案:A50.分析報告編制過程中“報告圖形化展示”的目的是提升報告可讀性。A、正確B、錯誤答案:A51.在SQL數據庫中,使用UPPER()可以將字符串全部轉換為大寫。A、正確B、錯誤答案:A52.納入我行《中國農業(yè)銀行數據分析項目管理辦法》中模型部署管理的模型特指依托數據分析項目,并在數據分析挖掘平臺完成建模、具有一定業(yè)務價值、需要在數據分析挖掘平臺運行中心定期運行的模型。A、正確B、錯誤答案:A53.SQL語句,MIN()返回指定列的最小值,且忽略列值為NULL的行。A、正確B、錯誤答案:A54.在SQL中用于查詢的語句是SELECT。A、正確B、錯誤答案:A55.數據資產管理平臺包括:大數據平臺和集市基礎數據資產;數據中臺指標、挖掘模型、挖掘特征、標簽等數據資產。A、正確B、錯誤答案:A56.短期借款是指期限在一年或一年以下的借款。A、正確B、錯誤答案:A57.SQL語句,在SELECT語句中,子查詢總是從內向外處理。A、正確B、錯誤答案:A58.基于分行數據服務云推廣,分行實現本地特色數據自主入庫分行集市個性區(qū)的試點。A、正確B、錯誤答案:A59.分行數據集市滿足分行營銷、管理、考核等分析型應用數據需求和特色業(yè)務創(chuàng)新需要。A、正確B、錯誤答案:A60.分行數據集市總行共性區(qū)的數據表來源只來自于大數據平臺主庫。A、正確B、錯誤答案:B61.《中華人民共和國民法總則》規(guī)定不得非法收集、使用、加工、傳輸他人個人信息,不得非法買賣、提供或者公開他人個人信息。A、正確B、錯誤答案:A62.統(tǒng)計學上用方差和標準差來度量多維數據的離散程度。A、正確B、錯誤答案:B63.do.while.是Python中流程控制語句的一種形式A、正確B、錯誤答案:B64.ROC曲線越靠近左上角性能越好。A、正確B、錯誤答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論