sqoop導(dǎo)出數(shù)據(jù)的原理【省一等獎(jiǎng)】_第1頁
sqoop導(dǎo)出數(shù)據(jù)的原理【省一等獎(jiǎng)】_第2頁
sqoop導(dǎo)出數(shù)據(jù)的原理【省一等獎(jiǎng)】_第3頁
sqoop導(dǎo)出數(shù)據(jù)的原理【省一等獎(jiǎng)】_第4頁
sqoop導(dǎo)出數(shù)據(jù)的原理【省一等獎(jiǎng)】_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

sqoop的導(dǎo)出1、了解sqoop導(dǎo)出數(shù)據(jù)的原理目錄sqoop的導(dǎo)出原理01sqoop的導(dǎo)出原理1sqoop的導(dǎo)出原理sqoop的導(dǎo)出原理連接數(shù)據(jù)庫的常用參數(shù):參數(shù)描述--connect<jdbc-uri>jdbc連接地址--connection-manager<class-name>連接管理類--driver<class-name>數(shù)據(jù)庫驅(qū)動(dòng)類--hadoop-mapred-home<dir>$HADOOP_MAPRED_HOME--helphelp信息--password-file為包含身份驗(yàn)證密碼的文件設(shè)置路徑-P從命令行輸入密碼--password<password>密碼--username<username>用戶名--verbose打印流程信息--connection-param-file<filename>可選參數(shù)--relaxed-isolation將連接事務(wù)隔離設(shè)置為讀取未提交的映射程序sqoop的導(dǎo)出原理常用參數(shù)說明:參數(shù)描述--columns<col,col,col…>Columnstoexporttotable--direct快速模式,利用了數(shù)據(jù)庫的導(dǎo)入工具,如mysql的mysqlimport,可以比jdbc連接的方式更為高效的將數(shù)據(jù)導(dǎo)入到關(guān)系數(shù)據(jù)庫中。--export-dir<dir>存放數(shù)據(jù)的HDFS的源目錄-m,--num-mappers<n>啟動(dòng)N個(gè)map來并行導(dǎo)入數(shù)據(jù),默認(rèn)是4個(gè),最好不要將數(shù)字設(shè)置為高于集群的最大Map數(shù)--table<table-name>要導(dǎo)入到的關(guān)系數(shù)據(jù)庫表--call<stored-proc-name>要調(diào)用的存儲(chǔ)過程--update-key<col-name>后面接條件列名,通過該參數(shù),可以將關(guān)系數(shù)據(jù)庫中已經(jīng)存在的數(shù)據(jù)進(jìn)行更新操作,類似于關(guān)系數(shù)據(jù)庫中的update操作--update-mode<mode>更新模式,有兩個(gè)值updateonly和默認(rèn)的allowinsert,該參數(shù)只能是在關(guān)系數(shù)據(jù)表里不存在要導(dǎo)入的記錄時(shí)才能使用,比如要導(dǎo)入的hdfs中有一條id=1的記錄,如果在表里已經(jīng)有一條記錄id=2,那么更新會(huì)失敗。--batch使用批處理模式執(zhí)行底層語句。sqoop的導(dǎo)出原理sqoop的插入和更新:默認(rèn)情況下,sqoop-export向表追加新行;將每個(gè)輸入記錄轉(zhuǎn)換為INSERT語句,該語句向目標(biāo)數(shù)據(jù)庫表添加一行。如果表有約束(例如,主鍵列的值必須是唯一的),并且已經(jīng)包含數(shù)據(jù),則必須小心避免插入違反這些約束的記錄。如果INSERT語句失敗,導(dǎo)出過程將失敗。這種模式主要是針對(duì)導(dǎo)出記錄到一個(gè)新表或空表。如果指定--update-key參數(shù),Sqoop將修改數(shù)據(jù)庫中的現(xiàn)有數(shù)據(jù)集。每個(gè)輸入記錄都被視為更新語句,修改一個(gè)現(xiàn)有的行。sqoop的導(dǎo)出原理輸入解析參數(shù):參數(shù)描述--input-enclosed-by<char>設(shè)置一個(gè)必用的字段關(guān)閉符--input-escaped-by<char>設(shè)置輸入轉(zhuǎn)義符--input-fields-terminated-bychar>設(shè)置輸入字段分隔符--input-lines-terminated-by<char>設(shè)置輸入的行結(jié)束符--input-optionally-enclosed-by<char>設(shè)置一個(gè)可選的閉合符sqoop的導(dǎo)出原理輸出解析參數(shù):參數(shù)說明設(shè)置一個(gè)必用的字段閉合符--escaped-by<char>設(shè)置轉(zhuǎn)義符--fields-terminated-by<char>設(shè)置字段分隔符--lines-terminated-by<char>設(shè)置行結(jié)束符--mysql-delimiters使用mysql默認(rèn)的一組分割符設(shè)置:字段:,分割符:/可選閉合符:'

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論