版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Kettle基本知識(shí)培訓(xùn)Kettle基本知識(shí)培訓(xùn)Kettle培訓(xùn)內(nèi)容Kettle功能Kettle控件介紹Kettle案例演示2Kettle培訓(xùn)內(nèi)容Kettle功能2Kettle介紹Kettle是一款開源的、元數(shù)據(jù)驅(qū)動(dòng)的ETL工具集,是開源ETL工具里功能比較強(qiáng)大的一個(gè)。Kettle是”KettleE.T.T.L.Envirnonment”只取首字母的縮寫,這意味著它被設(shè)計(jì)用來幫助你實(shí)現(xiàn)你的ETL需要:抽取、轉(zhuǎn)換、裝入和加載數(shù)據(jù);翻譯成中文名稱應(yīng)該叫水壺,名字的起源正如該項(xiàng)目的主程序員MATT在一個(gè)論壇里說的哪樣:希望把各種數(shù)據(jù)放到一個(gè)壺里然后以一種指定的格式流出。3Kettle介紹Kettle是一款開源的、元數(shù)據(jù)驅(qū)動(dòng)的ETKettle家族Kettle5.0家族目前包括幾個(gè)產(chǎn)品:Spoon—轉(zhuǎn)換(transform)設(shè)計(jì)工具(GUI方式)Pan—轉(zhuǎn)換(transform)執(zhí)行器(命令行方式)Kitchen—工作(job)執(zhí)行器(命令行方式)
4Kettle家族Kettle5.0家族目前包括幾個(gè)產(chǎn)品:Kettle的安裝要運(yùn)行此工具你必須安裝Sun公司的JAVA運(yùn)行環(huán)境1.4或者更高版本,相關(guān)資源你可以到網(wǎng)絡(luò)上搜索JDK進(jìn)行下載綠色免安裝,解壓即可用。在不同的平臺(tái)上運(yùn)行Spoon所支持的腳本:Spoon.bat:在windows平臺(tái)運(yùn)行Spoon。Spoon.sh:在Linux、AppleOSX、Solaris平臺(tái)運(yùn)行Spoon。5Kettle的安裝要運(yùn)行此工具你必須安裝Sun公司的JAKettle轉(zhuǎn)化功能介紹1Kettle中有兩種腳本文件,transformation(.ktr)和job(.kjb),transformation完成針對(duì)數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。所有功能支持控件化,使用簡(jiǎn)單支持多樣化數(shù)據(jù)源類型:基本的文本文件Access、Excel、XML、Property文件格式MDX查詢語(yǔ)言、Cube文件、StreamingXML數(shù)據(jù)流自動(dòng)產(chǎn)生空記錄或者行從XBase類型文件(DBF)讀取數(shù)據(jù)關(guān)系型數(shù)據(jù)庫(kù)獲取系統(tǒng)信息如文件名稱、系統(tǒng)時(shí)間等6Kettle轉(zhuǎn)化功能介紹1Kettle中有兩種腳本文件,Kettle轉(zhuǎn)化功能介紹2特殊目標(biāo)數(shù)據(jù)源支持把數(shù)據(jù)寫入到Cube把數(shù)據(jù)寫入XML支持多種查詢調(diào)用數(shù)據(jù)庫(kù)存儲(chǔ)過程基本的數(shù)據(jù)庫(kù)查詢判斷表以和列、操作系統(tǒng)文件是否存在從URL接收查詢使用Web服務(wù)查詢信息使用數(shù)據(jù)流中的值作為參數(shù)來執(zhí)行一個(gè)數(shù)據(jù)庫(kù)查詢流查詢:從轉(zhuǎn)換中其他流里查詢值轉(zhuǎn)換功能值映射、分組、去重、拆分字段、行列轉(zhuǎn)換復(fù)制行7Kettle轉(zhuǎn)化功能介紹2特殊目標(biāo)數(shù)據(jù)源支持7Kettle轉(zhuǎn)化功能介紹3支持的腳本JS腳本SQL腳本正則表達(dá)式支持漸變維度更新批量加載:GreenplumBulkLoaderOracleBulkLoaderMSSQLBulkLoaderMYSQLBulkLoaderPostgreSQLBulkLoader支持分區(qū)表和集群8Kettle轉(zhuǎn)化功能介紹3支持的腳本8Kettle作業(yè)功能介紹1可以執(zhí)行操作系統(tǒng)命令和操作:Ping主機(jī)寫日志發(fā)送郵件從POPServer獲取郵件并保存在本地比較文件夾、文件創(chuàng)建、復(fù)制、移動(dòng)、刪除、壓縮文件從HTTP獲取或者上傳文件操作延遲等待9Kettle作業(yè)功能介紹1可以執(zhí)行操作系統(tǒng)命令和操作:9Kettle作業(yè)功能介紹2判斷文件是否存在執(zhí)行JavaScript、SQL、Shell腳本支持安全FTP獲取、上傳文件刪除遠(yuǎn)程文件支持SSH2上傳下載10Kettle作業(yè)功能介紹2判斷文件是否存在10數(shù)據(jù)庫(kù)連接類型和訪問類型支持的數(shù)據(jù)庫(kù)連接類型,截圖如下,有些數(shù)據(jù)庫(kù)類型需要完善jar包,以確保數(shù)據(jù)庫(kù)能夠正確連接11數(shù)據(jù)庫(kù)連接類型和訪問類型支持的數(shù)據(jù)庫(kù)連接類型,截圖如下,11訪問類型數(shù)據(jù)庫(kù)訪問類型支持如下幾種:JDBCOCIODBCJNDI12訪問類型數(shù)據(jù)庫(kù)訪問類型支持如下幾種:12Kettle實(shí)施步驟雙擊運(yùn)行kettle文件夾下的Kettle
文件,出現(xiàn)kettle歡迎界面。創(chuàng)建資料庫(kù)(可省略)創(chuàng)建數(shù)據(jù)庫(kù)連接創(chuàng)建轉(zhuǎn)換創(chuàng)建Jobs,進(jìn)行流程化控制13Kettle實(shí)施步驟雙擊運(yùn)行kettle文件夾下的KeKettle案例案例描述:從oracle數(shù)據(jù)庫(kù)中導(dǎo)出數(shù)據(jù)到文本文件中14Kettle案例案例描述:14創(chuàng)建轉(zhuǎn)換選擇”文件”,選擇”新建”---->”轉(zhuǎn)換”15創(chuàng)建轉(zhuǎn)換選擇”文件”,選擇”新建”---->”轉(zhuǎn)換”15從左側(cè)輸入欄目中選擇”表輸入”控件和”文本文件輸出”控件,拖拽到右側(cè)工作空間中16從左側(cè)輸入欄目中選擇”表輸入”控件和”文本文件輸出”控件,拖選中兩個(gè)控件,在其中一個(gè)控件上右擊,選擇”新建節(jié)點(diǎn)連接”17選中兩個(gè)控件,在其中一個(gè)控件上右擊,選擇”新建節(jié)點(diǎn)連接”17選擇”起始步驟”18選擇”起始步驟”18雙擊”表輸入”控件,進(jìn)行編輯在SQL中輸入:SELECT*FROMEMPWHEREENAME='${ENAME}‘其中${ENAME}是參數(shù)。19雙擊”表輸入”控件,進(jìn)行編輯19數(shù)據(jù)庫(kù)連接點(diǎn)擊”新建”,并測(cè)試連接。點(diǎn)擊確認(rèn)保存改步驟。20數(shù)據(jù)庫(kù)連接點(diǎn)擊”新建”,并測(cè)試連接。點(diǎn)擊確認(rèn)保存改步驟。20雙擊”文本文件輸出”控件,進(jìn)行編輯。瀏覽選擇文件存儲(chǔ)的位置。21雙擊”文本文件輸出”控件,進(jìn)行編輯。瀏覽選擇文件存儲(chǔ)的位置。選擇”內(nèi)容”編輯文本的輸出格式22選擇”內(nèi)容”編輯文本的輸出格式22點(diǎn)擊”字段”選擇需要輸出的內(nèi)容。點(diǎn)擊”獲取字段”,自動(dòng)生成字段。點(diǎn)擊”確定”,保存。23點(diǎn)擊”字段”選擇需要輸出的內(nèi)容。23添加參數(shù)鼠標(biāo)點(diǎn)擊右鍵,選擇”轉(zhuǎn)換設(shè)置”。在”命名參數(shù)”填寫參數(shù):ENAME24添加參數(shù)24測(cè)試轉(zhuǎn)換點(diǎn)擊”運(yùn)行”按鈕,填寫參數(shù)內(nèi)容,并點(diǎn)擊”啟動(dòng)”25測(cè)試轉(zhuǎn)換25查看測(cè)試結(jié)果26查看測(cè)試結(jié)果26查看導(dǎo)出的數(shù)據(jù)文件27查看導(dǎo)出的數(shù)據(jù)文件27Kettle調(diào)用利用Pan工具實(shí)現(xiàn)轉(zhuǎn)換的調(diào)用pan-fileC:\TEST.ktr-levelBasic-logfileC:\TEST.log"-param:ENAME=ADAMS"28Kettle調(diào)用利用Pan工具實(shí)現(xiàn)轉(zhuǎn)換的調(diào)用28Kettle調(diào)用利用Kitchen工具實(shí)現(xiàn)作業(yè)的調(diào)用Kitchen-fileC:\TEST.kjb-levelDetailed-logfileC:\TEST_JOB.log"-param:EN
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧冶金職業(yè)技術(shù)學(xué)院《酒店人力資源管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 江西洪州職業(yè)學(xué)院《教師課堂教學(xué)藝術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 吉林職業(yè)技術(shù)學(xué)院《財(cái)經(jīng)法規(guī)與會(huì)計(jì)職業(yè)道德》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南電子科技職業(yè)學(xué)院《后期合成A》2023-2024學(xué)年第一學(xué)期期末試卷
- 黑龍江司法警官職業(yè)學(xué)院《電路理論A》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶應(yīng)用技術(shù)職業(yè)學(xué)院《當(dāng)代社會(huì)思潮評(píng)析》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶機(jī)電職業(yè)技術(shù)大學(xué)《影像設(shè)備學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江農(nóng)林大學(xué)暨陽(yáng)學(xué)院《版式設(shè)計(jì)與表現(xiàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 中國(guó)石油大學(xué)(北京)《畫法幾何與機(jī)械制圖I》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州升達(dá)經(jīng)貿(mào)管理學(xué)院《金融法》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年高標(biāo)準(zhǔn)農(nóng)田建設(shè)土地承包服務(wù)協(xié)議3篇
- 閱讀理解(專項(xiàng)訓(xùn)練)-2024-2025學(xué)年湘少版英語(yǔ)六年級(jí)上冊(cè)
- 無創(chuàng)通氣基本模式
- 飛行原理(第二版) 課件 第4章 飛機(jī)的平衡、穩(wěn)定性和操縱性
- 暨南大學(xué)珠海校區(qū)財(cái)務(wù)辦招考財(cái)務(wù)工作人員易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 羊水少治療護(hù)理查房
- 2024年全國(guó)統(tǒng)一高考英語(yǔ)試卷(新課標(biāo)Ⅰ卷)含答案
- OQC培訓(xùn)資料教學(xué)課件
- 2024年8月CCAA國(guó)家注冊(cè)審核員OHSMS職業(yè)健康安全管理體系基礎(chǔ)知識(shí)考試題目含解析
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識(shí) CCAA年度確認(rèn) 試題與答案
- 體育賽事組織與實(shí)施操作手冊(cè)
評(píng)論
0/150
提交評(píng)論