




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Hadoop大數(shù)據(jù)項目開發(fā)——Hive函數(shù)目錄content02Hive窗口函數(shù)01Hive內(nèi)置函數(shù)Hive內(nèi)置函數(shù)分類函數(shù)描述數(shù)值相關(guān)函數(shù)
greatest(Tv1,Tv2,..)返回一組相同類型數(shù)據(jù)中的最大值(過濾NULL值)least(Tv1,Tv2,...)返回一組相同類型數(shù)據(jù)中的最小值(過濾NULL值)rand()返回0~1之間的隨機(jī)值rand(INTseed)返回固定的隨機(jī)值round(DOUBLEA)返回參數(shù)A四舍五入后的BIGINT值Hive內(nèi)置函數(shù)分類函數(shù)描述字符串相關(guān)函數(shù)
upper(STRINGA)ucase(STRINGA)將字符串A中的小寫字母轉(zhuǎn)換成大寫字母lower(STRINGA)lcase(STRINGA)將字符串A中的大寫字母轉(zhuǎn)換成小寫字母concat(STRINGA,STRINGB,...)字符串拼接函數(shù),返回A連接B等產(chǎn)生的字符串regexp_replace(STRINGA,STRINGB,STRINGC)字符串替換函數(shù),用字符串C替換字符串A中的Brepeat(STRINGstr,INTn)返回字符串str重復(fù)n次的結(jié)果trim(STRINGA)ltrim(STRINGA)rtrim(STRINGA)trim(STRINGA)刪除字符串兩邊的空格,但不會刪除中間的空格,ltrim(STRINGA)和rtrim(STRINGA)分別刪除左邊和右邊的空格length(STRINGstr)獲取字符串str的長度split(STRINGstr,regex)按給定的正則表達(dá)式regex分割字符串str,將結(jié)果作為字符串?dāng)?shù)組返回substr(STRINGa,STRINGb)從字符串a(chǎn)中,第b位開始取,取右邊所有的字符Hive內(nèi)置函數(shù)分類函數(shù)描述條件函數(shù)
if(BOOLEANtestCondition,TvalueTrue,TvalueFalseOrNULL)函數(shù)會根據(jù)條件返回不同的值,如果滿足條件,返回第一個參數(shù)值,否則返回第二個參數(shù)值nvl(Tvalue,Tdefault_value)判斷值是否為空,如果T(可以為任意數(shù)據(jù)類型)為空,則返回默認(rèn)值時間相關(guān)函數(shù)
unix_timestamp()獲取當(dāng)前系統(tǒng)時間,返回值為數(shù)字型秒數(shù)to_date(stringtimestamp)將時間戳轉(zhuǎn)換為日期,傳入?yún)?shù)也可以是當(dāng)前時間戳current_timestampdatediff(STRINGenddate,STRINGstartdate)返回INT類型的兩個日期相差的天數(shù)date_add(STRINGstartdate,INTdays)獲取增加天數(shù)后的日期last_day(STRINGdate)獲取傳入日期的月末日期Hive內(nèi)置函數(shù)分類函數(shù)描述聚合函數(shù)
count(*)和count(expr)返回檢索行的總數(shù)sum(col)和sum(DISTINCTcol)返回col所有元素的總和avg(col)和avg(DISTINCTcol)返回col所有元素的平均值min(col)返回col所有元素的最小值max(col)返回col所有元素的最大值類型轉(zhuǎn)換函數(shù)cast(expras<type>)將一個數(shù)據(jù)類型轉(zhuǎn)換為另一個數(shù)據(jù)類型膨脹函數(shù)explode()將一行數(shù)據(jù)轉(zhuǎn)換成列數(shù)據(jù),可以用于array和map類型的數(shù)據(jù),函數(shù)中的參數(shù)傳入的是arrary數(shù)據(jù)類型的列名。此函數(shù)不能關(guān)聯(lián)原有的表中的其他字段、不能與groupby、clusterby、distributeby、sortby聯(lián)用、不能進(jìn)行UDTF嵌套和不允許選擇其他表達(dá)式。窗口分析函數(shù)想要既顯示聚集前的數(shù)據(jù),又要顯示聚集后的數(shù)據(jù),引入了窗口函數(shù)。窗口函數(shù)又叫分析函數(shù),窗口函數(shù)兼具分組和排序功能。over()默認(rèn)的窗口大小是從第一行到最后一行的所有數(shù)據(jù)。partitionby是按照要求進(jìn)行分組,這樣設(shè)定之后,over的窗口大小就是一個分組。當(dāng)只指定分組時,sum、avg統(tǒng)計的數(shù)據(jù)就是分組內(nèi)的數(shù)據(jù),當(dāng)既指定分組又指定排序時,sum、avg統(tǒng)計的數(shù)據(jù)就是分組第一行到當(dāng)前行的數(shù)據(jù)。窗口函數(shù)最重要的關(guān)鍵字是partitionby和orderby。分組TOPN函數(shù)創(chuàng)建userinfo表將本地數(shù)據(jù)user.txt文件加載到userinfo表分組TOPN函數(shù)查詢結(jié)果分組TOPN函數(shù)最終查詢結(jié)果累加計算函數(shù)創(chuàng)建index表將本地數(shù)據(jù)index.txt文件加載到index表累加計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年高中化學(xué) 第一章 微型專題(二)元素周期律的應(yīng)用及元素推斷教學(xué)實錄 新人教版選修3
- 2024年五年級數(shù)學(xué)上冊 八 方程 4列方程解決問題第1課時 倍數(shù)問題教學(xué)實錄 冀教版
- 2024-2025學(xué)年高中歷史 第7單元 現(xiàn)代中國的科技、教育與文學(xué)藝術(shù) 第19課 中華人民共和國成立以來的重大科技成就教學(xué)實錄 新人教版必修3
- 1 古詩詞三首 四時田園雜興(其二十五)教學(xué)設(shè)計-2023-2024學(xué)年語文四年級下冊統(tǒng)編版
- 2025部編人教版小學(xué)二年級數(shù)學(xué)上冊全冊教案
- Chapter 1 Buying Snacks(教學(xué)設(shè)計)-2023-2024學(xué)年新思維小學(xué)英語2B
- 2024-2025學(xué)年新教材高中物理 第四章 閉合電路 第3節(jié) 測量電源的電動勢和內(nèi)阻教學(xué)實錄 粵教版必修3
- 商務(wù)數(shù)據(jù)分析與應(yīng)用 教案全套 王進(jìn) 項目1-10 走進(jìn)商務(wù)數(shù)據(jù)分析- 商務(wù)數(shù)據(jù)分析報告
- 2024年版高中語文 第二單元 詩言志 第4課《詩經(jīng)》四首 鹿鳴教學(xué)實錄 語文版必修4
- 2《金木水火土》教學(xué)設(shè)計-2024-2025學(xué)年統(tǒng)編版語文一年級上冊
- 彎矩二次分配法EXCEL計算
- 美國UNF和unc螺紋標(biāo)準(zhǔn)
- 童話故事《老鼠搬雞蛋》.ppt
- 偏差管理和CAPA_王麗麗
- 河北省省直行政事業(yè)單位資產(chǎn)(房屋)租賃合同書(共7頁)
- 220kV、110kV設(shè)備基礎(chǔ)施工方案
- 北京大學(xué)數(shù)學(xué)物理方法經(jīng)典課件第五章——傅里葉變換
- 消防安全知識壁報-08滅火器作用及使用方法識別1
- 項目信息檔案登記表模板
- 白龍庵隧道出口端仰坡監(jiān)測專項方案
- 低壓智能綜合配電箱基礎(chǔ)知識培訓(xùn)(JP柜培訓(xùn))
評論
0/150
提交評論