下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、ATLas:為數(shù)據(jù)挖掘和數(shù)據(jù)流應(yīng)用的一個SQL擴展由于傳統(tǒng)的DBMS查詢語言本身功能有限,不能適應(yīng)數(shù)據(jù)驅(qū)動的應(yīng)用,如數(shù)據(jù)挖掘和數(shù)據(jù)流處理,因此Atlas在傳統(tǒng)的DBMS查詢語言基礎(chǔ)上定義了一套新的數(shù)據(jù)庫查詢語言,通過在傳統(tǒng)SQL上定義新的集合和表運算,使得Atlas成為圖靈完備的語言。Atlas的語言規(guī)范的核心是對user defined aggregates(UDAs)的定義,一個UDA包含三個部分:initialize,iterate和terminate。一個UDA的定義如下圖所示:在上圖中vdec(變量定義)的規(guī)范如下:<statement>就是傳統(tǒng)的SQL-like sta
2、tement。一個UDA有輸入?yún)?shù),也有輸出參數(shù),這些參數(shù)可以理解為元組。UDA的initialize部分是這個UDA的初始化部分,只運行一次。iterate部分是UDA的核心,在每當(dāng)有一個元組輸入時便調(diào)用一次,這個可以滿足數(shù)據(jù)流處理的需求。Terminate部分是UDA的結(jié)束部分,當(dāng)輸入元組是有限表中的元組時,terminate部分才是必需的,如果UDA的輸入是無限的數(shù)據(jù)流元組, terminate部分顯然不再需要,這時terminate部分可以缺省,也可以由revise來代替。在iterate部分和terminate部分都可以產(chǎn)生輸出。如果在iterate部分產(chǎn)生輸出,那么輸出就可以看成是
3、一個流(這是因為atlas將UDA的運行時模型作為一個管道來處理,在iterate部分產(chǎn)生的輸出可以馬上傳遞給調(diào)用者)。在數(shù)據(jù)流處理中,initialize和iterate部分分別在UDA第一次啟動運行時和數(shù)據(jù)流的窗口邊界還沒到達時執(zhí)行,一旦窗口邊界到達了,iterate部分將不再執(zhí)行,對每個新來的元組,將由revise部分執(zhí)行。同時,系統(tǒng)維護一個包含了剛剛過期的元組表EXPIRE,對于基于元組計數(shù)的窗口,EXPIRE表中只有一個元組,對于基于時間段的窗口,EXPIRE表中可能含有零個,一個或多個元組。下面圖一給出了數(shù)據(jù)流處理的一個例子,定義了窗口上的平均值。其中在revise部分的E表就是E
4、XPIRE表,它是系統(tǒng)表,不需要聲明。同時Atlas還支持窗口的定義,下面圖二給出了一個示例。圖一圖二由圖二可以看出窗口定義包含三部分:1 Partition子句(可選),將流數(shù)據(jù)分成幾個組,并為每個組分別維護一個窗口2 窗口大?。ū匦瑁?,可以基于元組數(shù)量,也可以基于時間段3 條件過濾謂詞(可選)Atlas既支持傳統(tǒng)數(shù)據(jù)庫表上的聚集挖掘操作(這里就不作介紹了),又支持數(shù)據(jù)流上的處理。因此在Storage Manager中便支持傳統(tǒng)Berkeley DB的接口,又有內(nèi)存數(shù)據(jù)表及索引接口。下面兩幅圖就是描述了Atlas的體系結(jié)構(gòu)。圖三是altas的流程框架,將altas腳本轉(zhuǎn)化成c+程序的步驟,將c+程序進行編譯鏈接,最后都會轉(zhuǎn)化成可執(zhí)行程序。圖三圖四是對atlas核心部分的細化描述。其中stream engin
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧輕工職業(yè)學(xué)院《藥學(xué)綜合實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 昆明冶金高等專科學(xué)?!陡叩蛪弘娖骷霸O(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 江蘇師范大學(xué)科文學(xué)院《刑法學(xué)總論》2023-2024學(xué)年第一學(xué)期期末試卷
- 吉林化工學(xué)院《UI交互設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南汽車工程職業(yè)學(xué)院《先進材料進展》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖北藝術(shù)職業(yè)學(xué)院《金屬塑性變形》2023-2024學(xué)年第一學(xué)期期末試卷
- 黑龍江農(nóng)業(yè)工程職業(yè)學(xué)院《水文學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 高考物理總復(fù)習(xí)《動量和動量守恒》專項測試卷含答案
- 重慶工商大學(xué)派斯學(xué)院《教育與心理研究方法》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州大學(xué)《商務(wù)禮儀》2023-2024學(xué)年第一學(xué)期期末試卷
- 上海市浦東新區(qū)2023-2024學(xué)年一年級上學(xué)期期末考試數(shù)學(xué)試題
- 插圖在小學(xué)英語口語教學(xué)中的運用
- 前列腺增生藥物治療
- 人工智能知識圖譜(歸納導(dǎo)圖)
- 滴滴補貼方案
- 民宿建筑設(shè)計方案
- 干部基本信息審核認定表
- 2023年11月外交學(xué)院(中國外交培訓(xùn)學(xué)院)2024年度公開招聘24名工作人員筆試歷年高頻考點-難、易錯點薈萃附答案帶詳解
- 春節(jié)行車安全常識普及
- 電機維護保養(yǎng)專題培訓(xùn)課件
- 汽車租賃行業(yè)利潤分析
評論
0/150
提交評論