課程設(shè)計(jì)(論文)基于VLDB和SIGMOD論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè)_第1頁
課程設(shè)計(jì)(論文)基于VLDB和SIGMOD論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè)_第2頁
課程設(shè)計(jì)(論文)基于VLDB和SIGMOD論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè)_第3頁
課程設(shè)計(jì)(論文)基于VLDB和SIGMOD論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè)_第4頁
課程設(shè)計(jì)(論文)基于VLDB和SIGMOD論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于基于 vldbvldb 和和 sigmodsigmod 論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè)論文統(tǒng)計(jì)的數(shù)據(jù)庫研究熱點(diǎn)預(yù)測(cè) (華南理工大學(xué) 軟件學(xué)院,廣東 廣州 510006) 摘摘要要:當(dāng)今世界上,在數(shù)據(jù)庫領(lǐng)域有幾個(gè)最具權(quán)威性的國(guó)際學(xué)術(shù)會(huì)議,比如 vldb、sigmod、icde 等,它們?yōu)楦鲊?guó)的數(shù)據(jù)庫研究者、開發(fā)者和應(yīng)用者提供一個(gè)討論和 交流的平臺(tái),引導(dǎo)和促進(jìn)數(shù)據(jù)庫學(xué)科的發(fā)展。我們可以從研究人員在這些會(huì)議上發(fā)表的 論文看出當(dāng)今數(shù)據(jù)庫技術(shù)的熱點(diǎn),發(fā)現(xiàn)相關(guān)課題的未來的發(fā)展趨勢(shì)。首先,我們分析了 vldb 和 sigmod 會(huì)議在 2008 年、2009 年和 2010 年所接受的關(guān)于核心數(shù)據(jù)庫技術(shù)的

2、論文。 我們還引用了observation on database research trends via publication statistics中對(duì)這 兩個(gè)會(huì)議從 1997 年到 2006 年進(jìn)行統(tǒng)計(jì)的數(shù)據(jù)。我們把論文歸為 28 個(gè)類中,其中的 22 個(gè)類是基于傳統(tǒng)的數(shù)據(jù)庫技術(shù)提出的,其他 6 個(gè)類是我們?cè)诜治龅倪^程中加入的新類別。 然后,我們預(yù)測(cè)了六個(gè)新類別將斷續(xù)走紅并成為未來的新熱點(diǎn),這也是本文的一大特色 所在。最后,我們分析出最近幾年數(shù)據(jù)庫技術(shù)熱點(diǎn)的變化趨勢(shì),并推測(cè)出未來數(shù)據(jù)庫技 術(shù)的發(fā)展趨勢(shì)。 關(guān)鍵詞:關(guān)鍵詞:數(shù)據(jù)庫;研究熱點(diǎn);趨勢(shì) prediction of database

3、 research focus based on statistical data of vldb and sigmod papers zhen zhen, lin yong (school of software engineering, south china university of technology, guangzhou 510006, china) abstract: today, there are several authoritative international academic conferences in the area of database, such as

4、 vldb, sigmod, and icde. they provide a platform for researchers, developers, and users of database from every country to discuss and exchange their minds, guiding and promoting the development of database. we can see the research focus of todays database technology and the trend of related topics i

5、n the future from researchers papers published in these conferences. first, we analyzed papers about core database technology, accepted by vldb and sigmod in 2008, 2009 and 2010. we also referred to statistical data from 1997 to 2006 in observation on database research trends via publication statist

6、ics. we classified these papers to 28 categories. 22 categories are classified based on traditional database technology, and the others are new categories we added during the analyzing. and then we predicte these 6 new categories will be more and more porpular and become hot spots in the future, whi

7、ch is the main feature of this paper. finally, we analyze the trend of database research focus in recent years, and predict the trend in the future. keywords: database; research focus; trend 目錄目錄 1 引言引言.3 2 介紹介紹.3 3 統(tǒng)計(jì)數(shù)據(jù)及總體分析統(tǒng)計(jì)數(shù)據(jù)及總體分析.3 4 具體分析具體分析.8 4.1 傳統(tǒng)升溫?zé)狳c(diǎn)傳統(tǒng)升溫?zé)狳c(diǎn).8 4.2 傳統(tǒng)穩(wěn)定熱點(diǎn)傳統(tǒng)穩(wěn)定熱點(diǎn).9 4.3 傳統(tǒng)降溫?zé)狳c(diǎn)傳統(tǒng)

8、降溫?zé)狳c(diǎn).11 4.4 新興熱點(diǎn)新興熱點(diǎn).13 4.5 往年熱門但現(xiàn)在不熱門往年熱門但現(xiàn)在不熱門.16 5 結(jié)論結(jié)論.17 參考文獻(xiàn)參考文獻(xiàn).17 1 引言引言 數(shù)據(jù)庫技術(shù)從 20 世紀(jì) 60 年代中期產(chǎn)生至今,經(jīng)歷了人工與文件管理階段、層次與 網(wǎng)狀數(shù)據(jù)庫系統(tǒng)階段、關(guān)系數(shù)據(jù)庫系統(tǒng)階段和新一代數(shù)據(jù)庫階段。今天,新的數(shù)據(jù)庫應(yīng) 用領(lǐng)域?yàn)閿?shù)據(jù)庫的應(yīng)用開辟了新的天地,在應(yīng)用中管理方面的新需求也推動(dòng)數(shù)據(jù)庫技術(shù) 的研究和發(fā)展,以關(guān)系數(shù)據(jù)庫為代表的傳統(tǒng)數(shù)據(jù)庫已很難勝任新領(lǐng)域的要求。為了支持 現(xiàn)代應(yīng)用,數(shù)據(jù)庫工作者們從各個(gè)角度對(duì)數(shù)據(jù)庫技術(shù)進(jìn)行研究。由于應(yīng)用特征及其要求 的變化多樣,加之?dāng)?shù)據(jù)庫工作者的不同立場(chǎng)、觀

9、點(diǎn)、策略和方法,從而形成了現(xiàn)代數(shù)據(jù) 庫世界百花齊放的景象。 我們現(xiàn)在面臨一個(gè)問題:當(dāng)前數(shù)據(jù)庫研究的熱門是什么以及發(fā)展趨勢(shì)怎么樣?為了 準(zhǔn)確地回答這個(gè)問題,僅憑感覺是不行的。為此,我們研究了 vldb 和 sigmod 近三 年的論文,將它們進(jìn)行歸類,從統(tǒng)計(jì)數(shù)據(jù)出發(fā),來分析當(dāng)前數(shù)據(jù)庫的研究熱點(diǎn)。 2 介紹介紹 為了更好地將會(huì)議論文進(jìn)行分類,我們從網(wǎng)絡(luò)資源中找到一些統(tǒng)計(jì)數(shù)據(jù)。這些統(tǒng)計(jì) 數(shù)據(jù)是通過把 vldb 和 sigmod 從 1997 年到 2006 年所有的會(huì)議論文分成了 22 個(gè)研究 方向,并將每一年的論文按研究方向進(jìn)行統(tǒng)計(jì)后得到的。這些數(shù)據(jù)準(zhǔn)確提供了 2006 年 以前十年的每一年每一方

10、向論文所占的百分比。 我們所完成的工作是將 vldb 和 sigmod 從 2008 到 2010 年的論文按那 22 個(gè)方向 和 6 個(gè)新興方向進(jìn)行歸類統(tǒng)計(jì)。為了將每篇論文準(zhǔn)確地分到一個(gè)研究方向中,我們閱讀 了每一篇論文的摘要部分。我們所增加的的新方向包括“云 (cloud) ” 、 “概率數(shù)據(jù) 庫(probabilistic database) ” , “移動(dòng)對(duì)象(moving object) ” 、 “gpu 與多核(gpu/cpus) ” 、 “圖數(shù)據(jù)庫(graph database) ” 、 “社交網(wǎng)絡(luò)(social network) ” 。 從我們的分析中,我們可以看到一些課題一直

11、是研究熱點(diǎn),比如“查詢處理 (query processing) ” ;而一些幾年前的熱點(diǎn)卻已經(jīng)不再是熱點(diǎn)了,比如“多媒體 (multimedia) ” ;我們還可以發(fā)現(xiàn)幾個(gè)新興的熱點(diǎn),雖然所占比例不是很高,但可以看 出發(fā)展勢(shì)頭不小,比如“云 (cloud) ” 、 “gpu 與多核(gpu/cpus) ” 。 值得注意的是,在所有數(shù)據(jù)中缺少了 2007 年的數(shù)據(jù)分析,這是時(shí)間有限所致。而 且我們的統(tǒng)計(jì)數(shù)據(jù)是分兩部分,2006 年之前是引用其他學(xué)者的,2008 年之后是我們自 己分析的。這兩部分?jǐn)?shù)據(jù)在歸類標(biāo)準(zhǔn)和判斷尺度上無法保證一致性。這在一定程度上影 響預(yù)測(cè)的準(zhǔn)確性。但我們基本是把兩部分?jǐn)?shù)據(jù)

12、先獨(dú)立分析,再聯(lián)合起來分析,盡力減小 這種影響。另外我們進(jìn)行歸類的會(huì)議論文只包括“reseach session”部分,而未將 “industry session” 、 “tutorial session” 、 “demo session”等其它部分包括在內(nèi)。 3 統(tǒng)計(jì)數(shù)據(jù)及總體分析統(tǒng)計(jì)數(shù)據(jù)及總體分析 表 1 vldb 和 sigmod 19972006,20082010 年論文統(tǒng)計(jì)表 topicsyear1997199819992000200120022003200420052006200820092010 recent 3-year total # of papers93931069510

13、3111128150150141118116115271 access methods0.11110.09790.10610.11300.10480.05070.08050.08920.05030.03550.00850.00860.00000.01 benchmark, performance tuning0.02080.02100.03790.00870.02420.00000.02870.01880.02010.03550.04240.02590.02610.03 data mining or information retrieval0.10420.20980.08330.15650.

14、11290.08700.05750.07980.09050.04570.00850.04310.03480.03 data model and schema mapping0.04170.03500.05300.00870.00810.00000.03450.02820.05030.03550.03390.02590.00870.02 data quality /recovery0.00000.00000.00760.00000.02420.00000.01150.00000.00500.01520.00000.00000.00870.00 data storage0.03470.02800.

15、01520.00000.02420.02170.04600.00940.00500.00510.02540.03450.04350.03 data warehousing0.07640.06290.08330.08700.08060.08700.02300.01410.04020.05080.00000.03450.00870.01 dbms architecture0.06250.02800.04550.01740.04030.02900.00000.01880.03520.00000.00850.00860.00870.01 extensibility or scalability0.01

16、390.02800.00000.01740.00810.01450.00000.01880.00000.01520.00000.02590.00870.01 information integration0.02780.02100.06060.02610.00000.02170.01150.00000.00500.01520.02540.01720.01740.02 multimedia0.02780.02100.00760.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00 network and distribute

17、d environment0.06250.01400.03790.05220.04840.02170.04020.03290.04520.08630.03390.05170.03480.04 query processing0.27080.28670.31820.26960.32260.21010.28160.30050.28140.28930.34750.23280.40000.33 reliability0.01390.00000.01520.00000.00000.00000.00000.00000.00000.01520.00000.00860.00000.00 security or

18、 privacy0.00690.00700.00760.00000.00000.05070.02870.03760.03020.04570.05930.07760.06960.07 sensor network0.00000.00000.00000.00000.00000.00000.01150.01880.01010.04060.00000.03450.02610.02 special database (gis, bio, scientific)0.05560.04200.03030.05220.04030.04350.03450.05160.07040.04060.01690.01720

19、.01740.02 statistical database0.00690.02100.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00 stream- based data management0.00000.00700.00760.00870.00000.08700.09200.10800.10050.09640.06780.04310.06090.06 transaction management0.02080.02100.00760.03480.00810.02900.01150.00940.005

20、00.02030.00850.01720.00870.01 web and web services0.04170.04900.04550.10430.06450.07250.06900.04230.03520.03050.01690.05170.03480.03 xml0.00000.00000.03030.04350.08870.17390.13790.12210.12060.08120.10170.07760.04350.07 cloud/0.00000.00860.02610.01 probabilistic databases / 0.11860.05170.03480.07 mov

21、ing object / 0.00000.01720.00000.01 gpu / cpus/0.00000.03450.03480.02 graph database / 0.06780.04310.02610.05 social network / 0.00850.00860.01740.01 在表 1 中,我們新加了 6 個(gè)新的研究方向,它們們于表中的最后六行。表 1 中的最 后一列是將 2008 到 2010 年的論文集合在一塊進(jìn)行的統(tǒng)計(jì)。圖 1 是我們根據(jù)表 1 中的數(shù) 據(jù)繪制的統(tǒng)計(jì)圖。 圖 1 19972006,20082010 各類論文統(tǒng)計(jì)折線圖 現(xiàn)在我們對(duì)表 1 和圖 1 進(jìn)行

22、詳細(xì)分析,可以看到“查詢處理(query processing) ”一 直受研究者所歡迎,保持比較穩(wěn)定的狀態(tài),這方面的主題還包括“性能調(diào)優(yōu) (benchmark, performance tuning) ” 、 “聯(lián)網(wǎng)與分布式(network and distributed environment) ” 。還有一些主題,比如“安全與隱私(security or privacy) ” 、 “數(shù)據(jù)存儲(chǔ) (data storage) ” 、 “流數(shù)據(jù)管理(stream-based data management) ”等,在近幾年來處于 升溫狀態(tài)。而有一些主題,已經(jīng)慢慢降溫了,這包括“數(shù)據(jù)挖掘(dat

23、a mining or information retrieval) ” 、 “xml”等。有一些主題,例如“多媒體(multimedia) ” 、 “dbms 框架(dbms architecture) ”已經(jīng)很少被研究者所關(guān)注了,盡管它們?cè)?jīng)備受關(guān) 注。從圖表中,我們也興奮地看到了一些新興的主題,這包括:“云 (cloud) ” 、 “概率數(shù)據(jù)庫(probabilistic database) ” , “移動(dòng)對(duì)象(moving object) ” 、 “gpu 與多核 (gpu/cpus) ” 、 “圖數(shù)據(jù)庫(graph database) ” 、 “社交網(wǎng)絡(luò)(social network

24、) ” 。它們是 新的市場(chǎng)需求和新的技術(shù)帶來的產(chǎn)物,它們將成為未來的數(shù)據(jù)庫技術(shù)的發(fā)展方向。更加 具體的分析,請(qǐng)看第四部分。 圖 2 2008 年-2010 年 各類論文所占百分比餅圖 我們并不對(duì)所有 28 個(gè)類別進(jìn)行詳細(xì)分析,而只是分析當(dāng)前的熱點(diǎn)主題,和一些有 特別意義的主題。為了便于接下來的討論,我們規(guī)定,如果一個(gè)研究方向在 2008 年- 2010 年間的論文數(shù)量比重3%則定為研究熱點(diǎn)。我們新加入的方向也為研究熱點(diǎn)。根據(jù) 圖 2,符合規(guī)定的研究熱點(diǎn)包括下列 16 個(gè): benchmark, performance tuning data mining or information retr

25、ieval data storage network and distributed environment query processing security or privacy sensor network stream-based data management web and web services xml cloud probabilistic databases moving object gpu / cpus graph database social network 在這 16 個(gè)熱點(diǎn)中,我們將新加入的 6 個(gè)方向稱為“新興的”熱點(diǎn),其余 10 個(gè)方向 稱為“傳統(tǒng)的”熱點(diǎn)。

26、這 10 個(gè)傳統(tǒng)的熱點(diǎn)根據(jù)現(xiàn)在的研究熱度又可分為三部分:熱度 正在加大的熱點(diǎn)、熱度保持穩(wěn)定的熱點(diǎn)和熱度降低的熱點(diǎn)。 另外,還有一些方向,以前是熱門方向,但現(xiàn)在卻已經(jīng)不再是熱點(diǎn)了,它們是: access methods multimedia statistical database 4 具體分析具體分析 這部分是針對(duì)第 3 部分提出來的熱點(diǎn)主題進(jìn)行的具體分析。總體上包括傳統(tǒng)主題和新興主題。 4.1 傳統(tǒng)升溫?zé)狳c(diǎn)傳統(tǒng)升溫?zé)狳c(diǎn) 傳統(tǒng)升溫?zé)狳c(diǎn),是指這些主題在若干年前就已經(jīng)存在,它們是近幾年的熱點(diǎn),并且可能繼續(xù)升 溫。這些主題的論文比例在未來幾年將會(huì)繼續(xù)增加。 (1) security or priva

27、cy安全與隱私 圖 3 從圖 3 我們可以看到這個(gè)主題從 2001 年之后越來越熱。這表示數(shù)據(jù)庫的安全問題 越來越受重視,而且在這個(gè)方面大有可為,至今仍是一個(gè)十分活躍的熱點(diǎn)。這應(yīng)該和當(dāng) 前的國(guó)際形勢(shì)有關(guān),世界各地的恐怖襲擊越來越多;企業(yè)也越來越重視數(shù)據(jù)的保護(hù)。 (2) data storage數(shù)據(jù)存儲(chǔ) 圖 4 數(shù)據(jù)存儲(chǔ)主題,比較特別,從圖上可以看到折線呈現(xiàn)一個(gè)“w”型。分別在 2000 年和 2005 年出現(xiàn)了兩個(gè)低谷,在 2005 年的低谷之后,我們可以看到呈現(xiàn)上升趨勢(shì)。研 究人員應(yīng)該是在近年來發(fā)現(xiàn)了一些新的存儲(chǔ)技術(shù),于是對(duì)這個(gè)主題又重新感到興趣。 (3) stream-based data

28、 management流數(shù)據(jù)管理 圖 5 隨著網(wǎng)絡(luò)路由、傳感器網(wǎng)絡(luò)、股票分析等應(yīng)用的推廣,產(chǎn)生了一種新的數(shù)據(jù)類型, 即流數(shù)據(jù)。流數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)持續(xù)到達(dá),速度快,規(guī)模大,傳統(tǒng)的數(shù)據(jù)庫技術(shù)并不適 用于這種新型數(shù)據(jù)。這使得此主題自 2002 以來一直是研究熱點(diǎn)。 4.2 傳統(tǒng)穩(wěn)定熱點(diǎn)傳統(tǒng)穩(wěn)定熱點(diǎn) 傳統(tǒng)穩(wěn)定熱點(diǎn),是指這些主題在若干年前就已經(jīng)存在,并且它們一直是數(shù)據(jù)庫研究的熱點(diǎn),每 一年的論文比例都比較高而且比例數(shù)值比較穩(wěn)定。 (1) query processing查詢處理 圖 6 查詢處理一直是一個(gè)熱點(diǎn),每年都有超過五分之一的論文是這個(gè)方面的。這是因?yàn)?數(shù)據(jù)庫從一開始就是用來滿足用戶的查詢需求的。

29、怎樣讓查詢更加高效,是一個(gè)非常重 要的問題。 (2) benchmark, perfomance tunning性能調(diào)優(yōu) 圖 7 數(shù)據(jù)庫性能調(diào)優(yōu),是指采取一系列措施,對(duì)數(shù)據(jù)庫進(jìn)行優(yōu)化,通常與查詢調(diào)優(yōu)有重 疊,但它常常與操作系統(tǒng)和 cpu 有關(guān)。這個(gè)方面也一直是一個(gè)熱點(diǎn)。 (3) network and distributed environment聯(lián)網(wǎng)與分布式 圖 8 為了提高數(shù)據(jù)庫的性能,和滿足一些特別的業(yè)務(wù)需求,出現(xiàn)了分布式數(shù)據(jù)庫。這個(gè) 主題一直是個(gè)熱點(diǎn)。近年來,傳感器網(wǎng)絡(luò)和物聯(lián)網(wǎng)的興起,也促進(jìn)這個(gè)主題的研究。 4.3 傳統(tǒng)降溫?zé)狳c(diǎn)傳統(tǒng)降溫?zé)狳c(diǎn) 傳統(tǒng)降溫?zé)狳c(diǎn),是指這些主題在若干年前就已經(jīng)存

30、在,它們也是近幾年的熱點(diǎn),但呈現(xiàn)出降溫 趨勢(shì)。在未來幾年,這些主題的論文比例可能會(huì)繼續(xù)下降。 (1) data mining or information retrieval數(shù)據(jù)挖掘和數(shù)據(jù)檢索 圖 9 從圖表中可以看出,數(shù)據(jù)挖掘在七八年前還是研究熱點(diǎn),它的高峰期是 1998 年左 右,但進(jìn)入二十世紀(jì)之后,論文的數(shù)量每年都減少。其原因極有可能與統(tǒng)計(jì)數(shù)據(jù)庫相同。 (2) sensor network傳感器網(wǎng)絡(luò) 圖 10 傳感器網(wǎng)絡(luò),是指利用分布在不同空間上的多個(gè)傳感器,進(jìn)行合作,聯(lián)合監(jiān)控一些 物理的或者環(huán)境的條件,比如溫度,聲音,速度,壓力等。從 2003 年以后是一個(gè)熱門, 但近年有回落趨勢(shì)。

31、(3) web and web services網(wǎng)絡(luò)和網(wǎng)絡(luò)服務(wù) 圖 11 從圖中我們可以看出這個(gè)主題曾經(jīng)比較熱門,可能是這個(gè)方面學(xué)者已經(jīng)做了大量研 究,所以在 2003 年之后逐漸冷卻。雖然近兩年有所提升,但比例也是比較小且又有回 落趨勢(shì)。 (4) xml 圖 12 xml 曾經(jīng)也是個(gè)十分活躍的研究熱點(diǎn),但近年來漸漸趨于冷卻。這一方面是因?yàn)?xml 并不是數(shù)據(jù)交換的唯一形式,它給 xml 查詢處理、半結(jié)構(gòu)化數(shù)據(jù)處理等方面帶來 新問題。另一方面是因?yàn)橐呀?jīng)有大量的研究成果可以很好地處理 xml 了。 4.4 新興熱點(diǎn)新興熱點(diǎn) 新興熱點(diǎn),是指在近三年才出現(xiàn)的研究主題,這包括:“云計(jì)算” 、 “社交網(wǎng)

32、絡(luò)” 、 “概率數(shù)據(jù)庫”和“gpu 及多核” 。這是因?yàn)樽罱鼛啄?,云?jì)算技術(shù),社交網(wǎng)站蓬勃發(fā) 展;數(shù)據(jù)的不確定性不斷增強(qiáng)所致。它們都是新的市場(chǎng)需求和新的技術(shù)帶來的產(chǎn)物,將 成為未來數(shù)據(jù)庫技術(shù)的主要熱點(diǎn)主題。 (1) cloud“云” 圖 13 云計(jì)算幾乎可以提供無限的廉價(jià)存儲(chǔ)和計(jì)算能力,作為一種新的技術(shù),它被各個(gè)企 業(yè)甚至是政府高度重視。在現(xiàn)階段,數(shù)據(jù)庫的數(shù)據(jù)容量激增與管理任務(wù)煩瑣的矛盾越來 越突出,云計(jì)算技術(shù)或許能擔(dān)當(dāng)起拯救者的角色。因?yàn)樵朴?jì)算剛剛興起,在很多方面還 不成熟,還存在著許多問題。所以,很多數(shù)據(jù)庫研究者便將目光轉(zhuǎn)向了云技術(shù)。 (2) social network社會(huì)網(wǎng)絡(luò) 圖 14

33、 傳統(tǒng)互聯(lián)網(wǎng)正在邁向一個(gè)全新的時(shí)代社交服務(wù)網(wǎng)時(shí)代,個(gè)體的社交圈會(huì)不斷地 擴(kuò)大和重疊并最終形成大的社交網(wǎng)絡(luò)。社交網(wǎng)的一個(gè)顯著特點(diǎn)是支持巨大用戶數(shù),在一 些大規(guī)模的社交網(wǎng)站中,其數(shù)據(jù)中心運(yùn)行著成千上臺(tái)的服務(wù)器,為遍布全球的用戶提供 信息通訊服務(wù)。另外,任何兩個(gè)社交網(wǎng)用戶都可能交互,也就是必須支持任何兩個(gè)數(shù)據(jù) 庫用戶的數(shù)據(jù)關(guān)聯(lián)操作。這對(duì)于服務(wù)端的數(shù)據(jù)庫管理提出了極大的挑戰(zhàn)。因此,該領(lǐng)域 也正逐漸成為數(shù)據(jù)庫研究者的研究熱點(diǎn)。 (3) gpu / cpus圖形處理器、多核 cpu 圖 15 數(shù)據(jù)庫處理查詢時(shí),往往要進(jìn)行大量的運(yùn)算,特別是執(zhí)行表的連接操作的時(shí)候,會(huì) 使計(jì)算時(shí)間大幅度地增長(zhǎng),導(dǎo)致查詢效率的降

34、低?,F(xiàn)在,越來越多的計(jì)算機(jī)具有多個(gè) cpu;在有些顯示芯片上,集成有很多的處理核。這就為在這些多余的處理核上分擔(dān) cpu 的工作量提供了可能。如果能將處理任務(wù)分配到這些處理核上,任務(wù)的執(zhí)行效率將 會(huì)得到極大的提高。因些,如何在這些硬件上分擔(dān)任務(wù)成為了一個(gè)吸引人的研究領(lǐng)域。 (4) probabilistic databases概率數(shù)據(jù)庫 圖 16 目前廣泛應(yīng)用的數(shù)據(jù)庫絕大多數(shù)是關(guān)系型數(shù)據(jù)庫 ,它們均以 e.f.codd 的關(guān)系代數(shù)為 數(shù)據(jù)庫理論的基礎(chǔ),由此導(dǎo)致了它只能存儲(chǔ)、管理完全確定性信息。而現(xiàn)實(shí)世界中存在 大量不確定信息如市場(chǎng)預(yù)測(cè)、專家系統(tǒng)、模糊分析等等 ,這就需要建立一種具有不確定 性度

35、量的數(shù)據(jù)庫模式。隨著數(shù)據(jù)采集的多樣性,現(xiàn)在的數(shù)據(jù)中包含大量的嗓音和不確定 性,這就使概率數(shù)據(jù)庫大有市場(chǎng),這方面的研究也成為一個(gè)新的熱點(diǎn)。 (5) moving object移動(dòng)對(duì)象 圖 17 隨著無線通訊技術(shù)與定位技術(shù)的不斷發(fā)展,對(duì)移動(dòng)對(duì)象的跟蹤和定位變得越來越可 行,如交通控制、生物保護(hù)、氣象監(jiān)視等都涉及到對(duì)連續(xù)移動(dòng)對(duì)象的存儲(chǔ)、查詢與處理 需求,這就需要移動(dòng)對(duì)象數(shù)據(jù)庫技術(shù)提供支持。在移動(dòng)對(duì)象數(shù)據(jù)庫的研究中,如何建模、 索引并查詢移動(dòng)對(duì)象的位置信息是很重要的。對(duì)此人們正在進(jìn)行大量研究。 (5) graph database圖形數(shù)據(jù)庫 圖 18 雖然圖結(jié)構(gòu)在理論上可以用關(guān)系數(shù)據(jù)庫模型規(guī)范化,但由

36、于關(guān)系數(shù)據(jù)庫的實(shí)現(xiàn)特點(diǎn), 對(duì)于圖結(jié)構(gòu)的查詢有嚴(yán)重的性能影響。每次操作都可能導(dǎo)致一次連接操作,以兩個(gè)表的 主鍵集合間的集合操作來實(shí)現(xiàn),這種操作不僅緩慢,并且無法隨著這些表中元組數(shù)量的 增加而伸縮。圖論的巨大用途被得到了認(rèn)可,它跟不同領(lǐng)域的很多問題都有關(guān)聯(lián)。然而, 在很多情況下,這些算法的應(yīng)用僅限制于研究,因?yàn)閷?shí)際中沒有任何可用于產(chǎn)品環(huán)境下 的高性能圖形數(shù)據(jù)庫實(shí)現(xiàn)。因此,很多研究者致力于圖形數(shù)據(jù)庫和研究。 4.5 往年熱門但現(xiàn)在不熱門往年熱門但現(xiàn)在不熱門 (1) access methods數(shù)據(jù)庫訪問方法 目前,數(shù)據(jù)庫訪問有 ado、oledb、dao、odbc、jdbc 等。 ado 的效率不是

37、最佳,但是使用極為方便,而且通過壓縮傳輸 recrodset 然后使用 updatebatch 功能極大的降低了網(wǎng)絡(luò)的負(fù)載。同時(shí) ado 支持將 recordset 用 xml 的方式 儲(chǔ)存、讀?。ㄗx取需通過 stream 對(duì)象) ,對(duì)于通過 http 協(xié)議傳輸 recordset 極為方便。 dao 微軟已經(jīng)放棄。odbc 作為一個(gè)標(biāo)準(zhǔn),地位正在受到 oledb 的挑戰(zhàn)。oledb 的 可擴(kuò)展性和與 ado 完美的結(jié)合使得我們可以訪問任意位置的數(shù)據(jù)。jdbc 是一種可用于 執(zhí)行 sql 語句的 javaapi,它由些 java 語言寫的類。通過使用 jdbc,開發(fā)人員可以很方 便地將 sql

38、 語句傳送給幾乎任何一種數(shù)據(jù)庫。 (2) multimedia多媒體 從統(tǒng)計(jì)數(shù)據(jù)表中,我們可以看到,連續(xù)好幾年都沒有這個(gè)主題的論文了,雖然它曾 經(jīng)是一個(gè)熱門主題。這表明現(xiàn)在在多媒體數(shù)據(jù)庫這方面的技術(shù)已經(jīng)非常成熟了。對(duì)于多 媒體的存儲(chǔ)、索引和查詢已經(jīng)有了較好的處理方法。 (3) statistical database統(tǒng)計(jì)數(shù)據(jù)庫 統(tǒng)計(jì)數(shù)據(jù)庫管理統(tǒng)計(jì)數(shù)據(jù)的數(shù)據(jù)庫系統(tǒng)。這類數(shù)據(jù)庫包含有大量的數(shù)據(jù)記錄,但其目的 是向用戶提供各種統(tǒng)計(jì)匯總信息,而不是提供單個(gè)記錄的信息。盡管統(tǒng)計(jì)數(shù)據(jù)庫是數(shù)據(jù) 挖掘的基礎(chǔ),它在科學(xué)領(lǐng)域的應(yīng)用也十分重要,但由于這個(gè)主題已經(jīng)有足夠的科研成果, 所以科研人員已經(jīng)不再對(duì)這個(gè)主題感興趣了。 5 結(jié)論結(jié)論 此文主要是統(tǒng)計(jì)了數(shù)據(jù)庫領(lǐng)域最具權(quán)威性的學(xué)術(shù)會(huì)議 vldb 和 sigmod 在 2008 年 2010 年的學(xué)術(shù)論文,并引用observation on database research trends via publication statistics中對(duì)這兩個(gè)會(huì)議在 2006 之前的統(tǒng)計(jì)數(shù)據(jù),對(duì)數(shù)據(jù)庫的發(fā)展趨勢(shì)和熱點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論