計(jì)算機(jī)導(dǎo)論 課件 第11、12章 數(shù)據(jù)庫(kù)、新技術(shù)領(lǐng)域_第1頁(yè)
計(jì)算機(jī)導(dǎo)論 課件 第11、12章 數(shù)據(jù)庫(kù)、新技術(shù)領(lǐng)域_第2頁(yè)
計(jì)算機(jī)導(dǎo)論 課件 第11、12章 數(shù)據(jù)庫(kù)、新技術(shù)領(lǐng)域_第3頁(yè)
計(jì)算機(jī)導(dǎo)論 課件 第11、12章 數(shù)據(jù)庫(kù)、新技術(shù)領(lǐng)域_第4頁(yè)
計(jì)算機(jī)導(dǎo)論 課件 第11、12章 數(shù)據(jù)庫(kù)、新技術(shù)領(lǐng)域_第5頁(yè)
已閱讀5頁(yè),還剩107頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第11章數(shù)據(jù)庫(kù)主要內(nèi)容文件和數(shù)據(jù)庫(kù)概念數(shù)據(jù)管理工具數(shù)據(jù)庫(kù)設(shè)計(jì)SQL云數(shù)據(jù)庫(kù)大數(shù)據(jù)文件和數(shù)據(jù)庫(kù)概念數(shù)據(jù)庫(kù)(Database)是數(shù)據(jù)的集合,數(shù)據(jù)庫(kù)中的數(shù)據(jù)能夠按照特定的數(shù)據(jù)結(jié)構(gòu)存儲(chǔ),能對(duì)多個(gè)用戶共享,具有盡可能小的冗余度,且與應(yīng)用程序彼此獨(dú)立。利用數(shù)據(jù)庫(kù)可以完成以下任務(wù):收集數(shù)據(jù)存儲(chǔ)數(shù)據(jù)更新數(shù)據(jù)整理數(shù)據(jù)查找數(shù)據(jù)生成和傳播數(shù)據(jù)分析數(shù)據(jù)數(shù)據(jù)庫(kù)層次數(shù)據(jù)庫(kù)可以分為三個(gè)層次,不同類型的用戶接觸的層次不盡相同:物理層。物理層是數(shù)據(jù)庫(kù)最底層的抽象,它描述了數(shù)據(jù)是怎樣在物理介質(zhì)上存儲(chǔ)的。通常只有數(shù)據(jù)庫(kù)的研究人員才會(huì)接觸數(shù)據(jù)庫(kù)的物理層。邏輯層。邏輯層是比物理層的層次稍高的抽象。它描述了數(shù)據(jù)條目存儲(chǔ)的內(nèi)容及數(shù)據(jù)之間的關(guān)系。數(shù)據(jù)庫(kù)的管理者使用邏輯層進(jìn)行管理。視圖層。視圖層是最高層次的抽象,只關(guān)注于數(shù)據(jù)庫(kù)的某一部分。絕大部分?jǐn)?shù)據(jù)庫(kù)用戶接觸到的是視圖層。數(shù)據(jù)庫(kù)常用詞匯字段。字段是數(shù)據(jù)庫(kù)的基本組成元素,存放著屬于同一類的信息。例如在iTunes播放列表中,名稱字段存儲(chǔ)的是歌曲的名稱,時(shí)間字段存儲(chǔ)的是歌曲的時(shí)長(zhǎng)等。字段又分變長(zhǎng)字段和定長(zhǎng)字段。其中變長(zhǎng)字段的長(zhǎng)度可以根據(jù)輸入數(shù)據(jù)的長(zhǎng)度動(dòng)態(tài)分配,只要不超過(guò)預(yù)設(shè)的最大值。定長(zhǎng)字段則會(huì)分配固定大小的空間,即使數(shù)據(jù)很小,也會(huì)占用掉整個(gè)空間。數(shù)據(jù)庫(kù)常用詞匯iTunes播放列表中的字段數(shù)據(jù)庫(kù)常用詞匯記錄。記錄是一組字段的集合,代表著一條信息。例如在iTunes播放列表中,每一首歌曲對(duì)應(yīng)著一條記錄,每條記錄都包含該歌曲的名稱、時(shí)間、播放次數(shù)等信息。記錄類型。記錄類型是記錄模板即字段名的集合,記錄類型不包含具體的數(shù)據(jù)。實(shí)體。實(shí)體是所有同類物品或生物的集合。每一個(gè)實(shí)體都對(duì)應(yīng)著一個(gè)記錄類型,例如,歌曲這個(gè)實(shí)體對(duì)應(yīng)著名稱、時(shí)間、播放次數(shù)的記錄類型。數(shù)據(jù)庫(kù)常用詞匯關(guān)系。關(guān)系是指不同記錄類型之間的聯(lián)系。例如,零售商出售的商品ID必須在該商品生產(chǎn)者記錄的商品ID列表里,否則該商品就有可能是偽造產(chǎn)品,這便是一種關(guān)系。基數(shù)?;鶖?shù)是指兩個(gè)記錄類型間可能存在的聯(lián)系的個(gè)數(shù)。例如:對(duì)特定種類產(chǎn)品只能由一個(gè)廠商生產(chǎn),而一個(gè)廠商卻可以生產(chǎn)多種產(chǎn)品,這是一對(duì)多關(guān)系。多對(duì)多關(guān)系如廠商和超市的貨物供應(yīng),超市可以選擇多個(gè)廠商的貨物,廠商也可以供給超市多種貨物。一對(duì)一關(guān)系如專輯和其描述的關(guān)系,一個(gè)專輯只允許有一個(gè)描述,而一個(gè)描述也只適用于一個(gè)專輯,一對(duì)一關(guān)系在數(shù)據(jù)庫(kù)中很少見(jiàn)。ER圖實(shí)體關(guān)系圖(EntityRelationshipDiagram,簡(jiǎn)稱ER圖)常用來(lái)表示實(shí)體間的關(guān)系與基數(shù)數(shù)據(jù)庫(kù)的分類數(shù)據(jù)庫(kù)系統(tǒng)可以用不同方式來(lái)分類,包括數(shù)據(jù)庫(kù)所支持的用戶數(shù)量、數(shù)據(jù)庫(kù)的層數(shù)、數(shù)據(jù)庫(kù)所處環(huán)境等。常用的數(shù)據(jù)庫(kù)分類有:?jiǎn)斡脩魯?shù)據(jù)庫(kù)系統(tǒng)與多用戶數(shù)據(jù)庫(kù)系統(tǒng)客戶端—服務(wù)器數(shù)據(jù)庫(kù)系統(tǒng)與N層數(shù)據(jù)庫(kù)系統(tǒng)集中式和分布式數(shù)據(jù)庫(kù)系統(tǒng)基于磁盤(pán)的和在內(nèi)存中的數(shù)據(jù)庫(kù)系統(tǒng)操作型數(shù)據(jù)庫(kù)和分析型數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)模型數(shù)據(jù)庫(kù)模型描述了數(shù)據(jù)在數(shù)據(jù)庫(kù)中的存儲(chǔ)結(jié)構(gòu)與表現(xiàn)方式。數(shù)據(jù)庫(kù)模型可以分為以下幾種:平面文件層次數(shù)據(jù)庫(kù)網(wǎng)狀數(shù)據(jù)庫(kù)關(guān)系數(shù)據(jù)庫(kù)維度數(shù)據(jù)庫(kù)對(duì)象數(shù)據(jù)庫(kù)對(duì)象-關(guān)系數(shù)據(jù)庫(kù)文檔數(shù)據(jù)庫(kù)圖形數(shù)據(jù)庫(kù)平面文件平面文件處于數(shù)據(jù)庫(kù)定義的邊緣,因?yàn)樗?jiǎn)單到無(wú)法在記錄間建立關(guān)系。iTunes播放列表就是一個(gè)平面文件,常見(jiàn)的平面文件還有電子表格、電子郵件地址簿等。用戶可以對(duì)平面文件進(jìn)行增、刪、改、查,但無(wú)法指定記錄間的關(guān)系。除了平面文件外,其他的數(shù)據(jù)庫(kù)模型都允許建立關(guān)系。層次數(shù)據(jù)庫(kù)層次數(shù)據(jù)庫(kù)使用樹(shù)形結(jié)構(gòu)來(lái)描述關(guān)系,由于“樹(shù)”的限制,只能定義一對(duì)一或一對(duì)多的關(guān)系,無(wú)法定義多對(duì)多關(guān)系。常見(jiàn)的層次數(shù)據(jù)庫(kù)如Windows的注冊(cè)表。層次數(shù)據(jù)庫(kù)現(xiàn)今已很少被使用。網(wǎng)狀數(shù)據(jù)庫(kù)網(wǎng)狀數(shù)據(jù)庫(kù)在樹(shù)的基礎(chǔ)上將其擴(kuò)成了網(wǎng)狀結(jié)構(gòu),從而可以表現(xiàn)多對(duì)多關(guān)系。目前除了DNS系統(tǒng)等專用系統(tǒng)或應(yīng)用還在使用網(wǎng)狀數(shù)據(jù)庫(kù),其他網(wǎng)狀數(shù)據(jù)庫(kù)都已被關(guān)系數(shù)據(jù)庫(kù)或?qū)ο髷?shù)據(jù)庫(kù)所取代。關(guān)系數(shù)據(jù)庫(kù)關(guān)系數(shù)據(jù)庫(kù)是目前最常使用到的數(shù)據(jù)庫(kù),它將存儲(chǔ)在一張張表格中。每個(gè)表格代表一個(gè)實(shí)體,表格中每行代表一個(gè)記錄,每列代表一個(gè)字段。而關(guān)系是通過(guò)將不同表中的相同字段聯(lián)系起來(lái)而指定的。維度數(shù)據(jù)庫(kù)維度數(shù)據(jù)庫(kù)是關(guān)系數(shù)據(jù)庫(kù)的一種擴(kuò)展,關(guān)系數(shù)據(jù)庫(kù)采用的是二維的表格,而維度數(shù)據(jù)庫(kù)采用了三維或更多維的“數(shù)據(jù)空間”來(lái)描述數(shù)據(jù)或關(guān)系,因此維度數(shù)據(jù)庫(kù)也稱多維數(shù)據(jù)庫(kù)。維度數(shù)據(jù)庫(kù)可以更形象地表現(xiàn)數(shù)據(jù),但使用和維護(hù)維度數(shù)據(jù)庫(kù)需要更多的專業(yè)技術(shù)。對(duì)象數(shù)據(jù)庫(kù)對(duì)象數(shù)據(jù)庫(kù)也叫面向?qū)ο髷?shù)據(jù)庫(kù),它將實(shí)體抽象為類,將字段抽象為屬性,將數(shù)據(jù)存儲(chǔ)為對(duì)象的形式,并定義出方法——對(duì)象能執(zhí)行的行為。對(duì)象數(shù)據(jù)庫(kù)適合表示屬性差別極小的不同類對(duì)象——只需設(shè)置一個(gè)父類存放它們的共有屬性,再設(shè)置相應(yīng)數(shù)目的派生類存放各自的特有屬性,并繼承父類即可。對(duì)象數(shù)據(jù)庫(kù)是一種正在發(fā)展的數(shù)據(jù)庫(kù),它能夠更好地表現(xiàn)日常生活中的實(shí)體和關(guān)系。對(duì)象-關(guān)系數(shù)據(jù)庫(kù)對(duì)象-關(guān)系數(shù)據(jù)庫(kù)將關(guān)系數(shù)據(jù)庫(kù)和對(duì)象數(shù)據(jù)庫(kù)的特征相結(jié)合。數(shù)據(jù)像傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)一樣存儲(chǔ)在表格中,但增加了對(duì)象數(shù)據(jù)庫(kù)的功能——可以擴(kuò)充自定義的數(shù)據(jù)類型和操作,支持復(fù)雜對(duì)象的查詢,以及支持繼承的概念。文檔數(shù)據(jù)庫(kù)面向文檔的數(shù)據(jù)庫(kù)可以存儲(chǔ)非結(jié)構(gòu)化的數(shù)據(jù),如講演的原話或雜志的文章。由于文章具有可變的長(zhǎng)度和結(jié)構(gòu),因此不需要將數(shù)據(jù)塑造成適應(yīng)數(shù)據(jù)庫(kù)的結(jié)果。文檔數(shù)據(jù)庫(kù)可按照這樣的方式來(lái)創(chuàng)建,即將類似于HTML的結(jié)構(gòu)化標(biāo)記插入到文檔自身。格式化文檔數(shù)據(jù)庫(kù)的兩種常用的方式是使用XML和JSON,相對(duì)而言,XML更靈活。圖形數(shù)據(jù)庫(kù)圖形數(shù)據(jù)庫(kù)包含節(jié)點(diǎn)、邊和特性。圖形數(shù)據(jù)庫(kù)是NoSQL數(shù)據(jù)庫(kù)的一種類型,是一種非關(guān)系型數(shù)據(jù)庫(kù),它應(yīng)用圖形理論存儲(chǔ)實(shí)體之間的關(guān)系信息。關(guān)系型數(shù)據(jù)庫(kù)用于存儲(chǔ)“關(guān)系型”數(shù)據(jù)的效果并不好,其查詢復(fù)雜、緩慢、超出預(yù)期,而圖形數(shù)據(jù)庫(kù)的獨(dú)特設(shè)計(jì)恰恰彌補(bǔ)了這個(gè)缺陷。數(shù)據(jù)管理工具常用的數(shù)據(jù)管理工具如:數(shù)據(jù)管理軟件數(shù)據(jù)庫(kù)管理系統(tǒng)數(shù)據(jù)管理軟件是最簡(jiǎn)單的數(shù)據(jù)管理工具,它可以創(chuàng)建并維護(hù)平面文件,但不能在記錄間建立關(guān)系,也沒(méi)有足夠能力維護(hù)企業(yè)所需的大量數(shù)據(jù)。常見(jiàn)的數(shù)據(jù)管理軟件如MicrosoftWord和MicrosoftExcel,它們都提供了創(chuàng)建與管理表格的工具。數(shù)據(jù)庫(kù)管理系統(tǒng)數(shù)據(jù)庫(kù)管理系統(tǒng)(DataBaseManagementSystem,簡(jiǎn)稱DBMS)是專業(yè)的數(shù)據(jù)管理工具,是專門(mén)用來(lái)管理數(shù)據(jù)庫(kù)中數(shù)據(jù)的軟件。數(shù)據(jù)庫(kù)管理系統(tǒng)具有良好的數(shù)據(jù)獨(dú)立性——即DBMS只負(fù)責(zé)數(shù)據(jù),而程序需要通過(guò)編程語(yǔ)言向DBMS申請(qǐng)以獲取數(shù)據(jù)。數(shù)據(jù)庫(kù)管理系統(tǒng)支持網(wǎng)絡(luò)訪問(wèn),可以管理數(shù)十億條的記錄,并支持每秒數(shù)百次甚至上千次的并發(fā)事務(wù)處理。DBMS≠DB數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS可以分為很多種,每一種都專用于某一數(shù)據(jù)庫(kù)模型,但也有一些DBMS可以同時(shí)處理多種數(shù)據(jù)庫(kù)模型:XMLDBMS,用于處理XML格式的數(shù)據(jù)。對(duì)象數(shù)據(jù)庫(kù)管理系統(tǒng)(ObjectDBMS,簡(jiǎn)稱ODBMS),用于處理對(duì)象數(shù)據(jù)庫(kù)模型。關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(RelationalDBMS,簡(jiǎn)稱RDBMS),用于處理關(guān)系數(shù)據(jù)庫(kù)模型,是時(shí)下最流行的數(shù)據(jù)庫(kù)管理系統(tǒng)。在商業(yè)領(lǐng)域最常用的RDBMS如Oracle、MicrosoftSQLServer、MySQL等,個(gè)人用戶則可以考慮使用MicrosoftAccess。數(shù)據(jù)庫(kù)管理系統(tǒng)關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)數(shù)據(jù)庫(kù)和Web數(shù)據(jù)庫(kù)是可以通過(guò)Web訪問(wèn)的,但它的訪問(wèn)方式非?!半[秘”,以至于大多數(shù)Web用戶甚至發(fā)覺(jué)不到信息是由數(shù)據(jù)庫(kù)生成的。例如,網(wǎng)上商城商品的價(jià)格、圖片和描述其實(shí)都是來(lái)自數(shù)據(jù)庫(kù),并經(jīng)由一定的處理生成的;12306網(wǎng)站上的列車時(shí)刻表也是源于數(shù)據(jù)庫(kù)??梢酝ㄟ^(guò)靜態(tài)或動(dòng)態(tài)發(fā)布的方式將數(shù)據(jù)庫(kù)中的內(nèi)容提供到Web上。靜態(tài)Web發(fā)布是將數(shù)據(jù)庫(kù)中的數(shù)據(jù)轉(zhuǎn)換成HTML文檔,從而提供訪問(wèn),其實(shí)質(zhì)是生成了一個(gè)數(shù)據(jù)庫(kù)的“快照”。Web用戶只可以對(duì)此HTML文檔進(jìn)行查看或搜素,而不能更改數(shù)據(jù)庫(kù)中的內(nèi)容。數(shù)據(jù)庫(kù)和Web如果要通過(guò)Web對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行修改,或進(jìn)行定制性的查看(如網(wǎng)上商城的“猜你喜歡”功能),則需要借助動(dòng)態(tài)Web發(fā)布。動(dòng)態(tài)Web發(fā)布依靠服務(wù)器端腳本在用戶瀏覽器和DBMS間建立連接。服務(wù)器端腳本可以用PHP、Ruby、Python、ASP等語(yǔ)言進(jìn)行編寫(xiě)。操作系統(tǒng)、Web服務(wù)器軟件、數(shù)據(jù)庫(kù)管理系統(tǒng)和服務(wù)器端腳本共同組成了Web服務(wù)器框架。數(shù)據(jù)庫(kù)和Web用戶通過(guò)網(wǎng)頁(yè)提交的記錄其實(shí)都是表單的形式,在HTML語(yǔ)言中就是<form>標(biāo)簽下的內(nèi)容,<form>標(biāo)簽會(huì)指定提交方式和提交到服務(wù)器端腳本的文件名。用戶提交后,<form>標(biāo)簽中的內(nèi)容就會(huì)提交到對(duì)應(yīng)腳本進(jìn)行處理,腳本處理完畢后再將結(jié)果以HTML文檔的方式返回給用戶。XMLXML(ExtensibleMarkupLanguage,可擴(kuò)展標(biāo)記語(yǔ)言)是對(duì)HTML語(yǔ)言的擴(kuò)展與補(bǔ)充。它與HTML語(yǔ)言在語(yǔ)法上的區(qū)別是:HTML中并不是所有標(biāo)簽都成對(duì)出現(xiàn),而XML要求所有標(biāo)簽必須成對(duì)出現(xiàn);HTML的標(biāo)簽不區(qū)分大小寫(xiě),而XML標(biāo)簽區(qū)分大小寫(xiě)。XML支持自定義的標(biāo)簽,如<author>標(biāo)簽可以標(biāo)記作者,<from>標(biāo)簽可以標(biāo)記來(lái)源。HTML和XML是為不同的目的而設(shè)計(jì)的。HTML被設(shè)計(jì)用來(lái)顯示數(shù)據(jù),關(guān)注于數(shù)據(jù)的外觀;而XML被設(shè)計(jì)為傳輸和存儲(chǔ)數(shù)據(jù),關(guān)注于數(shù)據(jù)的內(nèi)容。XML可以理解為,XML僅僅是純文本,XML文件不會(huì)做任何事情,但應(yīng)用程序卻可以利用XML文件的易讀性和標(biāo)記性有針對(duì)性地處理XML文件。例如,應(yīng)用程序可以直接搜索<author>標(biāo)簽找到該文件的作者,而無(wú)需借助人工查詢。XML文件可以用瀏覽器或任何的文字處理軟件打開(kāi)。XMLXML和數(shù)據(jù)庫(kù)都可以用來(lái)存儲(chǔ)數(shù)據(jù)。XML可在多個(gè)平臺(tái)上訪問(wèn),占用資源更少,操作更方便,但對(duì)復(fù)雜的操作如排序、更新支持不是很好,且在數(shù)據(jù)量增大時(shí),查看與搜索的壓力也會(huì)增大,所以XML文件通常用于存儲(chǔ)程序的配置,而程序所用到的數(shù)據(jù)還是要用數(shù)據(jù)庫(kù)存儲(chǔ)。XML提供了服務(wù)器和瀏覽器通過(guò)Web交換數(shù)據(jù)的方式,一些RDBMS可以接受XML形式的查詢并將結(jié)果到處到XML文件,同Web發(fā)送到用戶瀏覽器。數(shù)據(jù)庫(kù)設(shè)計(jì)在設(shè)計(jì)數(shù)據(jù)庫(kù)及相關(guān)系統(tǒng)時(shí),常常需要考慮如下內(nèi)容:定義字段組織記錄設(shè)計(jì)界面設(shè)計(jì)報(bào)表模板載入數(shù)據(jù)定義字段構(gòu)建關(guān)系數(shù)據(jù)庫(kù)的第一步是定義字段,即明確數(shù)據(jù)庫(kù)中要存放什么數(shù)據(jù)。例如,如果要構(gòu)建一個(gè)音樂(lè)數(shù)據(jù)庫(kù),那么可能的字段有歌曲名、專輯名、作者、時(shí)長(zhǎng)、描述等等。定義字段前,首先要明確如何組織數(shù)據(jù),例如,用戶的姓名是存放在一個(gè)字段里還是分成姓和名存放在兩個(gè)字段里。數(shù)據(jù)庫(kù)通常需要保證一張表里的任意兩條記錄都是互不相同的,因此需要將一個(gè)字段設(shè)置成主鍵(primarykey),主鍵字段中的數(shù)據(jù)不允許重復(fù),即可保證記錄是不重復(fù)的。定義字段字段可以存放的數(shù)據(jù)取決于它的數(shù)據(jù)類型,不同DBMS有不同的數(shù)據(jù)類型,但大體可分為以下幾類:整型數(shù)據(jù)類型(int或integer)浮點(diǎn)數(shù)據(jù)類型(real、float、decimal、numeric)字符數(shù)據(jù)類型(char、varchar)日期和時(shí)間數(shù)據(jù)類型(datetime)文本和圖形數(shù)據(jù)類型(text、image)貨幣數(shù)據(jù)類型(money)位數(shù)據(jù)類型(bit)二進(jìn)制數(shù)據(jù)類型(binary、varbinary)定義字段數(shù)據(jù)庫(kù)提供了進(jìn)行數(shù)據(jù)檢查的工具,以防用戶輸入不合法的數(shù)據(jù)。不合法的數(shù)據(jù)包括:數(shù)據(jù)類型不符數(shù)據(jù)值不符數(shù)據(jù)庫(kù)管理員還可以指定字段樣式,以便輸入數(shù)據(jù)時(shí)添加為自動(dòng)的格式。如何將字段編組為表也需要一定的技巧。原則之一是“一事一表”,這樣可以減少數(shù)據(jù)冗余。組織記錄對(duì)于同一張表,不同的數(shù)據(jù)庫(kù)用戶關(guān)注的重點(diǎn)可能不同。例如,倉(cāng)庫(kù)管理員會(huì)關(guān)注商品的庫(kù)存排序情況,而營(yíng)銷人員可能更關(guān)注商品的價(jià)格排序情況。這就需要數(shù)據(jù)庫(kù)去組織記錄,數(shù)據(jù)庫(kù)組織記錄的方式可以分為排序和索引兩種。排序是對(duì)物理介質(zhì)上的數(shù)據(jù)進(jìn)行重新排列,以得到有序的數(shù)據(jù)。每張表最多只能有一個(gè)排序字段,數(shù)據(jù)會(huì)按此字段在物理介質(zhì)上排序。組織記錄與排序不同,索引其實(shí)是一個(gè)鍵列表,每個(gè)鍵中都有索引排序字段的信息,并提供了一個(gè)指向?qū)?yīng)記錄的指針。索引按照索引排序字段進(jìn)行排序,以達(dá)到組織記錄的效果,但索引不會(huì)改變記錄的物理存儲(chǔ)位置。因此一張表可以有多個(gè)索引,以對(duì)多個(gè)不同的字段進(jìn)行排序。記錄表索引表商品ID價(jià)格庫(kù)存庫(kù)存商品ID10013.24352100510109.817171010100521.721581003100353.61584351001設(shè)計(jì)界面數(shù)據(jù)庫(kù)的用戶通常不是登錄DBMS后對(duì)數(shù)據(jù)進(jìn)行修改,而是通過(guò)Web訪問(wèn)網(wǎng)頁(yè)或通過(guò)應(yīng)用程序進(jìn)行數(shù)據(jù)的創(chuàng)建與修改。數(shù)據(jù)庫(kù)的設(shè)計(jì)者或?qū)iT(mén)的工程師需要設(shè)計(jì)出一個(gè)能完整包含記錄所需字段的頁(yè)面。設(shè)計(jì)界面時(shí)常須注意:將字段按照邏輯順序排列好,字段的文本框最好對(duì)齊,而不要參差不一。為正在輸入的字段提供視覺(jué)效果,如文本框加亮等。提供必要的說(shuō)明以確保輸入數(shù)據(jù)的合法性。如果字段過(guò)多,可考慮分頁(yè)或使用滾動(dòng)條,而不要擠在一起。應(yīng)用合適的字體和樣式。設(shè)計(jì)報(bào)表模板報(bào)表是打印出來(lái)的或展示在屏幕上的數(shù)據(jù)庫(kù)中部分?jǐn)?shù)據(jù)或全部數(shù)據(jù)的列表。多數(shù)DBMS都包含了報(bào)表生成器,可以根據(jù)設(shè)計(jì)好的報(bào)表模板,填入數(shù)據(jù)后生成報(bào)表。一個(gè)好的報(bào)表模板應(yīng)遵循以下原則:提供且僅提供用戶所需的信息。能夠簡(jiǎn)化用戶的手工計(jì)算。無(wú)歧義的表示信息。以用戶可以理解的方式表現(xiàn)信息。載入數(shù)據(jù)數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)完成后,需要將數(shù)據(jù)載入到數(shù)據(jù)庫(kù)中。最原始的做法是手工輸入數(shù)據(jù),這可能會(huì)花費(fèi)很長(zhǎng)時(shí)間,并且不可避免地會(huì)有拼寫(xiě)錯(cuò)誤。如果數(shù)據(jù)是以電子的方式存在于其他數(shù)據(jù)庫(kù)或文件中,就可以使用數(shù)據(jù)庫(kù)提供的導(dǎo)入導(dǎo)出程序,或?qū)懸粋€(gè)專門(mén)的轉(zhuǎn)換程序來(lái)載入數(shù)據(jù)。載入數(shù)據(jù)DBMS會(huì)提供導(dǎo)入導(dǎo)出程序,可以將數(shù)據(jù)在不同的數(shù)據(jù)庫(kù)或文件之間進(jìn)行轉(zhuǎn)換,如果導(dǎo)入導(dǎo)出程序不支持所需文件的格式,就需要寫(xiě)一個(gè)專門(mén)的轉(zhuǎn)換程序。對(duì)于大量數(shù)據(jù)來(lái)說(shuō),編寫(xiě)轉(zhuǎn)換程序的效率和準(zhǔn)確率依然要比手工錄入高。SQLSQL(StructuredQueryLanguage,結(jié)構(gòu)化查詢語(yǔ)言)是用來(lái)進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì)、查詢與管理的語(yǔ)言,任何對(duì)數(shù)據(jù)庫(kù)的操作都需要通過(guò)SQL語(yǔ)句(也稱SQL查詢)命令數(shù)據(jù)庫(kù)進(jìn)行。SQL語(yǔ)句很像是一個(gè)英文句子,如SELECTNameFROMStudentWHERESid=‘1001’就是一個(gè)最簡(jiǎn)單的SQL語(yǔ)句,它命令數(shù)據(jù)庫(kù)從Student表中找到學(xué)號(hào)為1001的學(xué)生,并返回其姓名。其中的大寫(xiě)單詞如SELECT、FROM和WHERE是SQL關(guān)鍵字,數(shù)據(jù)庫(kù)通過(guò)識(shí)別關(guān)鍵字來(lái)判斷指令的類型,并執(zhí)行對(duì)應(yīng)操作。SQL關(guān)鍵字不一定是大寫(xiě)的,大多數(shù)DBMS接受任意形式大小寫(xiě)的關(guān)鍵字,如SELECT和select、SeLeCt的效果是一樣的。每個(gè)SQL關(guān)鍵字都有對(duì)應(yīng)的語(yǔ)法。關(guān)鍵字含義示例SELECT查找記錄SELECT*FROMStudentWHEREClass=’3’DELETE刪除記錄DELETEFromMusicwhereID=’7’UPDATE更新記錄UPDATEStudentSETAge=20WHERESid=‘1002’CREATE創(chuàng)建數(shù)據(jù)庫(kù)、表等CREATETableStudentINSERT插入記錄INSERTINTOStudent(Sid,Age)VALUES(‘1020’,19)常見(jiàn)的SQL關(guān)鍵字添加記錄SQL添加記錄的語(yǔ)法有如下兩種:INSERTINTO...VALUES(...),用于插入單條記錄。例如,如下的查詢表示在Student表中插入一條記錄,其中學(xué)號(hào)是1020,年齡是19。INSERTINTOStudent(Sid,Age)VALUES(‘1020’,19)INSERTINTO....(),用于同時(shí)插入多條記錄,括號(hào)中是一個(gè)子查詢,通常是一個(gè)SELECT語(yǔ)句。例如,如下的查詢表示從Student2表中提取出所有的學(xué)號(hào)和年齡記錄,插入到Student表中。INSERTINTOStudent(Sid,Age)(SELECTSid,AgeFROMStudent2)查詢信息通用的查詢信息的語(yǔ)法是SELECT...FROM...WHERE...,但其中可以應(yīng)用一些關(guān)鍵字或符號(hào)來(lái)進(jìn)行更復(fù)雜的查詢,常用的關(guān)鍵字或符號(hào)有如下幾種:星號(hào)(*),表示所有信息比較符號(hào)如>,>=,=等,需要注意的是,不等于用<>表示OR和ANDBETWEEN...AND...,用于指定值的連續(xù)范圍IN,用于指定離散的數(shù)據(jù)范圍NOT,用于取反LIKE,用于字符串匹配ORDERBY,對(duì)查詢結(jié)果進(jìn)行排序更新字段更新字段的通用語(yǔ)法是UPDATE...SET...WHERE...,可以對(duì)一條記錄或多條記錄同時(shí)進(jìn)行修改。WHERE子句同樣可以應(yīng)用AND、OR、INT、BETWEEN...AND...、LIKE等關(guān)鍵字。例如,如下的查詢選出Product表中所有價(jià)格大于400的商品,并將其價(jià)格修改為400。UPDATEProductSETPrice=400WHEREPrice>400連接表使用SQL語(yǔ)句可以將兩個(gè)表通過(guò)共同字段連接起來(lái),連接得到的新表中僅包含在共同字段上值相同的記錄的組合。通過(guò)連接表可以進(jìn)行多表查詢,在SQL中,有兩種方法可以連接表:直接調(diào)用多張表。在SELECT...FROM...WHERE中引用多張表,并在WHERE后指明這多張表的連接原則。如:SELECT*FROMStudent,Course,SCWHEREStudent.Sid=SC.sidANDSC.cid=Course.Cid使用JOIN關(guān)鍵字,語(yǔ)法為SELECT...FROM...JOIN...ON...WHERE...。如:SELECT*FROMStudentJOINSCONStudent.Sid=SC.Sid云數(shù)據(jù)庫(kù)云數(shù)據(jù)庫(kù)是運(yùn)行在云計(jì)算平臺(tái)中的數(shù)據(jù)庫(kù),例如AmazonEC2、GoGrid,、Salesforce和Rackspace。云數(shù)據(jù)庫(kù)使企業(yè)能夠用更少的室內(nèi)硬件與維護(hù)花費(fèi)來(lái)創(chuàng)建簡(jiǎn)單規(guī)模的數(shù)據(jù)庫(kù),而僅僅需要支付數(shù)據(jù)存儲(chǔ)和運(yùn)輸?shù)馁M(fèi)用。云數(shù)據(jù)庫(kù)按照部署模式可分為虛擬機(jī)映像和數(shù)據(jù)庫(kù)即服務(wù)兩類,每一類又可分為基于SQL的數(shù)據(jù)模型(SQLDataModel)和支持多種語(yǔ)言的數(shù)據(jù)模型(NoSQLDataModel,其中NoSQL是NotonlySQL的簡(jiǎn)寫(xiě),即除了支持SQL語(yǔ)言外,還支持其他類似的語(yǔ)言)。云數(shù)據(jù)庫(kù)虛擬機(jī)映像(VirtualMachineImage),用戶可以在云提供商提供的虛擬機(jī)映像上自己建立與維護(hù)數(shù)據(jù)庫(kù)。云平臺(tái)允許用戶購(gòu)買(mǎi)一個(gè)限定時(shí)間的虛擬機(jī)映像,用戶可以在其中運(yùn)行數(shù)據(jù)庫(kù)。用戶既可以選擇將自己的帶有數(shù)據(jù)庫(kù)的機(jī)器映像上傳到虛擬機(jī)中,也可以使用云提供商已經(jīng)預(yù)先配置好的安裝有數(shù)據(jù)庫(kù)的機(jī)器映像。數(shù)據(jù)庫(kù)即服務(wù)(DataBaseasaService,簡(jiǎn)稱DBaaS),即通過(guò)服務(wù)的方式購(gòu)買(mǎi)數(shù)據(jù)庫(kù)。在DBaaS中,用戶不需要自己安裝或維護(hù)數(shù)據(jù)庫(kù)——這是云數(shù)據(jù)庫(kù)服務(wù)提供商的工作,用戶只需要根據(jù)對(duì)數(shù)據(jù)庫(kù)的使用量來(lái)付費(fèi)。大數(shù)據(jù)五年以前,各種企業(yè)收集的大多數(shù)數(shù)據(jù)都是結(jié)構(gòu)化的交互數(shù)據(jù),這些數(shù)據(jù)可以簡(jiǎn)單地填充到關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)的行、列當(dāng)中。然而現(xiàn)在,來(lái)自網(wǎng)站、郵件、社交媒體甚至音樂(lè)列表以及傳感器的數(shù)據(jù)帶來(lái)了數(shù)據(jù)爆炸,這些數(shù)據(jù)的無(wú)結(jié)構(gòu)或半結(jié)構(gòu)化使得它們不適用于通過(guò)行、列管理數(shù)據(jù)的關(guān)系數(shù)據(jù)庫(kù)產(chǎn)品。流行詞“大數(shù)據(jù)”指的就是這種蜂擁而至的數(shù)據(jù),這些數(shù)據(jù)可以從網(wǎng)站流向世界各地的公司,由于這些數(shù)據(jù)的容量過(guò)于龐大,以至于傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)無(wú)法在可接受的時(shí)間內(nèi)捕獲、存儲(chǔ)和分析它們。大數(shù)據(jù)“大數(shù)據(jù)”通常指的是來(lái)自不同資源的數(shù)量在10的15次方到24次方之間的數(shù)據(jù),換句話說(shuō)數(shù)十億到數(shù)兆的記錄?!按髷?shù)據(jù)”的產(chǎn)生速度遠(yuǎn)快于傳統(tǒng)數(shù)據(jù),并且該速度還在快速增長(zhǎng)?!按髷?shù)據(jù)”帶來(lái)的挑戰(zhàn)如:通過(guò)分析每天產(chǎn)生的12TB的微博數(shù)據(jù)來(lái)更好地了解用戶對(duì)產(chǎn)品的看法;分析1億封郵件以便在郵件旁邊投放合適的廣告;分析5億條呼叫記錄來(lái)尋找詐騙和偽造的方式。大數(shù)據(jù)特點(diǎn)——4V數(shù)據(jù)體積很大(Volume)數(shù)據(jù)類型多樣(Variety)傳輸速度很快(Velocity)具有潛在價(jià)值(Value)精確性(Veracity)大數(shù)據(jù)為了管理這些大量的無(wú)結(jié)構(gòu)、半結(jié)構(gòu)化與結(jié)構(gòu)化的數(shù)據(jù),企業(yè)通常使用Hadoop。Hadoop是一個(gè)由Apache軟件基金會(huì)管理的開(kāi)源軟件框架,它可以在廉價(jià)的計(jì)算機(jī)上分布并行處理大量的數(shù)據(jù)。它可將大數(shù)據(jù)問(wèn)題分解為多個(gè)子問(wèn)題,然后將它們分散在數(shù)千個(gè)廉價(jià)的計(jì)算機(jī)處理節(jié)點(diǎn)上,并將分析結(jié)果組合在一個(gè)較小的、易于分析的數(shù)據(jù)集上。第12章新技術(shù)領(lǐng)域主要內(nèi)容人工智能大數(shù)據(jù)云計(jì)算物聯(lián)網(wǎng)虛擬現(xiàn)實(shí)區(qū)塊鏈5G人工智能人工智能簡(jiǎn)介人工智能的發(fā)展階段圖靈測(cè)試深度學(xué)習(xí)人工智能簡(jiǎn)介人工智能(ArtificialIntelligence,,AI)亦稱機(jī)器智能,是指由人制造出來(lái)的機(jī)器所表現(xiàn)出來(lái)的智能。通常人工智能是指通過(guò)普通計(jì)算機(jī)程序的手段實(shí)現(xiàn)的類人智能技術(shù)、以及研究這樣的智能系統(tǒng)是否能夠?qū)崿F(xiàn)與如何實(shí)現(xiàn)的科學(xué)領(lǐng)域。人工智能的核心問(wèn)題包括如何賦予機(jī)器能夠比擬甚至超越人類的推理、知識(shí)、規(guī)劃、學(xué)習(xí)、交流、感知、移動(dòng)和操作物體的能力等。人工智能簡(jiǎn)介自20世紀(jì)40年代始,人工智能經(jīng)歷了多次低谷與繁榮,研究方向大體可分為以下幾個(gè)領(lǐng)域演繹、推理和解決問(wèn)題知識(shí)表示法規(guī)劃?rùn)C(jī)器學(xué)習(xí)自然語(yǔ)言處理運(yùn)動(dòng)和控制(機(jī)器人學(xué))知覺(jué)社交創(chuàng)造力倫理管理人工智能簡(jiǎn)介演繹、推理和解決問(wèn)題早期的人工能研究人員直接模仿人類進(jìn)行逐步的推理。到了20世紀(jì)八九十年代,人工智能研究還發(fā)展了非常成功的方法處理不確定或不完整的資訊。專家系統(tǒng)就是此領(lǐng)域的一種應(yīng)用。知識(shí)表示法如何存儲(chǔ)知識(shí)使其讓機(jī)器能夠處理并理解,是知識(shí)表示法的主要目標(biāo)。規(guī)劃智能機(jī)器人必須能夠制定目標(biāo)和實(shí)現(xiàn)這些目標(biāo)。它們需要一種方法來(lái)創(chuàng)建一個(gè)可預(yù)測(cè)的世界模型,并能預(yù)測(cè)它們的行為將如何改變這個(gè)世界,這樣它們就可以選擇功效最大的行為。強(qiáng)化學(xué)習(xí)就是該領(lǐng)域的一個(gè)延伸方向。人工智能簡(jiǎn)介機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)的主要目的是為了讓機(jī)器從輸入的的數(shù)據(jù)中獲得知識(shí),以便自動(dòng)地判斷和輸出相應(yīng)的結(jié)果。機(jī)器學(xué)習(xí)可以幫助減少錯(cuò)誤率,提高解決問(wèn)題的效率。自然語(yǔ)言處理自然語(yǔ)言處理領(lǐng)域探討如何處理及應(yīng)用自然語(yǔ)言,是人工智能和語(yǔ)言學(xué)領(lǐng)域的分支學(xué)科。運(yùn)動(dòng)和控制(機(jī)器人學(xué))運(yùn)動(dòng)和控制領(lǐng)域關(guān)注如何設(shè)計(jì)并制造出承載人工智能系統(tǒng)的機(jī)器人,用來(lái)達(dá)成某種實(shí)用目的。知覺(jué)知覺(jué)領(lǐng)域關(guān)注如何賦予人工智能系統(tǒng)以知覺(jué),并據(jù)此判斷世界的狀態(tài)。人工智能簡(jiǎn)介承載人工智能系統(tǒng)的機(jī)器人人工智能簡(jiǎn)介社交社交領(lǐng)域致力于情感分析,并賦予機(jī)器人以情感。創(chuàng)造力創(chuàng)造力領(lǐng)域關(guān)注如何賦予機(jī)器人以創(chuàng)造力。倫理管理針對(duì)人工智能的倫理討論由來(lái)已久?,F(xiàn)有事實(shí)是:機(jī)器常失控導(dǎo)致人員傷亡,這樣的情況是否會(huì)更加擴(kuò)大規(guī)模出現(xiàn),歷史顯然無(wú)法給出可靠的樂(lè)觀答案。人工智能簡(jiǎn)介現(xiàn)在的人工智能模型已經(jīng)可以自動(dòng)生成逼真的場(chǎng)景圖片人工智能的發(fā)展階段根據(jù)發(fā)展階段,人工智能可由淺入深分為以下三類:弱人工智能。僅在單個(gè)領(lǐng)域擁有比擬或超過(guò)人類能力的人工智能程序。強(qiáng)人工智能。強(qiáng)人工智能可以像人類一樣應(yīng)對(duì)不同層面的問(wèn)題。強(qiáng)人工智能被認(rèn)為是有知覺(jué)、有自我意識(shí)的。目前,強(qiáng)人工智能仍遙不可及。超人工智能。超人工智能是一種愿景,它擁有能夠準(zhǔn)確回答幾乎所有困難問(wèn)題的先知模式,能夠執(zhí)行任何高級(jí)指令的精靈模式和能執(zhí)行開(kāi)放式任務(wù),而且擁有自由意志和自由活動(dòng)能力的獨(dú)立意識(shí)模式。超人工智能將超過(guò)所有人類智能的總和。圖靈測(cè)試圖靈測(cè)試是這樣建立的,由一位質(zhì)問(wèn)者坐在一個(gè)房間中,用計(jì)算機(jī)終端與另外兩個(gè)回答者A和B通信。質(zhì)問(wèn)者知道一位回答者是人,另一位回答者是計(jì)算機(jī),但是不知道究竟哪個(gè)是人,哪個(gè)是計(jì)算機(jī)。分別與A和B交談之后,質(zhì)問(wèn)者要判斷出哪個(gè)回答者是計(jì)算機(jī)。這一過(guò)程將由多個(gè)人反復(fù)執(zhí)行。這個(gè)測(cè)試的假設(shè)是如果計(jì)算機(jī)能瞞過(guò)足夠多人,那么就可以把它看作是智能的。深度學(xué)習(xí)深度學(xué)習(xí)框架,尤其是基于人工神經(jīng)網(wǎng)絡(luò)的框架可以追溯到1980年福島邦彥提出的新認(rèn)知機(jī),而人工神經(jīng)網(wǎng)絡(luò)的歷史更為久遠(yuǎn)。1989年,燕樂(lè)存(YannLeCun)等人開(kāi)始將1974年提出的標(biāo)準(zhǔn)反向傳播算法應(yīng)用于深度神經(jīng)網(wǎng)絡(luò),這一網(wǎng)絡(luò)被用于手寫(xiě)郵政編碼識(shí)別。盡管算法可以成功執(zhí)行,但計(jì)算代價(jià)非常巨大,神經(jīng)網(wǎng)路的訓(xùn)練時(shí)間達(dá)到了3天,因而無(wú)法投入實(shí)際使用。許多因素導(dǎo)致了這一緩慢的訓(xùn)練過(guò)程,其中一種是反向傳播中的梯度消失問(wèn)題。因此深度學(xué)習(xí)沉寂了很長(zhǎng)時(shí)間。深度學(xué)習(xí)到了2012年,多倫多大學(xué)杰弗里·辛頓(GeoffreyHinton)的實(shí)驗(yàn)室設(shè)計(jì)出了一個(gè)深層的卷積神經(jīng)網(wǎng)絡(luò)(一種適用于圖像的人工神經(jīng)網(wǎng)絡(luò))AlexNet,奪得了當(dāng)年的ImageNetLSVRC(一項(xiàng)大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽)冠軍,打敗了傳統(tǒng)的機(jī)器學(xué)習(xí)與模式識(shí)別方法,且準(zhǔn)確率遠(yuǎn)超第二名。自此,深度學(xué)習(xí)迎來(lái)了大爆發(fā)。深度學(xué)習(xí)隨著硬件性能尤其是GPU的飛速發(fā)展,以及神經(jīng)網(wǎng)絡(luò)新組件的不斷發(fā)明,深度學(xué)習(xí)模型的可訓(xùn)練參數(shù)越來(lái)越多,效果越來(lái)越好。如今,在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理、音頻識(shí)別與生物信息學(xué)領(lǐng)域,深度學(xué)習(xí)都已取得極好的效果并已經(jīng)進(jìn)入商業(yè)化。大數(shù)據(jù)大數(shù)據(jù)簡(jiǎn)介大數(shù)據(jù)的特點(diǎn)大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)簡(jiǎn)介大數(shù)據(jù)是一個(gè)不斷發(fā)展的概念,可以指任何體量或復(fù)雜性超出常規(guī)數(shù)據(jù)處理方法的處理能力的數(shù)據(jù)。數(shù)據(jù)本身可以是結(jié)構(gòu)化、半結(jié)構(gòu)化甚至是非結(jié)構(gòu)化的。大數(shù)據(jù)技術(shù)的發(fā)展可以分為六大方向大數(shù)據(jù)采集與預(yù)處理方向大數(shù)據(jù)存儲(chǔ)與管理方向大數(shù)據(jù)計(jì)算模式方向大數(shù)據(jù)分析與挖掘方向大數(shù)據(jù)可視化分析方向大數(shù)據(jù)安全方向大數(shù)據(jù)簡(jiǎn)介Google上“大數(shù)據(jù)”一詞的搜索熱度大數(shù)據(jù)簡(jiǎn)介大數(shù)據(jù)采集與預(yù)處理方向這個(gè)方向最常見(jiàn)的問(wèn)題是數(shù)據(jù)的多源和多樣性導(dǎo)致數(shù)據(jù)的質(zhì)量存在差異,嚴(yán)重影響到數(shù)據(jù)的可用性。針對(duì)這個(gè)問(wèn)題,目前很多公司已經(jīng)推出了多種數(shù)據(jù)清洗和質(zhì)量控制工具,如IBM公司的InfoSphereDataStage。大數(shù)據(jù)存儲(chǔ)與管理方向這個(gè)方向最常見(jiàn)的挑戰(zhàn)是存儲(chǔ)規(guī)模大、存儲(chǔ)管理復(fù)雜,需要兼顧結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。分布式文件系系統(tǒng)和分布式數(shù)據(jù)庫(kù)相關(guān)技術(shù)的發(fā)展正在有效地解決這些方面的問(wèn)題。在大數(shù)據(jù)存儲(chǔ)和管理方向,尤其值得我們關(guān)注的是大數(shù)據(jù)索引和查詢技術(shù)、實(shí)時(shí)及流式大數(shù)據(jù)存儲(chǔ)與處理的發(fā)展。大數(shù)據(jù)計(jì)算模式方向由于大數(shù)據(jù)處理多樣性的需求,目前出現(xiàn)了多種典型的計(jì)算模式,包括大數(shù)據(jù)查詢分析計(jì)算(如Hive)、批處理計(jì)算(如HadoopMapReduce)、流式計(jì)算(如Storm)、迭代計(jì)算(如HaLoop)、圖計(jì)算(如Pregel)和內(nèi)存計(jì)算(如HANA),這些計(jì)算模式的混合計(jì)算方法將成為滿足多樣性大數(shù)據(jù)處理和應(yīng)用需求的有效手段。大數(shù)據(jù)簡(jiǎn)介HadoopMapReduce的架構(gòu)大數(shù)據(jù)簡(jiǎn)介Hadoop生態(tài)系統(tǒng)大數(shù)據(jù)簡(jiǎn)介大數(shù)據(jù)分析與挖掘方向在數(shù)據(jù)量迅速增加的同時(shí),還要進(jìn)行深度的數(shù)據(jù)分析和挖掘,并且對(duì)自動(dòng)化分析要求越來(lái)越高。越來(lái)越多的大數(shù)據(jù)分析工具和產(chǎn)品應(yīng)運(yùn)而生,如用于大數(shù)據(jù)挖掘的RHaDoop版、基于MapReduce開(kāi)發(fā)的數(shù)據(jù)挖掘算法等。大數(shù)據(jù)可視化分析方向通過(guò)可視化方式來(lái)幫助人們探索和解釋復(fù)雜的數(shù)據(jù),有利于決策者挖掘數(shù)據(jù)的商業(yè)價(jià)值,進(jìn)而有助于大數(shù)據(jù)的發(fā)展??梢暬ぞ逿ableau的成功上市反反映了大數(shù)據(jù)可視化的需求。大數(shù)據(jù)安全方向當(dāng)人們?cè)谟么髷?shù)據(jù)分析和挖掘獲取商業(yè)價(jià)值的時(shí)候,黑客很可能在向我們攻擊,收集有用的信息。文件訪問(wèn)控制權(quán)限ACL、基礎(chǔ)設(shè)備加密、匿名化保護(hù)技術(shù)和加密保護(hù)等技術(shù)正在最大程度地保護(hù)數(shù)據(jù)安全。大數(shù)據(jù)簡(jiǎn)介可視化工具Tableau大數(shù)據(jù)的特點(diǎn)IBM公司使用3V來(lái)描述大數(shù)據(jù)的特點(diǎn)

Volume(體量)。通過(guò)各種設(shè)備產(chǎn)生的海量數(shù)據(jù)體量巨大,遠(yuǎn)大于目前互聯(lián)網(wǎng)上的信息流量。

Variety(多樣)。大數(shù)據(jù)類型繁多,在編碼方式、數(shù)據(jù)格式、應(yīng)用特征等多個(gè)方面存在差異。Velocity(速率)。數(shù)據(jù)以非常高的速率到達(dá)系統(tǒng)內(nèi)部,這就要求處理數(shù)據(jù)段的速度必須非???。后來(lái),IBM公司又在3V的基礎(chǔ)上增加了Value(價(jià)值)維度來(lái)表述大數(shù)據(jù)的特點(diǎn),即大數(shù)據(jù)的數(shù)據(jù)價(jià)值密度低,因此需要從海量原始數(shù)據(jù)中進(jìn)行分析和挖掘,從形式各異的數(shù)據(jù)源中抽取富有價(jià)值的信息。大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)在各行各業(yè)的應(yīng)用越來(lái)越頻繁與深入,如:梅西百貨的實(shí)時(shí)定價(jià)機(jī)制Tipp24AG針對(duì)歐洲博彩業(yè)構(gòu)建的下注和預(yù)測(cè)平臺(tái)沃爾瑪?shù)乃阉骺觳蜆I(yè)的視頻分析PredPol和預(yù)測(cè)犯罪云計(jì)算云計(jì)算簡(jiǎn)介云交付模型云計(jì)算的優(yōu)勢(shì)與挑戰(zhàn)云計(jì)算與大數(shù)據(jù)云計(jì)算簡(jiǎn)介云計(jì)算(CloudComputing),是分布式計(jì)算技術(shù)的一種,其最基本的概念,是透過(guò)網(wǎng)絡(luò)將龐大的計(jì)算處理程序自動(dòng)分拆成無(wú)數(shù)個(gè)較小的子程序,再交由多部服務(wù)器所組成的龐大系統(tǒng)經(jīng)搜尋、計(jì)算分析之后將處理結(jié)果回傳給用戶。透過(guò)這項(xiàng)技術(shù),網(wǎng)絡(luò)服務(wù)提供者可以在數(shù)秒之內(nèi),達(dá)成處理數(shù)以千萬(wàn)計(jì)甚至億計(jì)的信息,達(dá)到和“超級(jí)計(jì)算機(jī)”同樣強(qiáng)大效能的網(wǎng)絡(luò)服務(wù)。云計(jì)算簡(jiǎn)介云計(jì)算中提供資源的網(wǎng)絡(luò)被稱為“云”?!霸啤敝械馁Y源在使用者看來(lái)是可以無(wú)限擴(kuò)展的,并且可以隨時(shí)獲取?!霸啤卑擞布Y源(服務(wù)器、存儲(chǔ)器、CPU等)和軟件資源(應(yīng)用軟件、集成開(kāi)發(fā)環(huán)境等),本地計(jì)算機(jī)只需要通過(guò)因特網(wǎng)發(fā)送一個(gè)需求信息,遠(yuǎn)端就有成千上萬(wàn)的計(jì)算機(jī)為用戶提供需要的資源并將結(jié)果返回給本地計(jì)算機(jī)。云計(jì)算簡(jiǎn)介云計(jì)算的組成可以分為六個(gè)部分,它們由下至上分別是:基礎(chǔ)設(shè)施(Infrastructure)存儲(chǔ)(Storage)平臺(tái)(Platform)應(yīng)用(Application)服務(wù)(Services)客戶端(Clients)云交付模型從用戶體驗(yàn)角度來(lái)看,云計(jì)算主要分為三種交付模型軟件即服務(wù)(SoftwareasaService,SaaS)平臺(tái)即服務(wù)(PlatformasaService,PaaS)基礎(chǔ)設(shè)施即服務(wù)(InfrastructureasaService,IaaS)云交付模型云計(jì)算的三大交付模型云交付模型軟件即服務(wù)(SaaS)SaaS是一種通過(guò)因特網(wǎng)提供軟件的模式,用戶無(wú)需購(gòu)買(mǎi)軟件,而是向提供商租用基于Web的軟件,來(lái)管理企業(yè)經(jīng)營(yíng)活動(dòng)。平臺(tái)即服務(wù)(PaaS)PaaS實(shí)際上是指將軟件研發(fā)的平臺(tái)作為一種服務(wù),以SaaS的模式提交給用戶。基礎(chǔ)設(shè)施即服務(wù)(IaaS)在IaaS模式下,服務(wù)提供商將多臺(tái)服務(wù)器組成的“云端”服務(wù)(包括內(nèi)存、I/O設(shè)備、存儲(chǔ)和計(jì)算能力等)作為計(jì)量服務(wù)提供給用戶。云交付模型除此之外,新興的容器即服務(wù)(ContainerasaService,CaaS)也稱為容器云,是以容器為資源分割和調(diào)度的基本單位,封裝整個(gè)軟件運(yùn)行時(shí)環(huán)境,為開(kāi)發(fā)者和系統(tǒng)管理員提供用于構(gòu)建、發(fā)布和運(yùn)行分布式應(yīng)用的平臺(tái)。云計(jì)算的優(yōu)勢(shì)與挑戰(zhàn)云計(jì)算具有以下優(yōu)勢(shì)超大規(guī)模虛擬化高可靠性通用性高可擴(kuò)展性按需服務(wù)極其廉價(jià)云計(jì)算的優(yōu)勢(shì)與挑戰(zhàn)云計(jì)算所面臨的挑戰(zhàn)服務(wù)的持續(xù)可用性服務(wù)的安全性服務(wù)的遷移服務(wù)的性能云計(jì)算與大數(shù)據(jù)本質(zhì)上,云計(jì)算與大數(shù)據(jù)的關(guān)系是靜與動(dòng)的關(guān)系。云計(jì)算強(qiáng)調(diào)的是計(jì)算,這是動(dòng)的概念;而數(shù)據(jù)則是計(jì)算的對(duì)象,是靜的概念。云計(jì)算為大數(shù)據(jù)提供了可以彈性擴(kuò)展、相對(duì)便宜的存儲(chǔ)空間和計(jì)算資源,使得中小企業(yè)也可以像亞馬遜公司一樣通過(guò)云計(jì)算來(lái)完成大數(shù)據(jù)分析。云計(jì)算IT資源龐大,分布較為廣泛,是異構(gòu)系統(tǒng)較多的企業(yè)及時(shí)準(zhǔn)確處理數(shù)據(jù)的有力方式,甚至是唯一方式。物聯(lián)網(wǎng)物聯(lián)網(wǎng)簡(jiǎn)介物聯(lián)網(wǎng)的應(yīng)用物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)簡(jiǎn)介物聯(lián)網(wǎng)技術(shù)的定義是:通過(guò)射頻識(shí)別(RFID)、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,按約定的協(xié)議,將任何物品與互聯(lián)網(wǎng)相連接,進(jìn)行信息交換和通訊,以實(shí)現(xiàn)智能化識(shí)別、定位、追蹤、監(jiān)控和管理的一種網(wǎng)絡(luò)技術(shù)。在物聯(lián)網(wǎng)應(yīng)用中有三項(xiàng)關(guān)鍵技術(shù)傳感器技術(shù)RFID嵌入式系統(tǒng)技術(shù)物聯(lián)網(wǎng)的應(yīng)用物聯(lián)網(wǎng)可以被用于多種多樣的領(lǐng)域,例如:農(nóng)業(yè):農(nóng)業(yè)標(biāo)準(zhǔn)化生產(chǎn)監(jiān)測(cè):、動(dòng)物標(biāo)識(shí)溯源、水文監(jiān)測(cè)工業(yè):電梯安防管理系統(tǒng)、輸配電設(shè)備監(jiān)控、遠(yuǎn)程抄表、企業(yè)一卡通服務(wù)業(yè):個(gè)人保健、智能家居、智能物流、移動(dòng)電子商務(wù)、機(jī)場(chǎng)防入侵公共事業(yè):智能交通、平安城市、城市管理、環(huán)保監(jiān)測(cè)、醫(yī)療衛(wèi)生物聯(lián)網(wǎng)的應(yīng)用智能物流系統(tǒng)物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)系統(tǒng)的安全除了包含IT系統(tǒng)的8個(gè)安全尺度(讀取控制,隱私保護(hù),用戶認(rèn)證,不可抵賴性,數(shù)據(jù)保密性,通訊層安全,數(shù)據(jù)完整性,隨時(shí)可用性),還面臨著特有的挑戰(zhàn):四大類(有線長(zhǎng)、短距離和無(wú)線長(zhǎng)、短距離)網(wǎng)路相互連接組成的異構(gòu)、多級(jí)、分布式網(wǎng)絡(luò)導(dǎo)致統(tǒng)一的安全體系難以實(shí)現(xiàn)“橋接”和過(guò)度。設(shè)備類型不一致導(dǎo)致安全信息的傳遞和處理難以統(tǒng)一設(shè)備可能無(wú)人值守,丟失,處于運(yùn)動(dòng)狀態(tài),連接可能時(shí)斷時(shí)續(xù),可信度差在保證一個(gè)智能物件要被數(shù)量龐大,甚至未知的其他設(shè)備識(shí)別和接受的同時(shí),又要同時(shí)保證其信息傳遞的安全性和隱私權(quán)。多用戶單一實(shí)例服務(wù)器的SaaS模式對(duì)安全框架的設(shè)計(jì)提出了更高的要求。 目前對(duì)于物聯(lián)網(wǎng)安全的研究和產(chǎn)品開(kāi)發(fā)仍處于起步階段。虛擬現(xiàn)實(shí)虛擬現(xiàn)實(shí)簡(jiǎn)介虛擬現(xiàn)實(shí)的應(yīng)用虛擬現(xiàn)實(shí)面臨的挑戰(zhàn)虛擬現(xiàn)實(shí)簡(jiǎn)介虛擬現(xiàn)實(shí)(VirtualReality,VR),是利用電腦模擬產(chǎn)生一個(gè)三維空間的虛擬世界,提供用戶關(guān)于視覺(jué)等感官的模擬,讓用戶感覺(jué)仿佛身歷其境,可以及時(shí)、沒(méi)有限制地觀察三維空間內(nèi)的事物。用戶進(jìn)行位置移動(dòng)時(shí),電腦可以立即進(jìn)行復(fù)雜的運(yùn)算,將精確的三維世界視頻傳回產(chǎn)生臨場(chǎng)感虛擬現(xiàn)實(shí)系統(tǒng)的基本特征可以用三個(gè)i來(lái)形容:沉浸(immersion)、交互(interaction)、構(gòu)想(imagination)虛擬現(xiàn)實(shí)簡(jiǎn)介虛擬現(xiàn)實(shí)是多種技術(shù)的綜合,其關(guān)鍵技術(shù)和研究?jī)?nèi)容包括以下幾個(gè)方面:環(huán)境建模技術(shù)立體聲合成和立體顯示技術(shù)觸覺(jué)反饋技術(shù)交互技術(shù)系統(tǒng)集成技術(shù)虛擬現(xiàn)實(shí)簡(jiǎn)介環(huán)境建模技術(shù)即虛擬環(huán)境的建立,目的是獲取實(shí)際三維環(huán)境的三維數(shù)據(jù),并根據(jù)應(yīng)用的需要,利用獲取的三維數(shù)據(jù)建立相應(yīng)的虛擬環(huán)境模型。立體聲合成和立體顯示技術(shù)在虛擬現(xiàn)實(shí)系統(tǒng)中,消除聲音的方向與用戶頭部運(yùn)動(dòng)的相關(guān)性,同時(shí)在復(fù)雜的場(chǎng)景中實(shí)時(shí)生成立體圖形。觸覺(jué)反饋技術(shù)在虛擬現(xiàn)實(shí)系統(tǒng)中,讓用戶能夠直接操作虛擬物體并感覺(jué)到虛擬物體的反作用力,從而產(chǎn)生身臨其境的感覺(jué)。虛擬現(xiàn)實(shí)簡(jiǎn)介交互技術(shù)在虛擬現(xiàn)實(shí)系統(tǒng)中,人機(jī)交互遠(yuǎn)遠(yuǎn)超出了鍵盤(pán)和鼠標(biāo)的傳統(tǒng)模式,利用數(shù)字頭盔、數(shù)字手套等復(fù)雜的傳感器設(shè)備,三位交互技術(shù)與語(yǔ)音識(shí)別、語(yǔ)音輸入技術(shù)成為重要的人機(jī)交互手段。系統(tǒng)集成技術(shù)由于虛擬現(xiàn)實(shí)系統(tǒng)中包括大量的感知信息和模型,因此系統(tǒng)的集成技術(shù)為重中之重,包括信息同步技術(shù)、模型標(biāo)定技術(shù)、數(shù)據(jù)轉(zhuǎn)換技術(shù)、識(shí)別和合成技術(shù)等。常和虛擬現(xiàn)實(shí)一同被提起的還有增強(qiáng)現(xiàn)實(shí)(AugmentedRealit

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論