云計算、大數(shù)據(jù)入門培訓(xùn)(內(nèi)部資料)_第1頁
云計算、大數(shù)據(jù)入門培訓(xùn)(內(nèi)部資料)_第2頁
云計算、大數(shù)據(jù)入門培訓(xùn)(內(nèi)部資料)_第3頁
云計算、大數(shù)據(jù)入門培訓(xùn)(內(nèi)部資料)_第4頁
云計算、大數(shù)據(jù)入門培訓(xùn)(內(nèi)部資料)_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PPT模板下載:/moban/行業(yè)PPT模板:/hangye/節(jié)日PPT模板:/jieri/PPT素材下載:/sucai/PPT背景圖片:/beijing/PPT圖表下載:/tubiao/優(yōu)秀PPT下載:/xiazai/PPT教程:/powerpoint/Word教程:/word/Excel教程:/excel/資料下載:/ziliao/PPT課件下載:/kejian/范文下載:/fanwen/試卷下載:/shiti/教案下載:/jiaoan/

云計算、大數(shù)據(jù)技術(shù)介紹4321大數(shù)據(jù)虛擬現(xiàn)實體感互動云計算你使用過云計算嗎?如果你使用過GoogleSearchEngine、Gmail、Gtalk、

GoogleDoc、百度云,那么你就是一名云計算的使用者!云計算到來的必然性和趨勢性云計算的提出2006年底Google推出了“Google101計劃”,并正式提出“云”的概念和理念。云計算是2007年末才興起的一個新名詞,在Google,IBM等公司的大力推動下逐漸進(jìn)入人們的視野。據(jù)Gartner公司——全球最具權(quán)威的IT研究與顧問咨詢公司分析師稱:2008-2012年期間,多核處理器、云計算、用戶界面、社會化網(wǎng)絡(luò)/社會化軟件和網(wǎng)絡(luò)混搭占據(jù)了改變IT前景的10大革命性技術(shù)前五名。云計算是計算能力的需求的增長云計算是隨著處理器技術(shù)、虛擬化技術(shù)、分布式存儲技術(shù)、寬帶互聯(lián)網(wǎng)技術(shù)和自動化管理技術(shù)的發(fā)展而產(chǎn)生的.這種大規(guī)模的計算能力通常是由分布式的大規(guī)模集群和服務(wù)器虛擬化軟件搭建。解決大型并行計算的問題

基于網(wǎng)絡(luò)訂購應(yīng)用和軟件的使用用類似電表計費的模式提供IT服務(wù)

在任何時間、任何地點可以訪問能動態(tài)提供的以服務(wù)為形式的IT資源軟件即服務(wù)SoftwareasaService用電模式計算UtilityComputing云計算CloudComputing網(wǎng)格計算GridComputing19902011從集中到分散再到集中全世界只需要5臺電腦就足夠了——托馬斯·沃森個人用戶的內(nèi)存只需640K足矣——比爾·蓋茨計算時代網(wǎng)絡(luò)時代云時代云計算本質(zhì)云計算是眾多新技術(shù)發(fā)展的必然趨勢是社會需求的推動(資源,成本,能源)是由需求引導(dǎo)的網(wǎng)絡(luò)環(huán)境下的各要素構(gòu)成的有機(jī)體提供了一種新的以按需租用資源的業(yè)務(wù)模式云計算SOAWeb2.0分布式計算效用計算網(wǎng)格計算業(yè)務(wù)模式創(chuàng)新虛擬化什么是云計算?云計算云計算是一種模式,它實現(xiàn)了對共享可配置計算資源(網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用和服務(wù)等)的方便、按需訪問;這些資源可以通過極小的管理代價或者與服務(wù)提供者的交互被快速地準(zhǔn)備和釋放。對于專業(yè)人員:

云計算:是分布式處理、并行處理、和網(wǎng)格計算的發(fā)展,或者說是這些計算機(jī)科學(xué)概念的商業(yè)實現(xiàn)。即把存儲于個人電腦、移動電話和其他設(shè)備上的大量信息和處理器資源集中在一起,協(xié)同工作。在極大規(guī)模上可擴(kuò)展的信息技術(shù)能力向外部客戶作為服務(wù)來提供的一種計算方式。對于用戶而言:

云計算:是一種全新網(wǎng)絡(luò)服務(wù)方式,將傳統(tǒng)的以桌面為核心的任務(wù)處理轉(zhuǎn)變?yōu)橐跃W(wǎng)絡(luò)為核心的任務(wù)處理,利用互聯(lián)網(wǎng)實現(xiàn)自己想要完成的一切處理任務(wù),使網(wǎng)絡(luò)成為傳遞服務(wù)、計算力和信息的綜合媒介,真正實現(xiàn)按需計算、多人協(xié)作。云計算特點高可靠性前所未有的計算能力數(shù)據(jù)多副本,計算節(jié)點同構(gòu)可互換等措施動態(tài)伸縮,滿足規(guī)模增長需要超大規(guī)模高可擴(kuò)展性極其廉價任意獲取相應(yīng)服務(wù)虛擬化通用性千變?nèi)f化,不針對特定應(yīng)用按需服務(wù)龐大的資源池,按需購買CloudFeatures云計算特點數(shù)據(jù)在云端:不怕丟失,不必備份,可以任意點的恢復(fù);軟件在云端:不必下載自動升級;無所不在的計算:在任何時間,任意地點,任何設(shè)備登錄后就可以進(jìn)行計算服務(wù);無限強(qiáng)大的計算:具有無限空間的,無限速度。PCC/S云計算以硬件為中心以軟件為中心以服務(wù)為中心云計算的好處買設(shè)備開發(fā)系統(tǒng)互聯(lián)網(wǎng)/局域網(wǎng)支付設(shè)備和勞動力費用用戶單一買外部服務(wù)可擴(kuò)展,有彈性,動態(tài),多用戶所用即所付通過Internet使用IFaPs(IP,HTML,HTTP)傳統(tǒng)IT模式云計算實現(xiàn)模式人機(jī)界面商業(yè)模式技術(shù)模式云計算的好處

任何一臺可以上網(wǎng)的通訊設(shè)備包括手機(jī)、PDA、上網(wǎng)本均可

降低成本全球購置計算機(jī)中,只有30%的計算能力被利用,甚至更低提高資源利用率

云端由成千上萬臺甚至更多服務(wù)器組成的集群為存儲和管理數(shù)據(jù)提供了幾乎無限大的空間和資源

用戶可以根據(jù)自己的需要或喜好定制相應(yīng)的服務(wù)、應(yīng)用及資源靈活定制動態(tài)遷移保證應(yīng)用和計算的正常進(jìn)行;在云計算服務(wù)器端提供了最可靠、最安全的數(shù)據(jù)存儲中心彈性計算和存儲能力高可靠性和安全性云計算的分類按服務(wù)類型分類云計算的分類按服務(wù)類型分類基礎(chǔ)設(shè)施云(InfrastructureCloud)為用戶提供底層的、接近于直接操作硬件資源的服務(wù)接口。平臺云(PlatformCloud)為用戶提供一個托管平臺,用戶可以將他們所開發(fā)和運營的應(yīng)用托管到云平臺中。應(yīng)用云(ApplicationCloud)為用戶提供可以直接為其所用的應(yīng)用,這些應(yīng)用一般是基于瀏覽器的,針對某一特定功能?;A(chǔ)設(shè)施即服務(wù)IaaS——InfrastructureasaService

位于云計算3層服務(wù)的最底端,把IT基礎(chǔ)設(shè)施像水、電一樣以服務(wù)的形式提供給用戶,以服務(wù)形式提供基于服務(wù)器和存儲等硬件資源的可高度擴(kuò)展和按需變化的IT能力。通常按照所消耗資源的成本進(jìn)行收費。該層提供的是基本的計算和存儲能力,以計算能力的提供為例,其提供的基本單元就是服務(wù)器,包含CPU、內(nèi)存、存儲、操作系統(tǒng)及一些軟件。

平臺即服務(wù)PaaS——PlatformasaService

PaaS位于云計算3層服務(wù)的最中間。通常也稱為"云計算操作系統(tǒng)"。它提供給終端用戶基于互聯(lián)網(wǎng)的應(yīng)用開發(fā)環(huán)境,包括應(yīng)用編程接口和運行平臺等,并且支持應(yīng)用從創(chuàng)建到運行整個生命周期所需的各種軟硬件資源和工具。通常按照用戶或登錄情況計費。在PaaS層面,服務(wù)提供商提供的是經(jīng)過封裝的IT能力,或者說是一些邏輯的資源,比如數(shù)據(jù)庫、文件系統(tǒng)和應(yīng)用運行環(huán)境等。平臺即服務(wù)SaaS——SoftwareasaService

這是最常見的云計算服務(wù),位于云計算3層服務(wù)的頂端。用戶通過標(biāo)準(zhǔn)的Web瀏覽器來使用Internet上的軟件。服務(wù)供應(yīng)商負(fù)責(zé)維護(hù)和管理軟硬件設(shè)施,并以免費(提供商可以從網(wǎng)絡(luò)廣告之類的項目中生成收入)或按需租用方式向最終用戶提供服務(wù)。這類服務(wù)既有面向普通用戶的,諸如GoogleCalendar和Gmail;也有直接面向企業(yè)團(tuán)體的,用以幫助處理工資單流程、人力資源管理、協(xié)作、客戶關(guān)系管理和業(yè)務(wù)合作伙伴關(guān)系管理等。這些SaaS提供的應(yīng)用程序減少了客戶安裝和維護(hù)軟件的時間和技能等代價,并且可以通過按使用付費的方式來減少軟件許可證費用的支出。云計算的一些術(shù)語、概念NO.1公有云、私有云簡單來說,云服務(wù)可以將企業(yè)所需的軟硬件、資料都放到網(wǎng)絡(luò)上,在任何時間、地點,使用不同的IT設(shè)備互相連接,實現(xiàn)數(shù)據(jù)存取、運算等目的。當(dāng)前,常見的云服務(wù)有公共云(PublicCloud)與私有云(PrivateCloud)兩種。與公有云相比,私有云的特點安全;私有云的服務(wù)對象被限制在企業(yè)內(nèi)部,因此私有云的建設(shè)、運營和使用都是在企業(yè)內(nèi)部完成,對外不提供公開接口,因此會相對安全。成本固定;云環(huán)境中通常是根據(jù)每單元存儲收費的。用戶只需根據(jù)服務(wù)水平協(xié)議對實際使用的部分付費,而不是根據(jù)分配的空間或者某一個標(biāo)準(zhǔn)??捎眯裕辉谟脩粜枰臅r候,空間需要能夠被及時分配,并且要求能在使用完后及時的收回。服務(wù)質(zhì)量;需要有詳細(xì)的服務(wù)水平描述并嚴(yán)格參照執(zhí)行??珊饬康臉?biāo)準(zhǔn)可以用于定義用戶能得到怎樣的響應(yīng)時間、恢復(fù)時間以及活動時間的支持。NO.2云安全云安全(CloudSecurity)是一個從“云計算”演變而來的新名詞。云安全的策略構(gòu)想是:使用者越多,每個使用者就越安全,因為如此龐大的用戶群,足以覆蓋互聯(lián)網(wǎng)的每個角落,只要某個網(wǎng)站被掛馬或某個新木馬病毒出現(xiàn),就會立刻被截獲?!霸瓢踩蓖ㄟ^網(wǎng)狀的大量客戶端對網(wǎng)絡(luò)中軟件行為的異常監(jiān)測,獲取互聯(lián)網(wǎng)中木馬、惡意程序的最新信息,推送到Server端進(jìn)行自動分析和處理,再把病毒和木馬的解決方案分發(fā)到每一個客戶端。NO.3云存儲云存儲是在云計算(cloudcomputing)概念上延伸和發(fā)展出來的一個新的概念,是指通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)。當(dāng)云計算系統(tǒng)運算和處理的核心是大量數(shù)據(jù)的存儲和管理時,云計算系統(tǒng)中就需要配置大量的存儲設(shè)備,那么云計算系統(tǒng)就轉(zhuǎn)變成為一個云存儲系統(tǒng),所以云存儲是一個以數(shù)據(jù)存儲和管理為核心的云計算系統(tǒng)。目前做云存儲的國內(nèi)有聯(lián)想網(wǎng)盤、百度云盤、360云盤、微云盤等。NO.4OpenStack和CloudStack對比常見的IaaS開源平臺有OpenStack、CloudStack、Eucalyptus和OpenNebula,公開的現(xiàn)狀報告和社區(qū)分析顯示,OpenStack和CloudStack的在企業(yè)接受度和社區(qū)的發(fā)展情況已經(jīng)遠(yuǎn)遠(yuǎn)超越另外兩者。OpenStack由NASA和Rackspace公司在2010年聯(lián)合發(fā)布,兩者分別貢獻(xiàn)計算代碼(Nova)和存儲代碼(Swift),以Apache許可協(xié)議進(jìn)行授權(quán)。OpenStack的目標(biāo)是提供一個既可以用來建設(shè)公有云也能建設(shè)私有云的通用的開源云計算平臺,而且做到云平臺的搭建盡量的簡單方便,同時能夠快速的橫向擴(kuò)展。OpenStack獨立于任何企業(yè),遵循開源、開放設(shè)計、開放開發(fā)流程和開放社區(qū)的理念,完全由社區(qū)主導(dǎo)和維護(hù)。OpenStack的發(fā)布周期是半年,到目前為止已經(jīng)發(fā)布9個正式版本,最新的版本是OpenStackIcehouse(2014年4月17日),在每個版本發(fā)布之后社區(qū)都會舉行一次峰會,來自世界各地的公司和開發(fā)者一起討論下一個版本的設(shè)計,同時進(jìn)行OpenStack相關(guān)的技術(shù)分享。CloudStack最初由C公司開發(fā),分為商業(yè)和開源兩個版本,開源版本通過GPLv3(GNUGeneralPublicLicense,version3)許可協(xié)議進(jìn)行授權(quán),Citrix(思杰)公司在2011年收購C后,將全部代碼開源,并在2012年將CloudStack貢獻(xiàn)給Apache軟件基金會,成為Apache的孵化項目,同時將授權(quán)協(xié)議改為更加寬松開放和商業(yè)友好的Apache許可協(xié)議,CloudStack在2013年3月份升級為Apache的正式項目。CloudStack的目標(biāo)是提供高度可用的、高度可擴(kuò)展的能夠進(jìn)行大規(guī)模虛擬機(jī)部署和管理的開放云平臺。CloudStack的發(fā)布周期并不固定,目前最新的版本是5.0,社區(qū)每年會舉行一次全球協(xié)作會議(CloudStackCollaborationConference)進(jìn)行技術(shù)分享和交流。

OpenStackCloudStack授權(quán)協(xié)議Apache2.0,可以免費商用Apache2.0,可以免費商用虛擬化技術(shù)XenServer/XCP,KVM,QEMU,

LXC,VMware

ESXi/vCenter,Hyper-VBaremetal,Docker,Xen/LibvirtXenServer,KVM,QEMU,

VMwarevCenter,LXC網(wǎng)絡(luò)服務(wù)VLAN,Flat,FlatDHCP

Quantum虛擬化網(wǎng)絡(luò)VLAN,Flat,OpenFlow存儲支持iSCSI,Ceph,NFS,LVM,Swift,SheepdogNFS,LVM,Ceph,Swift調(diào)度策略模型全面,易擴(kuò)展模型簡單,可擴(kuò)展用戶界面功能完善,界面簡單功能完善,界面友好數(shù)據(jù)庫PostgreSQL,MySQL,SQLiteMySQL虛擬機(jī)模板支持支持組件Nova,Glance,Keystone,

Horizon,Swift,Cinder,

Quantum,Heat,CeilometerConsoleProxyVM,

SecondStorageVM,

VirtualRouterVM,

HostAgent,ManagementServer開發(fā)主導(dǎo)開源社區(qū)Citrix公司開發(fā)語言PythonJava官方文檔非常詳細(xì)詳細(xì)版本問題存在版本兼容性問題不存在版本兼容性問題用戶群160家左右,包括NASA、

RedHat、Rackspace、HP、

網(wǎng)易、UnitedStack等不到60家,包括諾基亞、

日本電話電報公司Zynga、

阿爾卡特、迪斯尼等大唐移動云計算平臺架構(gòu)云計算在中小型企業(yè)中的實際應(yīng)用隨著企業(yè)的發(fā)展和競爭逐漸加劇,傳統(tǒng)的IT管理模式在時效性和靈活性上已不能滿足日新月異的市場需求,客觀上需要一種靈活、動態(tài)的,能夠為企業(yè)提供實時支持的IT管理模式。

多數(shù)企業(yè)特別是中小型企業(yè)在信息化過程中面臨一下幾點問題:昂貴的基礎(chǔ)設(shè)施建設(shè)持續(xù)不斷的維護(hù)成本平臺運行過程中的各種問題

問題1——昂貴的基礎(chǔ)設(shè)施建設(shè)昂貴的基礎(chǔ)設(shè)施建設(shè),使企業(yè)無法承擔(dān)由此帶來的風(fēng)險,使得企業(yè)信息化建設(shè)可望而不可及需要搭建企業(yè)內(nèi)部的網(wǎng)絡(luò),如果是跨區(qū)域的公司,還需要搭建獨立的外網(wǎng)系統(tǒng)購買符合公司個性化的信息管理軟件1、購買服務(wù)器硬件2、購買操作系統(tǒng)及數(shù)據(jù)庫服務(wù)系統(tǒng)問題2——持續(xù)不斷的維護(hù)成本1、服務(wù)器硬件定期檢修2、操作系統(tǒng)及數(shù)據(jù)庫服務(wù)系統(tǒng)定期檢修3、服務(wù)器性能監(jiān)控4、服務(wù)器故障排查

1、服務(wù)器網(wǎng)絡(luò)流量監(jiān)測2、服務(wù)器網(wǎng)絡(luò)安全檢測3、服務(wù)器網(wǎng)絡(luò)故障排查及修復(fù)

1、軟件升級2、軟件功能完善3、軟件BUG修復(fù)

信息化平臺的維護(hù)不但需要維持不斷變化的成本,也需要有IT技術(shù)專業(yè)人員的投入,這往往是中小企業(yè)不具備的問題3——平臺運維中的各種問題突然斷電、服務(wù)器過熱、服務(wù)器故障、網(wǎng)絡(luò)狀態(tài)等都會影響到信息平臺的穩(wěn)定性信息平臺的不穩(wěn)定直接關(guān)系到其可用性,如可用性受到影響,則企業(yè)日常業(yè)務(wù)將會受到嚴(yán)重影響包括數(shù)據(jù)安全性與網(wǎng)絡(luò)安全性;由于缺乏有效的安全維護(hù)計劃及措施,使得企業(yè)數(shù)據(jù)都裸露在外,企業(yè)信息毫無安全性可言隨著企業(yè)不斷發(fā)展,而差擴(kuò)展性的信息化平臺,再加上維護(hù)跟不上,使得企業(yè)當(dāng)前的信息平臺將會成為企業(yè)發(fā)展的絆腳石不穩(wěn)定、不可用、不安全及差擴(kuò)展,這些問題最終使得企業(yè)信息化平臺“天折”問題3——平臺運維中的各種問題突然斷電、服務(wù)器過熱、服務(wù)器故障、網(wǎng)絡(luò)狀態(tài)等都會影響到信息平臺的穩(wěn)定性信息平臺的不穩(wěn)定直接關(guān)系到其可用性,如可用性受到影響,則企業(yè)日常業(yè)務(wù)將會受到嚴(yán)重影響包括數(shù)據(jù)安全性與網(wǎng)絡(luò)安全性;由于缺乏有效的安全維護(hù)計劃及措施,使得企業(yè)數(shù)據(jù)都裸露在外,企業(yè)信息毫無安全性可言隨著企業(yè)不斷發(fā)展,而差擴(kuò)展性的信息化平臺,再加上維護(hù)跟不上,使得企業(yè)當(dāng)前的信息平臺將會成為企業(yè)發(fā)展的絆腳石不穩(wěn)定、不可用、不安全及差擴(kuò)展,這些問題最終使得企業(yè)信息化平臺“天折”實際案例—西湖云計算服務(wù)平臺

根據(jù)文件精神和對西湖區(qū)電子商務(wù)產(chǎn)業(yè)發(fā)展現(xiàn)狀的分析,為促進(jìn)西湖區(qū)電子商務(wù)產(chǎn)業(yè)健康持續(xù)快速發(fā)展,打造全國電子商務(wù)中心的核心區(qū),2010年9月文三路電子信息街區(qū)管委會與浙江工商大學(xué)、東華大學(xué)、上海聯(lián)合電子商務(wù)研究所、IBM中國開發(fā)中心開始共同推進(jìn)電子商務(wù)行業(yè)云計算公共服務(wù)平臺建設(shè)。

大數(shù)據(jù)基礎(chǔ)知識介紹數(shù)據(jù)的前世今生4step2step1step紙質(zhì)數(shù)據(jù)文件系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘大數(shù)據(jù)時代3step5step數(shù)據(jù)庫管理系統(tǒng)常見的數(shù)據(jù)庫管理系統(tǒng)MySQL、ORACLE、ACCESS、VisualFoxpro、MSSQLServerInformix、PostgreSQL、SYBASE、DB2數(shù)據(jù)倉庫和數(shù)據(jù)挖掘數(shù)據(jù)庫數(shù)據(jù)倉庫不可知的價值提取數(shù)據(jù)數(shù)據(jù)挖掘

示例:“尿布與啤酒”的故事總部位于美國阿肯色州的世界著名商業(yè)零售連鎖企業(yè)沃爾瑪(Wal

Mart)擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng)。為了能夠準(zhǔn)確了解顧客在其門店的購買習(xí)慣,沃爾瑪利對其顧客的購物行為進(jìn)行購物籃分析,想知道顧客經(jīng)常一起購買的商品有哪些。沃爾瑪數(shù)據(jù)倉庫里集中了其各門店的詳細(xì)原始交易數(shù)據(jù)。在這些原始交易數(shù)據(jù)的基礎(chǔ)上,沃爾瑪利用NCR數(shù)據(jù)挖掘工具對這些數(shù)據(jù)進(jìn)行分析和挖掘。一個意外的發(fā)現(xiàn)是:“跟尿布一起購買最多的商品竟是啤酒!”

這是數(shù)據(jù)挖掘技術(shù)對歷史數(shù)據(jù)進(jìn)行分析的結(jié)果,反映數(shù)據(jù)內(nèi)在的規(guī)律。那么這個結(jié)果符合現(xiàn)實情況嗎?是否是一個有用的知識?是否有利用價值?

于是,沃爾瑪派出市場調(diào)查人員和分析師對這一數(shù)據(jù)挖掘結(jié)果進(jìn)行調(diào)查分析。經(jīng)過大量實際調(diào)查和分析,揭示了一個隱藏在"尿布與啤酒"背后的美國人的一種行為模式:在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%

~40%的人同時也為自己買一些啤酒。產(chǎn)生這一現(xiàn)象的原因是:美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。

既然尿布與啤酒一起被購買的機(jī)會很多,于是沃爾瑪就在其一個個門店將尿布與啤酒并排擺放在一起,結(jié)果是尿布與啤酒的銷售量雙雙增長。

按常規(guī)思維,尿布與啤酒風(fēng)馬牛不相及,若不是借助數(shù)據(jù)挖掘技術(shù)對大量交易數(shù)據(jù)進(jìn)行挖掘分析,沃爾瑪是不可能發(fā)現(xiàn)數(shù)據(jù)內(nèi)在這一有價值的規(guī)律的。

大數(shù)據(jù)的特征數(shù)據(jù)量大(Volume)

大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。類型繁多(Variety)

包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等等,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。價值密度低(Value)速度快時效高(Velocity)

處理速度快,時效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。密不可分的大數(shù)據(jù)與云計算商業(yè)模式驅(qū)動應(yīng)用需求驅(qū)動云計算本身也是大數(shù)據(jù)的一種業(yè)務(wù)模式大數(shù)據(jù)是落地的云云計算的模式是業(yè)務(wù)模式,本質(zhì)是數(shù)據(jù)處理技術(shù)。數(shù)據(jù)是資產(chǎn),云為數(shù)據(jù)資產(chǎn)提供存儲、訪問和計算。當(dāng)前云計算更偏重海量存儲和計算,以及提供的云服務(wù),運行云應(yīng)用,但是缺乏盤活數(shù)據(jù)資產(chǎn)的能力,挖掘價值性信息和預(yù)測性分析,為國家、企業(yè)、個人提供決策和服務(wù),是大數(shù)據(jù)核心議題,也是云計算的最終方向。一些相關(guān)技術(shù)分析技術(shù):數(shù)據(jù)處理:自然語言處理技術(shù)統(tǒng)計和分析:A/Btest;topN排行榜;地域占比;文本情感分析數(shù)據(jù)挖掘:關(guān)聯(lián)規(guī)則分析;分類;聚類模型預(yù)測:預(yù)測模型;機(jī)器學(xué)習(xí);建模仿真大數(shù)據(jù)技術(shù):數(shù)據(jù)采集:ETL工具數(shù)據(jù)存?。宏P(guān)系數(shù)據(jù)庫;NoSQL;SQL等基礎(chǔ)架構(gòu)支持:云存儲;分布式文件系統(tǒng)等計算結(jié)果展現(xiàn):云計算;標(biāo)簽云;關(guān)系圖等存儲結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論