




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、20*年大數(shù)據(jù)的10大開展趨勢如今,人們尋求獲得更多的數(shù)據(jù)有著充分的理由,因為 數(shù)據(jù)分析推動了數(shù)字創(chuàng)新。然而,將這些龐大的數(shù)據(jù)集轉化 為可操作的洞察力仍然是一個難題。而那些獲得應對強大數(shù) 據(jù)挑戰(zhàn)的解決方案的組織將能夠更好地從數(shù)字創(chuàng)新的成果 中獲得經(jīng)濟利益??紤]到這個基本前提,以下是組織在20*年應該關注的 大數(shù)據(jù)的10個開展趨勢:.數(shù)據(jù)管理仍然很難大數(shù)據(jù)分析有著相當明確的重要思想:找到隱藏在大量 數(shù)據(jù)中的信息模式,訓練機器學習模型以發(fā)現(xiàn)這些模式,并 將這些模型實施到生產(chǎn)中以自動對其開展操作。需要清理數(shù) 據(jù),并在必要時開展重復。然而,將這些數(shù)據(jù)投入生產(chǎn)的現(xiàn)實要比看上去困難得多。 對于初學者來說,
2、收集來自不同孤島的數(shù)據(jù)很困難,需要提 取、轉換和加載(ETL)和數(shù)據(jù)庫技能。清理和標記機器學習 培訓的數(shù)據(jù)也需要花費大量的時間和費用,特別是在使用深 度學習技術時。此外,以平安可靠的方式將這樣的系統(tǒng)大規(guī) 模投入生產(chǎn)需要另外一套技能。出于這些原因,數(shù)據(jù)管理仍然是一個巨大的挑戰(zhàn),數(shù)據(jù) 工程師將繼續(xù)成為大數(shù)據(jù)團隊中受歡迎的角色之一。.數(shù)據(jù)孤島繼續(xù)激增這個預測并不困難。在五年前的hadoop開發(fā)熱潮中,人們認為可以將所有數(shù)據(jù)(包括分析和事務工作負載)整合 到一個平臺上。出于各種原因,這個想法從未真正實現(xiàn)過。其面臨的挑 戰(zhàn)是不同的數(shù)據(jù)類型具有不同的存儲要求。關系數(shù)據(jù)庫、圖 形數(shù)據(jù)庫、時間序列數(shù)據(jù)庫、HD
3、F和對象存儲都有各自的優(yōu) 缺點。如果開發(fā)人員將所有數(shù)據(jù)塞進一個適合所有數(shù)據(jù)的數(shù) 據(jù)湖中,他們就無法大限度地發(fā)揮其優(yōu)勢。在某些情況下,將大量數(shù)據(jù)集中到一個地方確實有意義。 例如,像S3這樣的云數(shù)據(jù)存儲庫為企業(yè)提供了靈活且經(jīng)濟 高效的存儲,而Hadoop仍然是非構造化數(shù)據(jù)存儲和分析的 經(jīng)濟高效的存儲。但對于大多數(shù)公司而言,這些只是必須管 理的額外孤島。當然,它們是重要的孤島,但它們不是唯一 的。而在缺乏強大集權的情況下,數(shù)據(jù)倉庫將會繼續(xù)激增。.流媒體分析的突破性的一年組織處理新數(shù)據(jù)越快,業(yè)務開展就會越好。這是實時分 析或流式分析背后的推動力。但組織一直面臨的挑戰(zhàn)是要真 正做到這一點非常困難,而且本
4、錢也很高,但隨著組織的分 析團隊的成熟和技術的進步,這種情況正在發(fā)生變化。NewSQL數(shù)據(jù)庫、內存數(shù)據(jù)網(wǎng)格和專用流分析平臺圍繞通 用功能開展融合,這需要對輸入數(shù)據(jù)開展超快處理,通常使 用機器學習模型來自動化決策。將它與Kafka. Spark和Fl ink等開源流式框架中的SQL 功能相結合,組織就可以在20*年獲得真正的進步。.數(shù)據(jù)治理不善將帶來風險有些人將數(shù)據(jù)稱之為“新石油”,也被稱為“新貨幣”。 無論是什么樣的比喻,大家都認為數(shù)據(jù)具有價值,并且如果 對此不重視將會帶來更大的風險。歐盟通過去年公布的GDPR法規(guī)說明了數(shù)據(jù)治理不善的 財務后果。雖然美國還沒有類似的法律,但美國公司仍然必 須遵
5、守由美國聯(lián)邦、各州等創(chuàng)立的80個不同的數(shù)據(jù)制授權 法規(guī)。數(shù)據(jù)泄露正在引發(fā)問題。根據(jù)Harris Poll公司開展的 一項在線調查,20*年有近6000萬美國人受到身份盜竊的 影響。這比20*年增長了 300%,當時只有1500萬人表示受 到了影響。大多數(shù)組織已經(jīng)意識到無序開展的大數(shù)據(jù)時代即將完 畢。而很多國家和地區(qū)的政府對數(shù)據(jù)濫用或隱私泄露行為不 再容忍。.隨著技術的開展,技能也在轉變人力資源通常是大數(shù)據(jù)工程中的較大本錢,因為工作人 員最終構建并運行大數(shù)據(jù)工程,并使其發(fā)揮作用。無論使用 何種技術,找到具有合適技能的人員對于將數(shù)據(jù)轉化為洞察 力很重要。而隨著技術的進步,技能組合也是如此。在20*
6、年,人 們可以看到企業(yè)對于神經(jīng)網(wǎng)絡專業(yè)人才的巨大需求。在數(shù)據(jù) 科學家(而不是人工智能專家)的技能中,Python仍然在語言 中占主導地位,盡管對于R、SAS、Matlab、Scala、Java和C等語言還有很多工作要做。隨著數(shù)據(jù)治理計劃的啟動,對數(shù)據(jù)管理人員的需求將會 增加。能夠使用核心工具(數(shù)據(jù)庫、Spark Airflow等)的數(shù) 據(jù)工程師將繼續(xù)看到他們的時機增長。人們還可以看到企業(yè) 對機器學習工程師的需求加速增長。然而,由于自動化數(shù)據(jù)科學平臺的進步和開展,組織的 一些工作可以通過數(shù)據(jù)分析師或“公民數(shù)據(jù)科學家”來完成, 因為眾所周知,數(shù)據(jù)和業(yè)務的知識和技能可能會讓組織在大 數(shù)據(jù)道路上走得更
7、遠,而不是統(tǒng)計和編程。.深度學習變得更加深入深度學習的開展為人工智能的應用提供了更多的動力, 在20*年沒有任何減緩的跡象。組織將繼續(xù)嘗試深度學習框 架,如 TensorFlow、Caffe、Keras、PyTorch 和 MXnet,以 期將大量數(shù)據(jù)集實現(xiàn)貨幣化。組織將擴展深度學習,超越其最初的用例,如計算機視 覺和自然語言處理(NLP),并找到實現(xiàn)強大技術的新的和創(chuàng) 造性的方法。大型金融機構已經(jīng)發(fā)現(xiàn)神經(jīng)網(wǎng)絡算法比“傳統(tǒng)” 機器學習方法更能發(fā)現(xiàn)欺詐行為,并且將在20*年繼續(xù)探索 新的用例。這也將支持對GPU的需求,GPU是培訓深度學習模型的 首選處理器。目前還不清楚是否有新的處理器類型,包括
8、 ASIC、TPU和FPGA。但是,顯然還需要更快的培訓和推理。然而,深度學習生態(tài)系統(tǒng)將保持相對年輕,缺乏通用平 臺將使其成為真正專家的領域。. “Special K” 擴大 了足跡軟件需要運行一些東西。用于提供通用根底的操作系統(tǒng), 但現(xiàn)在開發(fā)人員的目標要低一點:KubernetesoKubernetes由Google公司開發(fā),用于管理和協(xié)調云中 的虛擬化Linux容器,在IT行業(yè)中,它已成為大數(shù)據(jù)生態(tài) 系統(tǒng)中熱門的技術之一。隨著多云和混合部署變得越來越普 遍,Kubernetes就是將它們整合在一起的粘合劑。以前編寫Hadoop上運行的軟件的大數(shù)據(jù)軟件供給商現(xiàn) 在正在編寫Kubernetes
9、上運行的軟件,這至少讓他們進入 了前臺。支持Kubernetes軟件已經(jīng)成為軟件供給商(包括 Hadoop供給商)的需求。.難以忽略的云計算云計算的規(guī)模越來越大。20*年,全球三大公共云供給 商的業(yè)務增長率接近50%o云計算供給商提供了一系列大數(shù) 據(jù)工具和技術,更不用說用于存儲所有數(shù)據(jù)的廉價存儲,因 此用戶很難抵御云計算的誘惑。20*年,小型企業(yè)和初創(chuàng)企業(yè)將被主要的公共云提供商 提供的服務所吸引,這些云計算提供商正在投入巨資建設隨 時可運行的大數(shù)據(jù)平臺,提供自動化機器學習、分析數(shù)據(jù)庫 和實時流分析服務。即使本錢方面并不那么吸引人,大型企業(yè)也難以抗拒云 計算所帶來的好處。然而,將業(yè)務鎖定在單一云
10、計算供給商, 這讓大型企業(yè)擔憂面臨將所有雞蛋放在一個籃子中的風險。.新技術將會出現(xiàn)當今推動創(chuàng)新的許多主要大數(shù)據(jù)框架和數(shù)據(jù)庫都是由 全球網(wǎng)絡巨頭創(chuàng)立的,并作為開源應用發(fā)布。好消息是可能 將加快技術創(chuàng)新。在20*年,大數(shù)據(jù)從業(yè)者在他們的創(chuàng)作中會盡可能保持 靈活性。雖然出于性能原因,將應用程序綁定到某項技術可 能會很有誘惑力,但是當更好、更快地出現(xiàn)這種情況時,這 可能會讓組織感到困擾。盡可能多地保持應用程序“松散耦合但嚴密集成“,因 為最終必須將其拆分并重新構建。.智能設備無處不在如今,智能設備無處不在,并且不斷收集數(shù)據(jù)。而在消 費者需求的推動下,智能設備正以驚人的速度增長。智能設 備生態(tài)系統(tǒng)正在亞馬遜Alexa和谷歌智能助理兩大領先平臺 上嶄露頭角,為消費者提供了將遠程訪
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鏟車裝費合同范本
- 餐飲 委托加工合同范本
- 加工車間用工合同范本
- 村鎮(zhèn)門面出售合同范本
- 匡威加盟合同范本
- 家鄉(xiāng)傳統(tǒng)美食展-六年級語文下冊一單元《臘八粥》任務型教學設計
- 合肥新房投資合同范本
- 2025合同范本電子產(chǎn)品購銷合同
- 2025合同范本之辦公樓租賃合同租戶版
- 2025版助學貸款合同示范文本
- 古法拓印(非遺課程)
- 2024年武漢市第五醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 十個一護理服務心得體會
- 2025年民航華北空管局招聘筆試參考題庫含答案解析
- 裝配式建筑 構件生產(chǎn)與施工-預制墻板的套筒灌53課件講解
- 《高原地區(qū) 無人機預警系統(tǒng)基本要求》
- 《癱瘓的類型及病因》課件
- 【MOOC】生命的教育-浙江大學 中國大學慕課MOOC答案
- (2024年更新)國家慢性疾病編碼新目錄
- 醫(yī)院培訓課件:《醫(yī)患溝通技巧》
- 治療室物品分類擺放
評論
0/150
提交評論