大數(shù)據(jù)倉庫建設(shè)方案設(shè)計(jì)_第1頁
大數(shù)據(jù)倉庫建設(shè)方案設(shè)計(jì)_第2頁
大數(shù)據(jù)倉庫建設(shè)方案設(shè)計(jì)_第3頁
大數(shù)據(jù)倉庫建設(shè)方案設(shè)計(jì)_第4頁
大數(shù)據(jù)倉庫建設(shè)方案設(shè)計(jì)_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余29頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 1 章數(shù)據(jù)倉庫建設(shè)1.1 數(shù)據(jù)倉庫總體架構(gòu)專家系統(tǒng)接收增購項(xiàng)目車輛 TCMSTCMS 或其他子系統(tǒng)通過車地通信傳輸?shù)膶?shí)時(shí)或離線數(shù)據(jù),經(jīng)過一系列綜合診斷分析,以各種報(bào)表圖形或信息推送的形式向用戶展示分析結(jié)果。針對(duì)診斷出的車輛故障將給出專家建議處理措施,為車輛的故障根因修復(fù)提供必要的支持。根據(jù)專家系統(tǒng)數(shù)據(jù)倉庫建設(shè)目標(biāo),結(jié)合系統(tǒng)數(shù)據(jù)業(yè)務(wù)規(guī)范,包括數(shù)據(jù)采集頻率數(shù)據(jù)采集量等相關(guān)因素,設(shè)計(jì)專家系統(tǒng)數(shù)據(jù)倉庫架構(gòu)如下:數(shù)據(jù)倉庫架構(gòu)從層次結(jié)構(gòu)上分為數(shù)據(jù)采集、數(shù)據(jù)存、數(shù)據(jù)分析、數(shù)據(jù)服務(wù)等幾個(gè)方面的內(nèi)容:數(shù)據(jù)采集:負(fù)責(zé)從各業(yè)務(wù)自系統(tǒng)中匯集信息數(shù)據(jù),系統(tǒng)支撐 KafkaKafka、StormStorm、Flume

2、Flume 及傳統(tǒng)的 ETLETL 采集工具。數(shù)據(jù)存儲(chǔ):本系統(tǒng)提供 HdfsHdfs、HbaseHbase 及 RDBMSRDBMS 結(jié)合的存儲(chǔ)模式,支持海量數(shù)據(jù)的分布式存庫區(qū)ORkl安線范王繇健審評(píng)佑監(jiān)海相星J:0C/QDEC曝汴樓口機(jī),學(xué)習(xí)UDFOLAPSQLISE后 M 百溝寧云好白數(shù)據(jù)百里儲(chǔ)。數(shù)據(jù)分析:數(shù)據(jù)倉庫體系支持傳統(tǒng)的 OLAPOLAP 分析及基于 SparkSpark 常規(guī)機(jī)器學(xué)習(xí)算法。數(shù)據(jù)服務(wù)總線:數(shù)據(jù)系統(tǒng)提供數(shù)據(jù)服務(wù)總線服務(wù),實(shí)現(xiàn)對(duì)數(shù)據(jù)資源的統(tǒng)一管理和調(diào)度,并對(duì)外提供數(shù)據(jù)服務(wù)。1.2 數(shù)據(jù)采集專家系統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)采集包括兩個(gè)部分內(nèi)容:外部數(shù)據(jù)匯集、內(nèi)部各層數(shù)據(jù)的提取與加載。

3、 外部數(shù)據(jù)匯集是指從 TCMSTCMS 車載子系統(tǒng)等外部信息系統(tǒng)匯集數(shù)據(jù)到專家數(shù)據(jù)倉庫的操作型存儲(chǔ)層(ODSODS;內(nèi)部各層數(shù)據(jù)的提取與加載是指數(shù)據(jù)倉庫各存儲(chǔ)層間的數(shù)據(jù)提取、轉(zhuǎn)換與加載。1.2.1外部數(shù)據(jù)匯集專家數(shù)據(jù)倉庫數(shù)據(jù)源包括列車監(jiān)控與檢測(cè)系統(tǒng)(TCMSTCMS、車載子系統(tǒng)等相關(guān)子系統(tǒng),數(shù)據(jù)采集的內(nèi)容分為實(shí)時(shí)數(shù)據(jù)采集和定時(shí)數(shù)據(jù)采集兩大類, 實(shí)時(shí)數(shù)據(jù)采集主要對(duì)于各項(xiàng)檢測(cè)指標(biāo)數(shù)據(jù);非實(shí)時(shí)采集包括日檢修數(shù)據(jù)等。根據(jù)項(xiàng)目信息匯集要求,列車指標(biāo)信息采集具有采集數(shù)據(jù)量大,采集頻率高的特點(diǎn),考慮到系統(tǒng)后期的擴(kuò)展,因此在數(shù)據(jù)數(shù)據(jù)采集方面,要求采集體系支持高吞吐量、高頻率、海量數(shù)據(jù)采集,同時(shí)系統(tǒng)應(yīng)該靈活可配

4、置,可根據(jù)業(yè)務(wù)的需要進(jìn)行靈活配置橫向擴(kuò)展。本方案在數(shù)據(jù)采集架構(gòu)采用 Flume+Kafka+StormFlume+Kafka+Storm 的組合架構(gòu),采用 FlumeFlume 和 ETLETL 工具作為KafkaKafka 的 ProducerProducer, ,采用 StormStorm 作為 KafkaKafka 的 Consumer;StormConsumer;Storm 可實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的實(shí)時(shí)處理,及時(shí)對(duì)問題指標(biāo)進(jìn)行預(yù)警。具體采集系統(tǒng)技術(shù)結(jié)構(gòu)圖如下:1.2.1.1數(shù)據(jù)匯集架構(gòu)功能FlumeFlume 提供了從 consoleconsole (控制臺(tái)) 、 RPCRPC (Thrif

5、t-RPCThrift-RPC) 、 texttext (文件) 、 tailtail (UNIXtailUNIXtail) 、syslogsyslog(syslogsyslog 日志系統(tǒng),支持 TCTC 可口 UDUD 將 2 2 種模式),execexec(命令執(zhí)行)等數(shù)據(jù)源上收集數(shù)據(jù)的能力。FlumeFlume 的數(shù)據(jù)接受方,可以是 consoleconsole(控制臺(tái))、texttext(文件)、dfsdfs(HDFSHDFS 文件)、RPCRPC(Thrift-RPCThrift-RPC)和 syslogTCPsyslogTCP(TCPsyslogTCPsyslog 日志系統(tǒng))等。在

6、我們系統(tǒng)中由 kafkakafka 來接收。KafkaKafka 分布式消息隊(duì)列,支撐系統(tǒng)性能橫向擴(kuò)展,通過增加 brokerbroker 來提高系統(tǒng)的性能。StormStorm 流處理技術(shù),支撐Supervisor橫向擴(kuò)展以提高系統(tǒng)的擴(kuò)展性和數(shù)據(jù)處理的實(shí)時(shí)性。1.2.1.2采集架構(gòu)優(yōu)勢(shì)(一)解耦在項(xiàng)目中要平衡數(shù)據(jù)的匯集與數(shù)據(jù)的處理性能平衡,是極其困難的。消息隊(duì)列在處理過程中間插入了一個(gè)隱含的、基于數(shù)據(jù)的接口層,兩邊的處理過程都要實(shí)現(xiàn)這一接口。這允許你獨(dú)立的擴(kuò)展或修改兩邊的處理過程,只要確保它們遵守同樣的接口約束。?冗余有些情況下,處理數(shù)據(jù)的過程會(huì)失敗。除非數(shù)據(jù)被持久化,否則將造成丟失。消息隊(duì)

7、列把數(shù)據(jù)進(jìn)行持久化直到它們已經(jīng)被完全處理,通過這一方式規(guī)避了數(shù)據(jù)丟失風(fēng)險(xiǎn)。在被許多消息隊(duì)列所采用的“插入-獲取-刪除”范式中,在把一個(gè)消息從隊(duì)列中刪除之前,需要你的處理過程明確的指出該消息已經(jīng)被處理完畢, 確保你的數(shù)據(jù)被安全的保存直到你使用完producerKitfkaFlum=BrokerDroxerBrokerll&docpHEs”HdfsCansimcr畢。?擴(kuò)展性因?yàn)橄㈥?duì)列解耦了你的處理過程,所以增大消息入隊(duì)和處理的頻率是很容易的;只要另外增加處理過程即可。不需要改變代碼、不需要調(diào)節(jié)參數(shù)。擴(kuò)展就像調(diào)大電力按鈕一樣簡(jiǎn)單。?靈活性&峰值處理能力在訪問量劇增的情況下,應(yīng)用仍然需要繼續(xù)發(fā)揮作

8、用,但是這樣的突發(fā)流量并不常見;如果為以能處理這類峰值訪問為標(biāo)準(zhǔn)來投入資源隨時(shí)待命無疑是巨大的浪費(fèi)。 使用消息隊(duì)列能夠使關(guān)鍵組件頂住突發(fā)的訪問壓力,而不會(huì)因?yàn)橥话l(fā)的超負(fù)荷的請(qǐng)求而完全崩潰。?可恢復(fù)性當(dāng)體系的一部分組件失效,不會(huì)影響到整個(gè)系統(tǒng)。消息隊(duì)列降低了進(jìn)程間的耦合度,所以即使一個(gè)處理消息的進(jìn)程掛掉,加入隊(duì)列中的消息仍然可以在系統(tǒng)恢復(fù)后被處理。而這種允許重試或者延后處理請(qǐng)求的能力通常是造就一個(gè)略感不便的用戶和一個(gè)沮喪透頂?shù)挠脩糁g的區(qū)別。?送達(dá)保證消息隊(duì)列提供的冗余機(jī)制保證了消息能被實(shí)際的處理,只要一個(gè)進(jìn)程讀取了該隊(duì)列即可。在此基礎(chǔ)上,IronMQIronMQ 提供了一個(gè)”只送達(dá)一次”保證。

9、無論有多少進(jìn)程在從隊(duì)列中領(lǐng)取數(shù)據(jù), 每一個(gè)消息只能被處理一次。 這之所以成為可能, 是因?yàn)楂@取一個(gè)消息只是“預(yù)定”了這個(gè)消息,暫時(shí)把它移出了隊(duì)列。除非客戶端明確的表示已經(jīng)處理完了這個(gè)消息,否則這個(gè)消息會(huì)被放回隊(duì)列中去,在一段可配置的時(shí)間之后可再次被處理。?緩沖在任何重要的系統(tǒng)中,都會(huì)有需要不同的處理時(shí)間的元素。例如,加載一張圖片比應(yīng)用過濾器花費(fèi)更少的時(shí)間。 消息隊(duì)列通過一個(gè)緩沖層來幫助任務(wù)最高效率的執(zhí)行一寫入隊(duì)列的處理會(huì)盡可能的快速,而不受從隊(duì)列讀的預(yù)備處理的約束。該緩沖有助于控制和優(yōu)化數(shù)據(jù)流經(jīng)過系統(tǒng)的速度。?異步通信很多時(shí)候,你不想也不需要立即處理消息。消息隊(duì)列提供了異步處理機(jī)制,允許你把一

10、個(gè)消息放入隊(duì)列,但并不立即處理它。你想向隊(duì)列中放入多少消息就放多少,然后在你樂意的時(shí)候再去處理它們。1.2.2內(nèi)部各層數(shù)據(jù)提取與加載數(shù)據(jù)匯集將數(shù)據(jù)儲(chǔ)存于操作型數(shù)據(jù)存儲(chǔ)層(ODS,ODS,在數(shù)據(jù)倉庫各層次間數(shù)據(jù)轉(zhuǎn)換提取加載,采用傳統(tǒng)的 ETLETL 工具進(jìn)行采集,數(shù)據(jù)倉庫間的各層次的數(shù)據(jù)采集的實(shí)效性根據(jù)具體的數(shù)據(jù)需求而定,具體 ETLETL 建模界面如圖:1.3 數(shù)據(jù)加工與處理對(duì)于數(shù)據(jù)倉庫平臺(tái),應(yīng)該建立一套標(biāo)準(zhǔn)化、規(guī)范化的數(shù)據(jù)處理流程,例如:如何采集內(nèi)部和外部數(shù)據(jù)、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);如何清洗采集來的臟數(shù)據(jù)和無效數(shù)據(jù);如何對(duì)不同來源的數(shù)據(jù)進(jìn)行打通;如何對(duì)非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化加工;如何在結(jié)構(gòu)

11、化數(shù)據(jù)的基礎(chǔ)上進(jìn)行商業(yè)建模和數(shù)據(jù)挖掘等等。大數(shù)據(jù)管理層在一條數(shù)據(jù)總線上構(gòu)建了一條完整的大數(shù)據(jù)處理流水線。這條流水線從數(shù)據(jù)的采集、清洗到加工處理,把原始雜亂無章的數(shù)據(jù)加工成結(jié)構(gòu)化的數(shù)據(jù)組件,供上層的大數(shù)據(jù)應(yīng)用來拼裝調(diào)用,讓企業(yè)擁有創(chuàng)造數(shù)據(jù)資產(chǎn)的能力。1.4 存儲(chǔ)設(shè)計(jì)1.4.1數(shù)據(jù)量估算按每列列車平均 500500 毫秒通過車地通信采集監(jiān)測(cè)數(shù)據(jù) 100100 條,每天運(yùn)營(yíng)時(shí)間 1818 小時(shí),按每條記錄 160160 字節(jié)計(jì)算(監(jiān)測(cè)數(shù)據(jù)的數(shù)據(jù)項(xiàng)相對(duì)簡(jiǎn)單),),初步按照 6767 列列車計(jì)算。單列列車日監(jiān)測(cè)數(shù)據(jù)=3600*2*160*100*18/1024/1024/1024-2G=3600*2*1

12、60*100*18/1024/1024/1024-2G6767 列列車年數(shù)據(jù)量=2*67*365/1024=2*67*365/102448T48T1010 年總數(shù)據(jù)量(乘上增長(zhǎng)系數(shù) 10%10%產(chǎn) 530T530T(含操作系統(tǒng))數(shù)據(jù)規(guī)劃 1010 年,加上系統(tǒng)用戶信息、系統(tǒng)日志信息、專家信息、業(yè)務(wù)數(shù)據(jù)及其它不可預(yù)測(cè)類數(shù)據(jù),數(shù)據(jù)總量預(yù)估 530T530T。1.4.2數(shù)據(jù)存儲(chǔ)專家系統(tǒng)數(shù)據(jù)采用混合存儲(chǔ)模式進(jìn)行存儲(chǔ),RDBMRDBM/儲(chǔ)專家系統(tǒng)業(yè)務(wù)基本數(shù)據(jù)及最近 1 1 年的監(jiān)測(cè)數(shù)據(jù), 1010 年內(nèi)歷史監(jiān)測(cè)數(shù)據(jù)采用 NoSQLHBasNoSQLHBas 數(shù)據(jù)庫進(jìn)行存儲(chǔ), 以方便查詢, HBaseHB

13、ase 基于 HdfHdfs s分布式文件系統(tǒng)搭建,具體存儲(chǔ)模式如下圖。Hadoop(Hdfs)HbaseIII一一一一.一一高餅值密度數(shù)據(jù)低價(jià)值密度歷史數(shù)據(jù)存儲(chǔ)最近一年監(jiān)測(cè)數(shù)據(jù)測(cè)數(shù)據(jù)系統(tǒng)配置數(shù)據(jù)系統(tǒng)配置數(shù)據(jù)專家基本信息數(shù)據(jù)故障評(píng)估業(yè)務(wù)數(shù)據(jù)等1 1 .RDBM.RDBM 頷據(jù)庫,支持專家?guī)斓暮诵臉I(yè)務(wù),存儲(chǔ)列車最近 1 1 年的監(jiān)測(cè)數(shù)據(jù)為保證專家系統(tǒng)安全、 穩(wěn)定運(yùn)行, 在數(shù)據(jù)庫系統(tǒng)上支撐各種統(tǒng)計(jì)分析及傳統(tǒng)的 BIBI 業(yè)務(wù)。考慮到操作系統(tǒng)存儲(chǔ)、緩存存儲(chǔ)、數(shù)據(jù)庫系統(tǒng)存儲(chǔ)、日志存儲(chǔ)等因素,RDBMRDBM 數(shù)據(jù)庫服務(wù)器預(yù)計(jì)每臺(tái) 60T60T 存儲(chǔ),考慮數(shù)據(jù)安全及系統(tǒng)穩(wěn)定因素 RDBMRDBM 采用雙

14、機(jī)熱備技術(shù)互備。2 2 . .大數(shù)據(jù)平臺(tái)規(guī)劃存儲(chǔ)最近 1010 年監(jiān)測(cè)數(shù)據(jù),日志文件備份及歷史數(shù)據(jù)采用大數(shù)據(jù)HadoopHadoop 和 HBaseHBase 存儲(chǔ),大數(shù)據(jù)平臺(tái)數(shù)據(jù)采用節(jié)點(diǎn)問冗余備份,預(yù)設(shè)數(shù)據(jù) 2 2 倍冗余存儲(chǔ),(考慮平臺(tái)提供的壓縮技術(shù),壓縮存儲(chǔ)可以節(jié)省 30-55%30-55%勺空間)。1010 年數(shù)據(jù)量=530T*1.5=530T*1.5= =800T800T(2 2 倍冗余存儲(chǔ))結(jié)構(gòu)化數(shù)據(jù)統(tǒng)一資源調(diào)度結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)RDBMS非結(jié)構(gòu)化數(shù)據(jù)1.4.3分層存儲(chǔ)專家數(shù)據(jù)分三個(gè)層次進(jìn)行匯集與存儲(chǔ),分別為 ODSgODSg、數(shù)據(jù)倉庫層、主題數(shù)據(jù)層,各層次數(shù)據(jù)存儲(chǔ)內(nèi)容如下?

15、?ODS1:ODS1:數(shù)據(jù)來源于各生產(chǎn)系統(tǒng),通過 ETLETL 工具對(duì)接口文件數(shù)據(jù)進(jìn)行編碼替換和數(shù)據(jù)清洗轉(zhuǎn)換,不做關(guān)聯(lián)操作。未來也可用于準(zhǔn)實(shí)時(shí)數(shù)據(jù)查詢。? ?數(shù)據(jù)倉庫層:數(shù)據(jù)深度匯集層,根據(jù)業(yè)務(wù)有選擇的對(duì) ODSODS 層的數(shù)據(jù)進(jìn)行提取,通過對(duì)數(shù)據(jù)的加工處理,將單一的數(shù)據(jù)信息轉(zhuǎn)換成體系信息,將點(diǎn)信息數(shù)據(jù)變成面信息數(shù)據(jù)。? ?主題數(shù)據(jù)層:將數(shù)據(jù)信息體系根據(jù)各主題進(jìn)行提取與轉(zhuǎn)換,主題域內(nèi)部進(jìn)行拆分、關(guān)聯(lián)。是對(duì) ODSODS 操作型數(shù)據(jù)按照主題域劃分規(guī)則進(jìn)行的拆分及合并。、車輛健車輛以康評(píng)估障診斷1.5 數(shù)據(jù)分析建模伴隨著大數(shù)據(jù)時(shí)代的悄然來臨,數(shù)據(jù)的價(jià)值得到人們的廣泛認(rèn)同,對(duì)數(shù)據(jù)的重視提到了前所未有

16、的高度。數(shù)據(jù)已經(jīng)作為企業(yè)、事業(yè)單位的重要資產(chǎn)被廣泛應(yīng)用于盈利分析與預(yù)測(cè)、客戶關(guān)系管理、合規(guī)性監(jiān)管、運(yùn)營(yíng)風(fēng)險(xiǎn)管理等業(yè)務(wù)當(dāng)中。如何建大全立大數(shù)據(jù)分析模型,以提供決策依據(jù)是很多用戶所迫切解決的問題。專家數(shù)據(jù)倉庫建立在 HadoopHadoop 分布式系統(tǒng)之上,提供了多種豐富的算法模型,不同的應(yīng)用通過借助不同的接口實(shí)現(xiàn)數(shù)據(jù)的多維呈現(xiàn)和結(jié)果展示,為用戶提供科學(xué)的決策支持。數(shù)據(jù)服務(wù)乂數(shù)據(jù)集市層數(shù)據(jù)倉庫層操作型數(shù)據(jù)層數(shù)據(jù)源公Hadoop分布式球螭圖 10-7hadoop10-7hadoop 算法模型圖大數(shù)據(jù)平臺(tái)提供數(shù)據(jù)挖掘模型、分布式計(jì)算引擎、高性能機(jī)器學(xué)習(xí)算法庫(包含分類、聚類、預(yù)測(cè)、推薦等機(jī)器學(xué)習(xí)算法)

17、、即席查詢功能,可以幫助決策者快速建立數(shù)據(jù)分析模型立方體,便于決策者進(jìn)行 OLAOLA 小析。常用算法模型:? ?分類算法:分類是找出數(shù)據(jù)庫中的一組數(shù)據(jù)對(duì)象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是通過分類模型, 將數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別中。 如政務(wù)網(wǎng)中將用戶在一段時(shí)間內(nèi)的網(wǎng)上辦理所遇到的問題劃分成不同的類,根據(jù)情況向用戶推薦關(guān)聯(lián)類的問題解決方案,從而方便用戶快速解決網(wǎng)上辦事審批中遇到的各類問題。? ?回歸算法回歸分析反映了數(shù)據(jù)庫中數(shù)據(jù)的屬性值的特性,通過函數(shù)表達(dá)數(shù)據(jù)映射的關(guān)系來發(fā)現(xiàn)屬性值之間的依賴關(guān)系。在回歸算法中通常將數(shù)值結(jié)果轉(zhuǎn)化為了 0 0 到 1 1 之間的概率

18、,數(shù)值越大,函數(shù)越逼近 1,1,數(shù)值越小,函數(shù)越逼近 0,0,它可以應(yīng)用到對(duì)數(shù)據(jù)序列的預(yù)測(cè)及相關(guān)關(guān)系的研究中去。如我們根據(jù)這個(gè)概率可以做垃圾郵件預(yù)測(cè),例如概率大于 0.50.5, ,則這封郵件就是垃圾郵件。? ?聚類算法聚類類似于分類,但與分類的目的不同,是針對(duì)數(shù)據(jù)的相似性和差異性將一組數(shù)據(jù)分為幾個(gè)類別。屬于同一類別的數(shù)據(jù)間的相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關(guān)聯(lián)性很低。 分類算法中的一個(gè)顯著特征就是訓(xùn)練數(shù)據(jù)中包含了標(biāo)簽, 訓(xùn)練出的模型可以對(duì)其他未知數(shù)據(jù)預(yù)測(cè)標(biāo)簽。在聚類的算法中,訓(xùn)練數(shù)據(jù)都是不含標(biāo)簽的,而算法的目的則是通過訓(xùn)練,推測(cè)出這些數(shù)據(jù)的標(biāo)簽。以二維的數(shù)據(jù)來說,一個(gè)數(shù)

19、據(jù)就包含兩個(gè)特征,可通過聚類算法,給他們中不同的種類打上標(biāo)簽, 通過聚類算法計(jì)算出種群中的距離, 根據(jù)距離的遠(yuǎn)近將數(shù)據(jù)劃分為多個(gè)族群。? ?關(guān)聯(lián)算法關(guān)聯(lián)規(guī)則是隱藏在數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)或相互關(guān)系,即可以根據(jù)一個(gè)數(shù)據(jù)項(xiàng)的出現(xiàn)推導(dǎo)出其他數(shù)據(jù)項(xiàng)的出現(xiàn)。 關(guān)聯(lián)規(guī)則的挖掘過程主要包括兩個(gè)階段: 第一階段為從海量原始數(shù)據(jù)中找出所有的高頻項(xiàng)目組;第二極端為從這些高頻項(xiàng)目組產(chǎn)生關(guān)聯(lián)規(guī)則。?推薦算法推薦算法是目前業(yè)界非常火的一種算法,在電商界,如亞馬遜,天貓,京東等得到了廣泛的運(yùn)用。推薦算法的主要特征就是可以自動(dòng)向用戶推薦他們最感興趣的東西,從而增加購買率,提升效益。? ?神經(jīng)網(wǎng)絡(luò)模型神經(jīng)網(wǎng)絡(luò)模型,因其自身自行處理

20、、分布存儲(chǔ)和高度容錯(cuò)等特性非常適合處理非線性的以及那些以模糊、不完整、不嚴(yán)密的知識(shí)或數(shù)據(jù)為特征的處理問題,它的這一特點(diǎn)十分適合解決數(shù)據(jù)挖掘的問題。 典型的神經(jīng)網(wǎng)絡(luò)模型主要分為三大類: 第一類是以用于分類預(yù)測(cè)和模式識(shí)別的前饋式神經(jīng)網(wǎng)絡(luò)模型;第二類是用于聯(lián)想記憶和優(yōu)化算法的反饋式神經(jīng)網(wǎng)絡(luò)模型。第三類是用于聚類的自組織映射方法。? ?AdaboostAdaboost 算法其核心思想是針對(duì)同一個(gè)訓(xùn)練集,訓(xùn)練不同的分類器(弱分類器),然后把這些弱分類器集合起來,構(gòu)成一個(gè)更強(qiáng)的最終分類器(強(qiáng)分類器)。其算法本身是通過改變數(shù)據(jù)分布來實(shí)現(xiàn)的, 它根據(jù)每次訓(xùn)練集之中每個(gè)樣本的分類是否正確, 以及上次的總體分類的

21、準(zhǔn)確率,來確定每個(gè)樣本的權(quán)值。將修改過權(quán)值的新數(shù)據(jù)集送給下層分類器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類器最后融合起來,作為最后的決策分類器。? ?深度學(xué)習(xí)深度學(xué)習(xí)算法是對(duì)人工神經(jīng)網(wǎng)絡(luò)的發(fā)展。在計(jì)算能力變得日益廉價(jià)的今天,深度學(xué)習(xí)試圖建立大得多也復(fù)雜得多的神經(jīng)網(wǎng)絡(luò),用來處理存在少量未標(biāo)識(shí)數(shù)據(jù)的大數(shù)據(jù)集。1.6 數(shù)據(jù)資源管理專家系統(tǒng)數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類別多、數(shù)據(jù)關(guān)聯(lián)關(guān)系緊密等特點(diǎn),隨著數(shù)據(jù)的積累,數(shù)據(jù)資源的利用價(jià)值逐步體現(xiàn),提高數(shù)據(jù)的管理,是對(duì)數(shù)據(jù)資源充分利用的前提條件。數(shù)據(jù)資源管了包括如下幾部分內(nèi)容:數(shù)據(jù)標(biāo)準(zhǔn)化管理、數(shù)據(jù)監(jiān)測(cè)管理及元數(shù)據(jù)管理等。1.6.1數(shù)據(jù)標(biāo)準(zhǔn)管理匯集整理數(shù)據(jù)資源管理所需的標(biāo)

22、準(zhǔn)規(guī)范信息,建立數(shù)據(jù)標(biāo)準(zhǔn)數(shù)據(jù)庫。利用專家系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng)的接口同步更新標(biāo)準(zhǔn)信息。包括數(shù)據(jù)元標(biāo)準(zhǔn)以及信息代碼標(biāo)準(zhǔn)。1 1 . .建設(shè)數(shù)據(jù)資源庫,實(shí)現(xiàn)專家系統(tǒng)發(fā)布標(biāo)準(zhǔn)數(shù)據(jù)元與本地?cái)U(kuò)展數(shù)據(jù)元標(biāo)準(zhǔn)的匯集。實(shí)現(xiàn)與車輛檢修等數(shù)據(jù)源管理系統(tǒng)接口對(duì)接。2 2 . .建設(shè)信息代碼資源庫,梳理國(guó)標(biāo)、部標(biāo)和本省定義的標(biāo)準(zhǔn)代碼以及各業(yè)務(wù)信息系統(tǒng)需要使用的其它代碼,建立字典代碼實(shí)體數(shù)據(jù)庫。應(yīng)具備字典代碼定期同步功能。并建設(shè)信息代碼在線映射維護(hù)功能,以便對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化轉(zhuǎn)換提供支持。1.6.2數(shù)據(jù)監(jiān)控管理大數(shù)據(jù)運(yùn)行監(jiān)控通過對(duì)大數(shù)據(jù)資源庫相關(guān)服務(wù)器、OracleOracle 數(shù)據(jù)庫、分布式存儲(chǔ)系統(tǒng)、HadoopHadoop

23、 平臺(tái)等的運(yùn)行狀態(tài)、性能指標(biāo)以及數(shù)據(jù)更新情況進(jìn)行持續(xù)監(jiān)控,及時(shí)發(fā)現(xiàn)存在的問題及隱患,輔助系統(tǒng)管理員及時(shí)采取措施,提高大數(shù)據(jù)資源庫的運(yùn)行可靠性,保障大數(shù)據(jù)資源庫穩(wěn)定高效運(yùn)行。 發(fā)現(xiàn)異常問題時(shí)通過短信、 郵件等方式通知系統(tǒng)管理員及時(shí)處理,實(shí)現(xiàn)通過自動(dòng)、智能、持續(xù)的自動(dòng)監(jiān)控預(yù)警代替人工巡檢,降低運(yùn)維工作量,提高運(yùn)維效率。通過可視化圖表對(duì)監(jiān)控結(jié)果進(jìn)行統(tǒng)計(jì)分析直觀展現(xiàn)平臺(tái)運(yùn)行各類運(yùn)行指標(biāo), 輔助管理員從宏觀角度掌握平臺(tái)運(yùn)行情況。?性能指標(biāo)監(jiān)控可以對(duì)服務(wù)器 CPCP 頂載、OracleOracle 數(shù)據(jù)庫連接數(shù)、分布式存儲(chǔ) IOIO 負(fù)載、HadoopHadoop 負(fù)載等各類性能相關(guān)指標(biāo)進(jìn)行監(jiān)控,以便掌握

24、平臺(tái)負(fù)載情況,及時(shí)發(fā)現(xiàn)性能問題,輔助平臺(tái)優(yōu)化。?大數(shù)據(jù)庫日志監(jiān)控自動(dòng)采集大數(shù)據(jù)相關(guān)組件運(yùn)行日志,并根據(jù)既定規(guī)則進(jìn)行分析,發(fā)現(xiàn)異常及時(shí)告警。提供日志查詢檢索功能,可以按組件類型、時(shí)間、關(guān)鍵字等進(jìn)行過濾。?數(shù)據(jù)量監(jiān)控?cái)?shù)據(jù)量監(jiān)控通過對(duì)數(shù)據(jù)總量以及增量進(jìn)行定期監(jiān)控,可以掌握數(shù)據(jù)量變化情況,也可以從數(shù)據(jù)增量角度發(fā)現(xiàn)數(shù)據(jù)入庫異常。 數(shù)據(jù)量監(jiān)測(cè)結(jié)果可同步到數(shù)據(jù)臺(tái)帳, 以便數(shù)據(jù)臺(tái)帳統(tǒng)計(jì)數(shù)據(jù)總量情況。1.6.3元數(shù)據(jù)管理元數(shù)據(jù)是數(shù)據(jù)倉庫中存儲(chǔ)的基本單元, 實(shí)現(xiàn)對(duì)元數(shù)據(jù)的管理, 數(shù)據(jù)倉庫的最基本功能之一。元數(shù)據(jù)管理包括元數(shù)據(jù)注冊(cè)登記、元數(shù)據(jù)存儲(chǔ)、元數(shù)據(jù)建模等多方面功能。1.7 數(shù)據(jù)服務(wù)大數(shù)據(jù)平臺(tái)開放存儲(chǔ)訪問接口,

25、提供基于 HadoopHadoop 技術(shù)體系的 HDFSHBaseHDFSHBase 訪問接口,以O(shè)penAPIOpenAPI 的方式,為應(yīng)用提供大數(shù)據(jù)存儲(chǔ)服務(wù)。數(shù)據(jù)服務(wù)層主要由數(shù)據(jù)服務(wù)總線來建設(shè),主要負(fù)責(zé)將大數(shù)據(jù)平臺(tái)的能力接口注冊(cè)進(jìn)去,再以標(biāo)準(zhǔn)化接口開放給應(yīng)用系統(tǒng)使用,支持多種協(xié)議轉(zhuǎn)換、服務(wù)質(zhì)量控制、訪問控制、規(guī)則引擎等。數(shù)據(jù)服務(wù)層將大數(shù)據(jù)平臺(tái)的數(shù)據(jù)服務(wù)能力開放出去,供第三方平臺(tái)使用。服矜接口將入端服矜治理服將留量?jī)卓刂撇咦焱冉映龆索锬芰涌冢ú榈诮涌冢治鼋涌冢┤缟蠄D:應(yīng)用服務(wù)系統(tǒng)使用服務(wù)接口,來接入數(shù)據(jù)服務(wù)總線,經(jīng)過數(shù)據(jù)服務(wù)總線的接入端點(diǎn),進(jìn)行過濾。同時(shí)根據(jù)訪問控制、服務(wù)質(zhì)量、協(xié)議轉(zhuǎn)換

26、、策略調(diào)度、規(guī)則引擎的處理,接出到大數(shù)據(jù)平臺(tái)的能力接口。第 2 章大數(shù)據(jù)平臺(tái)2.1 大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)大數(shù)據(jù)基礎(chǔ)平臺(tái)基于烽火自主知識(shí)產(chǎn)權(quán) FitDataFitData 產(chǎn)品,F(xiàn)itDataFitData 主要集成了基礎(chǔ)計(jì)算資源、網(wǎng)絡(luò)資源、存儲(chǔ)資源,在統(tǒng)一的安全體管理體系下,將這些資源再進(jìn)行深度加工、處理、 關(guān)聯(lián), 形成多種類型的基礎(chǔ)服務(wù)能力, 構(gòu)建基礎(chǔ)資源層, 向應(yīng)用提供基礎(chǔ)資源的服務(wù)能力。數(shù)據(jù)服務(wù)總線通過服務(wù)治理來維護(hù)基礎(chǔ)資源服務(wù)能力,并通過訪問控制、服務(wù)質(zhì)量、協(xié)議轉(zhuǎn)換等,對(duì)應(yīng)用提供多協(xié)議支持。平臺(tái)支撐體系的運(yùn)維體系提供整體運(yùn)維能力,保障平臺(tái)的正常運(yùn)行;安全體系提供整體安全能力,保障平臺(tái)的數(shù)

27、據(jù)安全和使用安全;平臺(tái)采用分布式架構(gòu),支持巨量數(shù)據(jù)存儲(chǔ)與分析,保障專家管理系統(tǒng)的高性能、高可用性和易擴(kuò)展性。FitData大數(shù)據(jù)基礎(chǔ)平臺(tái)結(jié)構(gòu)如下圖紅線標(biāo)出部分。大數(shù)據(jù)應(yīng)用數(shù)據(jù)計(jì)算與存儲(chǔ): 是 FitDataFitData 大數(shù)據(jù)平臺(tái)的核心內(nèi)容, 提供分布式存儲(chǔ)能力和分布式計(jì)算能力。提供的存儲(chǔ)框架能力,包括基于結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)、非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和半結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),其計(jì)算框架與存儲(chǔ)框架均是分布式集群方式部署,可以平滑的進(jìn)行彈性擴(kuò)容。數(shù)據(jù)服務(wù)層:數(shù)據(jù)服務(wù)層主要由數(shù)據(jù)服務(wù)接口來實(shí)現(xiàn),對(duì)應(yīng)用提供數(shù)據(jù)支撐。通過數(shù)據(jù)服務(wù)接口將平臺(tái)的數(shù)據(jù)資源以標(biāo)準(zhǔn) APIAPI 接口的方式開放出來,供不同的應(yīng)用系統(tǒng)使用。車輛故

28、障車輛健康評(píng)車輛指標(biāo)檢測(cè)報(bào)警車輛檢修預(yù)案車輛對(duì)比分析其他多維分析數(shù)據(jù)共享數(shù)據(jù)檢索機(jī)器學(xué)習(xí)離線計(jì)算MapReduce內(nèi)存計(jì)算Spark實(shí)時(shí)計(jì)算StormHbase(數(shù)據(jù)庫)診斷估大數(shù)據(jù)處理平臺(tái)數(shù)據(jù)挖掘數(shù)據(jù)可視化可編程API迄維管理安裝 部 署 集群 管 理 主機(jī) 管 理 用戶 管 理 服務(wù) 管 理 監(jiān)控 預(yù) 警 版本管理Yarn(計(jì)算資源管理)數(shù)據(jù)11算/存儲(chǔ)數(shù)據(jù)應(yīng)用層主要提供基于該平臺(tái)來構(gòu)建的專家系統(tǒng)應(yīng)用。采用平臺(tái)的標(biāo)準(zhǔn) API,API,數(shù)據(jù)資源層獲取數(shù)據(jù)服務(wù),目前 APIAPI 接口包括資源目錄瀏覽、數(shù)據(jù)查詢搜索等。數(shù)據(jù)匯聚層:提供各層之間數(shù)據(jù)交換能力,由 ETLETL 數(shù)據(jù)集成工具來實(shí)現(xiàn)。

29、平臺(tái)支持多中異構(gòu)數(shù)據(jù)源,針對(duì)不同數(shù)據(jù)源的不同數(shù)據(jù),也提供多種數(shù)據(jù)抽取方式,例如數(shù)據(jù)庫直連抽取、SqoopSqoop 抽取等。提供計(jì)算框架能力,主要集成了批處理計(jì)算框架、流式計(jì)算框架、內(nèi)存計(jì)算框架等能力,還提供了像 HiveHive、MahoutMahout、SparkSpark 等二次計(jì)算能力框架。平臺(tái)可將這些計(jì)算能力開放,供數(shù)據(jù)模型、數(shù)據(jù)挖掘、應(yīng)用系統(tǒng)來使用。運(yùn)維體系:運(yùn)維體系提供面向?qū)<蚁到y(tǒng)完整運(yùn)維方案,涵蓋了運(yùn)行監(jiān)控到使用操作。安全體系提供面向?qū)<蚁到y(tǒng)大數(shù)據(jù)平臺(tái)的用戶權(quán)限管理、終端訪問控制、日志安全審計(jì)等能力。數(shù)據(jù)存與計(jì)算是 FitDataFitData 大數(shù)據(jù)平臺(tái)核心能力,將目前專家系

30、統(tǒng)內(nèi)部業(yè)務(wù)數(shù)據(jù)源進(jìn)行有效整合,集成以數(shù)據(jù)為核心的查詢、分析和管理能力。采用分層整合,靈活配置,橫向擴(kuò)展,縱向貫穿的大數(shù)據(jù)平臺(tái)服務(wù)能力,其計(jì)算框架、存儲(chǔ)框架都以容器的方式,可輕松靈活的在線進(jìn)行裝卸,以平滑擴(kuò)充大數(shù)據(jù)平臺(tái)的集成能力。除此還集成了二級(jí)計(jì)算框架、通用的數(shù)據(jù)處理算法庫和數(shù)據(jù)倉庫,將大數(shù)據(jù)平臺(tái)的數(shù)據(jù)進(jìn)行清洗、加工和分析挖掘,處理后的數(shù)據(jù)可訂閱,充分體現(xiàn)數(shù)據(jù)即服務(wù)的大數(shù)據(jù)思想。?分布式存儲(chǔ)框架:主要負(fù)責(zé)針對(duì)巨量數(shù)據(jù)的存儲(chǔ),以分布式存儲(chǔ)技術(shù),支持快速、巨量、多種類型的數(shù)據(jù)存取。支持從數(shù)據(jù)源抽取數(shù)據(jù)到大數(shù)據(jù)平臺(tái)存儲(chǔ),集成多種存儲(chǔ)方式,有針對(duì)結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)。?計(jì)算框架

31、:主要提供批處理計(jì)算、內(nèi)存計(jì)算、流式計(jì)算框架,由數(shù)據(jù)處理管理驅(qū)動(dòng)來分配和調(diào)度計(jì)算框架,加載數(shù)據(jù)處理算法,完成數(shù)據(jù)處理。? ?數(shù)據(jù)倉庫:主要對(duì)計(jì)算框架完成后的結(jié)果進(jìn)行存儲(chǔ),支持 HbaseHbase、MSSQLMSSQLServerServer 等存儲(chǔ),同時(shí)將數(shù)據(jù)以接口的形式開放出去。?數(shù)據(jù)處理算法庫:集成通用的數(shù)據(jù)分析算法、能夠插入用戶自定義的數(shù)據(jù)模型算法,配合以資源管理系統(tǒng)為主的計(jì)算存儲(chǔ)框架,進(jìn)行數(shù)據(jù)處理。?資源管理系統(tǒng),以容器的方式,來為計(jì)算框架和存儲(chǔ)框架分配資源,并支持資源調(diào)度,彈性伸縮。? ?數(shù)據(jù)服務(wù)總線:主要將基礎(chǔ)平臺(tái)的能力和數(shù)據(jù)服務(wù)接口,以 APIAPI 的方式開放出去,形成一個(gè)共

32、享的、供應(yīng)用使用的服務(wù)總線。2.2 FitData 特點(diǎn)廣泛適應(yīng)性:支持結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù);支持實(shí)時(shí)數(shù)據(jù)。巨量數(shù)據(jù):數(shù)據(jù)處理能力在 PBPB 級(jí)以上。線性擴(kuò)展:存儲(chǔ)、計(jì)算均可增加節(jié)點(diǎn)進(jìn)行線性擴(kuò)展。統(tǒng)一運(yùn)維管理:降低安裝部署、運(yùn)營(yíng)、維護(hù)成本。經(jīng)濟(jì)性:可運(yùn)行在普通 X86X86 服務(wù)器上,硬件成本低。高可靠性:支持容災(zāi)容錯(cuò)、備份恢復(fù)機(jī)制,支持自動(dòng)告警。支持節(jié)點(diǎn)可靠性、數(shù)據(jù)可靠性。高性能:高效數(shù)據(jù)處理性能,支持 SparkSpark、StormStorm、R R認(rèn)證安全:支持 KerberosKerberos 安全認(rèn)證、LDAPtLDAPt 戶管理控制。數(shù)據(jù)安全:支持?jǐn)?shù)據(jù)加密。負(fù)載均衡:

33、支持節(jié)點(diǎn)間存儲(chǔ)、技術(shù)負(fù)載均衡。開放性:支持符合 HadoopHadoop 規(guī)范的第三方組件或工具。2.3 FitData 主要功能FitDataFitData 是基于開源 HadoopFFHadoopFF 發(fā)的企業(yè)級(jí)大數(shù)據(jù)產(chǎn)品,提供 PBPB 級(jí)數(shù)據(jù)的采集、存儲(chǔ)和處理能力,支持?jǐn)?shù)據(jù)加載、查詢、分析、挖掘等功能。2.3.1節(jié)點(diǎn)批量自動(dòng)部署通過以 Web!Web!理, 以圖形界面的方式實(shí)現(xiàn)大數(shù)據(jù)平臺(tái)節(jié)點(diǎn)批量自動(dòng)部署, 只需添加主機(jī)名 (或者 IPIP 地址)即可實(shí)現(xiàn)將節(jié)點(diǎn)服務(wù)器添加到集群中,截圖如下:安裝選項(xiàng)安裝選項(xiàng)勝人主叫則依起包合守里用和序幅供的與SrSffl日卻王班進(jìn)丸主機(jī)用M愫用F-電而n

34、c3nnamNflmeFQE、事行 T、底雪陋用1.詁苴14歲13”31刎古音信動(dòng)生國(guó)H打曲寶*抨自SSHfc-SI=永豐旺主禮I強(qiáng)苒仃暹i;tiwTce;圖向集群中添加節(jié)點(diǎn)2.3.2節(jié)點(diǎn)動(dòng)態(tài)管理通過 webweb 管理實(shí)現(xiàn)節(jié)點(diǎn)的動(dòng)態(tài)添加、刪除,當(dāng)存儲(chǔ)空間或者計(jì)算資源不足時(shí),支持向集群中添加同等配置的服務(wù)器,實(shí)現(xiàn)大數(shù)據(jù)平臺(tái)在線動(dòng)態(tài)擴(kuò)容,而不需要停機(jī)處理,不影響平臺(tái)正常運(yùn)行。大數(shù)據(jù)平臺(tái)以 WebWeb 圖形界面實(shí)現(xiàn) HadoopHadoop 集群監(jiān)控, 包括大數(shù)據(jù)平臺(tái)的硬件資源、 軟件資源、數(shù)據(jù)資源的監(jiān)控,以及整個(gè) HadoopHadoop 集群的工作負(fù)載。主要包括以下幾個(gè)方面:2.3.3服務(wù)組

35、件狀態(tài)監(jiān)控通過管理平臺(tái)可以看到所有目前已安裝的服務(wù)組件的健康狀況。NuimhuikO域WLM七忖-iiHhu晶0SCdtlKl口w/N餐qE產(chǎn)5ddeiid2口iifeccmrw.jningfli)h始NinriiiNfld申llpniTNi17那耳鵬腫卡修N12渺37(1MBi110117)DsiUsgefDFSLfeedlU1GBfDiskUsago-|NoDFSLkMIEBIB/1767TE(B0J%)CHikFh由TQIB;1757g(SSJ現(xiàn)用的后隹幽聃39國(guó)od后虎comipEreplicaJ口rrisslngiI)underrepkaKidTdN&十OkBtmjriss鏟47葉張

36、琥志否有聲 F立個(gè)耳聞*蘇 FEZ 直添加主機(jī)向?qū)D服務(wù)組件運(yùn)行狀況圖計(jì)算資源監(jiān)控2.3.4計(jì)算資源負(fù)載監(jiān)控鼾中借器 102.3.5多任務(wù)實(shí)時(shí)監(jiān)控通過管理平臺(tái)可以實(shí)時(shí)看到整個(gè)平臺(tái)的資源負(fù)載情況,包括集群的 CPUCPU 集群磁盤 1010、集群網(wǎng)絡(luò) IOIO、HDFSIO,HDFSIO,如下圖所示:通過對(duì)集群運(yùn)行任務(wù)的實(shí)時(shí)監(jiān)測(cè),并根據(jù)任務(wù)優(yōu)先級(jí)和耗時(shí)不同對(duì)任務(wù)進(jìn)行動(dòng)態(tài)調(diào)度,減少出現(xiàn)大量任務(wù)等待和重要任務(wù)無法及時(shí)完成的可能,可以使 HadoopHadoop+Snr6Kh。曰HH19C司巾PTFfltalBAOVIUKMIJUDttiDkaXIHM心w福ui,DslshodeheapLFsags*

37、i-iiihrKiflrm”K附MeUagjeiHe/QMilWnhLA/SJJ&I i,PgE15qw3fiiHEipruawr咆W1?T/彈集網(wǎng)絡(luò) 2J更1、雄注211KJB-均 T或個(gè)爆量白甘0HDFSIO137 依總計(jì)唉,同15KJ3HOFSnam&3r2Sb/sHClFE.弓一 W 不詔用iHDFSnamawrui.1M,HDFS,后汁型不話用HOPSYARHYAflmHR0相道inM:1D#整卡主機(jī)巾的主機(jī)CPU使用率i.a%中可用2AmH也u1&司18怙da立鄧1也可用19dt|tft徹u怕dayzage中可用13dj的廣已可用1由413七訊二事可三赭財(cái)1ageT7K4P&SMl

38、森2尚 EEt 整用腳|*中國(guó)*4*凝.心*e際蜂厚率喃|存幽蹤的單亡4*的甲刈Bi帚七產(chǎn)即 7 第 W?五箱旭任:曲切;v-啥回“蝴用的R如姓里幼”臉加鼻4月所|;n,五liIrtthfl二P上由立HttijAIIIIH|*-AilfV!J星土利用徒杓可領(lǐng)-w斗亙司YW,皿1 個(gè)0H中立EHE丐的傳曰(咐事帝?靖石用檔禍七建彳卜二 1甘姆qn吊二T盾卜 勺 | 曾 療 丁 理 下 扁:cls-affivioNmtow*網(wǎng)觸齒i|-Gt;1,*;怏怏Ze射 位rMN&ih:-itm-1-畦工/海匚業(yè)一/B另如利于r二事?:*摩二的63 出外用歌乂面1耳社疆小安全異常等異常事件進(jìn)行預(yù)警、報(bào)警,并

39、通過郵件、短信報(bào)警手段進(jìn)行告警通知。提供預(yù)制的恢復(fù)規(guī)則和安全規(guī)則,對(duì)集群異常進(jìn)行自動(dòng)修復(fù)、自動(dòng)限制非安全行為的操作。大數(shù)據(jù)平臺(tái)能夠通過對(duì)告警信息的分析,快速定位平臺(tái)內(nèi)部出現(xiàn)故障的節(jié)點(diǎn),對(duì)于因故障無法繼續(xù)提供服務(wù)器的節(jié)點(diǎn)進(jìn)行標(biāo)記,將平臺(tái)的作業(yè)任務(wù)自動(dòng)分配到其他的節(jié)點(diǎn)上運(yùn)行,同時(shí),大數(shù)據(jù)平臺(tái)采用分布式體系結(jié)構(gòu)及無單點(diǎn)故障設(shè)計(jì),平臺(tái)內(nèi)任何節(jié)點(diǎn)的宕機(jī)都不會(huì)影響平臺(tái)的穩(wěn)定運(yùn)行和業(yè)務(wù)的正常使用。待故障節(jié)點(diǎn)恢復(fù)正常后,再將該節(jié)點(diǎn)納入平臺(tái)的資源中,將作業(yè)任務(wù)分配到恢復(fù)后的節(jié)點(diǎn)上運(yùn)行。2.3.8日常運(yùn)維監(jiān)控大數(shù)據(jù)綜合平臺(tái)提供完整的日常運(yùn)維監(jiān)控的服務(wù)能力,針對(duì)從上層應(yīng)用平臺(tái)到底層基礎(chǔ)平臺(tái)的各個(gè)功能模塊和組件均提供

40、有監(jiān)控能力,能夠分析系統(tǒng)的運(yùn)行日志和用戶日志,并且能夠?qū)⒈O(jiān)控?cái)?shù)據(jù)通過文件接口或 webservicewebservice 接口的方式匯總到平臺(tái)管理運(yùn)維模塊的監(jiān)控管理界面中進(jìn)行統(tǒng)一呈現(xiàn)和管理使用。系統(tǒng)能夠根據(jù)監(jiān)控到的數(shù)據(jù)進(jìn)行分析判斷,對(duì)異常的數(shù)據(jù)觸發(fā)告警,在前臺(tái)界面提醒,直至出發(fā)通知和處理等進(jìn)一步動(dòng)作。平臺(tái)的監(jiān)控范圍涵蓋有:平臺(tái)管理資源的使用與分配服務(wù)器視圖:提供針對(duì)各服務(wù)器和存儲(chǔ)等設(shè)備的資源使用情況的實(shí)時(shí)查看,包括當(dāng)前設(shè)備的 CPCP 改荷, 內(nèi)存占用情況, 存儲(chǔ)空間使用情況, 網(wǎng)絡(luò)帶寬占用情況、設(shè)備運(yùn)行狀態(tài)等。管理員能夠根據(jù)監(jiān)控信息在管理平臺(tái)上有效調(diào)度分配系統(tǒng)資源。其中集群的監(jiān)控如下圖所示:

41、圖霆軸分鐘14-lrj2E,M12葉137。30dGfft*CPU 尊般盅心percstrt.bytEfstwcohdIHI&FSIOU件3fWKClhda.ayvslryvsrI|-AjH已定成納lEpaia|kIIquWKr%f3刎修1I針對(duì)服務(wù)器的監(jiān)控如下圖所示:回耳工襄工斯三機(jī)tA*S*F,s,-升愫i-導(dǎo)國(guó)國(guó)己己:-1-=也示2Wi*IP平帆眠用派便用國(guó)兄把H再春空於雷用O*加Lidh&defn。只口崛但0.48T4.1Oflif$M4OBLC-&B313000BF15F8JOidamLocii5.deftio19211531Bl12HDke(5)0.97a95a,uT.aGlB3L

42、J朋朋舊囪國(guó)O鵬叫3dM口12Die12月啊白Q卓口an.29朋/般現(xiàn)750333155DBriSTGC第一個(gè)上,一呻s:-p,一步步aJk.第ET服務(wù)視圖:提供系統(tǒng)中各服務(wù)資源使用情況的實(shí)時(shí)查看,包括連接數(shù)、當(dāng)前作業(yè)數(shù),I/OI/O 情況,運(yùn)行狀態(tài)等。監(jiān)控系統(tǒng)的運(yùn)行情況接口服務(wù)運(yùn)行監(jiān)控:提供針對(duì)數(shù)據(jù)源和應(yīng)用層的監(jiān)控服務(wù),包括運(yùn)行狀態(tài)和流量等信息;數(shù)據(jù)存取過程監(jiān)控:提供針對(duì)數(shù)據(jù)存儲(chǔ)過程的監(jiān)控服務(wù),包括系統(tǒng)平臺(tái)的 I/OI/O 情況(整體 I/OI/O 和具體各節(jié)點(diǎn) I/OI/O 以及具體的各作業(yè)的 I/OI/O 情況)和數(shù)據(jù)存取過程的任務(wù)列表;數(shù)據(jù)匯聚過程監(jiān)控:監(jiān)控系統(tǒng)的數(shù)據(jù)匯聚過程,包括使用

43、資源信息,使用的數(shù)據(jù)源信息,作業(yè)進(jìn)程運(yùn)行狀況信息,使用時(shí)間/計(jì)劃完成時(shí)間等信息;數(shù)據(jù)處理過程監(jiān)控(作業(yè)監(jiān)控):監(jiān)控系統(tǒng)的數(shù)據(jù)處理(作業(yè))過程,包括使用資源信息,使用的數(shù)據(jù)源信息,作業(yè)進(jìn)程運(yùn)行狀況信息,使用時(shí)間/計(jì)劃完成時(shí)間等信息;應(yīng)用監(jiān)控:針對(duì)運(yùn)行在平臺(tái)上的應(yīng)用進(jìn)行監(jiān)控,包括各應(yīng)用當(dāng)前的運(yùn)行狀態(tài)、應(yīng)用對(duì)數(shù)據(jù)的使用狀況,應(yīng)用為用戶提供的查詢數(shù)量等;系統(tǒng)異常告警與處理用戶告警:對(duì)用戶操作使用過程中的異常行為進(jìn)行告警,例如某用戶訪問了超過其正常權(quán)限的數(shù)據(jù)等。系統(tǒng)告警:對(duì)系統(tǒng)中存在的服務(wù)節(jié)點(diǎn)宕機(jī),系統(tǒng)接口異常,數(shù)據(jù)存儲(chǔ)報(bào)錯(cuò), 系統(tǒng)資源緊張等系統(tǒng)運(yùn)行異常情況進(jìn)行告警觸發(fā), 并提醒用戶進(jìn)行操作處理。2.4

44、 FitData 優(yōu)勢(shì)烽火大數(shù)據(jù)平臺(tái) FitDataFitData 借助先進(jìn)開源的大數(shù)據(jù)存儲(chǔ)及處理技術(shù),成功實(shí)施了公安大數(shù)據(jù)平臺(tái)、楚天云政務(wù)大數(shù)據(jù)平臺(tái),通過大數(shù)據(jù)項(xiàng)目的實(shí)施,逐步沉淀了大量的算法模型及分析與展示工具,在平臺(tái)性能及穩(wěn)定性上經(jīng)歷了實(shí)戰(zhàn)的考驗(yàn),逐步總結(jié)出一套 FitDataFitData 自己的系統(tǒng)優(yōu)化策略及系統(tǒng)運(yùn)維策略,平臺(tái)經(jīng)受住了單節(jié)點(diǎn)超過 10001000 臺(tái)集群的實(shí)戰(zhàn)考驗(yàn),并支持 HAHA 高可用性運(yùn)行策略, 經(jīng)過四年時(shí)間及高強(qiáng)度項(xiàng)目的錘煉, FitDataFitData 大數(shù)據(jù)平臺(tái)已經(jīng)走出了自己的路。在數(shù)據(jù)處理上支持 PBPB 及超大量數(shù)據(jù)的秒級(jí)查詢及匯集。SmartASS

45、martAS 是企業(yè)級(jí)基礎(chǔ)開發(fā)平臺(tái),它基于 FitDataFitData 平臺(tái)之上,采用微服務(wù)架構(gòu),支持分布式部署,是成熟可靠的多終端應(yīng)用開發(fā)框架。它集成業(yè)界流行和成熟的技術(shù)框架,通過應(yīng)用系統(tǒng)使用,反饋的情況不斷完善應(yīng)用框架的通用功能,滿足業(yè)務(wù)系統(tǒng)快熟構(gòu)建的目標(biāo),具備良好用戶體驗(yàn)第 3 章硬件部署按照專家系統(tǒng)安裝接口規(guī)范要求,結(jié)合專家管理系統(tǒng)數(shù)據(jù)量估算值和數(shù)據(jù)存儲(chǔ)特點(diǎn),本著數(shù)據(jù)安全、 系統(tǒng)穩(wěn)定可靠的核心設(shè)計(jì)思路, 設(shè)計(jì)專家系統(tǒng)大數(shù)據(jù)平臺(tái)數(shù)據(jù)節(jié)點(diǎn)服務(wù)器 2222 臺(tái),其中管理節(jié)點(diǎn)服務(wù)器 2 2 臺(tái), 數(shù)據(jù)節(jié)點(diǎn)服務(wù)器 1919 臺(tái), 監(jiān)控節(jié)點(diǎn)一臺(tái), 系統(tǒng) RDBMSRDBMS 據(jù)庫服務(wù)器臺(tái),應(yīng)用服

46、務(wù)器 6 6 臺(tái),繪制專家系統(tǒng)部署邏輯結(jié)構(gòu)圖如下:第 4 章硬件清單根據(jù)系統(tǒng)規(guī)劃及安裝接口規(guī)范要求,初步規(guī)劃服務(wù)器如下:系統(tǒng)應(yīng)用服務(wù)器需求 6 6 臺(tái);大數(shù)據(jù)平臺(tái)設(shè)計(jì)節(jié)點(diǎn) 2222 個(gè),其中管理節(jié)點(diǎn) 2 2 個(gè),數(shù)據(jù)節(jié)點(diǎn) 1919 個(gè),監(jiān)大翻居?臺(tái)數(shù)據(jù)庫數(shù)據(jù)庫應(yīng)用廂片器應(yīng)用前務(wù)器R0都都?機(jī)應(yīng)用服辱器R臺(tái)I1控節(jié)點(diǎn)服務(wù)器 1 1 臺(tái),RDBMRDBM 數(shù)據(jù)庫服務(wù)器兩臺(tái)雙機(jī)熱備。具體各服務(wù)器硬件需求如下表:編號(hào)服務(wù)器名配置數(shù)量說明1RDBM嗽據(jù)庫服務(wù)器4*IntelXeonE7-4800/8800v3最大可擴(kuò)展至4CPU,72核支持8GB/16GB/32GB/64GBDDR4高速內(nèi)存配置128G

47、BDDR4內(nèi)存配置9塊900GB15KSAS,14*4TNLSAS硬盤。2雙機(jī)備份2大數(shù)據(jù)平臺(tái)管理節(jié)點(diǎn)2*IntelXeonE7-4800/8800v3最大可擴(kuò)展至4CPU,72核支持8GB/16GB/32GB/64GBDDR4高速內(nèi)存配置128GBDDR4內(nèi)存配置6塊600GB15KSAS,3*4TNLSAS硬盤。1Active3大數(shù)據(jù)平臺(tái)管理節(jié)點(diǎn)2*IntelXeonE7-4800/8800v3最大可擴(kuò)展至4CPU,72核支持8GB/16GB/32GB/64GBDDR4高速內(nèi)存配置128GBDDR4內(nèi)存配置6塊600GB15KSAS,3*4TNLSAS硬盤。1Standby4大數(shù)據(jù)平臺(tái)數(shù)據(jù)

48、節(jié)點(diǎn)2*IntelXeonE7-4800/8800v3最大可擴(kuò)展至4CPU,72核支持8GB/16GB/32GB/64GBDDR4高速內(nèi)存配置128GBDDR4內(nèi)存配置6塊600GB15KSAS,12*4TNLSAS硬盤。19數(shù)據(jù)節(jié)點(diǎn)5大數(shù)據(jù)集群性能檢測(cè)服務(wù)器2*IntelXeonE7-4800/8800v3最大可擴(kuò)展至4CPU,72核支持8GB/16GB/32GB/64GBDDR4高速內(nèi)存配置128GBDDR4內(nèi)存配置6塊600GB15KSAS,1監(jiān)控節(jié)點(diǎn)3*4TNLSAS硬盤。6應(yīng)用服務(wù)器CPU2顆E5-2630v324個(gè)內(nèi)存插槽,取大支持1.5TB內(nèi)存, 支持2133MHz內(nèi)存。當(dāng)前配置

49、64GB內(nèi)存。支持SASSSD和PCIeSSD硬盤,支持2.5寸和3.5寸硬盤混插。支持24+2個(gè)2.5寸SAS/SATA或者14個(gè)3.5寸SAS/SATA+2個(gè)2.5寸SAS/SATA+16個(gè)1.8SSD。硬盤:配置6塊600GB15KSAS硬盤2應(yīng)用服務(wù)器7交換機(jī)4810/100/1000Base-TX,4100/1000Base-XSFP2網(wǎng)絡(luò)設(shè)備8防火墻多功能防火墻,4口以上2安防設(shè)備9工作站Intel(R)XeonCPUE5,配置1TSATA硬盤。內(nèi)存:8GB2說明:硬件部分交換機(jī)、防火強(qiáng)及工作站,請(qǐng)根據(jù)標(biāo)書確認(rèn)!大數(shù)據(jù)服務(wù)器、RDBM激據(jù)庫服務(wù)器及應(yīng)用服務(wù)器的具體配置參數(shù)請(qǐng)硬件朋友

50、和標(biāo)書上進(jìn)行重新確認(rèn),這邊只對(duì)內(nèi)存量、CP則數(shù)及存儲(chǔ)空間大小做了要求。第 5 章個(gè)人介紹吳宏勛:“烽火集成”高級(jí)大數(shù)據(jù)架構(gòu)師,曾擔(dān)任醫(yī)療大數(shù)據(jù)、公安大數(shù)據(jù)、財(cái)稅大數(shù)據(jù)項(xiàng)目大數(shù)據(jù)架構(gòu)師,具有豐富的大數(shù)據(jù)項(xiàng)目實(shí)施經(jīng)驗(yàn),對(duì)高吞吐、高并發(fā)、海量數(shù)據(jù)實(shí)時(shí)匯集,TRPBTRPB 級(jí)海量數(shù)據(jù)即席查詢與實(shí)時(shí)處理具有針對(duì)性方案和經(jīng)驗(yàn),研讀過部分HadoopHBaseSparkHadoopHBaseSpark 源碼,對(duì) HadoopHBaseSparkHadoopHBaseSpark 的原理有很深的理解,曾從事多個(gè)項(xiàng)目大數(shù)據(jù)平臺(tái)的調(diào)優(yōu)工作!標(biāo)準(zhǔn)文案第 6 章專家系統(tǒng)架構(gòu)設(shè)計(jì)本系統(tǒng)總共分為四個(gè)層次,從下到上依次為數(shù)

51、據(jù)采集層、基礎(chǔ)平臺(tái)層、應(yīng)用支撐層、應(yīng)用及展示層,各層在專家系統(tǒng)統(tǒng)一業(yè)務(wù)規(guī)范、技術(shù)規(guī)范、安全規(guī)范下一|進(jìn)行數(shù)據(jù)通信及集成。|1 1 . .數(shù)據(jù)采集層:負(fù)責(zé)專家系統(tǒng)信息數(shù)據(jù)的匯集、轉(zhuǎn)換與加載,數(shù)據(jù)采集層提供多種數(shù)應(yīng)用支撐層報(bào)表引擎數(shù)據(jù)總線服務(wù)應(yīng)用服務(wù)組件身份認(rèn)證權(quán)限管理引擎界面定制引擎大數(shù)據(jù)分析算法大數(shù)據(jù)分析消息隊(duì)列大數(shù)據(jù)查詢適配器SearchAPIKHiveQLUDFSparksql常規(guī)算法(MapReduce)中文分詞-詞頻統(tǒng)計(jì)關(guān)聯(lián)算法機(jī)器學(xué)習(xí)分析適配器頻繁模式挖掘分類器標(biāo)準(zhǔn)規(guī)范組合算法L自定義算法推薦算法I線性回歸頻繁子項(xiàng)挖掘數(shù)據(jù)資源管理數(shù)據(jù)資源調(diào)度引擎基礎(chǔ)平臺(tái)層大數(shù)據(jù)基礎(chǔ)平臺(tái)R內(nèi)存計(jì)算/s

52、park+shark1SparkSQL/SparkMLlibHHiveonSparksparkstreamingHbase(實(shí)時(shí)、分布式、高維數(shù)據(jù)庫)HDFS(分布式文件系統(tǒng))二,二.r業(yè)務(wù)規(guī)范數(shù)據(jù)比對(duì)數(shù)據(jù)去重?cái)?shù)據(jù)關(guān)聯(lián)數(shù)據(jù)組合分布式協(xié)作服務(wù)二一 m 車輛能耗信息數(shù)據(jù)審計(jì)數(shù)據(jù)歸約監(jiān)控預(yù)警應(yīng)用層展示分布式計(jì)算框架/Yarn數(shù)據(jù)編碼格式轉(zhuǎn)換車輛故障信息車輛部件知識(shí)-車輛檢修信息數(shù)據(jù)采集層據(jù)采集方法:ETLETL、FlumeFlume、KafkaKafka 等,系統(tǒng)支持Flume+Kafka+StormFlume+Kafka+Storm 混合架構(gòu)的數(shù)據(jù)采集模式,以提高數(shù)據(jù)采集系統(tǒng)的吞吐量和并發(fā)量。2

53、2 . .基礎(chǔ)平臺(tái)層:基礎(chǔ)平臺(tái)層為專家數(shù)據(jù)倉庫提供大數(shù)據(jù)基礎(chǔ)平臺(tái)支撐,包括分布式存儲(chǔ)系統(tǒng)、HbaseHbase 數(shù)據(jù)庫系統(tǒng)、YarnYarn 并行計(jì)算資源管理與監(jiān)控等,同時(shí)支持 SparSpark k機(jī)器學(xué)習(xí)算法庫,支持 R R 等行業(yè)分析庫。3 3 . .應(yīng)用支撐層:應(yīng)用支撐層為系統(tǒng)各類應(yīng)用提供支撐,是系統(tǒng)數(shù)據(jù)層和應(yīng)用層的連接紐帶。應(yīng)用支撐層包括基礎(chǔ)平臺(tái)和常規(guī)算法兩個(gè)部分,基礎(chǔ)平臺(tái)負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)與并行計(jì)算,數(shù)據(jù)存儲(chǔ)支持分布式存儲(chǔ)、RDBMSRDBMS儲(chǔ)等存儲(chǔ)方式,常規(guī)算法負(fù)責(zé)數(shù)據(jù)分析與業(yè)務(wù)建模。4 4 . .應(yīng)用及展示層:應(yīng)用層是系統(tǒng)各項(xiàng)業(yè)務(wù)功能的集合,主要包括資車輛故障診斷、車輛健康評(píng)估、

54、車輛部件檢修、車輛故障處理及車輛對(duì)比分析等。展示層是用戶同系統(tǒng)交互的窗口,是應(yīng)用層對(duì)外提供服務(wù)的主要手段。支持多種圖表展示如餅圖、柱狀圖、曲線圖、熱力圖、氣泡圖和散點(diǎn)圖等可視化展示。第 7 章平臺(tái)運(yùn)維管理7.1 Hadoop 集群監(jiān)控大數(shù)據(jù)平臺(tái)以 WebWeb 圖形界面實(shí)現(xiàn) HadoopHadoop 集群監(jiān)控, 包括大數(shù)據(jù)平臺(tái)的硬件資源、 軟件資源、數(shù)據(jù)資源的監(jiān)控,以及整個(gè) HadoopHadoop 集群的工作負(fù)載。主要包括以下幾個(gè)方面:7.1.1服務(wù)組件狀態(tài)監(jiān)控通過管理平臺(tái)可以看到所有目前已安裝的服務(wù)組件的健康狀況,綠色圈表示運(yùn)行狀態(tài)健康。Cluster1狀態(tài)配者 f狀態(tài)綠色表示狀態(tài)良好FO

55、IKHBase*OaHD-S-04Hive*OHlHue-OQOozieO般Sqoop1Client.OSqoop2TOSIYARN(MR2lncL,.O.4ZooKeeper-圖:服務(wù)組件運(yùn)行狀況7.1.2存儲(chǔ)與內(nèi)存資源監(jiān)控包括獲取存儲(chǔ)量、剩余存儲(chǔ)量以及存儲(chǔ)系統(tǒng)整體情況信息。如果集群中的某臺(tái)機(jī)器的磁盤或者內(nèi)存的使用率達(dá)到指定的閥值,系統(tǒng)可以通過郵件或者短信的方式進(jìn)行預(yù)警。7.2 系統(tǒng)負(fù)載管理通過管理平臺(tái)可以實(shí)時(shí)看到整個(gè)平臺(tái)的資源負(fù)載情況,包括集群的群磁盤 IOIO、集群網(wǎng)絡(luò) IOIO、HDFSIO,HDFSIO,如下圖所示:群青CPU100%總看竺-i有且.211KJ9-電汁受應(yīng)金申白HDF

56、S0通過對(duì)集群運(yùn)行任務(wù)的實(shí)時(shí)監(jiān)測(cè), 并根據(jù)任務(wù)優(yōu)先級(jí)和耗時(shí)不同對(duì)任務(wù)進(jìn)行動(dòng)態(tài)調(diào)度,減少出現(xiàn)大量任務(wù)等待和重要任務(wù)無法及時(shí)完成的可能,可以使HadoopHadoop 集群的運(yùn)行變得更加高效合理。uaku,*電 k*修砧IflIT,力ftUff!ISrft ii更”r U*M1*MB亡出1眼AM1電|Cg:J3M譚*:iTitW1gunIIIHM謂IURMffiDM3D0hEiwntas-UCWF11仁1呻MQl$ST,msD44341WGMiJE3uEng 向某EHK*rrrlareILFJOE1一BBiNHlikH”IK(3flHE 孑DEn-i-iilaa-Tjae一E12IB一MlHl_1巾 7”1b=!=S=SS=KTAIftai圖: 存儲(chǔ)和內(nèi)存資源監(jiān)控CPUCPU 集看小主機(jī)中的主觀CPU使用率rJ!HDFSnsmsscf.2attiHDFSntanffifirviHDFS,.SibS不適用-HDF策總計(jì)然不曷用(1)(1)、系統(tǒng)根據(jù)各隊(duì)列資源的最小值分配集群資源,這樣可以按照需求對(duì)各任務(wù)隊(duì)列獲取的集群資源進(jìn)行分配,而且不會(huì)出現(xiàn)集群資源的閑置浪費(fèi)。(2)(2)、可以實(shí)現(xiàn)對(duì)各任務(wù)隊(duì)列獲取的集群資源大小實(shí)時(shí)動(dòng)態(tài)調(diào)整,及時(shí)保證高優(yōu)先級(jí)任務(wù)所在隊(duì)列獲得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論