商業(yè)智能與大數(shù)據(jù)分析軟件團(tuán)體標(biāo)準(zhǔn)_第1頁
商業(yè)智能與大數(shù)據(jù)分析軟件團(tuán)體標(biāo)準(zhǔn)_第2頁
商業(yè)智能與大數(shù)據(jù)分析軟件團(tuán)體標(biāo)準(zhǔn)_第3頁
商業(yè)智能與大數(shù)據(jù)分析軟件團(tuán)體標(biāo)準(zhǔn)_第4頁
商業(yè)智能與大數(shù)據(jù)分析軟件團(tuán)體標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

商業(yè)智能與大數(shù)據(jù)分析軟件本文件規(guī)定了商業(yè)智能與大數(shù)據(jù)分析軟件(以下簡稱“軟件”)的軟件定義、基礎(chǔ)軟件需求、軟件功能需求、非功能需求。本文件適用于商業(yè)智能與大數(shù)據(jù)分析軟件。2規(guī)范性引用文件下列文件對于本文件的應(yīng)用是必不可少的,凡是注日期的引用文件,僅注日期的版本適用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T26232基于J2EE的應(yīng)用服務(wù)器技術(shù)規(guī)范GB/T17544信息技術(shù)軟件包質(zhì)量要求和測試GB/T16260軟件質(zhì)量模型與度量介紹3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1報表Report用表格格式來動態(tài)顯示業(yè)務(wù)數(shù)據(jù),具備固定格式、不規(guī)則行列頭、多區(qū)域報表、支持跨區(qū)域公式計算的特點,且支持導(dǎo)出不同的文件格式。3.2聯(lián)機(jī)分析處理OLAPOLAP技術(shù)基于MDX查詢語言,主要通過多維的方式來對數(shù)據(jù)進(jìn)行分析、查詢和生成報表。OLAP系統(tǒng)的應(yīng)用主要是對用戶當(dāng)前的及歷史數(shù)據(jù)進(jìn)行分析,輔助決策。3.3儀表板Dashboard借助圖表、圖形和地圖等可視化元素形成業(yè)務(wù)綜合報告,供用戶查看和了解數(shù)據(jù)中的趨勢、異常和狀態(tài),從而改進(jìn)決策效率,具備高度交互化。3.4移動BIMobileBusinessIntelligence指通過移動設(shè)備提供報告、儀表板、可視化數(shù)據(jù)發(fā)現(xiàn)和基本分析功能。3.5數(shù)據(jù)準(zhǔn)備Datapreparation數(shù)據(jù)準(zhǔn)備一個為了使數(shù)據(jù)可用于分析為目的,而進(jìn)行迭代和敏捷的過程,用于探索、組合、清理原始數(shù)據(jù)并將其轉(zhuǎn)換為自助數(shù)據(jù)集成。3.6數(shù)據(jù)處理ETLETL是英文Extract-Transform-Load的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程。3.7元數(shù)據(jù)管理Metadatamanagement用于描述數(shù)據(jù)屬性的信息,為數(shù)據(jù)存儲位置、數(shù)據(jù)來源、資源查找、文件記錄提供支撐,進(jìn)而達(dá)成協(xié)助數(shù)據(jù)檢索、提高數(shù)據(jù)使用效率的目的。3.8數(shù)據(jù)探索Dataexploration具備可視化操作的清單明細(xì)數(shù)據(jù)查詢,以及多維度的深層次、自由式的數(shù)據(jù)分析過程。3.9數(shù)據(jù)目錄Datacatalog在安全受控的前提下,開放組織內(nèi)經(jīng)過清洗的數(shù)據(jù)給用戶,業(yè)務(wù)用戶可以在數(shù)據(jù)目錄中快速找到自己需要的數(shù)據(jù)并提出申請,以獲得數(shù)據(jù)的使用權(quán)限。3.10信創(chuàng)產(chǎn)業(yè)Informationtechnologyapplicationinnovationindustry信創(chuàng)產(chǎn)業(yè),即信息技術(shù)應(yīng)用創(chuàng)新產(chǎn)業(yè)。信創(chuàng)涉及到的行業(yè)包括IT基礎(chǔ)設(shè)施:CPU芯片、服務(wù)器、存儲、交換機(jī)、路由器、各種云和相關(guān)服務(wù)內(nèi)容;基礎(chǔ)軟件:數(shù)據(jù)庫、操作系統(tǒng)、中間件;應(yīng)用軟件:OA、ERP、辦公軟件、政務(wù)應(yīng)用、流版簽軟件;信息安全:邊界安全產(chǎn)品、終端安全產(chǎn)品等。4軟件的概述商業(yè)智能與大數(shù)據(jù)分析軟件指在一個安全可控的平臺上將企業(yè)現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為知識,幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策,實現(xiàn)從“數(shù)據(jù)”到“決策行動”。主要包括以下4類分析:4.1描述性分析解決“發(fā)生了什么”的問題。通常由IT主導(dǎo),基于預(yù)處理好的數(shù)據(jù)模型進(jìn)行交互式的KPI和報表的創(chuàng)建,從而讓管理者瀏覽查閱,幫助其做出分析決策。4.2診斷性分析解決“為什么發(fā)生”的問題。由業(yè)務(wù)分析師主導(dǎo),通過可視化的探索平臺,進(jìn)行自由的用戶交互操作,創(chuàng)建用于監(jiān)控和分析的儀表板,從而解決診斷性、探索性的問題。4.3預(yù)測性分析解決“將來會怎么樣”的問題。由業(yè)務(wù)分析師和消費者主導(dǎo),基于開放式問題和結(jié)構(gòu)化數(shù)據(jù)進(jìn)行增強(qiáng)分析。包括增加了機(jī)器學(xué)習(xí)ML用于解決預(yù)測性的問題,增加了自然語言分析NLA用于人機(jī)交互等。4.4指示性分析解決“我應(yīng)該怎么做”的問題。通常面向消費者,進(jìn)行數(shù)據(jù)的增強(qiáng)消費,解決指示性的問題。主要體現(xiàn)在:以機(jī)器學(xué)習(xí)為主導(dǎo)在上下文中為用戶連續(xù)自動生成描述性,診斷性,預(yù)測性,說明性見解;以故事或新聞饋送的形式或可固定到儀表板的動態(tài)儀表板的形式提供洞察力。5基礎(chǔ)軟件需求基礎(chǔ)軟件是指部署于運行商業(yè)智能與數(shù)據(jù)分析軟件系統(tǒng)的基本依賴軟件或應(yīng)用,包含操作系統(tǒng)、數(shù)據(jù)庫(存放系統(tǒng)元數(shù)據(jù))、中間件等模塊。需要與國內(nèi)信創(chuàng)產(chǎn)業(yè)需求高度貼合,充分體現(xiàn)核心信息技術(shù)產(chǎn)品和關(guān)鍵服務(wù)完整的可控性與自主性。5.1操作系統(tǒng)系統(tǒng)應(yīng)支持部署和在多種不同的操作系統(tǒng)上使用,包括但不限于基于Linux、Unix等系統(tǒng)平臺。5.2數(shù)據(jù)庫系統(tǒng)的元數(shù)據(jù)應(yīng)支持存放在國產(chǎn)化的數(shù)據(jù)庫上。5.3中間件中間件是介于應(yīng)用系統(tǒng)和系統(tǒng)軟件之間的一類軟件,它使用系統(tǒng)軟件所提供的基礎(chǔ)服務(wù),銜接應(yīng)用系統(tǒng)的各個部分或不同的應(yīng)用,能夠達(dá)到資源共享、功能共享的目的。需支持國產(chǎn)化中間件。6軟件功能需求6.1統(tǒng)一平臺管理統(tǒng)一管理平臺是系統(tǒng)平穩(wěn)運行的基礎(chǔ),主要為系統(tǒng)提供底層服務(wù),其功能需涵蓋數(shù)據(jù)源管理、性能監(jiān)控管理、元數(shù)據(jù)管理、權(quán)限管理等模塊。6.1.1數(shù)據(jù)源管理數(shù)據(jù)源是管理信息系統(tǒng)、辦公自動化系統(tǒng)、決策支持系統(tǒng)等各類信息系統(tǒng)的核心部分,是進(jìn)行數(shù)據(jù)分析和決策管理的重要技術(shù)手段和基礎(chǔ)來源。系統(tǒng)應(yīng)具備界面化配置式的數(shù)據(jù)源管理能力,使用戶能夠連接和攝取本地和云中各種類型的存儲數(shù)據(jù)庫中包含的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的功能使用戶能夠連接和提取本地和云中各種類型的存儲數(shù)據(jù)庫中包含的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的功能。支持?jǐn)?shù)據(jù)源包括但不限于:a)應(yīng)支持國產(chǎn)數(shù)據(jù)庫,且具備自主可控性。b)應(yīng)支持文本數(shù)據(jù)源,能夠直接讀取CSV、TXT等數(shù)據(jù)、數(shù)據(jù)分析包加載到系統(tǒng)中進(jìn)行分析,無須預(yù)先定義模板。c)應(yīng)支持開源的NoSQL數(shù)據(jù)庫。6.1.2性能監(jiān)控與管理系統(tǒng)應(yīng)提供性能監(jiān)控的分析能力,能夠跟蹤和監(jiān)控系統(tǒng)運行情況,分析及排查系統(tǒng)問題,性能監(jiān)控與管理內(nèi)容包括但不限于:a)應(yīng)提供統(tǒng)一的系統(tǒng)監(jiān)控界面,方便系統(tǒng)管理員進(jìn)行系統(tǒng)運行監(jiān)控與問題排查,包括線程、緩存、堆打印、實驗監(jiān)控、服務(wù)監(jiān)控、會話、網(wǎng)絡(luò)、內(nèi)存、SQL監(jiān)控等分析顯現(xiàn)能力。b)應(yīng)提供耗時分析功能,報表可進(jìn)行耗時分析,能查看服務(wù)器總耗時時間、SQL執(zhí)行時間、數(shù)據(jù)讀取時間、服務(wù)器處理時間、數(shù)據(jù)集行數(shù)。并可對相關(guān)時間進(jìn)行詳情查看。6.1.3元數(shù)據(jù)管理元數(shù)據(jù)是描述數(shù)據(jù)屬性的數(shù)據(jù),其主要是描述數(shù)據(jù)屬性的信息,如數(shù)據(jù)存儲位置、數(shù)據(jù)來源、文件記錄等。系統(tǒng)應(yīng)具備對元數(shù)據(jù)的管理能力,包括但不限于以下功能:a)應(yīng)提供元數(shù)據(jù)搜索功能,能夠搜索系統(tǒng)內(nèi)數(shù)據(jù)源、數(shù)據(jù)集、參數(shù)等所有系統(tǒng)資源,并定位資源所在路徑。b)應(yīng)提供對資源進(jìn)行影響性分析和血緣分析的功能。血緣關(guān)系和影響分析兩個關(guān)鍵特性為用戶重建了整個元數(shù)據(jù)家族的構(gòu)建過程,刻畫了家族成員彼此連接的脈絡(luò)和途徑。比如當(dāng)報表數(shù)據(jù)出現(xiàn)錯誤或者異常時,我們可通過血緣關(guān)系圖向上分析鎖定問題產(chǎn)生的源頭(如表和字段當(dāng)對某些字段數(shù)據(jù)進(jìn)行修改時,可通過影響關(guān)系圖向下分析,得到哪些數(shù)據(jù)實體中的數(shù)據(jù)會受到影響。6.1.4權(quán)限管理權(quán)限管理指根據(jù)系統(tǒng)設(shè)置的安全規(guī)則或者安全策略,用戶可以訪問而且只能訪問自己被授權(quán)的資源。系統(tǒng)應(yīng)具備數(shù)據(jù)行權(quán)限、資源權(quán)限、操作權(quán)限的管理能力,包括但不限于以下功能:a)需提供細(xì)粒度權(quán)限控制的功能,能夠?qū)⒛夸浕驁蟊硎跈?quán)給用戶、用戶組、角色等,實現(xiàn)查看、編輯、刪除、再授權(quán)等不同粒度的權(quán)限控制。b)需提供批量授權(quán)的功能,報表資源權(quán)限授權(quán)用戶后,直接對用戶進(jìn)行該報表資源的引用資源的一鍵批量授權(quán),從而減輕授權(quán)工作量。c)需提供權(quán)限繼承的功能,能夠?qū)⑾录壞夸浕驁蟊砜勺詣永^承上級目錄的授權(quán)設(shè)置,無需逐個目錄或報表進(jìn)行授權(quán),權(quán)限繼承的方式可配置。6.2數(shù)據(jù)管理數(shù)據(jù)管理是一個為了使數(shù)據(jù)可用于分析為目的,而進(jìn)行迭代和敏捷的數(shù)據(jù)準(zhǔn)備過程,用于探索、組合、清理原始數(shù)據(jù),并將其轉(zhuǎn)換為BI分析成果來源的各種分析模型。包括但不但于數(shù)據(jù)目錄、數(shù)據(jù)處理、數(shù)據(jù)緩存、虛擬語義模型、增強(qiáng)數(shù)據(jù)集等內(nèi)容。6.2.1數(shù)據(jù)目錄在安全受控的前提下,開放組織內(nèi)經(jīng)過清洗的數(shù)據(jù)給用戶,業(yè)務(wù)用戶可以在數(shù)據(jù)目錄中快速找到自己需要的數(shù)據(jù)并提出申請,以獲得數(shù)據(jù)的使用權(quán)限。數(shù)據(jù)目錄應(yīng)包括但不限于以下功能:a)應(yīng)提供數(shù)據(jù)快速定位的功能,用戶可以在數(shù)據(jù)目錄中通過全文檢索的方式快速查找有平臺內(nèi)部有哪些數(shù)據(jù)可以使用。b)應(yīng)提供數(shù)據(jù)快查的功能,需提供數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)脫敏預(yù)覽、數(shù)據(jù)溯源分析等基礎(chǔ)的能力,用戶可以直接查看權(quán)限范圍內(nèi)的數(shù)據(jù),對于沒有權(quán)限的數(shù)據(jù),系統(tǒng)對數(shù)據(jù)進(jìn)行隨機(jī)脫敏和處理,以保障數(shù)據(jù)的安全。c)應(yīng)提供在線數(shù)據(jù)申請授權(quán)的功能,對于未授權(quán)的數(shù)據(jù),用戶可以自主申請授權(quán),審核用戶審核通過并授權(quán)后即可獲取需要的數(shù)據(jù)。6.2.2數(shù)據(jù)處理數(shù)據(jù)處理(ETL)指的是在數(shù)據(jù)分析之前對數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、加載的過程。源數(shù)據(jù)通常來自不同的業(yè)務(wù)系統(tǒng),它們有不同的數(shù)據(jù)格式,也包含一些冗余的信息。ETL負(fù)責(zé)將分散的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時中間層后,進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘提供決策支持的數(shù)據(jù)。ETL數(shù)據(jù)處理應(yīng)包括但不限于以下內(nèi)容:.數(shù)據(jù)源支持應(yīng)支持關(guān)系數(shù)據(jù)源、Kafka流、文本數(shù)據(jù)文件等多種數(shù)據(jù)源。.基于Web的可視化ETL作業(yè)流程配置應(yīng)具備可視化流式操作界面,能夠在界面上直接配置ETL轉(zhuǎn)換作業(yè)流,業(yè)務(wù)人員能夠在Web端通過拖拉拽的方式完成配置等操作。.數(shù)據(jù)采樣應(yīng)支持?jǐn)?shù)據(jù)進(jìn)行隨機(jī)采樣、加權(quán)采樣、分層采樣,下采樣,并且可選擇按個數(shù)、比例進(jìn)行采樣。.豐富的數(shù)據(jù)處理組件應(yīng)具備豐富的數(shù)據(jù)處理組件,包括但不限于:數(shù)據(jù)拆分、字段過濾與映射、列選擇、過濾空值、合并列、合并行、JOIN、元數(shù)據(jù)編輯、行選擇、去除重復(fù)值、排序、增加序列號、聚合、分列、派生列、類型轉(zhuǎn)換、行列轉(zhuǎn)換等操作。.自定義腳本應(yīng)支持自定義編寫SQL、Python等數(shù)據(jù)處理腳本,能夠輕松應(yīng)對一些比較復(fù)雜的業(yè)務(wù)場景。.支持大數(shù)據(jù)量表關(guān)聯(lián)應(yīng)支持對兩個億級數(shù)據(jù)進(jìn)行表關(guān)聯(lián)處理,能夠應(yīng)對超大數(shù)據(jù)量處理。.支持作業(yè)流及調(diào)度監(jiān)控應(yīng)支持在Web端可視化的配置作業(yè)流,對ETL轉(zhuǎn)換流進(jìn)行可視化組裝配置,支持作業(yè)流的運行進(jìn)行調(diào)度監(jiān)控。6.2.3數(shù)據(jù)緩存應(yīng)提供分布式的數(shù)據(jù)緩存引擎,用于性能加速,在進(jìn)行數(shù)據(jù)分析的時候,可基于數(shù)據(jù)集進(jìn)行數(shù)據(jù)增量或者全量抽取到分布式存儲的數(shù)據(jù)緩存層,解決性能瓶頸。并且需要能夠提供多種緩存庫可靈活替換抽取方案。6.2.4虛擬語義模型虛擬語義模型是指允許用戶創(chuàng)建涵蓋整個倉庫的語義模型,可以按照業(yè)務(wù)邏輯對原始數(shù)據(jù)表進(jìn)行重新建模,將數(shù)據(jù)庫物理表、字段,封裝重組成面向業(yè)務(wù)的邏輯視圖,方便業(yè)務(wù)分析用戶進(jìn)行自助式的數(shù)據(jù)分析。通過構(gòu)建主題視圖,用戶即可靈活、自助式地獲取業(yè)務(wù)上所需要的信息,從而快速輔助決策,包括但不限于以下功能:a)應(yīng)支持將數(shù)據(jù)庫中的數(shù)據(jù)定義成明確有業(yè)務(wù)含義的名稱,業(yè)務(wù)人員面對的不再是表、字段,而是業(yè)務(wù)術(shù)語。b)應(yīng)支持將數(shù)據(jù)庫中的表字段進(jìn)行拖拽重組,形成面向業(yè)務(wù)分析的邏輯主題,并支持在主題中對表字段進(jìn)行時間層次、轉(zhuǎn)換規(guī)則、參與分組等設(shè)置。c)應(yīng)支持跨多種不同的數(shù)據(jù)庫建立語義模型。d)應(yīng)支持對指標(biāo)設(shè)置默認(rèn)的瀏覽格式(如百分比、萬元)和聚合方式(合計、計數(shù)等),在分析展現(xiàn)瀏覽數(shù)據(jù)時該字段應(yīng)可自動以該格式展現(xiàn),無需逐個設(shè)置。e)應(yīng)支持多表關(guān)聯(lián)設(shè)置,支持左連接、右連接、內(nèi)連接、全連接等方式,并支持按列名、按別名、按外鍵自動創(chuàng)建表關(guān)系,支持一鍵清除表關(guān)系。6.2.5增強(qiáng)數(shù)據(jù)集系統(tǒng)需要具有數(shù)據(jù)建模能力,作為數(shù)據(jù)源和可視化展示的中間環(huán)節(jié),承接數(shù)據(jù)源的輸入,并作為可視化展示輸出到儀表盤或報表,這通常通過增強(qiáng)數(shù)據(jù)集功能提供。在增強(qiáng)數(shù)據(jù)集中,您可以對數(shù)據(jù)集關(guān)聯(lián)、轉(zhuǎn)換ETL高級查詢,預(yù)覽數(shù)據(jù)、抽取設(shè)置、自動創(chuàng)建維度表,標(biāo)記計算度量等操作。.多源組合能力多源組合能力是指產(chǎn)品在BI建模的過程中,數(shù)據(jù)集可能需要連接多個數(shù)據(jù)源以創(chuàng)建報表,而創(chuàng)建不同數(shù)據(jù)源之間的邏輯連接,需要創(chuàng)建一種關(guān)系,即表與表之間的關(guān)系,了解表與表之間的關(guān)系,讓您能夠更快速/便捷地讀取數(shù)據(jù)中的關(guān)鍵信息。包含但不限于以下功能:a)應(yīng)支持跨源跨庫:能夠連接不同種類、不同類型的數(shù)據(jù)庫;能夠連接SQL數(shù)據(jù)集、存儲過程數(shù)據(jù)集、腳本查詢以及即席查詢等二次分析結(jié)果b)應(yīng)支持?jǐn)?shù)據(jù)關(guān)系管理:支持通過關(guān)聯(lián)表功能,將多張數(shù)據(jù)表以雪花模型或星型模型方式關(guān)聯(lián)。c)應(yīng)支持圖形化設(shè)置:左聯(lián)、內(nèi)聯(lián)、外聯(lián)、全聯(lián)。d)應(yīng)支持二次數(shù)據(jù)處理分析:能夠新建或編輯度量、維度,支持高級ETL轉(zhuǎn)換,將多來源的異構(gòu)數(shù)據(jù)進(jìn)行處理后得到具備完整性、一致性的數(shù)據(jù)模型,應(yīng)支持的數(shù)據(jù)預(yù)處理方法包括采樣、拆分、過濾與映射、列選擇、空值處理、合并列、合并行、元數(shù)據(jù)編輯、JOIN、行選擇、去除重復(fù)值、排序、增加序列號、聚合、分列、派生列等;能夠直接在界面配置數(shù)據(jù)脫敏規(guī)則實現(xiàn)數(shù)據(jù)脫敏,并對不同用戶組、用戶、角色生效;能夠直接將文本數(shù)據(jù)或數(shù)據(jù)分析包加載到系統(tǒng)中進(jìn)行分析,無須預(yù)先定義模板。e)應(yīng)支持直連和抽取模式,其中抽取模式可基于數(shù)據(jù)集進(jìn)行數(shù)據(jù)增量或者全量抽取,數(shù)據(jù)可抽取到國產(chǎn)數(shù)據(jù)緩存庫。.增強(qiáng)OLAP能力增強(qiáng)OLAP主要是通過數(shù)據(jù)立方體(cube)進(jìn)行數(shù)據(jù)分析,提供直觀易懂的查詢結(jié)果,滿足多維環(huán)境下特定的查詢和報表需求。其功能應(yīng)包括但不限于:a)支持多維數(shù)據(jù)建模,需要能建立與設(shè)置如下功能:1)維度(Dimension):是人們觀察數(shù)據(jù)的特定角度,是考慮問題時一類屬性的集合(時間維、地理維等)2)度量(Measure):也稱為測量值,是數(shù)值型的數(shù)據(jù),通常是可聚合的。3)層次(level人們觀察數(shù)據(jù)的某個特定角度(即某個維)還可以存在細(xì)節(jié)程度不同的各個描述方面(例如時間維:年、季度、月份、日期;地理維:國家、地區(qū)、省份、城市)。4)層次結(jié)構(gòu)(Hierarchy):維度中層次的上下級組織關(guān)系。(例如年-季-月是一個層次結(jié)構(gòu),年-月-日是另一個層次結(jié)構(gòu))同一個維度可以有多個層次結(jié)構(gòu)。5)成員(Member):維度上的某一個特定取值。6)成員屬性(Properties):維度成員的描述信息,name、caption等是成員的內(nèi)置成員屬性,可以定義其它附屬的成員屬性。例如商店維度的商店層次,有商店面積、店員人數(shù)等,這些信息屬于這個商店這個分析維度,又不適合獨立成一個維度。7)多維數(shù)據(jù)集(Cube):一組分析維度和一組面向相同主題的度量,構(gòu)成了一個多維數(shù)據(jù)集。b)應(yīng)支持的國產(chǎn)或者開源多維數(shù)據(jù)庫。c)應(yīng)支持多維表達(dá)式(MDX):1)計算成員:計算成員是為一個動態(tài)添加的臨時成員2)命名集:命名集是一個預(yù)先定義的集合,供后面的mdx子句使用。當(dāng)一個集合重復(fù)出現(xiàn)多次時,可以通過命名集來簡化語句,避免重復(fù)。3)MDX函數(shù):如數(shù)值函數(shù)、邏輯函數(shù)、字符串函數(shù)、成員函數(shù)、集合函數(shù)等.增強(qiáng)計算能力增強(qiáng)計算能力是指通過機(jī)器學(xué)習(xí)和AI,幫助用戶準(zhǔn)備海量數(shù)據(jù)進(jìn)行分析,并提供見解。并助能夠根據(jù)用戶行為等不同維度的信息動態(tài)的提供預(yù)測,其功能包括但不限于:a)分布式計算。b)直觀的流式建模、拖拽式操作。c)Python擴(kuò)展。d)預(yù)測/聚類等成熟學(xué)習(xí)算法。e)模型集中管理與發(fā)布功能。.高性能高性能主要是保障系統(tǒng)運行的生命周期和擴(kuò)展能力,系統(tǒng)應(yīng)具備高速緩存機(jī)制來提高系統(tǒng)性能,應(yīng)對在處理大數(shù)據(jù)或超大數(shù)據(jù)時導(dǎo)致報表長時間刷不出來或者系統(tǒng)崩潰等現(xiàn)象。高性能應(yīng)具備但不限于以下能力:a)應(yīng)支持列式數(shù)據(jù)庫b)應(yīng)支持MPP:1)應(yīng)支持集群部署和大規(guī)模并行處理。2)應(yīng)能夠處理PB級別的、高質(zhì)量結(jié)構(gòu)化數(shù)據(jù),同時為應(yīng)用提供豐富的SQL和事務(wù)支持能3)應(yīng)支持兩個億級表關(guān)聯(lián)查詢,秒級響應(yīng)。4)對于海量大數(shù)據(jù)跨庫查詢,內(nèi)置的跨庫引擎應(yīng)能夠通過線性擴(kuò)充、并行處理。6.3數(shù)據(jù)分析數(shù)據(jù)分析指用適當(dāng)?shù)慕y(tǒng)計、分析方法對收集來的大量數(shù)據(jù)進(jìn)行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。6.3.1報表報表就是用表格、圖表等格式來動態(tài)顯示數(shù)據(jù),它對數(shù)據(jù)按一定的表格形式進(jìn)行匯總反映和綜合反映,其功能需包括但不限于:a)應(yīng)支持直接在Web上開發(fā)設(shè)計報表,以便更好的支持國產(chǎn)系統(tǒng)和軟件。b)應(yīng)支持各種計算復(fù)雜格式復(fù)雜的中國式報表,如不規(guī)則報表、交叉報表、多區(qū)域報表、分片報表等。c)需兼容日常辦公軟件的表格函數(shù)。6.3.2數(shù)據(jù)探索數(shù)據(jù)探索是指進(jìn)行探索式的數(shù)據(jù)分析,用戶嘗試各種方法來探索發(fā)現(xiàn)數(shù)據(jù)中可能存在的關(guān)系。數(shù)據(jù)探索通常通過簡單的操作,用戶即可進(jìn)行明細(xì)數(shù)據(jù)查詢或是統(tǒng)計分析,還能自定義查詢條件。.即席查詢即席查詢是用戶根據(jù)自己的需求,靈活的選擇查詢條件,系統(tǒng)能夠根據(jù)用戶的選擇生成相應(yīng)的統(tǒng)計報表。即席查詢與普通應(yīng)用查詢最大的不同是普通的應(yīng)用查詢是定制開發(fā)的,而即席查詢是由用戶自定義查詢條件的。其功能需包括但不限于:a)應(yīng)支持條件篩選,可以選擇任意輸出字段也可以將任意字段作為篩選條件。b)應(yīng)支持靈活更改查詢運算符,靈活改變查詢條件間組合關(guān)系和順序,還能根據(jù)字段類型智能顯示參數(shù)控件類型。c)應(yīng)支持大數(shù)據(jù)量的批量導(dǎo)出。d)應(yīng)支持加密導(dǎo)出,能夠?qū)蟊韺?dǎo)出為加密的數(shù)據(jù)分析包,數(shù)據(jù)分析包可以導(dǎo)入回系統(tǒng)進(jìn)行數(shù)據(jù)分析。.透視分析透視分析是指通過交互式的方式進(jìn)行多維度統(tǒng)計分析。它可以進(jìn)行某些計算,如求和與計數(shù)等,所進(jìn)行的計算與數(shù)據(jù)跟維度的排列有關(guān)。之所以稱為透視分析,是因為可以動態(tài)地改變分析維度,以便按照不同方式分析數(shù)據(jù),每一次改變維度布置時,透視分析會立即按照新的布置重新計算數(shù)據(jù)。另外,如果原始數(shù)據(jù)發(fā)生更改,則可以更新透視分析。a)應(yīng)支持組合、匯總計算,不需要預(yù)先構(gòu)建多維模型,任何字段都可直接作為輸出字段或篩選條件。b)應(yīng)支持多種分析方法,包括但不局限于切片、鉆取、旋轉(zhuǎn)、行列互換、焦點項等。c)應(yīng)支持超多維度、甚至維度無法固定的分析場景d)應(yīng)支持通過自定義計算字段,擴(kuò)展可分析的維度和度量e)應(yīng)支持超大數(shù)據(jù)量的查詢性能,億級數(shù)據(jù)秒級響應(yīng)。f)應(yīng)支持自定義時間維度,并支持多種時間計算選項,包括但不局限于:同期值、同期增長率、前期值、環(huán)比、環(huán)比增長率、期初期末值、日均、累計值、增長值等。.OLAP分析OLAP分析使得不同角色的用戶可基于自身所關(guān)注的維度,進(jìn)行靈活快捷、多維度的交互數(shù)據(jù)分析,從而使用戶對大量復(fù)雜數(shù)據(jù)的分析變得輕松而高效,以利于迅速做出正確的判斷,輔助商業(yè)決策。其功能需包括但不限于涵蓋多維分析、統(tǒng)計分析、自定義計算。a)多維分析支持用戶能按指定維度層次進(jìn)行匯總并呈現(xiàn)成表格或圖形,并在表格或者圖形上進(jìn)行鉆取、聚合、切塊、行列互換、分級排序等分析操作,以供用戶靈活地操縱企業(yè)的數(shù)據(jù),以多維的形式從多方面和多角度來觀察企業(yè)的狀態(tài)與變化。1)鉆取:能夠改變當(dāng)前多維分析中維的層次,變換分析粒度的一類分析操作。包含但不限于向上鉆取、向下鉆取、層鉆操作。向上鉆取,應(yīng)當(dāng)支持以漸增概括方式匯總數(shù)據(jù)(例如,從周到季度,再到年度);向下鉆取,應(yīng)當(dāng)支持使用戶在多層數(shù)據(jù)中展現(xiàn)漸增的細(xì)節(jié)層次,獲得更多的細(xì)節(jié)性數(shù)據(jù);層鉆,應(yīng)當(dāng)支持在維度樹結(jié)構(gòu)中根據(jù)查找條件搜索出當(dāng)前維度中任意層次中的成員。2)聚合:系統(tǒng)應(yīng)當(dāng)支持用戶以更為簡便的表格操作方式實現(xiàn)維度成員的聚合。包括但不限于常用的匯總方法,如合計、平均值、最大值和最小值。3)切塊:系統(tǒng)應(yīng)當(dāng)支持使人們能把維度放到多維分析切塊區(qū)域,實現(xiàn)在多個維上集中觀察數(shù)據(jù)。同時,應(yīng)當(dāng)支持用戶為了實現(xiàn)更復(fù)雜的需求,能夠自定義一類參數(shù)。4)行列互換:系統(tǒng)應(yīng)當(dāng)支持用戶能夠?qū)⑿猩纤械木S與列上所有的維按照原有順序進(jìn)行整體調(diào)換,從而得到不同視角的數(shù)據(jù)。5)分級排序:系統(tǒng)應(yīng)當(dāng)支持用戶根據(jù)某數(shù)據(jù)列對表格區(qū)中的數(shù)據(jù)重新進(jìn)行排列的操作。6)系統(tǒng)設(shè)計好的多維分析報表發(fā)布到門戶后,支持業(yè)務(wù)人員仍然能夠在瀏覽界面(非編輯報表界面)繼續(xù)對維度和度量等進(jìn)行調(diào)整,繼續(xù)做進(jìn)一步探索。b)統(tǒng)計分析通過簡便操作就能實現(xiàn)與業(yè)務(wù)有關(guān)的統(tǒng)計分析能力,包括但不限于現(xiàn)狀分析和發(fā)展分析。1)現(xiàn)狀分析:系統(tǒng)應(yīng)當(dāng)支持用戶能夠從不同角度對當(dāng)前關(guān)鍵數(shù)據(jù)進(jìn)行分析,從而可以了解機(jī)構(gòu)業(yè)務(wù)或經(jīng)營情況的現(xiàn)狀,現(xiàn)狀分析方法應(yīng)該包括但不限于占比分析、排名分析等。2)發(fā)展分析:系統(tǒng)應(yīng)當(dāng)支持用戶能夠?qū)ν粋€指標(biāo)不同時期的樣本進(jìn)行比較,從而總結(jié)出分析指標(biāo)發(fā)展規(guī)律;發(fā)展分析方法應(yīng)該包括但不限于環(huán)比分析、前期值分析、同期值分析、同比分析等。c)自定義計算支持用戶無需編程就可以定義新的專門計算,實現(xiàn)復(fù)雜的業(yè)務(wù)計算需求。1)自定義計算:基于已有成員通過算術(shù)運算符、數(shù)字和MDX函數(shù)進(jìn)行重新組合生成新的指標(biāo),或者為重復(fù)使用而創(chuàng)建的維度成員集合,將其作為分析的一部分。2)計算優(yōu)先級:存在兩個或多個自定義成員的計算規(guī)則時,能夠設(shè)置自定義成員的計算優(yōu)先級,以保證計算結(jié)果的正確性。6.3.3儀表板儀表板代表了一種報告風(fēng)格,它聚合并顯示各種指標(biāo),使所有用戶都能一目了然地檢查數(shù)據(jù)。儀表板通過組合信息和交互能力來幫助改進(jìn)決策。它還使用諸如刻度盤、儀表和“紅綠燈”之類的信息圖形來顯示指標(biāo),這些信息圖形指示顯示著既定目標(biāo)的進(jìn)展。在某些情況下,儀表板正在演變?yōu)樽约旱摹皯?yīng)用程序”。.交互式可視化交互式可視化是指將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來,用戶可直接在圖形或圖像上進(jìn)行交互式操作。需要支持的圖形或圖像包括但不限于:a)應(yīng)支持各種各樣的圖形,并能可視化設(shè)置圖形選項。圖形類型包括但是不局限于柱圖、線圖、餅圖、瀑布圖、旭日圖、關(guān)系圖、雷達(dá)圖、油量圖、熱力圖、樹圖、?;鶊D、漏斗圖、極坐標(biāo)柱圖、極坐標(biāo)線圖等圖形,還能支持迷你圖、帕累托圖、子彈圖、小又多圖等等特色圖形,支持3D航線圖、3D散點圖、3D柱圖等3D圖形。b)應(yīng)支持地理圖形展現(xiàn)。地圖包括但是不局限于中國、及各省行政區(qū)域地圖,內(nèi)置支持百度地圖,支持自定義地圖;地圖還應(yīng)該包括多種地圖樣式供選擇,包括但不局限于區(qū)域地圖、散點標(biāo)記地圖、熱力地圖和航線圖等;c)圖形之間應(yīng)支持各種交互操作,包括但不局限于聯(lián)動、跳轉(zhuǎn)、鉆取等。d)應(yīng)具備較好的擴(kuò)展能力,能夠擴(kuò)展第三方圖形。.自助儀表盤儀表盤是為了實現(xiàn)些某些特定目標(biāo)而對重要信息進(jìn)行的視覺傳達(dá)方式,對一屏上的內(nèi)容進(jìn)行組織呈列使人一瞥便能掌握其所要傳達(dá)的信息。自助儀表盤是人人都可以操作的儀表盤,用戶只用托拉拽的操作全程自助式地完成儀表盤的操作。自助儀表盤應(yīng)包括但不限于以下功能:a)應(yīng)支持可視化拖拽操作,簡單易用;還支持所見即所得,一屏完成儀表板的創(chuàng)建。b)應(yīng)支持各種可視化組件,包括但不局限于柱圖、瀑布圖、面積圖、雷達(dá)圖、地圖、TAB頁組件和URL鏈接組件等。c)應(yīng)支持多種主題樣式,包括但不局限儀表盤主題、圖形主題、組件主題等;配色樣式包括深色風(fēng)格、淺色風(fēng)格等,主題和樣式都支持自定義。d)應(yīng)支持多種布局方式,包括但不局限于高寬自適應(yīng)、寬度自適應(yīng)、自由布局。布局還支持拖拽實現(xiàn)資源自由組合、縮放大??;e)應(yīng)支持多種終端的適合,創(chuàng)建的成果支持發(fā)布電腦、手機(jī)、平板等。f)應(yīng)支持各種交互效果,包括但不局限于聯(lián)動、鉆取、跳轉(zhuǎn)等。.大屏可視化大屏可視化主要是將數(shù)據(jù)和信息通過可視化的形式一屏全面展現(xiàn)。通過可視化大屏,企業(yè)可以觀察數(shù)據(jù)的變化、了解業(yè)務(wù)的發(fā)展,及時發(fā)現(xiàn)問題、根據(jù)問題解決實際業(yè)務(wù)問題,幫助企業(yè)更有效地管理決策、監(jiān)控運營等。大屏可視化應(yīng)包括但不限于以下功能:a)應(yīng)支持各種大屏種類,包括但不局限于管理駕駛艙、監(jiān)控大屏、可視化展示報告等。b)應(yīng)支持自由布局及自適應(yīng),組件、控件任意擺放,高寬自適應(yīng)。c)應(yīng)支持不同應(yīng)用場景的業(yè)務(wù)互動,包括但不局限于多種篩選聯(lián)動、不限層次的鉆取、跳轉(zhuǎn)資源、監(jiān)控預(yù)警等。d)應(yīng)支持多終端展示,包括但不局限于PC、手機(jī)、平板、液晶顯示屏、大屏設(shè)備等,還應(yīng)支持單屏和多屏展示,可以根據(jù)不同的分辨率進(jìn)行自適應(yīng)。e)應(yīng)支持大屏和人工智能融合,比如通過智能的機(jī)器學(xué)習(xí)算法加持,可以自動分析波動原因。用戶可以通過PC端、移動端語音命令或手動輸入提問,即可進(jìn)行統(tǒng)計分析。6.3.4分析故事分析故事是將交互式數(shù)據(jù)可視化與敘事技術(shù)相結(jié)合,敘述從數(shù)據(jù)中發(fā)現(xiàn)的規(guī)律,以引人注目的、易于理解的形式打包和交付分析內(nèi)容,以呈現(xiàn)給決策者。分析故事應(yīng)包括但不限于以下功能:a)應(yīng)包含多個故事點,每個故事點都能夠利用數(shù)據(jù)講述交互式故事b)應(yīng)支持在故事點中添加分析報表或儀表盤,便于使用一個屏幕講述整個可視化故事c)同個分析故事中應(yīng)支持復(fù)用已有故事點,簡單修改即可從不同維度傳遞另一個新的分析故事。d)應(yīng)支持添加文本,表達(dá)觀點和最終結(jié)論e)應(yīng)支持設(shè)置分析故事顯示大小和布局,以適應(yīng)不同分辨率的顯示設(shè)備f)應(yīng)支持與來源保持連接,基礎(chǔ)數(shù)據(jù)、分析報表、儀表盤發(fā)生變化時,故事內(nèi)容隨之變化6.3.5移動BI移動BI是通過移動設(shè)備(平板電腦和智能手機(jī))提供報告、儀表板、可視化數(shù)據(jù)發(fā)現(xiàn)和基本分析功能。通過在較小的屏幕上呈現(xiàn)BI內(nèi)容,可以通過基于觸摸的界面、查詢遠(yuǎn)程或本地數(shù)據(jù)實現(xiàn)導(dǎo)航。移動BI應(yīng)包括但不限于以下功能:a)應(yīng)支持H5標(biāo)準(zhǔn),能夠與微信企業(yè)號、釘釘集成;b)應(yīng)支持報表分享,可以匿名將報表分享到微信等第三方系統(tǒng)。c)應(yīng)支持在離線狀態(tài)下可以進(jìn)行交互分析,包括但是不局限于鉆取、跳轉(zhuǎn)、改變查詢條件等;支持離線包推送,用戶接收后可以增量更新離線數(shù)據(jù)包。d)應(yīng)該提供數(shù)據(jù)安全保障的訪問機(jī)制,包括但不局限于密碼錯誤安全響應(yīng)機(jī)制、數(shù)據(jù)權(quán)限控制、訪問資源權(quán)限控制等。6.4增強(qiáng)分析6.4.1預(yù)測分析預(yù)測分析是對商業(yè)數(shù)據(jù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性信息的過程。預(yù)測分析模塊旨在為企業(yè)所做的決策提供預(yù)測性智能服務(wù),其功能需涵蓋可視化建模、特征處理、預(yù)測算法、模型評估、模型部署、自動建模等,且采用大規(guī)模分布式的計算引擎實現(xiàn)高效的模型訓(xùn)練。.可視化建模可視化建模是指通過圖形化的實現(xiàn),將復(fù)雜的建模過程轉(zhuǎn)變?yōu)閷τ脩舾鼮橛押们铱衫斫獾慕缑妫档蜆I(yè)務(wù)人員的使用門檻。在預(yù)測分析模塊中,提供可視化建模方式,具備無需編程技術(shù)即可自定義建模流程的能力,包括但不限于:a)應(yīng)支持將數(shù)據(jù)建模過程各個步驟的核心能力封裝為獨立的節(jié)點,每個節(jié)點可以自定義參數(shù);b)應(yīng)提供直觀的流式建模方式,通過拖拉拽的方式快速構(gòu)建機(jī)器學(xué)習(xí)模型;c)應(yīng)支持啟動/停止任務(wù),斷點重跑;d)應(yīng)支持查看運行結(jié)果(如數(shù)據(jù)、分析報告、保存模型等)、運行記錄及運行日志。.特征處理特征處理指的是根據(jù)業(yè)務(wù)需求,對數(shù)據(jù)表的字段進(jìn)行加工、擴(kuò)展和衍生,形成建模所需要的特征變量,最終生成一張統(tǒng)一的寬表數(shù)據(jù)進(jìn)行建模處理,并能夠?qū)I(yè)務(wù)模型的特征變量進(jìn)行重要性分析,幫助業(yè)務(wù)人員理解。預(yù)測分析模塊應(yīng)具備特征處理能力,能夠最大限度地從原始數(shù)據(jù)中提取特征,以供算法和模型使用。特征處理能力包括但不限于:a)對于各種類別型特征,應(yīng)支持可對其編碼;b)應(yīng)支持使用特征離散化算法將數(shù)據(jù)自動進(jìn)行分桶和離散化,從而得到離散化非線性的特征指標(biāo);c)分析樣本表中每個特征和目標(biāo)值之間的重要性關(guān)系,通過圖形或者列表的方式展示特征對預(yù)測目標(biāo)值的重要性系數(shù),以此分析特征的異?,F(xiàn)象,從而對模型特征進(jìn)行調(diào)整優(yōu)化。d)應(yīng)提供多種消除特征之間的量綱影響的數(shù)據(jù)歸一化方法;e)應(yīng)支持采用某種映射方法,將高維空間中的數(shù)據(jù)點映射到低維度的空間以達(dá)到數(shù)據(jù)降維;f)應(yīng)支持對一份數(shù)據(jù)表做各種特征組合分析,自動快速探索并生成優(yōu)化后的組合特征并評估生成的特征的重要性;.預(yù)測算法機(jī)器學(xué)習(xí)是一類算法的總稱,這些算法從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測或者分類。預(yù)測分析模塊應(yīng)具備多種機(jī)器學(xué)習(xí)算子,不需要寫任何與問題有關(guān)的特定代碼,將數(shù)據(jù)輸入泛型算法當(dāng)中,在數(shù)據(jù)的基礎(chǔ)上建立對應(yīng)的邏輯,即可輸出期望的結(jié)果。預(yù)測算法包括但不限于:a)向量機(jī)、梯度提升決策樹等二分類算法:b)邏輯回歸、樸素貝葉斯、決策樹、多層感知機(jī)、隨機(jī)森林等多分類算法;c)線性回歸、梯度提升回歸樹等回歸算法;d)K均值、高斯混合模型等聚類算法;e)FP-Growth等關(guān)聯(lián)規(guī)則算法f)分詞、停用詞處理、TF-IDF、Word2Vec詞向量、詞頻編碼、詞頻統(tǒng)計、主題模型等文本分析算法,具有對文字類型的數(shù)據(jù)進(jìn)行處理的能力。.模型評估模型評估功能包含一系列模型評估標(biāo)準(zhǔn),通過多維度、多度量體系的評估指標(biāo)體系來評判模型的好壞。預(yù)測分析模塊應(yīng)具備對于使用不同算法構(gòu)建的模型,提供可視化的對比分析,包括算法訓(xùn)練性能對比、超參數(shù)對比、特征變量對比、評估指標(biāo)對比等。對于每個模型可以一鍵生成模型評估報告,評估報告中需要特征變量、評估指標(biāo)等內(nèi)容。且能夠根據(jù)算法類型提供不同的評估指標(biāo),模型評估指標(biāo)包括但不限于:a)混淆矩陣、準(zhǔn)確率、精確率、召回率、F1值、假陽率、假陰率、特異度、ROC曲線、AUC值、KS曲線等分類評估指標(biāo);b)平均絕對誤差、均方誤差、均方根誤差、R方、校正R方等回歸評估指標(biāo);c)CalinskiHarabasz指標(biāo)、和方差、輪廓系數(shù)等聚類評估指標(biāo)。.模型部署模型部署指的是將已經(jīng)訓(xùn)練好的優(yōu)化預(yù)測模型部署成為Web服務(wù),提供API供實際業(yè)務(wù)使用。預(yù)測分析模塊應(yīng)具備通過提供REST或者其他形式的接口的方式,將持久化后的模型對外發(fā)布,提供預(yù)測服務(wù)的能力,包括但不限于:a)應(yīng)提供模型保存、模型導(dǎo)入、模型導(dǎo)出的功能。b)調(diào)用服務(wù)后應(yīng)支持依據(jù)訓(xùn)練好的預(yù)測模型返回預(yù)測結(jié)果;c)應(yīng)支持服務(wù)發(fā)布上線/下線;d)應(yīng)支持灰度測試功能,即多版本模型并行運行;e)應(yīng)支持批量調(diào)用,可以通過計劃任務(wù)的方式配置模型調(diào)用的頻次和有效時間段。.自動建模自動建模旨在為不懂算法、編程的業(yè)務(wù)人員輕松構(gòu)建符合業(yè)務(wù)應(yīng)用的分析模型,將數(shù)據(jù)挖掘的門檻降到最低,節(jié)省企業(yè)成本。在預(yù)測分析模塊中,提供自動建模能力,使得機(jī)器學(xué)習(xí)模型無需人工干預(yù)即可被應(yīng)用,包括但不a)應(yīng)支持輸入數(shù)據(jù)、配置相關(guān)選項后,即可完成數(shù)據(jù)預(yù)處理、特征工程、模型構(gòu)建、超參數(shù)優(yōu)化、模型評估等一系列數(shù)據(jù)挖掘的環(huán)節(jié);b)應(yīng)支持自動將最優(yōu)模型進(jìn)行服務(wù)部署和模型自學(xué)習(xí),輕松實現(xiàn)從建模到生產(chǎn)以及模型運維整個生命周期的全自動化和智能化學(xué)習(xí);在幫助用戶提升建模的效率同時保證模型的質(zhì)量。c)應(yīng)支持自動化建模完成后可生成建模流程圖,用戶可對流程圖進(jìn)行修改,達(dá)到進(jìn)一步提升模型質(zhì)量的效果。.分布式計算分布式計算是一種把需要進(jìn)行大量計算的工程數(shù)據(jù)分割成小塊,由多臺計算機(jī)分別計算,在上傳運算結(jié)果后,將結(jié)果統(tǒng)一合并得出數(shù)據(jù)結(jié)論的科學(xué)。預(yù)測分析模塊需采用分布式計算,實現(xiàn)平臺高效的模型訓(xùn)練。功能點包括但不限于:a)應(yīng)支持動態(tài)擴(kuò)展,可隨時加入新的計算節(jié)點b)應(yīng)支持節(jié)點資源分配,可以指定節(jié)點上的資源使用如CPU、內(nèi)存c)應(yīng)支持節(jié)點資源監(jiān)控,具有監(jiān)控界面能實時查看節(jié)點使用情況6.4.2自然語言分析BI(BusinessIntelligence)系統(tǒng)中的自然語言分析是指通過自然語言與數(shù)據(jù)分析軟件功能的有機(jī)結(jié)合,將自然語言轉(zhuǎn)換為系統(tǒng)指令,對系統(tǒng)中的數(shù)據(jù)進(jìn)行查詢、分析、展現(xiàn)等操作,支持多種終端,而且其核心能力以API(ApplicationProgrammingInterface)形式供第三方系統(tǒng)調(diào)用。.自然語言指令解析自然語言指令解析是指通過內(nèi)置語義分析模型,對輸入的自然語言進(jìn)行語義分析,進(jìn)行用戶意圖識別,并根據(jù)數(shù)據(jù)系統(tǒng)中實際情況進(jìn)行反饋,其功能應(yīng)包括但不限于:a)應(yīng)提供資源搜索功能,能夠?qū)?shù)據(jù)指標(biāo)、報表、功能進(jìn)行查找。b)應(yīng)提供數(shù)據(jù)查詢功能,能夠提取自然語言中關(guān)鍵信息,生成查詢定義,根據(jù)數(shù)據(jù)系統(tǒng)的實際情況生成查詢語句,獲取數(shù)據(jù);c)應(yīng)提供預(yù)測分析功能,能夠使用系統(tǒng)中內(nèi)置預(yù)測模型,基于已有數(shù)據(jù)對數(shù)據(jù)未來發(fā)展趨勢進(jìn)行預(yù)測,并將預(yù)測結(jié)果返回。.指令執(zhí)行指令執(zhí)行是指通過自然語言完成標(biāo)準(zhǔn)化程度較高的操作,包括但不限于:a)應(yīng)支持自助報表生成,通過自然語言指導(dǎo)系統(tǒng)中對查詢結(jié)果的組合,完成報表制作。b)應(yīng)支持報表查詢訪問,通過自然語言檢索系統(tǒng)中的報表與分析。c)應(yīng)支持參數(shù)切換,通過自然語言切換報表、分析中的參數(shù)。.多輪對話/會話式分析多輪對話是用于構(gòu)建系統(tǒng)與用戶對話共識,當(dāng)系統(tǒng)識別用戶的評估存在疑惑時,則提供正向反饋(如確認(rèn)等行為)、負(fù)向反饋(如拒絕理解/要求重復(fù)/要求rephrase),要求反饋、修復(fù)請求等響應(yīng)機(jī)制。為提供更貼近用戶真實意圖的服務(wù),多輪對話應(yīng)包括但不限于以下功能:a)應(yīng)提供會話式分析功能,終端以會話界面進(jìn)行系統(tǒng)數(shù)據(jù)展示,根據(jù)輸入的自然語言指令,輸出系統(tǒng)反饋的結(jié)果。b)應(yīng)提供數(shù)據(jù)探索分析功能,根據(jù)用戶自然語言指令,不斷對數(shù)據(jù)進(jìn)行加工處理,處理方式根據(jù)自然語言解析結(jié)果選擇,進(jìn)行數(shù)據(jù)探索分析過程。.API接口自然語言API接口主要對指令解析、指令執(zhí)行、多輪對話進(jìn)行封裝,并提供一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開發(fā)人員基于某軟件或硬件得以訪問一組例程的能力,而又無需訪問源碼,或理解內(nèi)部工作機(jī)制的細(xì)節(jié),可以在第三方系統(tǒng)中使用上述功能,API接口包括但不限于以下:a)登入接口:調(diào)用開始,對調(diào)用方身份進(jìn)行識別,授權(quán)使用功能。b)登出接口:功能調(diào)用結(jié)束,關(guān)閉授權(quán)。c)語音轉(zhuǎn)文本接口:當(dāng)輸入系統(tǒng)指令為語音時,需要將語音文件轉(zhuǎn)化為文本供系統(tǒng)識別分析。d)自然語言查詢接口:對輸入的自然語言文本進(jìn)行語義解析,進(jìn)行系統(tǒng)指令歸類,輸出觸發(fā)執(zhí)行系統(tǒng)指令的命令。e)關(guān)閉查詢接口:根據(jù)語義分析結(jié)果,生成觸發(fā)相應(yīng)的系統(tǒng)指令,返回結(jié)果后,關(guān)閉查詢。6.5分享與協(xié)作分享是將一件物品或是信息的使用權(quán)和知情權(quán)與他人共用擁有;協(xié)作是指在目標(biāo)實施過程中,部門與部門之間、個人與個人之間的協(xié)調(diào)與配合。企業(yè)間數(shù)據(jù)和應(yīng)用的分享和協(xié)作,可以幫助企業(yè)將數(shù)據(jù)資源和分析應(yīng)用的價值發(fā)揮到最大。通過分享和協(xié)作可以真正提升企業(yè)的決策效率,解決企業(yè)存在無沉淀、無共享、無文化的問題,幫助企業(yè)構(gòu)建完善的數(shù)據(jù)化運營的生態(tài)系統(tǒng)。6.5.1應(yīng)用門戶應(yīng)用門戶是把數(shù)據(jù)分析資源、入口和相關(guān)應(yīng)用等內(nèi)容,集中地組織起來,以便作為統(tǒng)一的瀏覽入口。應(yīng)用門戶還可以針對每個用戶進(jìn)行個性化設(shè)置,這樣有利于對信息的治理、傳播和信任。a)應(yīng)支持顯示在不同的終端,包括但不局限于PC端、移動端。b)應(yīng)滿足不同部門不同用戶的個性化要求。門戶內(nèi)容包括但不局限于用戶關(guān)注的分析資源、常用功能、關(guān)注的分析指標(biāo),外部系統(tǒng)的快捷入口等等;門戶還應(yīng)該能在其他方面支持個性化,比如布局、配色等。c)應(yīng)支持豐富的門戶組件,包括但不局限于收藏夾、卡片列件、應(yīng)用商店、便捷入口等,操作上通過可視化拖拽、可視化設(shè)置實現(xiàn)。d)應(yīng)支持提供完備的門戶組件接口,供第三方信息接入。6.5.2消息中心在日常的辦公中會產(chǎn)生各種消息通知,包括預(yù)警、推薦、公告、待辦、@、私信等等,消息中心用于實現(xiàn)平臺內(nèi)消息的接收、存儲、消息狀態(tài)報告、推送等功能。信息資訊互聯(lián)互通,所有分析相關(guān)、平臺相關(guān)的資訊都在消息中心訪問。a)根據(jù)消息來源和應(yīng)用范圍,應(yīng)支持不同種類的消息,包括但不局限于系統(tǒng)消息、數(shù)據(jù)預(yù)警、審核信息、企業(yè)公告信息、個人私信、評論行為提醒等等。b)消息的推送應(yīng)該具有實時性,支持顯示信息的發(fā)布人和發(fā)布時間等信息。c)消息查看應(yīng)該具有便捷性。滿足的功能包括但不局限:入口明顯,點擊信息即可打開查看詳細(xì)內(nèi)容等。d)消息中心應(yīng)支持狀態(tài)標(biāo)記,如標(biāo)記已讀未讀,未讀消息支持高亮顯示。e)消息中心應(yīng)該支持統(tǒng)一管理,包括但不局限于編輯重發(fā),重發(fā),刪除等操作。6.5.3互動交流互動交流是指用戶對平臺上的各種資源都可以進(jìn)行點贊、評論、收藏等互動,并且也能把好的分析成果分享給其他人。通過互動交流企業(yè)能夠動態(tài)傳播更多優(yōu)秀的分析成果,吸引更廣泛用戶參與到分析平臺里面,形成企業(yè)獨特的數(shù)據(jù)分析社交文化。a)互動的方式應(yīng)包括但不局限于點贊、評論、收藏、分享。b)應(yīng)提供分享功能,系統(tǒng)內(nèi)部用戶間可互相分享優(yōu)秀的分析資源,也可以通過OA、釘釘?shù)认蛲獠坑脩舴窒?。c)應(yīng)支持一次分享多個資源,被分享者能收到消息提醒。d)分享應(yīng)保證分析資源的安全,可以控制的權(quán)限包括但是不限于資源范圍、用戶范圍、時間范圍、權(quán)限粒度等。7非功能需求7.1軟件安全管理針對軟件系統(tǒng)安全提供完整的解決方案,包括管理應(yīng)用的用戶訪問和身份驗證、數(shù)據(jù)的安全及備份、安全管理措施等方面內(nèi)容。7.1.1應(yīng)用安全.身份鑒別身份鑒別是對登錄用戶進(jìn)行身份標(biāo)識和鑒別,保障系統(tǒng)的安全。身份鑒別應(yīng)包括但不限于以下功a)應(yīng)支持在系統(tǒng)前端界面自定義用戶名校驗規(guī)則和用戶名校驗錯誤提示。b)應(yīng)支持自定義用戶密碼復(fù)雜度校驗規(guī)則,用戶名校驗錯誤提示;比如:密碼至少包含大寫字母、小寫字母、數(shù)字以及特殊字符中的三個。.訪問控制應(yīng)提供訪問控制系統(tǒng)功能操作、系統(tǒng)資源,控制用戶組/用戶/角色對系統(tǒng)功能和用戶數(shù)據(jù)的訪問;并且應(yīng)由授權(quán)主體來配置訪問策略,能嚴(yán)格限制用戶的權(quán)限,要求包括但不限于:a)應(yīng)支持將目錄或報表授權(quán)給用戶、用戶組、角色等,實現(xiàn)查看、編輯、刪除、再授權(quán)等不同粒度的操作權(quán)限控制。b)下級目錄或報表應(yīng)支持自動繼承上級目錄的授權(quán)設(shè)置,無需逐個目錄或報表進(jìn)行授權(quán),并且是否繼承的方式可配置。c)移動設(shè)備應(yīng)支持訪問限制,對注冊服務(wù)平臺的移動設(shè)備管理,如:審核、啟用、禁用等。.安全審計通過安全審計收集、分析、評估系統(tǒng)的用戶行為信息、系統(tǒng)資源異常使用等信息,才能實現(xiàn)掌握安全的狀況,從而制定行之有效的安全策略,確保整個安全體系的完備性、合理性和適用性,才能將系統(tǒng)調(diào)整到“最安全”和“最低風(fēng)險”的狀態(tài)。要求包括但不限于:a)應(yīng)提供全面記錄用戶的各種操作信息的記錄表,包含訪問時間、用戶、操作類型、詳細(xì)操作描述等信息。b)應(yīng)提供內(nèi)存告警日志,包含告警的資源名稱、類型、告警時間、告警原因等。c)應(yīng)能夠根據(jù)記錄數(shù)據(jù)進(jìn)行二次分析,并生成審計報表。.軟件容錯性系統(tǒng)在運行中應(yīng)具備較好的從錯誤中恢復(fù)的能力,故障存在的情況下系統(tǒng)不失效,仍然能夠正常工作。本項要求包括但不限于:a)應(yīng)具備自研分發(fā)器,無需依賴應(yīng)用服務(wù)器分發(fā),系統(tǒng)可自行依據(jù)應(yīng)用節(jié)點CPU、GC時間獨立進(jìn)行分發(fā),可在圖形化界面進(jìn)行節(jié)點配置,負(fù)載均衡采用平滑加權(quán)輪詢算法保證系統(tǒng)穩(wěn)定性。b)應(yīng)支持應(yīng)用服務(wù)器共享會話信息,無論是否宕機(jī)、切換服務(wù)器,無須用戶重新登錄,保障業(yè)務(wù)操作不中斷、數(shù)據(jù)/模板不丟失。c)應(yīng)支持一鍵進(jìn)行系統(tǒng)全面檢查,包括系統(tǒng)的完整性和正確性,從而提示存在的問題進(jìn)行修復(fù)。.資源控制應(yīng)能夠?qū)ο到y(tǒng)的會話進(jìn)行控制與分析,能夠一鍵進(jìn)行批量或單個會話進(jìn)行斷開。提供針對不同時間范圍內(nèi)的會話情況、內(nèi)存情況進(jìn)行分析。.安全監(jiān)控系統(tǒng)應(yīng)具備可視化、統(tǒng)一的系統(tǒng)監(jiān)控界面,方便系統(tǒng)管理員進(jìn)行系統(tǒng)運行監(jiān)控與問題排查,包括進(jìn)行線程、緩存、堆打印、實驗監(jiān)控、服務(wù)監(jiān)控、會話、網(wǎng)絡(luò)、內(nèi)存、SQL監(jiān)控等分析。.安全補(bǔ)丁更新應(yīng)支持安全補(bǔ)丁熱修復(fù),即可在不重啟設(shè)備的情況下,對設(shè)備當(dāng)前軟件版本的缺陷進(jìn)行修復(fù)。安全補(bǔ)丁更新方式包括:在線更新和手動更新。7.1.2數(shù)據(jù)安全及備份恢復(fù).數(shù)據(jù)脫敏在界面配置實現(xiàn)數(shù)據(jù)脫敏功能,應(yīng)支持掩碼、字符替換、正則替換等脫敏算法,應(yīng)支持指定不同用戶組、用戶、角色生效,并且可控制在瀏覽或者導(dǎo)出時候生效。.備份恢復(fù)采用冗余技術(shù)設(shè)計系統(tǒng)拓?fù)浣Y(jié)構(gòu),避免關(guān)鍵節(jié)點存在單點故障。應(yīng)提供系統(tǒng)級別的一鍵備份與恢復(fù)機(jī)制,可自動備份;支持資源級別的備份恢復(fù),并且在導(dǎo)出資源時可一鍵添加依賴資源、資源權(quán)限、數(shù)據(jù)權(quán)限,實現(xiàn)資源在不同環(huán)境(如測試環(huán)境、開發(fā)環(huán)境和生產(chǎn)環(huán)境)之間的快速資源遷移。7.1.3安全管理要求應(yīng)制定系統(tǒng)的安全策略、安全管理制度和操作流程規(guī)范等一體化的信息安全管理制度體系。從事軟件相關(guān)關(guān)鍵崗位的人員,需簽署崗位安全協(xié)議,并提供嚴(yán)格的安全意識培訓(xùn)和安全審查。7.2開放兼容性系統(tǒng)應(yīng)具備良好的開放兼容性,必須能與主流的國產(chǎn)化產(chǎn)品完全兼容。7.3性能系統(tǒng)應(yīng)采用標(biāo)準(zhǔn)且先進(jìn)成熟的技術(shù)手段,應(yīng)具有較高性能及較強(qiáng)的生命力,滿足未來不斷發(fā)展的業(yè)務(wù)需求。即使在高用戶負(fù)載、長時間不間斷運行的情況下系統(tǒng)仍然健壯性良好,并且無論是前端訪問還是數(shù)據(jù)后臺都具備強(qiáng)大的計算能力,系統(tǒng)正常穩(wěn)定運行為用戶帶來流暢且持續(xù)的使用體驗。a)系統(tǒng)應(yīng)具備良好的穩(wěn)定性,應(yīng)支持連續(xù)7×24小時不間斷工作;b)在單節(jié)點8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論