![云數(shù)據(jù)平臺算法模型優(yōu)化方案_第1頁](http://file4.renrendoc.com/view/c01ce691ad332fffb762819f9688f65c/c01ce691ad332fffb762819f9688f65c1.gif)
![云數(shù)據(jù)平臺算法模型優(yōu)化方案_第2頁](http://file4.renrendoc.com/view/c01ce691ad332fffb762819f9688f65c/c01ce691ad332fffb762819f9688f65c2.gif)
![云數(shù)據(jù)平臺算法模型優(yōu)化方案_第3頁](http://file4.renrendoc.com/view/c01ce691ad332fffb762819f9688f65c/c01ce691ad332fffb762819f9688f65c3.gif)
![云數(shù)據(jù)平臺算法模型優(yōu)化方案_第4頁](http://file4.renrendoc.com/view/c01ce691ad332fffb762819f9688f65c/c01ce691ad332fffb762819f9688f65c4.gif)
![云數(shù)據(jù)平臺算法模型優(yōu)化方案_第5頁](http://file4.renrendoc.com/view/c01ce691ad332fffb762819f9688f65c/c01ce691ad332fffb762819f9688f65c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
29云數(shù)據(jù)平臺算法模型優(yōu)化方案\l“_TOC_250040“第1章整體方案 4\l“_TOC_250039“工程需求理解方案 4\l“_TOC_250038“工程背景 4\l“_TOC_250037“工程概述 4\l“_TOC_250036“工程現(xiàn)狀 4\l“_TOC_250035“工程目標 6\l“_TOC_250034“工程內(nèi)容 7\l“_TOC_250033“總體設計方案 8\l“_TOC_250032“總體定位及目標 8\l“_TOC_250031“設計原則及約束 9\l“_TOC_250030“總體設計約束 9\l“_TOC_250029“總體應用架構(gòu)設計 10\l“_TOC_250028“總體數(shù)據(jù)架構(gòu)設計 12\l“_TOC_250027“數(shù)據(jù)框架設計 12\l“_TOC_250026“數(shù)據(jù)框架細化設計 13\l“_TOC_250025“算法模型優(yōu)化方案 15\l“_TOC_250024“算法概述 15\l“_TOC_250023“算法的特征 16\l“_TOC_250022“算法的要素 16\l“_TOC_250021“算法的判定 17\l“_TOC_250020“算法的描述方式 18\l“_TOC_250019“典型的算法 18\l“_TOC_250018“算法模型優(yōu)化 22\l“_TOC_250017“算法模型優(yōu)化要點 22\l“_TOC_250016“數(shù)據(jù)模型優(yōu)化 24\l“_TOC_250015“數(shù)據(jù)建模工具 37\l“_TOC_250014“優(yōu)化完善及運維的算法模型效勞 38\l“_TOC_250013“根底算法模型設計 38\l“_TOC_250012“開放算法模型效勞 40\l“_TOC_250011“機構(gòu)改革的算法模型優(yōu)化 40\l“_TOC_250010“算法模型指標重測算 40\l“_TOC_250009“國合并影響分析 41\l“_TOC_250008“應用支撐方案 41\l“_TOC_250007“應用接入標準制定 42\l“_TOC_250006“應用接入方式 43\l“_TOC_250005“應用接入管控 44\l“_TOC_250004“應用接入效勞 44\l“_TOC_250003“平臺層應用接入效勞 44\l“_TOC_250002“數(shù)據(jù)層應用接入效勞 45\l“_TOC_250001“具體應用層接入 46\l“_TOC_250000“應用接入聯(lián)調(diào) 47第1工程需求理解方案工程背景始終以“用數(shù)據(jù)效勞征管方式轉(zhuǎn)變”為建設主線,在大數(shù)據(jù)算法應用、海量用戶支持、關系云圖、風險動態(tài)積分、用戶畫像等方面進展了樂觀探究、實踐,精彩實現(xiàn)為目標,涵蓋數(shù)據(jù)“采、存、通、用”全生命周期的一體化生態(tài)系統(tǒng),是大數(shù)據(jù)、互聯(lián)網(wǎng)+、云計算等理念、方法論、技術(shù)手段和解決方案的集成呈現(xiàn)。變化,營造良好稅收數(shù)據(jù)生態(tài)。工程概述工程現(xiàn)狀SLB、ODPSDataV18類用戶需求的稅收大數(shù)據(jù)平臺。主要完成平臺層、數(shù)據(jù)層、應用層的建設:云環(huán)境,并構(gòu)建完整的三層效勞模式。通過建設IaaS層,為全國數(shù)據(jù)大集中環(huán)CPU、內(nèi)存、存儲、網(wǎng)絡、操作系統(tǒng)等根底設施資源,提高資源的利用率,降低選購本錢;通過建設PaaSIaaSSaaS。續(xù)的提升,保證數(shù)據(jù)資產(chǎn)的長期價值。根底層完成了對稅務數(shù)據(jù)、外部數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)三類數(shù)據(jù)的集成,化數(shù)據(jù)等操作。中間層完成了四大主題庫和標簽體系的建設。四大主題庫分別是:組〔法人和法人分支機構(gòu)200稅務機關庫,涉及模型近200〔單位納稅人之間、單位納稅人與自然人之間,涉及模型幾十個。同時構(gòu)建了企業(yè)、自然人、稅務機關標簽體系,包含:企業(yè)標簽〔一般納稅人標簽、小規(guī)模納稅人標簽、千戶集團標簽、自然人標簽、稅務機關標簽。模型層完成了面對應用的數(shù)據(jù)模型構(gòu)建。在建設模型層的過程中,以票流分析、關系云圖、增值稅發(fā)票查詢分析系統(tǒng)等應用共設計數(shù)百個數(shù)據(jù)模型,上千個指標口徑。業(yè)效勞動態(tài)監(jiān)控等應用。數(shù)據(jù)治理工作主要從五個方面開展:元數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)治理、數(shù)據(jù)質(zhì)量規(guī)章指標二百多項,推動全國數(shù)據(jù)質(zhì)量持續(xù)優(yōu)化。數(shù)據(jù)效勞作,為信用評價指標調(diào)整供給數(shù)據(jù)依據(jù)等;開展辦企業(yè)預警模型、非正常戶預警模型、進銷不匹配模型等指標設計測算工作。工程目標各項工作,保障云平臺平穩(wěn)運行。面的對接工作,滿足其數(shù)據(jù)庫創(chuàng)立、擴容、變更等需求。管改革和稅制改革。在完成金三系統(tǒng)合并、調(diào)整與地方稅費全國集成根底上,完成云平臺數(shù)據(jù)層、應用層的相應調(diào)整優(yōu)化與功能開發(fā)工作,以保障數(shù)據(jù)準時、準確集成至云平臺,并依據(jù)最的需求展現(xiàn)和供給數(shù)據(jù)。工程內(nèi)容不限于以下內(nèi)容:云平臺數(shù)據(jù)治理升級完善及運維和機構(gòu)改革軟件效勞工程是在云平臺數(shù)據(jù)涉及云平臺調(diào)整優(yōu)化工作兩項內(nèi)容:總體設計方案總體定位及目標云平臺數(shù)據(jù)治理工程是工程其次階段的重要組成局部,工程基于目前最工程定位集中表達了根底性、創(chuàng)性和示范性。自行開發(fā)應用工程供給根底數(shù)據(jù)和工具,鼓舞多樣性應用開發(fā)。發(fā)結(jié)合的格局。發(fā)的示范性模板,推動全收數(shù)據(jù)利用水平提升。有效共享整合,為國家信息共享化建設供給了稅務方案。云平臺數(shù)據(jù)治理工程升級完善及運維和機構(gòu)改革軟件效勞工程以云平臺數(shù)供給必要的根底運維,保障云平臺正常運行。設計原則及約束總體設計約束總體設計包括總體架構(gòu)設計和數(shù)據(jù)治理機制設計兩個局部??傮w設計要求設計目標和機構(gòu)改革軟件效勞工程的總體設計。設計要求技術(shù)、集成、部署等方面的框架,也包括設計管控的體系。一方面,作為框架,總體設計要求定義應用、數(shù)據(jù)、技術(shù)、集成、部署等架構(gòu)的目標藍圖,還包括相的實施符合云平臺數(shù)據(jù)治理升級完善及運維和機構(gòu)改革軟件效勞工程的總體規(guī)劃。的目標。設計約束遵循本工程總體設計要求和工程設計約束。數(shù)據(jù)治理機制設計目標依據(jù)數(shù)據(jù)本工程數(shù)據(jù)治理要求與約束,完成國家數(shù)據(jù)治理機制建設。設計要求據(jù)標準治理和數(shù)據(jù)質(zhì)量治理三個方面的機制和流程建設。設計約束遵循本工程數(shù)據(jù)治理機制要求和約束??傮w應用架構(gòu)設計建設、數(shù)據(jù)層建設和應用層建設。云計算支撐平臺:系統(tǒng)搭建敏捷、可隨時調(diào)用計算資源的數(shù)據(jù)云環(huán)境,并構(gòu)建完整的三層效勞據(jù)分析應用需求的沖突。大數(shù)據(jù)支撐平臺:大數(shù)據(jù)支撐平臺是用于各項數(shù)據(jù)相關工作的云計算產(chǎn)品和大數(shù)據(jù)工具軟件標準、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量,實現(xiàn)數(shù)據(jù)“好用、足用”的目標。應用平臺層:在全收數(shù)據(jù)大集中和外部數(shù)據(jù)擴展根底上,為總局和各司局及局部省局供給3總體數(shù)據(jù)架構(gòu)設計4型組織、信息加工、質(zhì)量治理、結(jié)果呈現(xiàn)等處理功能。數(shù)據(jù)框架設計數(shù)據(jù)應用數(shù)據(jù)應用數(shù)據(jù)治理分析模型數(shù)據(jù)挖掘數(shù)據(jù)供給元數(shù)據(jù)治理數(shù)據(jù)匯總數(shù)據(jù)主體定義主體匯總關系定義數(shù)據(jù)集成數(shù)據(jù)定義數(shù)據(jù)抽取數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)加載數(shù)據(jù)集成負責數(shù)據(jù)集成,通過調(diào)度掌握和規(guī)章治理實現(xiàn)對數(shù)據(jù)集成的任務治理,數(shù)據(jù)集成平臺將源數(shù)據(jù)〔核心征管、電子稅務、出口退稅、外部數(shù)據(jù)等〕ETL/數(shù)據(jù)復制的數(shù)據(jù)加工、清洗、轉(zhuǎn)換,完成從源數(shù)據(jù)數(shù)據(jù)預備區(qū)統(tǒng)一數(shù)據(jù)視圖。加工中消滅的錯誤預警提交給數(shù)據(jù)治理平臺的數(shù)據(jù)質(zhì)量治理應用。數(shù)據(jù)會聚的輕度匯總的事實表和事實表關聯(lián)的維度表。數(shù)據(jù)應用由查詢統(tǒng)計、征管狀況分析、報表治理、風險治理、政策評估、績效治理、學問治理、稅收收入核算分析系統(tǒng)、電子檔案治理等局部和日常應用治理組成。本包負責:查詢統(tǒng)計、常應用治理建設。數(shù)據(jù)治理負責環(huán)境的數(shù)據(jù)治理,它是結(jié)合數(shù)據(jù)治理相關的組織、制度和流程和數(shù)據(jù)標命周期的治理、以及數(shù)據(jù)審計治理等。數(shù)據(jù)框架細化設計數(shù)據(jù)應用數(shù)據(jù)應用數(shù)據(jù)報表數(shù)據(jù)分析數(shù)據(jù)治理數(shù)據(jù)擴展利用…挖掘應用層數(shù)據(jù)治理數(shù)據(jù)倉庫區(qū)元數(shù)據(jù)數(shù)據(jù)質(zhì)量掌握運行監(jiān)控數(shù)據(jù)中間層統(tǒng)一數(shù)據(jù)視圖區(qū)數(shù)據(jù)預備區(qū)數(shù)據(jù)預備層數(shù)據(jù)集成數(shù)據(jù)標準治理元數(shù)據(jù)治理數(shù)據(jù)審計范ETL/數(shù)據(jù)復制度范警數(shù)據(jù)源核心征管電子稅務出口退稅發(fā)票底賬征管日志文件外部數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)1、根底數(shù)據(jù)層外部交換數(shù)據(jù)、互聯(lián)網(wǎng)開放數(shù)據(jù)。稅收業(yè)務系統(tǒng):稅收業(yè)務系統(tǒng)是本次數(shù)據(jù)體系中最主要的數(shù)據(jù)源頭,稅務13到核心征管數(shù)據(jù)體系內(nèi)。交換數(shù)據(jù)合并數(shù)據(jù)構(gòu)造,采集到統(tǒng)一的數(shù)據(jù)交換域?;ヂ?lián)網(wǎng)數(shù)據(jù):互聯(lián)網(wǎng)是一個開放式的數(shù)據(jù)源,在本次數(shù)據(jù)體系和應用的建度的要求,滿足爬取數(shù)據(jù)從非構(gòu)造化到構(gòu)造化存儲的要求;2、數(shù)據(jù)中間層豐富,不停豐富主體的描述、行為及治理類的數(shù)據(jù)。易用的生產(chǎn)原料??偩执髷?shù)據(jù)云平臺將具有強大得數(shù)據(jù)計算和存儲力量?;谄脚_的力量和層的建設將著重三個主體庫的建設:企業(yè)庫、自然人庫、關系庫。3數(shù)據(jù)挖掘?qū)有偷慕ㄔO和數(shù)據(jù)價值的挖掘。基于本次云平臺數(shù)據(jù)治理工程的業(yè)務需求,數(shù)據(jù)模型和挖掘?qū)鞴芊趾烍w系模型。征管分析模型:標數(shù)據(jù),并持續(xù)跟蹤指標的變化狀況,為征管工作分析應用供給數(shù)據(jù)支撐。企業(yè)標簽體系模型進展數(shù)據(jù)挖掘,獲得刻畫企業(yè)的標簽數(shù)據(jù)。庫的數(shù)據(jù)進展數(shù)據(jù)挖掘,獲得刻畫自然人的標簽數(shù)據(jù)。算法模型優(yōu)化方案算法概述算法〔Algorithm〕是指解題方案的準確而完整的描述,是一系列解決問題時間簡單度來衡量。算法中的指令描述的是一個計算,當其運行時能從一個初始狀態(tài)和〔可能為空的的一些算法,包含了一些隨機輸入。算法的特征一個算法應當具有以下五個重要的特征:有窮性〔Finiteness〕算法的有窮性是指算法必需能在執(zhí)行有限個步驟之后終止;精準性(Definiteness)算法的每一步驟必需有精準的定義;輸入項(Input)0是指算法本身定出了初始條件;輸出項(Output)的算法是毫無意義的;可行性(Effectiveness)每個計算步都可以在有限時間內(nèi)完成〔也稱之為有效性。算法的要素一,數(shù)據(jù)對象的運算和操作計算機可以執(zhí)行的根本操作是以指令的形式描述的。一個計算機系統(tǒng)能執(zhí)操作有如下四類:算術(shù)運算:加減乘除等運算。規(guī)律運算:或、且、非等運算。關系運算:大于、小于、等于、不等于等運算。二,算法的掌握構(gòu)造行挨次有關。算法的判定同一問題可用不同算法解決,而一個算法的質(zhì)量優(yōu)劣將影響到算法乃至程從時間簡單度和空間簡單度來考慮。時間簡單度nf(n),算法的時間簡單度也因此記做:T(n)=Ο(f(n))f(n)的增長率正相關,稱作漸進時間簡單度〔AsymptoticTimeComplexity??臻g簡單度算法的空間簡單度是指算法需要消耗的內(nèi)存空間。其計算和表示方法與時度的分析要簡潔得多。正確性算法的正確性是評價一個算法優(yōu)劣的最重要的標準??勺x性算法的可讀性是指一個算法可供人們閱讀的簡潔程度。強健性錯性。算法的描述方式PAD圖等,其中最普遍的是流程圖。典型的算法遞推法遞推是序列計算機中的一種常用算法。它是依據(jù)肯定的規(guī)律來計算序列中機速度快和不知疲乏的特點。遞歸法程序調(diào)用自身的編程技巧稱為遞歸〔recursion。一個過程或函數(shù)在其定時,遞歸返回。留意:遞歸就是在過程或函數(shù)里調(diào)用自身;在使用遞歸策略時,必需有一個明確的遞歸完畢條件,稱為遞歸出口。窮舉法10000因此最多嘗試10000一種密碼,問題只在于如何縮短試誤時間。因此有些人運用計算機來增加效率,有些人輔以字典來縮小密碼組合的范圍。貪心算法貪心算法是一種對某些求最優(yōu)解問題的更簡潔、更快速的設計技術(shù)。用貪心法設計算法的特點是一步一步地進展,常以當前狀況為根底依據(jù)某窮盡全部可能而必需消耗的大量時間,它承受自頂向下,以迭代的方法做出相繼過每一步貪心選擇,可得到問題的一個最優(yōu)解,雖然每一步上都要保證能獲得局部最優(yōu)解,但由此產(chǎn)生的全局解有時不肯定是最優(yōu)的,所以貪欲法不要回溯。貪欲算法是一種改進了的分級處理方法,其核心是依據(jù)題意選取一種量度下最優(yōu)解的分級處理方法稱為貪欲算法。優(yōu)解的最優(yōu)量度標準是使用貪欲算法的核心。擇出最優(yōu)量度標準后,用貪欲算法求解則特別有效。分治法分治法是把一個簡單的問題分成兩個或更多的一樣或相像的子問題,再把即子問題的解的合并。分治法所能解決的問題一般具有以下幾個特征:該問題的規(guī)??s小到肯定的程度就可以簡潔地解決;性質(zhì);利用該問題分解出的子問題的解可以合并為該問題的解;的子子問題。動態(tài)規(guī)劃法動態(tài)規(guī)劃是一種在數(shù)學和計算機科學中使用的,用于求解包含重疊子問題廣泛應用于計算機科學和工程領域。動態(tài)規(guī)劃程序設計是對解最優(yōu)化問題的一種途徑、一種方法,而不是一種去求解。迭代法迭代法也稱輾轉(zhuǎn)法,是一種不斷用變量的舊值遞推值的過程,跟迭代法相對應的是直接法〔或者稱為一次解法,即一次性解決問題。迭代法又分為準確〔或肯定步驟〕進展重復執(zhí)行,在每次執(zhí)行這組指令〔或這些步驟〕時,都從變量的原值推出它的一個值。分支界限法同類型的問題解法也各不一樣。分支定界法的根本思想是對有約束條件的最優(yōu)化問題的全部可行解〔數(shù)目來越小的子集〔稱為分支,并為每個子集內(nèi)的解的值計算一個下界或上界〔稱為定界。在每次分支后,對但凡界限超出可行解值那些子集不再做進一步〔即搜尋樹上的很多結(jié)點〕就可以不予考慮了,從而何子集的界限。因此這種算法一般可以求得最優(yōu)解。與貪心算法一樣,這種方法也是用來為組合優(yōu)化問題設計求解算法的,所不行能得到最優(yōu)解的子空間進一步搜尋〔類似于人工智能中的剪枝,故它比窮舉法效率更高。回溯法〔探究與回溯法其根本思想是,在包含問題的全部解的解空間樹中,依據(jù)深度優(yōu)先搜尋的〔其實回溯法就是對隱式圖的深度優(yōu)先搜尋算法的子樹都要已被搜尋遍才完畢。而假設使用回溯法求任一個解時,只要搜尋到問題的一個解就可以完畢。算法模型優(yōu)化算法模型優(yōu)化要點和工具建立起來的算法模型,它是口徑、算法及其數(shù)據(jù)的集合。設計,涵蓋稅務業(yè)務內(nèi)涵需完整、全面。具體的優(yōu)化要點如下:1、統(tǒng)一數(shù)據(jù)視圖建模優(yōu)化支持對即時性的、操作性的、集成的數(shù)據(jù)運用需求。統(tǒng)一數(shù)據(jù)視圖可以依據(jù)3NF數(shù)據(jù)庫,以總體架構(gòu)工程規(guī)劃的數(shù)據(jù)模型為根底,優(yōu)化其規(guī)律訪問及物理存儲構(gòu)造,到達高效查詢的要求。2、數(shù)據(jù)倉庫建模優(yōu)化數(shù)據(jù)倉庫的特征在于面對主題、集成性、穩(wěn)定性和時變性,用于供給稅收業(yè)3NF、理大量的數(shù)據(jù)并發(fā)訪問。3、數(shù)據(jù)集市建模優(yōu)化圍繞數(shù)據(jù)倉庫數(shù)據(jù),面對不同分析主題,進展數(shù)據(jù)集市建模,完成數(shù)據(jù)運用平臺和聯(lián)機分析應用。數(shù)據(jù)集市的構(gòu)造可以是多維數(shù)據(jù)集〔如星型、雪花型,析主題建立等三項內(nèi)容?!踩鐢?shù)據(jù)質(zhì)量指標庫用平臺支持的需求,具有前瞻性、敏捷性、可擴展性等特點。算法,聚類、關聯(lián)、分類等高級算法,以及決策樹、神經(jīng)網(wǎng)絡等數(shù)據(jù)挖掘算法。數(shù)據(jù)模型優(yōu)化征管分析模型發(fā)票發(fā)票票證登記認定申報征收計會統(tǒng)優(yōu)待證明綜合評估審計稽查法制我們針對該模型的建設方式也需要圍繞該主題進展。企業(yè)標簽體系模型企業(yè)標簽體系模型,針對目前總局對于企業(yè)征稅治理的需要,設計對企業(yè)據(jù)進展數(shù)據(jù)挖掘,獲得刻畫企業(yè)的標簽數(shù)據(jù)。企業(yè)標簽概念模型設計說明。行為力量挖掘框架設計用戶力量標簽挖掘流程中,首先通過用戶關系數(shù)據(jù)(主要是分組,用于表達粉絲關領域內(nèi)的影響力)挖掘出用戶的力量標簽及其根底權(quán)重;其次通過引入用戶的用。標簽挖掘模型關鍵點設計標簽集合分組信息即用戶為關注對象打上的標簽作為用戶關系數(shù)據(jù)引入到挖掘過程中,由于標簽屬于UGC,就會造成同一個標簽主題有多種不同的表達方式,將多可以有效地提升力量標簽的準確率和掩蓋率。首先將分組信息通過分類模型劃分為強關系型(稅務機關,稅務活動等)和行為型(繳納、金額等)兩類,并將行為型分組信息作為我們的根底預料。接下來通過聚類、關聯(lián)等相關算法進展標簽詞(分組信息)的聚合;標簽高相關標簽低相關標簽標簽高相關標簽低相關標簽稅務活動入庫標識等用戶關注度用戶關注度指的是用戶在某個特定標簽下的受關注程度,因此影響力計算的邊界是標簽對應的興趣用戶群體〔包含該標簽的力量用戶,即對該標簽所對注為作為根底數(shù)據(jù),利用迭代算法進展該用戶關注度的計算。時間衰減效益考慮到企業(yè)用戶數(shù)據(jù)的消費價值和計算代價,對于用戶內(nèi)容數(shù)據(jù),我們選取了用戶近一段時期內(nèi)行為活動作為根底參照進展計算。關于時間衰減,我們結(jié)合牛頓冷卻定律和微博的業(yè)務需求推導出相應的衰行為標簽內(nèi)容權(quán)重的時間衰減函數(shù)自然人標簽體系模型自然人標簽體系模型,針對目前總局對于自然人征稅治理的需要,設計對人庫的數(shù)據(jù)進展數(shù)據(jù)挖掘,獲得刻畫自然人的標簽數(shù)據(jù)。自然人標簽體系概念模型行為力量挖掘框架設計短時動態(tài)數(shù)據(jù)建設短時動態(tài)數(shù)據(jù)建設為解決總局快速覺察問題、快速反響業(yè)務變化的需求供給反響業(yè)務的變化,覺察可能存在的問題,并能夠業(yè)務系統(tǒng)產(chǎn)生聯(lián)動。短時動態(tài)數(shù)據(jù)建設主要基于流式數(shù)據(jù)處理,其過程根本分為三個階段:數(shù)據(jù)處理基于流計算技術(shù)實現(xiàn)。展現(xiàn)。流式數(shù)據(jù)設計據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)效勞化。數(shù)據(jù)采集流式數(shù)據(jù)處理的支持根底是實時數(shù)據(jù)采集。數(shù)據(jù)處理加載后形成可以存儲到數(shù)據(jù)隊列中。數(shù)據(jù)效勞化數(shù)據(jù)通過隊列訂閱獵取流式數(shù)據(jù)隊列中的數(shù)據(jù),并依據(jù)隊列輸出數(shù)據(jù)進展效勞化轉(zhuǎn)變。企業(yè)風險〔信用〕模型納稅信用等級是指稅務機關依據(jù)納稅人履行納稅義務狀況,依據(jù)《納稅信內(nèi)的納稅信用所評定的等級。企業(yè)風險〔信用〕評定方法評定等級分值比例涉及風險項A分值>=95具有涉嫌違反稅收法律、行政法規(guī)行為,至評定日仍未結(jié)案或已結(jié)案但未依據(jù)稅務機關處理打算改正的〔指稅務機關確定納稅信用等級之日起向前推算兩年〕發(fā)生欠繳稅款情形的料的評定期前兩年有稅務行政懲罰記錄的C20<=分值<60評定依法應當辦理稅務登記而未辦理稅務登記的評定期內(nèi)同時具備按期納稅申報率在90%以下,納稅申報準確率在70%以下,應納稅款按期入庫率在80%以下,代扣代繳申報準確率在80%以下,代扣代繳稅款入庫率90%以下的〔指稅務機關確定納稅信用等級之日起向前推算兩年〕有違反稅收法律、行政法規(guī)的行為,且受到稅務行政懲罰的抄報稅的應稅收入、應稅所得核算混亂,有關憑證、賬簿、報表不完整、不真實的D分值<20具有涉稅犯罪嫌疑,已依法移送公安機關,尚未結(jié)案的〔指稅務機關確定納稅信用等級之日起向前推算兩年〕有偷稅、躲避追繳欠稅、騙取出口退稅、抗稅、虛開增值稅專用發(fā)票等涉稅犯罪行為記錄的騙取稅收優(yōu)待政策、騙取多繳稅款退回的不能完整、準確核算應納稅款或者不能完整、準確代扣代繳稅款的不能完整、準確核算應納稅款或者不能完整、準確代扣代繳稅款的B60<=<955〔信用評估模型。表名:表名:fx_qyfxpg表描述:企業(yè)風險〔信用〕評估表描述企業(yè)風險信用等級為劃型和稅務評估做出參考列名字段類型注釋備注NSRSBHVARCHAR2(30)納稅人識別碼NSRMCVARCHAR2(75)納稅人名稱FXPGXMLXCHAR(2)風險工程類型PGXMLXFZNUMBER評估工程類型分值表名:表名:fx_fxpgxmlx表描述:風險〔信用〕工程評估類型風險評定代碼類型表列名字段類型注釋備注fxpgxmlxCHAR2(2)估類型Fxpgxmlx_mcVARCHAR2(30)風險工程評估名稱fxpgzcyjChar(6)風險評定政策依據(jù)LXLRRQLXLRRQDATE風險工程類型列入日期XYBJCHAR(1)選用標記表名:表名:fx_nsrfxpdsx表描述:納稅人風險評定事項風險評定事項列名字段類型注釋備注nsrsbhVarchar2(30)納稅人識別碼dqzrnumber檔期收入ljsrnumber累計收入djrqdate登記日期djzlblnumber登記資料完成比例sssxcsnumber涉稅事項次數(shù)wfajcsnumber違法案件次數(shù)1.3.2.2.6然人風險〔信用〕模型自然人風險〔信用〕模型自然人風險〔信用〕表模型表名:表名:fx_zrrfxpg表描述:自然人風險〔信用〕評估表描述自然人風險信用等級為劃型和稅務評估做出參考列名字段類型注釋備注zrrsfzjxxVARCHAR2(30)自然人身份證件信息zrrmcVARCHAR2(75)自然人名稱FXPGXMLXCHAR(2)風險工程類型PGXMLXFZNUMBER評估工程類型分值表名:表名:fx_zrrfxpgxmlx表描述:風險〔信用〕工程評估類型風險評定代碼類型表列名字段類型注釋備注fxpgxmlxCHAR2(2)估類型Fxpgxmlx_mcVARCHAR2(30)風險工程評估名稱fxpgzcyjChar(6)風險評定政策依據(jù)LXLRRQLXLRRQDATE風險工程類型列入日期XYBJCHAR(1)選用標記表名:表名:fx_zrrfxpdsx表描述:自然人風險評定事項風險評定事項列名字段類型注釋備注nsrsbhVarchar2(30)納稅人識別碼grsrnumber個人收入ljsrnumber累計收入djrqdate登記日期lcysbjChar(1)兩處以上標記sssxcsnumber涉稅事項次數(shù)wfajcsnumber違法案件次數(shù)1.3.2.3數(shù)據(jù)建模工具1、工具需求描述領域模型、規(guī)律模型、物理模型四個層次建模過程。2、工具需求分析名目名目分析說明支持業(yè)務模型、領域建模、規(guī)律模型、物理模型,以及這之間的轉(zhuǎn)換;模型支持IDEF支持正向工程:為某些數(shù)據(jù)庫設計生成源代碼。支持數(shù)據(jù)庫周支持逆向工程:以現(xiàn)有數(shù)據(jù)庫或圖式為根底創(chuàng)立可視化模型。期代碼將修改應用于數(shù)據(jù)庫。名目名目分析說明對不同數(shù)據(jù)源的元數(shù)據(jù)進展導入和導出,數(shù)據(jù)源包括:BI平臺UML和元數(shù)據(jù)整合XML圖式、以及公共倉庫模型CW。模型審查找是否存在目標定義遺漏、未用域名、唯一索引、及循環(huán)關系等。支持可視化界面開發(fā),操作簡潔、易用、易學,支持菜單驅(qū)動和拖拉式易用性操作。支持團隊開發(fā)分別、比較、合并等。文檔報表供給建立多模型的RTF和HTML格式的文檔報表。優(yōu)化完善及運維的算法模型效勞根底算法模型設計算法模型開發(fā)設計主要包括以下內(nèi)容:增值稅發(fā)票風險防范與打擊方案計算資源和算法資源,設計相應的增值稅發(fā)票風險防范和打擊方案。利益相關群體挖掘與分析的風險。商品名稱歸類模型一樣屬性的商品歸為同一類〔如將中華和中南海歸類為香煙,以供給不同粒度的商品名稱列表,為其它大數(shù)據(jù)算法供給良好的數(shù)據(jù)根底。1.3.3.1.2法模型優(yōu)化完善1.辦企業(yè)納稅風險評估模型效勞。在現(xiàn)有算法的根底上做進一步優(yōu)化,以提高評估結(jié)果的準確率。納稅人動態(tài)信用積分分規(guī)模建立細分模型,依據(jù)實際運行狀況,進展迭代優(yōu)化。進銷不符風險企業(yè)覺察企業(yè)名單的準確率。商品名稱歸集模型升級〔或物質(zhì)〔18K24K,降低商品名稱多樣性所引入的數(shù)據(jù)噪音。優(yōu)化現(xiàn)有的算法,以提升商品名稱的歸集效果。開放算法模型效勞算法模型錄入算法模型查詢算法模型治理位供給公用算法模型資源的維護。機構(gòu)改革的算法模型優(yōu)化準確的數(shù)據(jù)效勞和數(shù)據(jù)應用。算法模型指標重測算滿足實際工作的需要。國合并影響分析影響等方面的分析,也是機構(gòu)改革算法模型優(yōu)化的一個方面。包括但不限于以下內(nèi)容:非正常戶推測模型調(diào)整優(yōu)化;辦企業(yè)風險第一階段模型調(diào)整優(yōu)化;辦企業(yè)風險其次階段模型調(diào)整優(yōu)化;辦企業(yè)風險第三階段模型調(diào)整優(yōu)化;團伙分析模型調(diào)整優(yōu)化;增數(shù)據(jù)主題動態(tài)監(jiān)控、用戶畫像、風險治理應用。應用支撐方案據(jù)申請、模型開發(fā)等流程標準,做好應用接入的把關、管控。本工程承受面對效勞的設計理念,系統(tǒng)應用能夠通過效勞形式供給集成,實個前提:OLAP充分考慮系統(tǒng)數(shù)據(jù)與業(yè)務應用的關系,形成合理的應用布局,便于打包成可復制的解決方案;打好根底。工作流引擎嵌入其中,融為云平臺數(shù)據(jù)治理系統(tǒng)中的一局部。支持操作型BI,系統(tǒng)的一個具體的電子檔案、查詢或分析結(jié)果等。商業(yè)智能軟件標準、成熟的分析方法和手段,實現(xiàn)報表分析、即席分析、數(shù)理統(tǒng)OLAP理論,支持雪花、星型等多種數(shù)據(jù)模型,固定報表支3NF數(shù)據(jù);支持集中部署,多級應用的數(shù)據(jù)共享模式。應用接入承受中間件技術(shù),承受的中間件產(chǎn)品應為主流、開放、成熟的產(chǎn)品。應用接入標準制定治理,并供給必要的培訓。工作約束如下:準標準;要求應用層的用戶權(quán)限治理使用的權(quán)限標準;撐省局的應用創(chuàng);面集成、功能集成、消息集成、權(quán)限繼承、流程集成、效勞集成、數(shù)據(jù)集成。應用接入方式最終用戶供給一個統(tǒng)一的界面級視圖。業(yè)務工作門戶至少包含以下內(nèi)容:完整的界面運行環(huán)境。戶共性化的配置。支持各應用系統(tǒng)待辦事宜的集中呈現(xiàn)。系統(tǒng)的無縫連接。二、應用集成本工程應用集成承受基于企業(yè)級效勞總線〔CSB〕的應用集成平臺,供給系內(nèi)并供給應應用作為效勞使用。統(tǒng)的各個功能實現(xiàn)。三、安全集成1、用戶治理要求遵循總局統(tǒng)一用戶模型設計;支持接入總局統(tǒng)一用戶治理系統(tǒng);支持總局統(tǒng)一部署運維,總局省局分級進展用戶信息維護功能。認證治理要求支持接入總局統(tǒng)一認證治理系統(tǒng);CA/密碼、動態(tài)口令、IP..,將來可以敏捷擴展;身份互信體系要求遵循總局統(tǒng)一規(guī)劃、設計、開發(fā)的身份互信體系。應用接入管控重點工作內(nèi)容如下:協(xié)作應用開發(fā)商完成數(shù)據(jù)架構(gòu)的設計,跟蹤治理相關成果物文檔。協(xié)作應用開發(fā)商完成數(shù)據(jù)關聯(lián)需求分析,跟蹤治理相關成果物文檔。的分層歸屬,并跟蹤治理相關成果物文檔。與應用開發(fā)商對接入問題進展爭論并處理。處理好與應用開發(fā)商的意見分歧,確保應用開發(fā)能夠遵循肯定的標準。應用接入效勞平臺層應用接入效勞位、應用研發(fā)廠商供給以下效勞:培訓效勞:按需培訓云平臺相關產(chǎn)品,以及平臺產(chǎn)品運維體系。產(chǎn)品選型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二四年度現(xiàn)代物流智能倉儲管理系統(tǒng)開發(fā)合同
- 二零二四年度企業(yè)并購與技術(shù)轉(zhuǎn)讓合同
- 二零二四年度體育賽事教練聘請合同3篇
- 二零二五年度新能源汽車促銷禮品研發(fā)及銷售合同3篇
- 二零二五年度能源項目PPP合作合同2篇
- 二零二四年度切片項目廠房及配套設施建設與交通規(guī)劃合同3篇
- 二零二四年度印刷業(yè)印刷品印刷與發(fā)行服務合同3篇
- 二零二五版出租車司機車輛大包合作合同與執(zhí)行規(guī)范3篇
- 二零二四年度企業(yè)購銷合同
- 二零二五年度風電場變壓器采購、運輸、安裝一體化服務合同3篇
- 2025年有機肥行業(yè)發(fā)展趨勢分析報告
- 2023-2024年員工三級安全培訓考試題及參考答案(綜合題)
- 2025保安部年度工作計劃
- 2024年江蘇經(jīng)貿(mào)職業(yè)技術(shù)學院單招職業(yè)適應性測試題庫
- 人居環(huán)境綜合治理項目項目背景及必要性分析
- 招標采購基礎知識培訓
- 電力系統(tǒng)分布式模型預測控制方法綜述與展望
- 2024年注冊建筑師-二級注冊建筑師考試近5年真題附答案
- 五年級口算題卡每天100題帶答案
- 2024年貴州省中考理科綜合試卷(含答案)
評論
0/150
提交評論