科技政策庫數(shù)據(jù)分析與展示項(xiàng)目技術(shù)規(guī)范建議書_第1頁
科技政策庫數(shù)據(jù)分析與展示項(xiàng)目技術(shù)規(guī)范建議書_第2頁
科技政策庫數(shù)據(jù)分析與展示項(xiàng)目技術(shù)規(guī)范建議書_第3頁
科技政策庫數(shù)據(jù)分析與展示項(xiàng)目技術(shù)規(guī)范建議書_第4頁
科技政策庫數(shù)據(jù)分析與展示項(xiàng)目技術(shù)規(guī)范建議書_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、科技政策庫數(shù)據(jù)分析與展示項(xiàng)目技術(shù)規(guī)范建議書3.1 建設(shè)背景為落實(shí)中國科協(xié)高水平科技智庫建設(shè)十三五規(guī)劃 “利用現(xiàn)代信息系統(tǒng),建立國家科技政策數(shù)據(jù)庫,及時(shí)收集、定期更新、系統(tǒng)整理中央和各地新近出臺(tái)的科技政策、科技人才政策,實(shí)現(xiàn)科協(xié)系統(tǒng)科技政策信息的共通共享。” 的要求,利用網(wǎng)絡(luò)爬蟲、深度學(xué)習(xí)等最新信息技術(shù),從互聯(lián)網(wǎng)爬取國內(nèi)外科技政策文獻(xiàn),構(gòu)建完整的科技政策庫,并進(jìn)行挖掘分析,實(shí)現(xiàn)政策文獻(xiàn)的快速檢索和統(tǒng)計(jì)分析功能,支持政策研究與制定,建成科技政策領(lǐng)域有影響的一流智庫。3.2 建設(shè)目標(biāo)3.2.1 項(xiàng)目整體目標(biāo)構(gòu)建面向中央、地方(省級(jí))的科技政策全文庫。構(gòu)建面向世界主要發(fā)達(dá)國家的科技政策全文庫。構(gòu)建面向

2、科技政策研究的研究成果庫(論文、專著、報(bào)告、政策建議)。支撐政策研究與分析。3.2.2 本期項(xiàng)目目標(biāo)科技政策庫數(shù)據(jù)分析與展示項(xiàng)目主要目的是根據(jù)前期項(xiàng)目采集的政策法規(guī)、相關(guān)研究論文、政策解讀、相關(guān)研究項(xiàng)目信息,以及美印自1980 年后國家層面的政策信息,進(jìn)行數(shù)據(jù)挖掘分析和多維展示。定制化開發(fā)政策文本挖掘系統(tǒng),支持中英文的單一文本在線分析。定制化開發(fā)中英文一體化檢索引擎和國外智庫信息采集編輯。3.3 業(yè)務(wù)需求3.3.1 政策文本挖掘分析文本挖掘是對(duì)國內(nèi)外政策文本、政策解讀、相關(guān)論文等信息進(jìn)行文本挖掘處理, 提取知識(shí)化的信息并用可視化的方式進(jìn)行表示,著力于政策文本的分類、政策關(guān)聯(lián)分析,政策主題提取等

3、方面。輔助政策研究者政策制定者快速理解政策文本,挖掘數(shù)據(jù)價(jià)值。( 1)政策文本分類,通過機(jī)器學(xué)習(xí)的聚類算法對(duì)政策文本進(jìn)行分類,并形成相應(yīng)的專題,并以可視化的方式展示。系統(tǒng)可定制生成時(shí)間與區(qū)域維度的政策熱點(diǎn)散點(diǎn)圖。系統(tǒng)可定制生成區(qū)域政策的研究熱點(diǎn)及統(tǒng)計(jì)展示圖。系統(tǒng)定期更新,保證政策分析的時(shí)效性。( 2) ) 政策關(guān)聯(lián)分析,通過對(duì)文本的結(jié)構(gòu)分析完成政策的關(guān)聯(lián)分析。并將分析出的政策關(guān)系應(yīng)用到政策檢索與政策展示中去。( 3)政策主題抽取和摘要的機(jī)器編寫,針對(duì)單個(gè)文本可實(shí)現(xiàn)文本的關(guān)鍵信息提取,生成相應(yīng)的文本摘要信息,并在在線文本分析和檢索中展示相關(guān)信息。摘要內(nèi)容包括但不限于此政策文件的涉及領(lǐng)域、所針對(duì)的

4、政策對(duì)象、政策發(fā)布部門、時(shí)間、政策工具等。3.3.2 中英文文本在線分析為更好地幫助政策研究人員政策制定者快速準(zhǔn)確閱讀理解政策文本,借助機(jī)器學(xué)習(xí)和云計(jì)算能力,系統(tǒng)提供中英文單一政策文本的在線分析,實(shí)現(xiàn)秒級(jí)的文本摘要提取、詞云展現(xiàn)、政策溯源和相似政策導(dǎo)讀。( 1)生成政策主題和摘要生成,提取文本關(guān)鍵信息,生成摘要,。摘要內(nèi)容包括政策涉及的行業(yè)領(lǐng)域、所使用的政策手段、所針對(duì)的政策對(duì)象等。( 2)生成政策詞云,通過自然語義理解相關(guān)的技術(shù),分析輸入文本中的政策關(guān)鍵詞,聚焦政策關(guān)鍵點(diǎn),輔助政策分析。( 3)政策溯源分析,通過自然語言理解技術(shù)挖掘出政策之間的依賴關(guān)系,并以友好、美觀的界面展示,達(dá)到清晰、直

5、觀的展示效果。( 4)相似政策推薦,通過自然語言理解技術(shù)挖掘出政策之間相似性,并根據(jù)相似度進(jìn)行排序。機(jī)器學(xué)習(xí):支持至少包括隨機(jī)森林、邏輯回歸、支持向量機(jī)、貝葉斯等多種機(jī)器學(xué)習(xí)算法,這些算法具有國內(nèi)組織的機(jī)器學(xué)習(xí)大規(guī)模實(shí)際應(yīng)用場(chǎng)景,要求提供相關(guān)證明材料。3.3.3 中英文一體化檢索為更好地服務(wù)中文用戶,充分利用好系統(tǒng)的中英文政策數(shù)據(jù)資源,系統(tǒng)提供中英文一體化檢索引擎,實(shí)現(xiàn)中英文政策資源的統(tǒng)一檢索,用戶只需輸入一種語言即可實(shí)現(xiàn)兩種資源的同時(shí)檢索。( 1)靈活的檢索方式。一種語言檢索,兩種語言呈現(xiàn)。支持條件檢索,從政策領(lǐng)域、政策層次、政策性質(zhì)、發(fā)文單位等維度限定檢索的的范圍;支持聯(lián)想檢索, 當(dāng)用戶輸

6、入某個(gè)檢索詞的一部分時(shí),自動(dòng)在搜索下拉列表中聯(lián)想到與該輸入詞相關(guān)的詞語,方便用戶直接選擇進(jìn)行搜索。( 2) 智能雙語檢索結(jié)果呈現(xiàn)。同時(shí)呈現(xiàn)智能、高相關(guān)度雙語最優(yōu)檢索結(jié)果。支持相關(guān)度、發(fā)布時(shí)間排序。檢索結(jié)果支持對(duì)排序方式的配置選擇,支持多級(jí)排序; 檢索結(jié)果排序支持中文和英文的檢索結(jié)果的切換。豐富的檢索結(jié)果篩選。用戶可以基于現(xiàn)有的政策文本標(biāo)簽,對(duì)已有檢索結(jié)果進(jìn)行多維度的篩選,如發(fā)布部門、行政區(qū)域等為維度,高效、準(zhǔn)確的協(xié)助用戶找到自己關(guān)注的政策文本。1.1.4 政策信息發(fā)布展示集成政策數(shù)據(jù)采集與管理系統(tǒng)的國內(nèi)政策信息(另外項(xiàng)目提供數(shù)據(jù))、本項(xiàng)目采集的國外智庫信息、中英文一體化檢索和文本分析展示需求對(duì)

7、外提供一體化信息檢索展示門戶。1.1.5 國外智庫信息采集研究分析國際排名前50 的智庫網(wǎng)站,有針對(duì)性提供相關(guān)欄目信息的采集,并將相關(guān)數(shù)據(jù)開放給文本挖掘分析、中英文一體化檢索和信息展示頁面。智庫名錄詳見附錄6.1 章節(jié)英文智庫名錄。1.1.6 智庫信息編輯發(fā)布協(xié)助完成微信公眾號(hào)的開通,并提供基礎(chǔ)的運(yùn)維保障,包括信息編輯、發(fā)布、統(tǒng)計(jì)分析、運(yùn)維管理等功能。信息編輯指根據(jù)采集的國際智庫信息,進(jìn)行過濾后推薦給用戶,用戶選擇后,翻譯和美工處理工作。其間翻譯美工處理文章篇幅不超過50 篇。信息發(fā)布依托微信公共平臺(tái)完成。統(tǒng)計(jì)分析包括用戶分析、圖文分析、菜單分析、消息分析等。運(yùn)維管理包括消息管理、用戶管理和素

8、材管理。1.1.7 信息展現(xiàn)需求設(shè)計(jì)集成提供國外熱點(diǎn)研究報(bào)告的加工展示,以區(qū)域板塊輪循的方式呈現(xiàn)不同信息源的信息展示,并集成相應(yīng)的檢索和分析界面。1.1.8 信息管理需求用戶可以通過CMS8統(tǒng)對(duì)采集的信息進(jìn)行編輯、刪除、轉(zhuǎn)移、發(fā)布等操作。 系統(tǒng)可以統(tǒng)一配置CMST理權(quán)限,提供統(tǒng)一的配置入口,便于用戶對(duì)系統(tǒng)使用和 管理。3.4 技術(shù)要求3.4.1 平臺(tái)整體要求 總體要求構(gòu)建基于自然語言處理、機(jī)器學(xué)習(xí)、文本挖掘引擎、搜索引擎的技術(shù)架構(gòu)平臺(tái)。著重考慮大型搜索框架和文本挖掘引擎對(duì)平臺(tái)的技術(shù)要求。 建設(shè)原則1. 開放性系統(tǒng)設(shè)計(jì)要采用開放標(biāo)準(zhǔn),選用的技術(shù)產(chǎn)品要符合開放標(biāo)準(zhǔn),可根

9、據(jù)甲方未來業(yè)務(wù)的變化而靈活地改變,滿足業(yè)務(wù)系統(tǒng)今后進(jìn)一步拓展的需要。2. 高安全性信息安全是甲方業(yè)務(wù)系統(tǒng)的重要要求,要確保所涉及軟件不存在任何已知漏洞, 確保信息內(nèi)容網(wǎng)絡(luò)上的安全傳輸,防止任何未經(jīng)授權(quán)的訪問,防范黑客對(duì)內(nèi)容和系統(tǒng)的攻擊,當(dāng)發(fā)生入侵時(shí)能夠及時(shí)檢測(cè)并自動(dòng)屏蔽和恢復(fù)。不論硬件設(shè)備、操作系統(tǒng),還是中間件和應(yīng)用開發(fā)都要將全系統(tǒng)的安全性放在首位。3. 高可用性本系統(tǒng)是甲方的重要業(yè)務(wù)系統(tǒng),系統(tǒng)工作要穩(wěn)定、可靠,要確保7X24小時(shí)不間斷工作,不存在單點(diǎn)故障。4. 可擴(kuò)展性和可分步實(shí)施性系統(tǒng)應(yīng)從數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)索引和功能服務(wù)等方面充分考慮集群架構(gòu)和分布式架構(gòu), 根據(jù)數(shù)據(jù)量增加和服務(wù)訪問增強(qiáng),能夠靈

10、活的進(jìn)行系統(tǒng)擴(kuò)展;系統(tǒng)應(yīng)考慮到和其他信息系統(tǒng)的通信連接,應(yīng)具有良好的外接接口;隨著業(yè)務(wù)的不斷擴(kuò)充,系統(tǒng)可以方便地?cái)U(kuò)展業(yè)務(wù)功能模塊。5. 良好的管理性和維護(hù)性本系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),因此要求技術(shù)架構(gòu)合理,模塊清晰,有管理和運(yùn)維模塊, 可方便管理員進(jìn)行系統(tǒng)管理和維護(hù)。各子系統(tǒng)應(yīng)具有詳細(xì)的系統(tǒng)異常描述文檔及相應(yīng)異常處理文檔。6. 先進(jìn)性系統(tǒng)建設(shè)時(shí)應(yīng)使用先進(jìn)和成熟的技術(shù),以滿足技術(shù)領(lǐng)先的要求。7. 集成性系統(tǒng)能夠由各個(gè)軟件模塊構(gòu)建,各個(gè)模塊之間,要有良好的內(nèi)置集成;其次,各模塊具有與其他系統(tǒng)集成的能力。8. 開發(fā)接口和二次開發(fā)能力系統(tǒng)應(yīng)提供開放接口,并可以根據(jù)項(xiàng)目具體需求方便地進(jìn)行二次開發(fā),滿足個(gè)性化

11、的要求,實(shí)現(xiàn)應(yīng)用集成。9. 部署簡易性系統(tǒng)部署應(yīng)采用微服務(wù)部署策略,實(shí)現(xiàn)自動(dòng)化或半自動(dòng)化部署。10. 后臺(tái)管理界面提供簡潔、易用的管理界面,方便監(jiān)控文本數(shù)據(jù)處理情況,直觀展示政策文本管理、分析報(bào)表配置、文本處理狀態(tài)、權(quán)限管理等操作功能。 接口要求根據(jù)整個(gè)文本挖掘和搜索引擎的流程,考慮整個(gè)科技政策庫數(shù)據(jù)分析與展示項(xiàng)目的規(guī)范性和擴(kuò)展性等需求,以及與科技政策庫數(shù)據(jù)采集與管理項(xiàng)目的融合,系統(tǒng)提供的接口應(yīng)具有包括但不限于:中英文文本在線分析功能按照RESTful 的風(fēng)格提供http 接口。中英文文本在線分析功能接口調(diào)用應(yīng)包括生成政策主題和摘要生成、政策詞云生成、政策溯源分析、相似政策推薦四

12、個(gè)功能接口的調(diào)用,而且支持通過接口的方式對(duì)文檔進(jìn)行批量處理。接口應(yīng)支持二次開發(fā)。3.4.2 自然語言NLPtt理要求系統(tǒng)應(yīng)采用自然語義理解技術(shù),對(duì)每個(gè)政策文本進(jìn)行深度分析,不僅要保障政策庫內(nèi)文本的識(shí)別的準(zhǔn)確率,而且要能夠?qū)υ诰€輸入的政策文本進(jìn)行深度挖掘,在政策文本分類、政策關(guān)聯(lián)分析和政策主題抽取和摘要的機(jī)器編寫等維度進(jìn)行深度剖析,為政策制定者提供更高品質(zhì)的政策文本智能分析服務(wù)。利用中英文自然語言理解相關(guān)技術(shù),提升系統(tǒng)的中英文文本分析能力,對(duì)現(xiàn)有算法進(jìn)行優(yōu)化,并根據(jù)政策文本分析實(shí)際業(yè)務(wù)進(jìn)行調(diào)整。系統(tǒng)應(yīng)利用自然語言理解中的神經(jīng)網(wǎng)絡(luò)模型,對(duì)文本挖掘相關(guān)模型進(jìn)行改進(jìn),在文本挖掘過程中不斷進(jìn)行語料積累,

13、形成政策語料庫,要求如下:支持停用詞的處理。支持自定義詞典和詞語合并拆分。支持詞性篩選。支持標(biāo)準(zhǔn)化規(guī)約化語料集的形成。支持同義詞及近義詞的處理。數(shù)據(jù)挖掘分析數(shù)據(jù)挖掘分析在本項(xiàng)目中的主要作用是對(duì)庫內(nèi)政策文本進(jìn)行文本挖掘處理,準(zhǔn)確地提取結(jié)構(gòu)化的信息,挖掘出更有價(jià)值的信息數(shù)據(jù),并進(jìn)行更深層次加工,為政策文本分類、政策關(guān)聯(lián)分析和政策主題抽取和摘要的機(jī)器編寫等方面提供必要的數(shù)據(jù)處理基礎(chǔ)。數(shù)據(jù)挖掘分析應(yīng)采用中英文語義分析和文本挖掘技術(shù),支持中英文政策文本的解析。功能要求數(shù)據(jù)挖掘分析主要功能要求如下:1) 政策文本分類結(jié)合語義理解和文本挖掘技術(shù),準(zhǔn)確的將庫內(nèi)政策文本進(jìn)行分類結(jié)合實(shí)際應(yīng)用場(chǎng)景的需求,進(jìn)行定制化

14、開發(fā),形成政策專題 政策文本分類和聚類過程應(yīng)由機(jī)器自動(dòng)完成。隨著訓(xùn)練樣本數(shù)量的提升,準(zhǔn)確率應(yīng)滿足線性增長。2) 政策關(guān)聯(lián)分析基于海量政策數(shù)據(jù)樣本,結(jié)合語義理解和文本挖掘技術(shù),深度分析庫內(nèi) 政策文本的內(nèi)容,找到政策間的關(guān)聯(lián)關(guān)系。系統(tǒng)應(yīng)具備自學(xué)習(xí)能力,可以通過用戶的負(fù)樣本反饋,自動(dòng)優(yōu)化算法模 型。3) 政策主題抽取和摘要的機(jī)器編寫深度定制主題模型,結(jié)合語義理解和文本挖掘技術(shù),建立多維度政策專 屬信息框架,準(zhǔn)確提取政策內(nèi)關(guān)鍵信息。將政策文本中包含的關(guān)鍵信息進(jìn)行處理,并將抽取的信息以結(jié)構(gòu)化數(shù)據(jù) 的形式進(jìn)行展示,形成政策文本的摘要內(nèi)容。3.4.3 算法要求數(shù)據(jù)挖掘分析應(yīng)用算法要求如下:1) 文本分詞模塊

15、支持基于科技政策庫業(yè)務(wù)需求進(jìn)行定制化開發(fā)。2) 文本分詞算法模型應(yīng)至少融合五種分詞算法,包括但不限于基于詞典的機(jī)械分詞、命名實(shí)體識(shí)別等分詞技術(shù)。3) 文本分類算法模型應(yīng)包括多種分類器,包括但不限于支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。4) 序列標(biāo)注算法模塊應(yīng)包括多種序列標(biāo)注技術(shù),包括但不限于HMMCRF等。5) 特征提取算法模塊中應(yīng)包括三種以上評(píng)估函數(shù)。3.4.4 性能要求數(shù)據(jù)挖掘分析模塊性能要求上,需滿足如下指標(biāo):廳P功能名稱技術(shù)參數(shù)要求1基礎(chǔ)分詞準(zhǔn)確率90%2政策文本分類準(zhǔn)確率不低于90%3政策關(guān)聯(lián)分析準(zhǔn)確率不低于90%4政策主題抽取召回率不低于91%5政策主題抽取準(zhǔn)確率不低于90%6政策文本摘要的召回

16、率不低于91%7政策文本摘要的準(zhǔn)確率不低于90%8人名、地名、機(jī)構(gòu)名等實(shí)體詞提取準(zhǔn)確率90%9單機(jī)實(shí)體提取速度不付 500KBZ#10支持指定字?jǐn)?shù)區(qū)間的摘要提取支持11詞性標(biāo)注準(zhǔn)確率不付90.5%12單機(jī)詞性標(biāo)注速度不付 500KBZ#13人工判定的關(guān)鍵詞提取準(zhǔn)確率不低于85%14單機(jī)關(guān)鍵詞提取速度不付 500KBZ#15類別數(shù)為100以內(nèi)的分類準(zhǔn)確率不低于80%16并發(fā)量為100時(shí),分類處理速度不低于400篇/秒3.5 文本在線分析文本在線分析是通過用戶自定義輸入政策文本, 利用語義分析和文本挖掘技 術(shù),對(duì)輸入的內(nèi)容進(jìn)行信息提取、分類,再結(jié)合庫內(nèi)已有政策文本的內(nèi)容,輸出 政策關(guān)聯(lián)關(guān)系的分析結(jié)

17、果,從而達(dá)到政策文本智能在線分析目的, 幫助政策研究 者快速的理解政策文本,提高政策研究效率。文本在線分析應(yīng)采用中英文語義分析和文本挖掘技術(shù),支持中英文政策文本的解析。3.5.1 功能要求文本在線分析主要功能要求如下:1)生成政策主題和摘要生成:支持通過文本挖掘技術(shù),分析文本內(nèi)容,提取政策主題,并形成政策領(lǐng)域的主題模型庫,豐富政策主題模型自動(dòng)從原始文本中提取文本信息,以結(jié)構(gòu)化的的方式進(jìn)行展示,反映出政策文本的關(guān)鍵內(nèi)容。2)生成政策詞云對(duì)輸入的政策文本進(jìn)行分析,對(duì)權(quán)重較高的關(guān)鍵詞予以視覺上的突出, 形成政策詞云。提取高質(zhì)量政策關(guān)鍵詞,過濾掉大量的低質(zhì)量文本信息,使政策研究者 可以快速了解政策的主

18、旨。3)政策溯源分析通過對(duì)海量政策文本的分析和深度挖掘的訓(xùn)練,對(duì)在線輸入的政策文本 進(jìn)行分析,并結(jié)合現(xiàn)有政策文本特征,輸出當(dāng)前在線分析政策的制定依據(jù)。支持基于用戶負(fù)反饋的調(diào)優(yōu)機(jī)制。4)相似政策推薦通過對(duì)海量政策文本的分析和深度挖掘的訓(xùn)練,對(duì)在線輸入的政策文本 進(jìn)行分析,并結(jié)合現(xiàn)有政策文本特征,輸出與當(dāng)前在線分析政策文本相似的政策。支持基于用戶負(fù)反饋的調(diào)優(yōu)機(jī)制。3.5.2 算法要求文本在線分析應(yīng)用算法要求如下:1)文本分詞模塊支持基于科技政策庫業(yè)務(wù)需求進(jìn)行定制化開發(fā)。2)文本分詞算法模型應(yīng)至少融合五種分詞算法,包括但不限于基于詞典的 機(jī)械分詞、命名實(shí)體識(shí)別等分詞技術(shù)。3)文本分類算法模型應(yīng)包括多

19、種分類器,包括但不限于支持向量機(jī)、神經(jīng) 網(wǎng)絡(luò)等。4)序列標(biāo)注算法模塊應(yīng)包括多種序列標(biāo)注技術(shù),包括但不限于HMM CRF5)特征提取算法模塊中應(yīng)包括三種以上評(píng)估函數(shù)。3.5.3 性能要求1)支持中文簡體、英語文本的輸入。2)平均處理時(shí)長(ms)小于30m&3)服務(wù)響應(yīng)率不低于99.5%。4)最大 QPSftj 2000。3.6 中英文檢索建立中英文政策文本一體化檢索引擎, 實(shí)現(xiàn)中英文政策資源的統(tǒng)一檢索,用 戶只需輸入一種語言即可實(shí)現(xiàn)兩種資源的同時(shí)檢索。中英文檢索引擎建立在對(duì)自然語言理解的基礎(chǔ)之上, 其關(guān)鍵問題是要使查詢 語言與政策文本語言在檢索之前達(dá)成一致, 使用戶以一種語言提問,可以檢

20、索出 另外一種語言描述的相關(guān)政策。例如,輸入中文搜索內(nèi)容,中英文檢索平臺(tái)會(huì)返 回中文、英文語言的政策文本,而且這些信息不僅僅是文本信息, 還可以是其他 形式的政策分析結(jié)果。中英文檢索引擎要通過機(jī)器翻譯技術(shù)和歧義消解技術(shù)。完成提問式與文本之間的匹配、完成不同語言之問的語義對(duì)等、解決翻譯過程中的多義和歧義問題 。中英文檢索引擎的輸入和輸出端應(yīng)采用中英文語義分析和文本挖掘技術(shù),全面支持中英文政策文本的搜索。3.6.1 功能要求1)靈活的檢索方式:支持勾選式條件檢索,用戶可通過頁面選擇要添加的檢索條件。支持基于自然語言理解的條件檢索,同時(shí)輸入多個(gè)查詢內(nèi)容,系統(tǒng)應(yīng)自 動(dòng)檢索包含這兩個(gè)查詢內(nèi)容的相關(guān)結(jié)果。

21、支持聯(lián)想檢索,基于政策文本語料庫和語義聯(lián)想技術(shù),實(shí)現(xiàn)檢索詞聯(lián)想 功能,根據(jù)用戶輸入的檢索詞進(jìn)行搜索內(nèi)容補(bǔ)全提示。2)智能雙語檢索結(jié)果呈現(xiàn)支持對(duì)中英文檢索結(jié)果進(jìn)行組織和排列,突出顯示用戶查詢結(jié)果的標(biāo)志 性信息,幫助用戶快速理解和篩查。要求根據(jù)查詢內(nèi)容與查詢結(jié)果之間的關(guān)聯(lián)程度進(jìn)行排序,相關(guān)度越高的排名越靠前支持對(duì)中英文檢索結(jié)果進(jìn)行篩選,可按照時(shí)間、分類和標(biāo)簽進(jìn)行篩選, 可根據(jù)篩選內(nèi)容對(duì)檢索結(jié)果進(jìn)行實(shí)時(shí)更新。支持按照內(nèi)容分類、標(biāo)簽等維度進(jìn)行檢索結(jié)果的分類展示。3.6.2 能力要求中英文檢索引擎要求如下:1)支持分別對(duì)中文和英文政策文件構(gòu)建 query,對(duì)外提供文本索引。2)支持對(duì)中英文分詞模塊的定制

22、化修改。3)支持中文和英文檢索,支持utf-8統(tǒng)一編碼。4)支持基于NLP和特定的行業(yè)語料識(shí)別用戶真正的搜索意圖。5)支持檢索結(jié)果集篩選功能。6)支持檢索詞在結(jié)果集中高亮顯示,具體要求關(guān)鍵詞及分詞在結(jié)果集中特 定字段中高亮顯示,高亮顯示顯示字段及高亮顏色靈活可配。3.6.3 性能要求中英文檢索在性能要求上,需滿足如下指標(biāo):廳P功能名稱招標(biāo)要求1參數(shù)指標(biāo)查準(zhǔn)率及查全率要求提供93%勺查全率先在數(shù)據(jù)完 整的情況下提供較高的查準(zhǔn)率,實(shí)現(xiàn)按需檢索;2創(chuàng)建索引創(chuàng)建索引效率滿足單臺(tái)10M磨(服務(wù)器配置標(biāo)準(zhǔn):8 核CPU 2.3GHz, 64G內(nèi)存),集群滿足單臺(tái)線性增長 效率;3并發(fā)性能并發(fā)量滿足單臺(tái)10

23、0并發(fā),集群滿足單臺(tái)線性增長效 率;4檢索性能千萬級(jí)數(shù)據(jù)量,100并發(fā)請(qǐng)求下小于0.8秒更新索引 性能;5索引更新性能批量更新千萬(條)索引數(shù)據(jù)速度不低于 2000條/ 秒。6系統(tǒng)資源每個(gè)數(shù)據(jù)節(jié)點(diǎn)應(yīng)支撐 仃以上的數(shù)據(jù)量,100以上并3.7 其他要求3.7.1 項(xiàng)目輸出形式服務(wù)提供方應(yīng)按照各業(yè)務(wù)系統(tǒng)的需求完成相應(yīng)的功能實(shí)現(xiàn),項(xiàng)目成果包括但不局限于:系統(tǒng)技術(shù)說明文檔。系統(tǒng)部署文檔。軟件源代碼(定制內(nèi)容所有源代碼)(含相關(guān)構(gòu)建配置文件)。工作日志。模型驗(yàn)證手冊(cè)。詳細(xì)設(shè)計(jì)說明書。提供完善的接口文檔,所有接口都應(yīng)該提供詳細(xì)錯(cuò)誤返回說明。3.7.2 項(xiàng)目團(tuán)隊(duì)要求1 .項(xiàng)目團(tuán)隊(duì)人員由服務(wù)方自行管理。2 .服

24、務(wù)提供方需提供至少10人的項(xiàng)目團(tuán)隊(duì)列表,團(tuán)隊(duì)成員中至少3人具有 2年及以上文本挖掘開發(fā)工作經(jīng)驗(yàn),并具有機(jī)器學(xué)習(xí)相關(guān)背景,至少 3人具有2 年及以上搜索引擎開發(fā)工作經(jīng)驗(yàn),具有機(jī)器學(xué)習(xí)相關(guān)背景;應(yīng)答方應(yīng)提供包括人 員參與的時(shí)間和相關(guān)人員的資質(zhì)(按附件三提供每個(gè)人員的簡歷并簽章)。3 .項(xiàng)目經(jīng)理必須具有5年及以上項(xiàng)目管理經(jīng)驗(yàn),且提供過駐場(chǎng)服務(wù)。4 .團(tuán)隊(duì)成員(包含項(xiàng)目經(jīng)理)至少有 2人具有博士及以上學(xué)歷。5 .如果人員更換需提前兩個(gè)月向招標(biāo)人提交書面申請(qǐng),且替代人員試用兩個(gè)月后征得招標(biāo)人同意方可更換6 .服務(wù)團(tuán)隊(duì)需要有完善的管理和協(xié)調(diào)機(jī)制,且能承諾7*24小時(shí)響應(yīng)招標(biāo)人需求。7 .7.3 項(xiàng)目執(zhí)行要

25、求在項(xiàng)目實(shí)施全過程中,采購人有對(duì)實(shí)施質(zhì)量進(jìn)行監(jiān)督控制的職責(zé)和權(quán)利,服務(wù)提供方也應(yīng)按照項(xiàng)目管理要求進(jìn)行嚴(yán)格的質(zhì)量控制, 并制定詳細(xì)合理的溝通計(jì) 劃,至少包括周報(bào)、月報(bào)和項(xiàng)目例會(huì),應(yīng)確保買賣雙方能及時(shí)了解所需的信息。通知中選后,采購方將按照中選份額根據(jù)應(yīng)答方所提供的團(tuán)隊(duì)成員列表指定 項(xiàng)目成員,并有權(quán)根據(jù)業(yè)務(wù)需求,動(dòng)態(tài)新增或者減少項(xiàng)目成員。服務(wù)提供方應(yīng)該:從前期溝通即由項(xiàng)目經(jīng)理負(fù)責(zé),相關(guān)人員要保證在項(xiàng)目中的時(shí)間付出。服務(wù)提供方應(yīng)制定詳細(xì)的項(xiàng)目人員配置與管理方案,保證項(xiàng)目實(shí)施過程中,資源配置足額、并能全時(shí)為采購人項(xiàng)目服務(wù)。項(xiàng)目范圍應(yīng)由采購人確認(rèn)并同意,服務(wù)提供方不得隨意變更項(xiàng)目范圍及 活動(dòng),如需變更,

26、應(yīng)經(jīng)采購人確認(rèn)并同意。采購人變更時(shí),服務(wù)提供方應(yīng)配合買 方及時(shí)進(jìn)行相應(yīng)的變更工作。項(xiàng)目實(shí)施過程中及時(shí)與相關(guān)負(fù)責(zé)人溝通,根據(jù)實(shí)際及時(shí)調(diào)整。8 .7.4交付服務(wù)要求1 .需求調(diào)研、設(shè)計(jì)、研發(fā)、測(cè)試、投產(chǎn)部署支持調(diào)試和落地實(shí)施等服務(wù)。2 .要求原廠工程師提供生產(chǎn)及測(cè)試環(huán)境的軟硬件(如有)需求調(diào)研、設(shè)計(jì)、 研發(fā)、測(cè)試、協(xié)助部署安裝、配置和調(diào)試、平臺(tái)使用實(shí)施、維護(hù)文檔編寫、用戶 使用手冊(cè)和指導(dǎo)等服務(wù),相關(guān)費(fèi)用必須包含在投標(biāo)總價(jià)內(nèi)。3 .在本服務(wù)內(nèi)容實(shí)施前,需要中標(biāo)廠商派遣實(shí)施人員,并配合我中心技術(shù) 人員制定項(xiàng)目計(jì)劃和實(shí)施計(jì)劃。計(jì)劃內(nèi)容包括廠商項(xiàng)目經(jīng)理和技術(shù)人員,以及派遣的人/天數(shù),設(shè)計(jì)、研發(fā)、測(cè)試、投產(chǎn)

27、、實(shí)施指導(dǎo)等工作內(nèi)容。4 .7.5維護(hù)服務(wù)耍求1.專人專項(xiàng)快速響應(yīng):為招標(biāo)人建立高水平技術(shù)人員組成的技術(shù)支持小組, 以向招標(biāo)人提供售前、售后和技術(shù)支持服務(wù)。從人員上保證7X24小時(shí)的支持響 應(yīng),并且做到A、B角人員備份。(請(qǐng)以列表方式給出人員姓名、職務(wù)、職責(zé)、技 術(shù)水平等級(jí)和聯(lián)系方式(服務(wù)熱線、公司電話和手機(jī)等)。2.重大時(shí)刻現(xiàn)場(chǎng)值守服務(wù):在重大事件時(shí)刻,包括重大會(huì)議期間、業(yè)務(wù)系 統(tǒng)重大變更或其他任何可能對(duì)業(yè)務(wù)運(yùn)營產(chǎn)生重大影響的時(shí)刻,按需派遣專業(yè)服務(wù)人員趕赴招標(biāo)人相關(guān)機(jī)構(gòu)和場(chǎng)所進(jìn)行現(xiàn)場(chǎng)值守,保證系統(tǒng)的穩(wěn)定及通暢。3.維保服務(wù):免費(fèi)維護(hù)期為1年,包含在投標(biāo)總價(jià)中。3.7.6部署環(huán)境要求本項(xiàng)目中的

28、數(shù)據(jù)挖掘分析引擎、文本在線挖掘引擎、中英文檢索引擎、后臺(tái) 管理系統(tǒng)等均要求進(jìn)行本地化部署安裝,并支持根據(jù)實(shí)際環(huán)境進(jìn)行靈活開發(fā)??萍颊邘鞌?shù)據(jù)分析與展示系統(tǒng)的部署架構(gòu)應(yīng)采用分布式存儲(chǔ)及領(lǐng)先的微 環(huán)境技術(shù),支持鏡像化管理,高效安全部署,并支持無限擴(kuò)展。平臺(tái)要求在Linux環(huán)境下部署,數(shù)據(jù)庫要求采用 Mysql數(shù)據(jù)庫。3.7.7軟件質(zhì)量本項(xiàng)目實(shí)施過程中的質(zhì)量控制尤為重要, 投標(biāo)方應(yīng)對(duì)項(xiàng)目的質(zhì)量控制及質(zhì)量 保證制度提出比較完善的方案,軟件質(zhì)量要求如下:1)系統(tǒng)應(yīng)運(yùn)行穩(wěn)定,并具有較強(qiáng)的容錯(cuò)能力。2)管理后臺(tái)盡量從用戶角度出發(fā),以方便用戶使用系統(tǒng),操作簡單、界面 表達(dá)清晰、美觀。3)功能應(yīng)全面、實(shí)用,技術(shù)

29、先進(jìn),專業(yè)性強(qiáng),滿足各類交互場(chǎng)景需求。4)軟件應(yīng)具有較強(qiáng)用戶個(gè)性化定制能力、移植能力和后續(xù)開發(fā)能力,能夠 容易根據(jù)用戶需求進(jìn)行功能組合及調(diào)整。5)系統(tǒng)數(shù)據(jù)安全,應(yīng)該能夠記錄系統(tǒng)運(yùn)行時(shí)所發(fā)生的所有錯(cuò)誤,包括本機(jī) 錯(cuò)誤和網(wǎng)絡(luò)錯(cuò)誤。這些錯(cuò)誤記錄便于查找錯(cuò)誤的原因。6)系統(tǒng)的所有功能都應(yīng)該進(jìn)行功能權(quán)限、數(shù)據(jù)權(quán)限的判斷和控制。7)系統(tǒng)安裝方便,易于維護(hù)。8)供應(yīng)商必須提供該項(xiàng)目相關(guān)的完整資料,包括但不僅限于設(shè)計(jì)文檔、開發(fā)工具、開發(fā)組件及平臺(tái)組件的 API使用說明等。3.7.8 信息安全管理服務(wù)提供方需要嚴(yán)格遵守采購人的信息安全管理規(guī)定, 不得將客戶信息提供 給第三方,不得將客戶信息用于除本項(xiàng)目外任何目的

30、、 形式的商業(yè)、非商業(yè)研究。3.7.9 方案設(shè)計(jì)要求本項(xiàng)目投標(biāo)時(shí)需提供相關(guān)設(shè)計(jì)文檔、實(shí)施方案等內(nèi)容。投標(biāo)人提供的設(shè)計(jì)方案里,需包含系統(tǒng)功能架構(gòu)和實(shí)現(xiàn)方式,并提供所需組 件的說明,包括如下內(nèi)容:1)項(xiàng)目需求的理解。2)詳細(xì)執(zhí)行方案。3)項(xiàng)目控制措施。4)其他資源配置計(jì)劃(說明開展本項(xiàng)目所計(jì)劃投入的各種非人力資源)。5)技術(shù)/服務(wù)質(zhì)量承諾,包括項(xiàng)目執(zhí)行管理規(guī)范等等。3.8 售后服務(wù)要求投標(biāo)人應(yīng)承諾該項(xiàng)目穩(wěn)定運(yùn)行,并承諾提供一年免費(fèi)運(yùn)維服務(wù),服務(wù)期自項(xiàng) 目驗(yàn)收合格之日開始。服務(wù)期內(nèi)為采購人需要集成的業(yè)務(wù)系統(tǒng)免費(fèi)提供接口、 版 本升級(jí)和技術(shù)支持等。3.9 軟件著作權(quán)的要求1、投標(biāo)人提供產(chǎn)品的知識(shí)產(chǎn)權(quán)須

31、為投標(biāo)人合法所有或經(jīng)合法授權(quán),投標(biāo)人 承諾本項(xiàng)目的開發(fā)及產(chǎn)品沒有任何不能向采購人提交著作產(chǎn)權(quán)的內(nèi)容和技術(shù)細(xì) 節(jié)。2、為了保證系統(tǒng)能安全可靠運(yùn)行,投標(biāo)人承諾非開放性的、未經(jīng)軟件產(chǎn)品 權(quán)威認(rèn)定部門認(rèn)定的開發(fā)工具或技術(shù)構(gòu)件,在系統(tǒng)開發(fā)過程及運(yùn)行環(huán)境中將禁止 使用。3、本項(xiàng)目實(shí)施的所有成果版權(quán)屬于中國科協(xié)創(chuàng)新戰(zhàn)略研究院所有,用戶方 有權(quán)對(duì)系統(tǒng)進(jìn)行二次開發(fā)和修改。3.10 附錄1 :英文智庫名錄Rank智庫名錄Wiki Year Rating Reviews1Brookings Institution (United States)Wiki916100%742Chatham House (United

32、Kingdom)Wiki92097%643Carnegie Endowment for International Peace (UnitedStates)Wiki91097%874Center for Strategic and International Studies(CSIS) (United States)wiki 196296%875Bruegel (Belgium)Wiki91894%876Council on Foreign Relations (CFR) (United States) Wiki 196492%747International Institute for St

33、rategic Studies(IISS) (United Kingdom)Wiki 191891%1228RAND Corporation (United States)Wiki 194890%729Woodrow Wilson International Center for Scholars(United States)Wiki 196889%8510Amnesty International (AI) (United Kingdom)Wiki 196184%7811Cato Institute (United States)Wiki 197412Heritage Foundation

34、(United States)Wiki 197313Fundacao Getulio Vargas (FGV) (Brazil)Wiki 194414Transparency International (TI) (Germany)Wiki 199315Japan Institute of International Affairs (JIIA)(Japan)Wiki16French Institute of International Relations (IFRI)(France)Wiki 197917Fraser Institute (Canada)Wiki 197418German I

35、nstitute for International and SecurityAffairs (SWP) (Germany)Wiki 196219Center for American Progress (CAP) (United States) W/iki 200)3Rank智庫名錄Wiki dear Rating Reviews20Peterson Institute for International Economics(PIIE) (United States)Wiki 198121Centre for European Policy Studies (CEPS) (Belgium)

36、W八ki 198,322Stockholm International Peace Research Institute(SIPRI) (Sweden)Wiki 196623Centre for Economic Policy Research (CEPR) (UnitedKingdom)Wiki 198324Carnegie Moscow Center (Russia)Wiki 199425Konrad Adenauer Foundation (KAS) (Germany)Wiki 195526Friedrich Ebert Foundation (FES) (Germany)Wiki 19

37、2527International Crisis Group (ICG) (Belgium)Wiki 199528American Enterprise Institute for Public PolicyResearch (AEI) (United States)Wiki 193829Asian Development Bank Institute (ADBI) (Japan)Wiki 199630European Council on Foreign Relations (ECFR)(United Kingdom)Wiki 2>00731Chinese Academy of Social Sciences (CASS) (China) Wiki 197732Institute for World Economy and InternationalRelations (IMEMO RAS) (Russia)Wiki 195633Korea Institute for

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論