大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究_第1頁
大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究_第2頁
大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究_第3頁
大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究_第4頁
大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究

0引言“提高自主創(chuàng)新能力,建設(shè)創(chuàng)新型國家”是我國自十七大以來確定的國家未來發(fā)展戰(zhàn)略的核心思想,而在勝利召開的黨的十八大會議中,更是明確提出了“實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略”的偉大構(gòu)想,并指出“科技創(chuàng)新是提高社會生產(chǎn)力和綜合國力的戰(zhàn)略支撐,必須擺在國家發(fā)展全局的核心位置”以及“以全球視野謀劃和推動創(chuàng)新,提高原始創(chuàng)新、集成創(chuàng)新和引進消化吸收再創(chuàng)新能力,更加注重協(xié)同創(chuàng)新”等重要方針政策。這是黨中央國務(wù)院在深刻把握當(dāng)代科學(xué)技術(shù)與經(jīng)濟發(fā)展特征的基礎(chǔ)上,為我國未來發(fā)展打造核心驅(qū)動力所做出的重大戰(zhàn)略部署。因此,在這一特定環(huán)境下,如何實現(xiàn)技術(shù)創(chuàng)新管理工作的“創(chuàng)新驅(qū)動發(fā)展”,是我國科技工作者亟待思考的重要問題之一。另一方面,近年來,“大數(shù)據(jù)”引起各國政府、產(chǎn)業(yè)界和科技界的高度關(guān)注[1],2012年3月19日,美國總統(tǒng)奧巴馬宣布啟動“大數(shù)據(jù)研究與開發(fā)計劃(BigDataResearchandDevelopmentInitiative)”,旨在提高從大型復(fù)雜數(shù)字數(shù)據(jù)中抽取知識與觀點的能力,以幫助解決國家在科學(xué)與工程中最緊迫的諸多挑戰(zhàn)問題,增強國家安全,實現(xiàn)教育與學(xué)習(xí)的轉(zhuǎn)變[2]。該項計劃的提出將“大數(shù)據(jù)”研究上升到美國國家戰(zhàn)略的最高層,以國家政府為核心的全球“大數(shù)據(jù)”戰(zhàn)略競爭正式拉開序幕?!按髷?shù)據(jù)”時代的來臨,標(biāo)志著傳統(tǒng)數(shù)據(jù)挖掘方法已經(jīng)不再適應(yīng)日新月異的數(shù)據(jù)環(huán)境,在數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析以及可視化等諸多方面捉襟見肘。與此同時,各行各業(yè)對數(shù)據(jù)的依賴性有增無減,甚至以數(shù)據(jù)為基礎(chǔ)的定量分析方法也有逐步取代耗時耗力的以專家為基礎(chǔ)的定性分析方法的趨勢。正是在這樣的大背景下,傳統(tǒng)的“技術(shù)創(chuàng)新管理”方法也面臨著巨大的挑戰(zhàn),傳統(tǒng)的數(shù)據(jù)挖掘方法與工具技術(shù)逐漸無法應(yīng)付技術(shù)領(lǐng)域中迅速涌現(xiàn)的大規(guī)模數(shù)據(jù),更無法實現(xiàn)對如此量級數(shù)據(jù)的實時處理與分析,從而喪失產(chǎn)生輔助決策依據(jù)的數(shù)據(jù)分析方案與能力。因此,從我國技術(shù)創(chuàng)新管理工作的實際需求出發(fā),如何有效把握“大數(shù)據(jù)”環(huán)境下的大機遇與大挑戰(zhàn),應(yīng)對“大數(shù)據(jù)”給傳統(tǒng)技術(shù)創(chuàng)新管理工作所帶來的從思維體系到技術(shù)方法的大變革,實現(xiàn)我國技術(shù)創(chuàng)新管理工作的決策創(chuàng)新,既是本文的立足點,也是本文期望解決的實際問題。為達到這一目標(biāo),一方面,本文將結(jié)合當(dāng)前國內(nèi)外的最新研究進展,并著重關(guān)注已公開的美國“大數(shù)據(jù)研究與開發(fā)計劃”項目研究內(nèi)容[2],深入剖析美國國防部與國防部高級研究計劃局相關(guān)項目的研究目標(biāo)與研究對象,尋求“大數(shù)據(jù)”環(huán)境下美國國防研究中的新思路、新理念。另一方面,本文以數(shù)據(jù)挖掘技術(shù)為核心,構(gòu)建“目標(biāo)驅(qū)動”與“數(shù)據(jù)驅(qū)動”并行的雙向技術(shù)創(chuàng)新管理方法體系,為我國技術(shù)創(chuàng)新管理的實際工作提供有力支撐。1研究背景1.1國內(nèi)外研究現(xiàn)狀麥肯錫全球研究院將“大數(shù)據(jù)”定義為“無法在一定時間內(nèi)使用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進行獲取、管理和處理的數(shù)據(jù)集合”[3]?!按髷?shù)據(jù)”可以認為是“分析”的另一種表述,它是尋求從數(shù)據(jù)中萃取知識,并將其轉(zhuǎn)化為商業(yè)優(yōu)勢的智能化活動[4]。在大多數(shù)文獻中,“大數(shù)據(jù)”被總結(jié)為如下三個特征(即三個V):(1)容量大(Volume):2012年,全球數(shù)據(jù)總量約為2.7~3.5ZB。而每秒鐘通過網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)總量已經(jīng)超過了20年之前互聯(lián)網(wǎng)的總存儲量。(2)產(chǎn)生速度快(Velocity):IBM將這一屬性定義為數(shù)據(jù)進出的高速性,也可以將這一特性引申理解為對大數(shù)據(jù)迅速的處理能力以及決策能力的要求。(3)多樣性(Variety):大數(shù)據(jù)所包含的數(shù)據(jù)種類不僅僅包含常規(guī)意義上的關(guān)系數(shù)據(jù)庫或數(shù)據(jù)倉庫數(shù)據(jù),還容納了如圖片、流媒體以及社會網(wǎng)絡(luò)信息在內(nèi)的全新數(shù)據(jù)類型。此外,大數(shù)據(jù)的“信息價值大與冗余信息多(Value)”這一屬性也被眾多專家學(xué)者納為大數(shù)據(jù)的第四個特征。雖然,“大數(shù)據(jù)”一詞早在20世紀80年代就已經(jīng)出現(xiàn),但是一直以來,“大數(shù)據(jù)”僅僅是作為數(shù)據(jù)挖掘技術(shù)定義中“海量數(shù)據(jù)”的另一種表述,局限于計算機學(xué)科中的“海量數(shù)據(jù)”挖掘與處理技術(shù)等研究,并未形成具有影響力及代表意義的突出研究成果或研究方案。2008年,《Nature》雜志出版??禕igData》,基于多個學(xué)科的實際研究現(xiàn)狀系統(tǒng)地介紹了“大數(shù)據(jù)”所蘊含的潛在價值與挑戰(zhàn)[5]。自此,“大數(shù)據(jù)”正式登上科學(xué)研究的大舞臺,并成為各個學(xué)科中的研究熱點問題。而2011年,《Science》雜志出版的??禗ealingwithData》則標(biāo)志著“大數(shù)據(jù)”時代的到來[6]。筆者于2013年2月12日通過WebofScience在SCI與SSCI數(shù)據(jù)庫中以“BigData”為檢索詞,在主題中進行檢索,共獲得232篇文獻。其中,196篇的出版時間在2008年以后(包括2008年),117篇來自2012年。由此可見,“大數(shù)據(jù)”研究在全球范圍內(nèi)的“新”與“熱”。本文通過VantagePoint文本挖掘軟件生成了SCI與SSCI數(shù)據(jù)庫中“大數(shù)據(jù)”相關(guān)文獻的基于關(guān)鍵詞的關(guān)聯(lián)圖譜(見圖1)。從圖1不難發(fā)現(xiàn),“BigData”與“CloudComputing”(云計算)是所有文獻的最核心,而33個關(guān)鍵詞中計算機與軟件技術(shù)相關(guān)的關(guān)鍵詞在一半以上,其中具有“大數(shù)據(jù)”文件管理與處理軟件Hadoop與MapReduce更是出現(xiàn)在了關(guān)聯(lián)圖的顯著位置。不過,我們還發(fā)現(xiàn),“DataManagement”(數(shù)據(jù)管理)、“DataGrid”(數(shù)據(jù)格)以及“Ontology”(本體)三個關(guān)鍵詞形成了聚類,出現(xiàn)在圖的右下角(圈中所示),這可以認為是“大數(shù)據(jù)”管理相關(guān)研究的涌現(xiàn)。由圖1可知,當(dāng)前國外的“大數(shù)據(jù)”研究工作仍然集中在如何進行大數(shù)據(jù)存儲、處理、分析以及管理的技術(shù)及軟件應(yīng)用上,而關(guān)于“大數(shù)據(jù)”與應(yīng)用管理科學(xué)的結(jié)合,尤其是與技術(shù)管理科學(xué)結(jié)合的研究幾乎為零。本文還對這232篇文章作者所在的國家與其相關(guān)文章的關(guān)鍵詞進行了關(guān)聯(lián)分析,生成基于關(guān)鍵詞的國家間關(guān)聯(lián)圖如圖2所示。很顯然,以美國為核心,包括德國、英國以及比利時等在內(nèi)的歐美國家是研究“大數(shù)據(jù)”的最核心,而中國并不在這個核心集群之內(nèi),且與其他國家也幾乎無關(guān)聯(lián)。放眼當(dāng)前國內(nèi)學(xué)者圍繞“大數(shù)據(jù)”展開的相關(guān)研究,不難發(fā)現(xiàn),雖然“大數(shù)據(jù)”研究已經(jīng)引起了中國學(xué)者的高度重視,圍繞“大數(shù)據(jù)”的研究工作也全面展開。然而,國內(nèi)的“大數(shù)據(jù)”研究尚屬起步階段。自2012年5月份以“大數(shù)據(jù)科學(xué)與工程——一門新興的交叉學(xué)科?”為主題的香山會議順利召開以來,在不到一年的時間,以李國杰院士為核心的計算機學(xué)科專家學(xué)者紛紛就圍繞“大數(shù)據(jù)”定義的“數(shù)據(jù)科學(xué)”的理論架構(gòu)與算法應(yīng)用等問題進行了綜述性的歸納研究與探討[1]。如馬帥等就對“大數(shù)據(jù)”的異構(gòu)數(shù)據(jù)模型與存儲、復(fù)雜數(shù)據(jù)智能分析、數(shù)據(jù)質(zhì)量以及大數(shù)據(jù)安全性等問題進行了分析和討論[7]。不過,針對如何應(yīng)對“大數(shù)據(jù)”環(huán)境給科技管理問題帶來的挑戰(zhàn),國內(nèi)的相關(guān)研究微乎其微。在這一方面,中國科學(xué)院的王飛躍教授及其研究團隊在處理與分析大數(shù)據(jù)使其有效支撐科技決策問題上進行了深入的研究,并構(gòu)建了面向大數(shù)據(jù)和開源信息的科技態(tài)勢解析與決策服務(wù)系統(tǒng)[8]?;谝陨蠂鴥?nèi)外研究現(xiàn)狀,可以發(fā)現(xiàn),“大數(shù)據(jù)”研究雖然是當(dāng)前全球各個學(xué)科領(lǐng)域的研究熱點問題,但是,相關(guān)研究仍然很大程度上集中在以“云計算”為核心的“大數(shù)據(jù)”相關(guān)計算機技術(shù)與軟件的開發(fā)上,如何把“大數(shù)據(jù)研究”應(yīng)用于實際的學(xué)科領(lǐng)域,或者說如何指導(dǎo)生產(chǎn)實踐工作應(yīng)對“大數(shù)據(jù)環(huán)境”的研究,幾乎僅停留于理論階段。因此,本文將著眼點于美國的“大數(shù)據(jù)研究與開發(fā)計劃”,希望能從該項計劃的制定與實施過程中尋找能夠?qū)ⅰ按髷?shù)據(jù)”研究與技術(shù)創(chuàng)新管理工作相結(jié)合的突破口。1.2美國“大數(shù)據(jù)研究與開發(fā)計劃”與美國國防自“大數(shù)據(jù)研究與開發(fā)計劃”宣布啟動以來,涉及該項計劃的六大聯(lián)邦部門(美國國家科學(xué)基金會、美國國家衛(wèi)生研究院、美國能源部、美國國防部、美國國防部高級研究計劃局與美國地質(zhì)勘探局)承諾投資兩億多美元,以大力推動和改善與大數(shù)據(jù)相關(guān)的收集、組織和分析工具及技術(shù),從而提升其從大型復(fù)雜數(shù)字數(shù)據(jù)中抽取知識與觀點的能力。其中,不難發(fā)現(xiàn)兩個問題:一、國防部及其高級研究計劃局均被列入大數(shù)據(jù)計劃的核心部門之中,可見國家安全問題在本次美國大數(shù)據(jù)計劃中有舉足輕重的地位;二、“從大型復(fù)雜數(shù)字數(shù)據(jù)中抽取知識與觀點的能力”是各大部門均強調(diào)的核心問題,而這也正是本次美國大數(shù)據(jù)計劃尤為重視的“預(yù)警與監(jiān)測”問題的根源所在。與此同時,美國國防部也提出應(yīng)對大數(shù)據(jù)環(huán)境的基本策略為不斷提高“從數(shù)據(jù)到?jīng)Q策的能力”,實現(xiàn)由數(shù)據(jù)優(yōu)勢向決策優(yōu)勢的轉(zhuǎn)化。美國國防部與國防部高級研究計劃局針對“大數(shù)據(jù)”計劃的立項情況以及各項目擬解決的核心問題(見表1),國防部每年通過2.5億美元左右(其中6000萬美元用于支持新的研究項目)的投資在各個軍事部門開展一系列研究計劃,旨在以創(chuàng)新方式使用海量數(shù)據(jù),通過感知、認知和決策支持的組合,建立真正的、能夠獨立完成操控并做出決策的自治式系統(tǒng),提高作戰(zhàn)人員和分析人員的環(huán)境與狀況感知能力,增強對任務(wù)和流程的支持[9]。國防部的目標(biāo)是將分析人員從任意語言文字資料中提取信息的能力提高100倍,同時希望他們觀察到的目標(biāo)、活動和事件的數(shù)量也獲得相同幅度的提升。本文針對表1所列美國國防部的8個項目和國防部高級研究計劃局的“XDATA”項目進行分析與歸納,對其解決的問題目標(biāo)之間的內(nèi)在聯(lián)系總結(jié)如圖3所示。其中,“XDATA”項目是全部項目計劃的基礎(chǔ),它通過提供基礎(chǔ)技術(shù)與軟件工具,實現(xiàn)對大數(shù)據(jù)的自動化處理能力;“心靈之眼”項目與“機器讀取”項目則側(cè)重于針對大數(shù)據(jù)的數(shù)據(jù)分析能力的提升,而“機器讀取”項目更將這種能力上升到了“人工智能”的高度;“PROCEED”項目集中于“加密”算法層,是大數(shù)據(jù)分析能力在具體領(lǐng)域中的應(yīng)用研究;“彈性云”項目、“ADAMS”項目與“CINDER”項目則將大數(shù)據(jù)研究與國防緊密結(jié)合,把著眼點定位在“網(wǎng)絡(luò)”之中,并通過相應(yīng)的大數(shù)據(jù)“監(jiān)測”能力,實現(xiàn)保障國家安全的最終目標(biāo);“INSIGHT”項目可以認為是國防部諸多項目的制高點,它將“監(jiān)測”提升為“預(yù)警”能力,這也是“數(shù)據(jù)驅(qū)動決策”的最終體現(xiàn)。因此,通過分析美國國防部針對大數(shù)據(jù)展開的項目研究內(nèi)容及其目標(biāo),可以歸納為以下三個層次:“面向大數(shù)據(jù)的基礎(chǔ)工具與技術(shù)研發(fā)”、“以指揮與控制為導(dǎo)向的大數(shù)據(jù)分析及可視化”、“基于大數(shù)據(jù)研究的偵查與預(yù)警機制”(如圖4所示)。其具體內(nèi)容包括如下幾點:“面向大數(shù)據(jù)的基礎(chǔ)工具和技術(shù)研發(fā)”方面,基于非結(jié)構(gòu)化與半結(jié)構(gòu)化的大數(shù)據(jù)處理技術(shù)是美國國防項目研究的重點問題,以改善從國家快速增長的海量數(shù)據(jù)中提取知識與觀點的能力。而軍事數(shù)據(jù)中占據(jù)很大比例的軍事圖像及視頻數(shù)據(jù),又成為相關(guān)研究必須重視的問題之一。與此同時,信息安全問題也是國防研究中的重要挑戰(zhàn)?!耙灾笓]與控制為導(dǎo)向的大數(shù)據(jù)分析及可視化”方面,美國希望運用先進的計算機技術(shù)極大程度地實現(xiàn)大數(shù)據(jù)指揮與控制的人工智能化,包括針對大數(shù)據(jù)的智能處理、輔助決策的能力。一方面,常規(guī)的計算機技術(shù)(如數(shù)據(jù)挖掘方法等)被大量的運用到針對大數(shù)據(jù)的智能化處理工作中來。另一方面,針對大數(shù)據(jù)的可視化研究也迅速成為眾多研究的熱點與重點?!盎诖髷?shù)據(jù)研究的偵查與預(yù)警機制”方面,提升軍事情報的獲取、跟蹤、定位、處理、分析和預(yù)警能力,是各國軍事研究中的最核心問題。美國為確保其在相關(guān)研究工作中的世界領(lǐng)先定位,更加關(guān)注于如何有效利用大數(shù)據(jù)這一挑戰(zhàn)與契機,尋求通過有效的技術(shù)與工具提前識別軍事情報中的潛在威脅,達到提前預(yù)警與防護的最終目的。值得一提的是,在大數(shù)據(jù)項目的具體施行過程中,美國國家政府有效地利用了美國科研機構(gòu)與高校在基礎(chǔ)算法與技術(shù)研究以及軟件開發(fā)等領(lǐng)域的卓絕研究能力,與其展開深度合作,提升了項目研發(fā)的效率。例如,根據(jù)佐治亞理工大學(xué)官方網(wǎng)站上的相關(guān)報道,2012年11月,佐治亞理工大學(xué)工程學(xué)院的兩個研究團隊獲得了一份來自于“大數(shù)據(jù)研究與開發(fā)計劃”價值270萬美元的技術(shù)研發(fā)項目,其側(cè)重點為機器學(xué)習(xí)方法以及數(shù)據(jù)可視化方面的研究[10]。綜上所述,基于美國“大數(shù)據(jù)研究與開發(fā)計劃”項目的深入調(diào)研,尤其是針對大數(shù)據(jù)計劃最核心的美國國防部及國防部高級研究計劃局在相關(guān)立項中的側(cè)重點與項目目標(biāo)的分析,不難發(fā)現(xiàn),從傳統(tǒng)的“目標(biāo)驅(qū)動決策”向“數(shù)據(jù)驅(qū)動決策”的重大轉(zhuǎn)型是美國國家戰(zhàn)略應(yīng)對大數(shù)據(jù)環(huán)境的最直接變化之一,而基于傳統(tǒng)數(shù)據(jù)分析方法的“評估與預(yù)測”理念也正在向“監(jiān)測與預(yù)警”轉(zhuǎn)化。有效地利用大數(shù)據(jù)環(huán)境,深入挖掘與分析潛在技術(shù)競爭情報,監(jiān)測技術(shù)發(fā)展動態(tài),分析潛在網(wǎng)絡(luò)威脅與攻擊,正是大數(shù)據(jù)環(huán)境下美國政府的全新國家戰(zhàn)略思維與部署。2大數(shù)據(jù)環(huán)境下我國技術(shù)創(chuàng)新管理“雙向”決策模型如何應(yīng)對“大數(shù)據(jù)”時代所帶來的挑戰(zhàn)與機遇?美國“大數(shù)據(jù)研究與開發(fā)計劃”項目提供了一條行之有效的新思路與新方案,即轉(zhuǎn)變決策驅(qū)動根源,由傳統(tǒng)的“目標(biāo)驅(qū)動決策”向“數(shù)據(jù)驅(qū)動決策”轉(zhuǎn)化。以此為契機,我國的技術(shù)創(chuàng)新管理工作如何適應(yīng)大數(shù)據(jù)環(huán)境,如何應(yīng)對大數(shù)據(jù)環(huán)境下更為復(fù)雜與激烈的國際競爭,如何有效地將大數(shù)據(jù)環(huán)境作為重要契機運用到國家技術(shù)創(chuàng)新研究工作中來,正是本文希望達到的重要目標(biāo)。參照美國“大數(shù)據(jù)研究與開發(fā)計劃”項目中引入的新思路,本文在整合技術(shù)創(chuàng)新管理現(xiàn)有理論方法的基礎(chǔ)上,充分考慮大數(shù)據(jù)環(huán)境帶來的挑戰(zhàn)與機遇,構(gòu)建了面向技術(shù)創(chuàng)新管理的雙向決策模型,即目標(biāo)驅(qū)動模式與數(shù)據(jù)驅(qū)動模式并行的雙向決策模型(見圖5)。一方面,以傳統(tǒng)目標(biāo)驅(qū)動為基礎(chǔ),形成以傳統(tǒng)數(shù)據(jù)挖掘技術(shù)與方法為核心的數(shù)據(jù)獲取、處理、分析、支持決策的技術(shù)評估與預(yù)測模型。另一方面,圍繞大數(shù)據(jù)環(huán)境下的復(fù)雜數(shù)據(jù)特征與環(huán)境,采用當(dāng)前數(shù)據(jù)挖掘領(lǐng)域應(yīng)用于大數(shù)據(jù)處理的新方法、新思路,形成以自組織動態(tài)實時監(jiān)測為核心,能夠有效預(yù)警并積極處理突發(fā)事件的技術(shù)監(jiān)測與預(yù)警模型。本模型的數(shù)據(jù)源均切實圍繞“大數(shù)據(jù)”展開。一方面,包含科技文獻(期刊、專利)、技術(shù)研究報告與統(tǒng)計數(shù)據(jù)等在內(nèi)的科技數(shù)據(jù)是作為傳統(tǒng)數(shù)據(jù)挖掘方法的核心數(shù)據(jù)源之一;另一方面,作為“大數(shù)據(jù)”環(huán)境賴以生存的網(wǎng)絡(luò)環(huán)境是考慮“大數(shù)據(jù)”數(shù)據(jù)源問題時不可忽視的問題,因此,本模型采納了網(wǎng)絡(luò)數(shù)據(jù)中的輿情數(shù)據(jù)與社交網(wǎng)絡(luò)動態(tài)數(shù)據(jù)(博客、微博客等),這部分數(shù)據(jù)也是“大數(shù)據(jù)”環(huán)境下實現(xiàn)實時監(jiān)測并預(yù)警的數(shù)據(jù)基礎(chǔ)。此外,本模型還把政府政策數(shù)據(jù)、市場動態(tài)與企業(yè)數(shù)據(jù)以及金融交易數(shù)據(jù)等信息囊括在技術(shù)競爭情報分析的數(shù)據(jù)源中。而作為大數(shù)據(jù)環(huán)境中不可或缺的重要要素——“云計算與云存儲”技術(shù)與“并行計算”技術(shù)也被本模型納入到數(shù)據(jù)層中,作為本模型提取潛在信息、展開技術(shù)競爭情報分析的重要技術(shù)方法之一。2.1技術(shù)評估與預(yù)測模型技術(shù)評估與預(yù)測模型圍繞雙向決策中的“目標(biāo)驅(qū)動決策”展開,即決策者首先要明白自己的目的是什么,明白“干什么”,然后,研究“怎么干”。一般而言,“目標(biāo)驅(qū)動決策”面向具體的“技術(shù)”對象,在大數(shù)據(jù)環(huán)境下,采用常規(guī)的數(shù)據(jù)挖掘方法,通過數(shù)據(jù)采集、加工與分析計算等步驟,將數(shù)據(jù)轉(zhuǎn)化為可供技術(shù)創(chuàng)新決策目標(biāo)支持的有效知識或觀點。具體運用在我國技術(shù)創(chuàng)新管理工作中,“目標(biāo)驅(qū)動決策”模型則通過有目的的對大數(shù)據(jù)環(huán)境下科技、網(wǎng)絡(luò)以及其他數(shù)據(jù)中的潛在信息進行有效萃取與分析,實現(xiàn)對具體技術(shù)領(lǐng)域的“知識發(fā)現(xiàn)”與“可視化”,從而達到評估技術(shù)發(fā)展?fàn)顟B(tài),預(yù)測技術(shù)發(fā)展趨勢的最終目的。技術(shù)評估與預(yù)測模型圍繞“技術(shù)挖掘”理論體系展開。其中,作為“技術(shù)挖掘”理論的核心思想——“技術(shù)機會分析”方法由美國佐治亞理工大學(xué)AlanPorter教授于1995年提出[11],即整合文獻計量學(xué)方法與專家知識,針對與某特定新興技術(shù)領(lǐng)域相關(guān)的科技文獻數(shù)據(jù)展開挖掘與分析,定義技術(shù)領(lǐng)域的核心參與者、核心國家或地區(qū)、該技術(shù)的實時變化以及技術(shù)參與者或國家間的關(guān)聯(lián)關(guān)系等。2003年,AlanPorter教授以“技術(shù)機會分析”方法為核心,提出“技術(shù)挖掘”理論[12],系統(tǒng)地歸納了技術(shù)創(chuàng)新環(huán)境下如何掌握并分析科技文獻數(shù)據(jù)[13],提取“技術(shù)競爭情報”,并通過“預(yù)測創(chuàng)新路徑”方法進行可視化展示[14]。本模型中采用了“技術(shù)挖掘”理論中歸納的技術(shù)創(chuàng)新環(huán)境下進行技術(shù)競爭情報分析需要考慮的39個技術(shù)管理問題[12],如“技術(shù)發(fā)展的熱門方向是什么?”、“什么驅(qū)動了技術(shù)的發(fā)展?”、“技術(shù)的哪些方面符合應(yīng)用目的?”以及“哪些國家、公司、大學(xué)或研究機構(gòu)在此技術(shù)或領(lǐng)域中領(lǐng)先?”等。這些技術(shù)管理問題是結(jié)合實際技術(shù)創(chuàng)新管理應(yīng)用,可供選擇的實際“目標(biāo)”,而如何目標(biāo)驅(qū)動決策,“干什么”與“怎么干”由此展開。技術(shù)評估與預(yù)測模型基于傳統(tǒng)的數(shù)據(jù)挖掘方法,引入當(dāng)前文獻計量學(xué)與科學(xué)計量學(xué)領(lǐng)域中的適當(dāng)新技術(shù)新方法,在兼顧傳統(tǒng)數(shù)據(jù)挖掘能力的基礎(chǔ)上,提升知識發(fā)現(xiàn)與表現(xiàn)能力。其中,“基礎(chǔ)工具與技術(shù)”部分在采用了傳統(tǒng)的“自然語言處理”技術(shù)的基礎(chǔ)上,引入了“主題詞簇技術(shù)[15]”,即綜合運用停詞表、模糊語義處理、主題詞網(wǎng)絡(luò)合并分析、詞頻與文本頻次轉(zhuǎn)換分析以及關(guān)聯(lián)規(guī)則等文獻計量學(xué)方法,實現(xiàn)對自然語言處理后仍然存在大量冗余主題詞與噪聲數(shù)據(jù)的數(shù)據(jù)清洗與合并工作。而“分析理論與方法”部分,本文則以“語義TRIZ理論”為核心[16],打破傳統(tǒng)詞頻分析專注于孤立的主題詞的分析方法,通過語義分析方法,構(gòu)建基于“主語—謂語—賓語”的“問題與解決方案”模型,深入挖掘科技文獻中的語義信息,并將知識發(fā)現(xiàn)結(jié)果通過技術(shù)路線圖方法予以可視化表征。2.2技術(shù)監(jiān)測與預(yù)警模型大數(shù)據(jù)環(huán)境下,蘊含著豐富潛在信息的海量數(shù)據(jù)大量涌現(xiàn),任何一種可能改變經(jīng)濟社會結(jié)構(gòu)與現(xiàn)有技術(shù)水平的新興技術(shù)或者任何一次可能產(chǎn)生技術(shù)創(chuàng)新的新思維、新想法都可能存在并以某種形式表征在大數(shù)據(jù)中。在國家技術(shù)創(chuàng)新管理工作中,如何掌控潛在新興技術(shù)的發(fā)展動態(tài),挖掘可能促進技術(shù)升級的核心技術(shù),監(jiān)測競爭對手相關(guān)技術(shù)領(lǐng)域的最新進展,并針對這一切可能情況做出及時并有效的反應(yīng),正是技術(shù)監(jiān)測與預(yù)警模型所希望達到的最終目的。有別于技術(shù)評估與預(yù)測模型需要事先制定“目標(biāo)”,依“目標(biāo)”的需求進行相應(yīng)的數(shù)據(jù)挖掘工作,技術(shù)監(jiān)測與預(yù)警模型更側(cè)重于機器的自組織與自學(xué)習(xí)能力,通過對小規(guī)模數(shù)據(jù)的訓(xùn)練與學(xué)習(xí),形成反應(yīng)并處理相應(yīng)大數(shù)據(jù)的人工智能。這種自組織自學(xué)習(xí)的動態(tài)實時檢測系統(tǒng)在傳統(tǒng)數(shù)據(jù)挖掘方法的基礎(chǔ)上,融入能夠響應(yīng)動態(tài)數(shù)據(jù)變化的動態(tài)數(shù)據(jù)挖掘理念,有效地運用相應(yīng)的技術(shù)方法,能發(fā)現(xiàn)大數(shù)據(jù)中的“容疑點”,并深入挖掘與分析“容疑點”中的有效信息,從而達到最終形成“監(jiān)測與預(yù)警”的最高目標(biāo)。結(jié)合我國技術(shù)創(chuàng)新管理工作的實際需求,本文歸納了技術(shù)創(chuàng)新管理決策支持目標(biāo)的四個方面,如表2所示。有別于技術(shù)評估與預(yù)測模型中的傳統(tǒng)數(shù)據(jù)挖掘技術(shù),技術(shù)監(jiān)測與預(yù)警模型中以數(shù)據(jù)為驅(qū)動,首先就表現(xiàn)在“自組織動態(tài)實時監(jiān)測”模塊的構(gòu)建。通過規(guī)則的建立與基于機器學(xué)習(xí)的算法訓(xùn)練,形成專

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論