爬架項目數(shù)據(jù)采集分析與知識管理(完整版)_第1頁
爬架項目數(shù)據(jù)采集分析與知識管理(完整版)_第2頁
爬架項目數(shù)據(jù)采集分析與知識管理(完整版)_第3頁
爬架項目數(shù)據(jù)采集分析與知識管理(完整版)_第4頁
爬架項目數(shù)據(jù)采集分析與知識管理(完整版)_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、泓域咨詢/爬架項目數(shù)據(jù)采集分析與知識管理爬架項目數(shù)據(jù)采集分析與知識管理一、 網(wǎng)絡信息搜索和提取方法(一)概過現(xiàn)在,雖然不能說人類所有文獻與其他信息都上了互聯(lián)網(wǎng),但是網(wǎng)上的信息極為豐富,許多都可用于咨詢。但是,許多咨詢人員還不善于甚至不知道如何從網(wǎng)上快速、安全、有效地獲得自己需要的信息和知識。咨詢工程師應當知曉網(wǎng)上有何利信息,應掌握從網(wǎng)上獲取信息的方法與基本技巧。對于網(wǎng)上的信息,可利用瀏覽器和搜索引擎獲取。瀏覽器是供用戶閱讀網(wǎng)頁內容的軟件;而搜索引擎,指從互聯(lián)網(wǎng)上搜集信息的特定電腦程序。早期的搜索引擎是收集互聯(lián)網(wǎng)中服務器的地址,按這些服務器擁有的資源類型將其編成不同的目錄,各個目錄再逐層分類。搜

2、索引擎則沿著此類層級向下搜索,找到用戶想要的信息。這種方式只適用于互聯(lián)網(wǎng)信息不多的時代。隨著互聯(lián)網(wǎng)上信息的迅猛增長,出現(xiàn)了新式搜索引擎,性能大為改進,能夠找到網(wǎng)站每一頁的起始地址,隨后搜索網(wǎng)上所有超級鏈接,把代表超級鏈接的所有詞匯放入一個數(shù)據(jù)庫。搜索引擎的功能不再限于搜索,已經(jīng)添加了電子商務、新聞信息服務、個人免費電子信箱服務等。(二)搜索引擎工作原理搜索引擎有信息搜集、信息整理和接受用戶查詢三部分,各自工作原理大致如下:1搜集信息:搜索引擎利用稱為網(wǎng)絡蜘蛛(spider)的自動搜索機器人程序,從少數(shù)幾個網(wǎng)頁開始,將各個網(wǎng)頁的超鏈接連結在一起,只要網(wǎng)頁上有適當?shù)某溄?,機器人便可以遍歷絕大部分

3、網(wǎng)頁。2整理信息:這個過程稱為“建立索引”。搜索引擎不僅要保存搜集到的信息,還要按照一定規(guī)則編排之。這樣,搜索引擎無須重新翻查已保存的所有信息,便能迅速找到所要的資料,從而能夠大大加快搜索速度。3接受查詢:對于每時每刻都會接到的大量用戶幾乎同時發(fā)出的查詢請求,搜索引擎按照各個用戶的要求檢查自己的索引,能在極短時間內找到用戶需要的資料,并交給用戶。目前,搜索引擎交給用戶的主要是網(wǎng)頁鏈接,用戶按照這些鏈接便能找到含有自己所需資料的網(wǎng)頁。搜索引擎一般會在這些鏈接下加一段有關這些網(wǎng)頁的摘要,以便用戶判斷此網(wǎng)頁是否含有自己需要的內容。(三)搜索引擎種類現(xiàn)在,搜索引擎有很多種,可以從不同的角度分類。按搜索

4、方法,分全文索引、目錄索引、元搜索、垂直搜索、集合式搜索、門戶搜索、個性搜索、專家型搜索與免費鏈接列表等。按搜索對象,分購物、自然語言、新聞、mp3、圖片等搜索引擎。按搜索范圍,分桌面、地址欄、本地等搜索引擎。按出現(xiàn)的時間,分第三代、第四代搜索引擎等?,F(xiàn)在,用的較多的搜索引擎有google,百度、yahoo、msnsearch,webcrawler,lycos,cnetsearch,looksmart等。(四)搜索方法與技巧要想使搜索引擎能在網(wǎng)上快速找到有關咨詢的資料,首先要明確查詢目的。目的不同,查詢策略與方法不同。在明確目的之后,還應了解查詢的種類與技巧,學會恰當?shù)厥褂藐P鍵詞。搜索方法的選

5、擇取決于搜索的內容。不同搜索引擎的復雜條件查詢功能和實現(xiàn)方法各有不同,網(wǎng)站中一般都有“幫助”和“說明”解釋各自的功能和方法。現(xiàn)在的搜索引擎都有模糊查詢功能。當用戶輸入關鍵詞時,搜索引擎不但交給用戶關鍵詞的網(wǎng)址,還發(fā)來與關鍵詞意義相近的內容。比如,查找“建筑報”一詞時,模糊查詢搜索的結果會有“建筑報”“建設報”“建筑時報”等的網(wǎng)址。網(wǎng)址的排列,一般是完全符合關鍵詞在最前邊,其次是相近的。模糊查詢的結果往往并非用戶所需,為了排除不需要的結果,各種搜索引擎也設置了相應的功能。二、 工程咨詢信息采集途徑調查方法可分為普查與抽樣調查兩大類,這兩類都有文案調查、實地調查、問卷調查、實驗調查等幾種。選擇調查

6、方法要考慮收集信息的能力、調查研究的成本、時間要求、樣本控制和人員效應的控制程度。上述各種方法,各有利弊,各有適用范圍。文案調查是上述各種調查方法中最簡單、最一般和常用的方法,也是其他調查方法的基礎。實地調查能夠控制調查過程,應用靈活,信息充分,但耗時長、費用多,調查對象易受心理暗示影響,不夠客觀。問卷調查適應范圍廣、簡單易行、費用較低,得到了大量應用。實驗調查最復雜、費用高、應用范圍有限,但調查結果可信度較高。(一)文案調查法文案調查法是指對已經(jīng)存在的各種資料檔案,以查閱和歸納的方式進行的市場調查。文案調查法又稱二手資料或文獻調查。文案資料來源很多,主要有:國際組織和政府機構資料;行業(yè)資料;

7、公開出版物;相關企業(yè)和行業(yè)網(wǎng)站;有關企業(yè)的內部資料。(二)問卷調查法這種方法是調查人員以面談、電話詢問、網(wǎng)上填表或郵寄問卷等方式,了解調查對象的行為方式,從而收集信息。問卷調查法是市場調查常用方法,尤其在消費者行為調查中大量應用,其核心工作是設計問卷,實施問卷調查。(三)實地調查法此法是調查人員通過跟蹤、記錄調查對象的行為取得第一手資料的方法。這種方法是調查人員直接到市場或某些場所(商品展銷會、商品博覽會、商場等)親身感受或借助于某些攝錄設備和儀器,跟蹤、記錄調查對象的活動、行為和事物的特點,獲取所需信息資料。(四)實驗調查法該法是指調查人員在調查過程中,通過改變某些影響調查對象的因素,觀察調

8、查對象行為的變化,從而獲得消費行為和某些因素之間的內在因果關系。該法主要用于消費行為的調查,企業(yè)推出新產品、改變產品外形和包裝、調整產品價格、改變廣告方式時,都可以用這種方法。三、 信息的綜合信息綜合是信息工作的重要內容。采集來的信息經(jīng)常是零散、無序,甚至殘缺不全,無法直接使用。對于這樣的信息,須進行分析、聯(lián)系、推斷、整理和組合,使之成為有用信息,然后確定其特征,如精度、類型、長度、保密度、保留時間、用途等。信息綜合有兩種方式:一是對已有信息挖掘、延伸,引發(fā)創(chuàng)新需求的新信息,達到信息的“增值”,二是通過設計和試驗創(chuàng)造新的信息。有價值的信息往往是反復推理分析和猜想后的結果,這個過程要求咨詢工程師

9、具備很強的分析、聯(lián)想、綜合與創(chuàng)造能力。四、 信息鑒別常用方法(一)溯源法對到手信息涉及的問題應追根溯源,及時核對。例如,盡量找到現(xiàn)場和掌握第一手資料的人;核對原始資料,并查對主要參考文獻;按其中敘述的方法、步驟,重做實驗或演算,以便從來源上找到鑒別依據(jù)。鑒別和篩選在手信息,判斷是否完整、適用與可靠,是咨詢人員的重要工作。工程咨詢所需信息十分廣泛,不可能也不必均由咨詢人員鑒別。為了確保信息可靠,應盡可能選用權威機構發(fā)布或已鑒定、批準的信息。例如,地質儲量選用儲量委員會批準的儲量報告;地震帶的分布用國家地震局的數(shù)據(jù);歷史數(shù)據(jù)用國家統(tǒng)計局的數(shù)據(jù)。一般來說,專業(yè)技術力量強的單位提供的信息較可靠。例如,

10、國際金融組織的國際金融信息較可靠;來自從事鋼鐵、汽車行業(yè)研究的機構的鋼鐵、汽車業(yè)信息較可靠。(二)比較法有些信息受主客觀條件限制難以溯源,對此,可用比較法,即比較不同人、不同時間和其他方面的材料;對于某一事實,說法、結論是否一致。如果一致,則基本可辨真?zhèn)巍H舴?,就需進一步核查。(三)佐證法任何事物都與其他事物有一定聯(lián)系,并相互制約。找到這些聯(lián)系和制約因素,便可判斷事物的真?zhèn)?。一般說來,口頭材料不如文字材料可靠,文字不如實物可靠。分析信息產生的過程也是尋求信息佐證的辦法。1普查數(shù)據(jù)一般比抽查數(shù)據(jù)全面、準確。2監(jiān)測數(shù)據(jù),長期比短期全面,監(jiān)測范圍大的數(shù)據(jù)比監(jiān)測范圍小的數(shù)據(jù)代表性強;勘探密度大的數(shù)據(jù)比

11、勘探密度小的數(shù)據(jù)準確,科學實驗和仿真模擬計算的數(shù)據(jù)比一般推理的數(shù)據(jù)準確。3核對來源不同,收集方法不同的數(shù)據(jù)。如衛(wèi)星圖片、航測數(shù)據(jù)可用地面實測數(shù)據(jù)驗證;了解來的市場需求量與行業(yè)協(xié)會、主要企業(yè)、國家統(tǒng)計局的數(shù)據(jù)對比。4對比不同時期、不同來源的數(shù)據(jù),并適當修正其間的差距。同一對象的數(shù)據(jù),在不同國家、不同歷史時期,由于范圍不同,計算的標準和口徑可能有所不同,造成數(shù)據(jù)之間有很大的差異。在對比這些數(shù)據(jù)時,必須查明統(tǒng)計口徑,否則就會出錯。5由專家集體辨別信息是否準確,是否可靠。對于來自不同渠道的信息,可能因角度不同、口徑不一、方法各異等而不一致,甚至矛盾。這時,可請專家集體討論,弄清差異和矛盾的原因,去偽存

12、真,取得一致意見。(四)邏輯法鑒別信息,邏輯判斷必不可少。不經(jīng)縝密的邏輯思考容易出錯。有些基本差錯,例如語言或文字的前后矛盾,夸大其詞,有悖情理,以及某些虛構,禁不起邏輯的推敲。當然,邏輯合理并不總能證明事物為真,從虛假的前提出發(fā),經(jīng)過合理的邏輯推斷得出的結果不會真實。因此,鑒別信息,既要充分利用經(jīng)驗、認識和判斷力,也要借助其他手段。五、 項目背景分析隨著我國高層、超高層建筑的極速增加,傳統(tǒng)的腳手架施工中材料用量過多,高空搭拆作業(yè)過多,安全風險過大等一系列弊端隱患凸顯。附著式升降腳手架(智能爬架)的廣泛應用,全封閉的作業(yè)體系,大大降低了高空作業(yè)的風險,機械化升降減輕了作業(yè)的強度,體現(xiàn)出良好的安

13、全和適用性。雖然附著式升降腳手架(智能爬架)的出現(xiàn),給爬架行業(yè)帶了很多直觀的改變,大大加速了行業(yè)的整體效率,但是由于缺乏統(tǒng)一,完善的平臺運營服務,導致爬架行業(yè)仍然存在著許多痛點:1.產品參差不齊,部分廠家的產品設計上存在缺陷,或者在短時間內將會被淘汰;2.產品質量把關不嚴格,大部分投資方購買了爬架設備后,廠家后續(xù)服務跟不上,給經(jīng)營工作帶來較大的困難;3.施工現(xiàn)場管理脫節(jié),沒有標準化的監(jiān)管方案,特別對于沒有足夠經(jīng)驗的,加盟合作項目后續(xù)施工過程中問題頻發(fā);4.缺乏規(guī)范化運營,單打獨斗導致資金瓶頸、業(yè)務瓶頸;5.施工現(xiàn)場很多未知安全風險的出現(xiàn)。爬架行業(yè)市場規(guī)模巨大,潛力也大,整個產業(yè)鏈很長,涉及到的

14、版塊較多,對于資金需求量也大,同時又需要高標準化專業(yè)化的管理才能順利完成每一個環(huán)節(jié),所以只有平臺化綜合運營才能發(fā)揮各環(huán)節(jié)不同角色的優(yōu)勢,迅速擴充規(guī)模搶占市場,樹立品牌。六、 工程咨詢企業(yè)知識管理(一)知識管理及知識管理的組織1知識管理的概念日益激烈的競爭以及其他眾多因素對工程咨詢企業(yè)知識的數(shù)量與質量提出了更高的要求。從某種意義上說,知識管理是咨詢企業(yè)最重要的能力。經(jīng)常有人將知識管理與信息管理混為一談。信息是知識的來源,但不一定成為知識。要想從信息中提煉知識,需要有意識地開展必要的活動,使信息經(jīng)過大腦的處理、加工與提煉。知識管理,是建立一套制度,開展一系列活動,獲取、記錄、整合、存取、更新和創(chuàng)新

15、知識,以適當?shù)男问綖樽稍兤髽I(yè)所掌握,成為企業(yè)知識積累中的一部分,用來為客戶、社會創(chuàng)造價值,不至隨著企業(yè)活動的結束或停止或因當事人的離開而流失。知識管理可以延伸到人在知識方面的行為、企業(yè)管理制度與企業(yè)文化等方面。簡而言之,知識管理就是對知識提煉、創(chuàng)造、共享和積累,以及應用等過程進行規(guī)劃、實施和控制的活動。2,知識管理的必要性知識管理能夠減少重復勞動,增強企業(yè)的記憶,豐富咨詢企業(yè)的智慧。知識管理在全球迅猛發(fā)展的原因在于:(1)競爭。市場競爭日益激烈,創(chuàng)新速度加快。咨詢企業(yè)必須不斷獲得新知識,利用知識為企業(yè)和社會創(chuàng)造價值。要走向世界,就必須掌握與世界交流,以及獲取、創(chuàng)造與轉換知識的能力。企業(yè)文化對企

16、業(yè)學習能力影響極大,必須擺脫封閉、保守、不思進取的陳舊文化,轉變成學習型企業(yè),才能在競爭中立于不敗之地。(2)以客戶為中心。企業(yè)要為客戶創(chuàng)造價值。(3)員工流動。如果企業(yè)不能及時妥善地處理,就會喪失員工在本企業(yè)工作期間獲得的知識。很多咨詢企業(yè),當某專業(yè)骨干離職后,在相當長一段時間內,無法正常開展該專業(yè)的業(yè)務,給企業(yè)和客戶造成了損失。(4)不確定性。咨詢企業(yè)內外不確定因素眾多,市場競爭使咨詢企業(yè)不能確保客戶上門。當前的世界,新技術頻出,更新加快,咨詢企業(yè)不能確信自己為客戶提出的技術方案一定成功。企業(yè)及其成員獲取和使用知識的能力成為企業(yè)生存與發(fā)展的決定性因素,知識已成為企業(yè)獲取競爭優(yōu)勢的基礎與稀缺

17、資產。3知識管理的組織工程咨詢企業(yè)必須建立知識管理需要的組織,明確必要的角色及其職責、權限和相互關系,并分派給適當人員。必須制訂管理方針、目標以及實現(xiàn)這些目標所需要的規(guī)章制度。此外,還要設立必要的知識庫、多渠道知識收集系統(tǒng)等。知識管理需要長期堅持并且努力使其成為企業(yè)文化的一部分。知識管理體系應當具備如下特征:(1)以人為本。知識管理要以人為本,咨詢企業(yè)應充分發(fā)動每個部門、每一員工,貢獻自己掌握的信息與知識,使之成為企業(yè)的知識與智慧。(2)以無形資產為主要對象。知識管理比以往任何管理形式都更重視知識資產。(3)無間斷的循環(huán)。在企業(yè)存續(xù)期間,知識管理是一個不間斷的“積累一創(chuàng)造一應用一再積累一再創(chuàng)造

18、一再應用”的循環(huán)過程(4)以提煉隱性知識為主。知識管理對象有顯性和隱性知識,但以提煉隱性知識為重點,設法將隱性知識轉換為易于企業(yè)內共享的知識。研究表明,大多數(shù)企業(yè),有序、關系清楚,可供員工參考的信息與知識只占自身擁有總量的10%,其他90%存在員工個人大腦之中,且難于用語言、文字或圖形清楚地表達出來供企業(yè)使用。一旦這些人流失,企業(yè)將蒙受巨大損失。(5)以創(chuàng)新為目標。知識管理以創(chuàng)新,以建立創(chuàng)造新知識平臺為目標,創(chuàng)新和孕育新智慧是知識管理的標志。(6)建立學習型組織。便于知識管理的組織與疊床架屋的層級組織不同,只有中間層次簡單的“扁平”、開放學習型組織,才有利于知識管理。知識管理必須利用先進的信息

19、技術與工具。有些咨詢企業(yè)已按自身的發(fā)展戰(zhàn)略及管理體制建立了獨特的知識管理系統(tǒng)。與信息管理一樣,知識管理也應具備安全管理功能,保護本企業(yè)掌握的知識不受損害。(二)知識管理原則與功能1知識管理原則(1)積累原則。知識積累是實施知識管理的基礎(2)共享原則。咨詢企業(yè)應使每一員工都能接觸和使用公司的知識和信息。(3)交流原則。知識管理的核心是要在企業(yè)內部建立有利于交流的結構和文化,消除員工之間的交流的障礙。知識交流在上述原則中處于最高層次。2知識管理功能知識管理要獲得成功,需要有完整的知識管理制度。該制度應具備的主要功能如下:(1)能夠清楚地了解企業(yè)已有何種知識,還需要何種知識;(2)要能夠及時將知識

20、傳遞給真正需要的人;(3)一定要使需要知識的人能夠獲?。徊粩嗌a新知識,并使整個企業(yè)的人能夠使用;(4)確保進入企業(yè)的知識可靠、有生命力;(5)定期檢查企業(yè)的知識是否仍然有效;(6)改造企業(yè)文化,建立激勵機制,為知識管理創(chuàng)造便利條件。(三)內部交流與共享咨詢企業(yè)內部的知識交流一方面可以讓不同項目組之間交流咨詢方法和經(jīng)驗,促進隱性知識的提煉;另一方面也便于彼此加深了解和信任,促進合作,促進知識的創(chuàng)新與共享。知識共享有多種方式,例如即時通信、培訓與及時交流會等。知識共享將分散于各部門和各員工頭腦中的知識匯集起來,將知識孤島連成大陸,產生孤島無法產生的價值。交流可以最大限度地使知識和經(jīng)驗得到融合和升

21、華,也是使舊知識得以發(fā)展、新知識得以產生的催化劑。咨詢企業(yè)應當成為學習型組織,內部的知識交流是員工學習與組織學習的重要方式。咨詢單位應當建立適當?shù)募钪贫?,促進知識共享,在共享中充實。企業(yè)的知識管理規(guī)章和制度,應當全面鼓勵各部門奉獻自己的知識,與他人共享。只有這樣,才有利于企業(yè)的知識積累。四)知識管理成效的評估咨詢企業(yè)知識管理的好壞與成效,可從以下幾個方面評估:1人力資源:培訓費用、員工向心力與經(jīng)驗;2創(chuàng)新成果:研發(fā)費用、員工創(chuàng)新態(tài)度與比率、咨詢業(yè)務的更新、知識產權;3客戶態(tài)度:服務質量、合作時間、咨詢次數(shù)、銷售額等。七、 建立知識管理系統(tǒng)步驟建立知識管理系統(tǒng),一般經(jīng)歷認知、規(guī)劃、試點、投入使

22、用與建立新制度幾個階段。(一)認知這一階段任務是統(tǒng)一企業(yè)對知識管理的認識,評價企業(yè)知識管理現(xiàn)狀,提出知識管理的策略。主要工作有:對企業(yè)管理者,尤其是高層培訓,使其全面、正確地認識知識管理的作用;利用知識管理成熟度模型等多角度評價企業(yè)知識管理現(xiàn)狀,調查、分析存在的主要問題;評價知識管理對企業(yè)發(fā)展的長遠和近期影響;做出必要的決策;提出實施戰(zhàn)略和努力方向等。(二)規(guī)劃在認知的基礎上,制訂詳細的實施計劃。這一階段主要是詳細分析本企業(yè)所需知識的類型,根據(jù)業(yè)務流程等制訂知識管理計劃。規(guī)劃時,務必將知識管理融入企業(yè)管理之中。主要工作有:從戰(zhàn)略、業(yè)務流程及職能劃分的角度制訂計劃;實事求是地分析企業(yè)管理與知識管

23、理的現(xiàn)狀;從企業(yè)發(fā)展戰(zhàn)略上提出知識管理的目標和實施策略,并對業(yè)務流程進行合理化改造;分析對知識管理的具體要求;為知識管理奠定堅實的理論與實施基礎。(三)試點選取適當部門和業(yè)務試行知識管理。及時觀察與記錄實施結果,解決遇到的問題。咨詢業(yè)務雖然需要多方面知識,但重點應放在關鍵知識上,提出改進知識管理的具體策略。在分析與總結試點成敗、要求和改進計劃之后,應考慮必需的it系統(tǒng)建立或改造工作。應建立有力的團隊,協(xié)調各業(yè)務部門、外部參與者等多方面的行動。(四)投入使用知識管理計劃試點并經(jīng)完善之后,應全面推廣。主要工作有:推廣試點部門的具體作法和完善后的知識管理計劃;將知識管理融人業(yè)務流程和價值鏈;建立初步

24、的知識管理制度;將企業(yè)逐步改造成學習型組織,充分利用頭腦風暴等手段和技術提煉知識。在全面推廣過程中應注意:把握實施全局,合理協(xié)調企業(yè)文化、管理與技術;要恰當控制難免的混亂;將知識管理融入日常業(yè)務和工作并非一蹴而就,須持之以恒;努力使知識管理為企業(yè)發(fā)展做出貢獻;對于人的思想觀念等應予以引導,充分考慮實施知識管理造成的利益再分配;建立有效的激勵和評價制度,確保知識管理成功.(五)建立新制度建立適合于知識管理與企業(yè)發(fā)展的新制度,既是知識管理項目實施的結束,又是企業(yè)知識管理的新開端,也是企業(yè)自我完善的過程。為此,企業(yè)須重新定義發(fā)展戰(zhàn)略,并改造企業(yè)組織結構及業(yè)務流程,準確評估知識管理為企業(yè)帶來的價值。八

25、、 時間數(shù)據(jù)分析方法(一)時間數(shù)據(jù)時間數(shù)據(jù)也稱時間序列(timeseries)或動態(tài)數(shù)據(jù),是按時序排列的一組來自同一現(xiàn)象的觀察值。時間序列可按日、月、季度、年等收集,有些呈現(xiàn)很強的季節(jié)性,建模時應給予反映。氣象、水文、生態(tài)環(huán)境、經(jīng)濟及社會活動都能觀察到周期性時間序列。實際觀測并記錄的時間序列,實際上是隨機過程的樣本,即,在產生時間序列的實際過程的每一時點上,人們看到的只是該時點隨機變量的樣本,并不能觀察到母體。時間序列可分為平穩(wěn)和非平穩(wěn)序列,還可以分成線性和非線性時間序列。(二)時間序列分析1概述時間序列分析是根據(jù)隨機過程理論,研究時間序列的統(tǒng)計規(guī)律。時間序列分析廣泛應用于信息壓縮、利用衛(wèi)星照

26、片識別地球資源、石油勘探、經(jīng)營管理、預測(氣象、水文、地震、地下水位、農作物病蟲災害)、控制(環(huán)境污染、生態(tài)平衡)(天文學和海洋學)等方面。時間序列預測的基本依據(jù)是:(1)客觀過程是連續(xù)的,有慣性,現(xiàn)在是過去的繼續(xù),過去的信息會傳遞到現(xiàn)在與未來,利用過去的數(shù)據(jù)或信息能推測未來。(2)偶然因素會影響到客觀過程,使其行為與模式有隨機性。預測要利用時間序列各時點隨機量的相關關系。時間序列的趨勢與波動稱為“模式”,時間序列分析首要要識別其模式,然后用適當?shù)那€擬合。擬合模式的各種參數(shù)根據(jù)按“最優(yōu)預測”原則估算出的時間序列數(shù)字特征(期望值、方差、協(xié)方差、自相關函數(shù))等確定。2.時間序列成分時間序列常含有

27、4種成分:趨勢、季節(jié)變動、規(guī)則波動和不規(guī)則波動。所謂趨勢,是長期持續(xù)向上或持續(xù)向下的傾向。季節(jié)變動,是實際過程受氣候、市場狀況、節(jié)假日或風俗習慣等影響而呈現(xiàn)的周期性波動。規(guī)則波動,是周期不等的變動,呈漲落交替之狀。波動的周期可能很長,但與趨勢不同。不規(guī)則波動,是時間序列除去趨勢、季節(jié)變動和周期波動之后的波動。不規(guī)則波動總是夾雜在時間序列中,致使時間序列產生一種波浪形或震蕩式的變動。時間序列經(jīng)常是各種周期成分的疊加,例如地震或人工地震波的記錄。這樣的序列要做頻域分析。頻域分析確定時間序列各周期成分稱為“譜”或“功率譜”的能量分布形態(tài)。頻域分析又稱譜分析。譜分析的重要內容就是通過序列的周期圖()的

28、極值點尋找各種分量的周期。3時間序列建模時間序列建模一般有如下幾個步驟(1)取得時間序列樣本。(2)將樣本點畫成圖,進行相關分析。時間序列圖形可顯示出變化趨勢和周期,并發(fā)現(xiàn)離群點和轉折點。若離群點確實為觀測值,建模時應加以考慮,若非,應加以調整。轉折點指時間序列趨勢突變的點。如果發(fā)現(xiàn)轉折拐點,則在建模時須分段用不同的模型擬合時間序列,例如用門限回歸模型。(3)模式識別與擬合。時間序列模式眾多。小樣本可用趨勢模型、季節(jié)模型加上隨機誤差擬合。對于樣本容量(即觀測值個數(shù))大于50的平穩(wěn)時間序列,可用arma(自回歸移動平均)模型擬合。非平穩(wěn)時間序列可經(jīng)差分化為平穩(wěn)時間序列,再用arma模型擬合。(4

29、)預測未來。利用建成的模型預測時間序列未來值。4時間序列常用模型(1)arma模型(2)回歸模型九、 大數(shù)據(jù)系統(tǒng)和數(shù)據(jù)挖掘技術(一)數(shù)據(jù)挖掘概述1大數(shù)據(jù)大數(shù)據(jù)是指超過既往數(shù)據(jù)庫系統(tǒng)規(guī)模、傳輸速度和處理能力,或者既往數(shù)據(jù)庫系統(tǒng)結構無法容納的數(shù)據(jù)。大數(shù)據(jù)常以萬億或eb衡量,且種類多、實時性強,蘊藏的商業(yè)價值大。很多現(xiàn)有的新或舊的信息基礎設施、工具和技術可用來開發(fā)和利用大數(shù)據(jù)中蘊藏的價值。大數(shù)據(jù)有各種各樣的來源:傳感器、氣候信息、公開的信息、如雜志、報紙、文章、買賣記錄、網(wǎng)絡日志、病歷、事監(jiān)控、視頻和圖像檔案,及大型電子商務。大數(shù)據(jù)是數(shù)據(jù)挖掘產生與生存發(fā)展的土壤。如今數(shù)據(jù)每五年翻一番,面對前所未有的

30、海量數(shù)據(jù),為了從中發(fā)現(xiàn)有用的信息必須進行數(shù)據(jù)挖掘。此外,計算機存儲、處理大量數(shù)據(jù),以及運算的能力大為增強,為數(shù)據(jù)挖掘創(chuàng)造了條件,使其成為一門獨特的學科和技術。2數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別數(shù)據(jù)挖掘與數(shù)據(jù)分析的主要區(qū)別在于:(1)處理工作量。數(shù)據(jù)分析的數(shù)據(jù)量可能并不大,而數(shù)據(jù)挖掘的數(shù)據(jù)量極大。(2)制約條件。數(shù)據(jù)分析是從某些假設出發(fā),建立方程或模型,而數(shù)據(jù)挖掘不作假設,可以自動建立方程。(3)處理對象。數(shù)據(jù)分析往往是針對數(shù)字型數(shù)據(jù),而數(shù)據(jù)挖掘對象類型繁多,例如圖像、聲音、文本等。(4)處理結果。數(shù)據(jù)分析可以解釋結果的含義;數(shù)據(jù)挖掘的結果不易解釋,著眼于預測未來,并提出決策建議。想要從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律(即認知),往往需將數(shù)據(jù)分析和數(shù)據(jù)挖掘結合起來。(二)數(shù)據(jù)挖掘步驟按挖掘對象,數(shù)據(jù)挖掘分為數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘和網(wǎng)絡挖掘兩種,各自步驟分述如下。1數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘數(shù)據(jù)挖掘一般有信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估和知識表示8個步驟。(1)信息收集。從確定的挖掘對象中提取特征,然后選擇合適的收集方法,將收集到的信息存入數(shù)據(jù)庫。對于海量數(shù)據(jù),必須選擇合適的數(shù)據(jù)倉庫。(2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論