![數(shù)據(jù)挖掘在銷售預測中的應用(初稿)_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/8/0472d04c-601a-4432-b834-1be4ee7a02df/0472d04c-601a-4432-b834-1be4ee7a02df1.gif)
![數(shù)據(jù)挖掘在銷售預測中的應用(初稿)_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/8/0472d04c-601a-4432-b834-1be4ee7a02df/0472d04c-601a-4432-b834-1be4ee7a02df2.gif)
![數(shù)據(jù)挖掘在銷售預測中的應用(初稿)_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/8/0472d04c-601a-4432-b834-1be4ee7a02df/0472d04c-601a-4432-b834-1be4ee7a02df3.gif)
![數(shù)據(jù)挖掘在銷售預測中的應用(初稿)_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/8/0472d04c-601a-4432-b834-1be4ee7a02df/0472d04c-601a-4432-b834-1be4ee7a02df4.gif)
![數(shù)據(jù)挖掘在銷售預測中的應用(初稿)_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/8/0472d04c-601a-4432-b834-1be4ee7a02df/0472d04c-601a-4432-b834-1be4ee7a02df5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、數(shù)據(jù)挖掘在銷售預測中的應用易飛南京信息工程大學職業(yè)技術(shù)學院,南京 210044摘要:銷售量的預測對于生產(chǎn)和銷售部門是極其重要的,面對銷售部門日益增長的海量數(shù)據(jù),給出一個完整的數(shù)據(jù)挖掘過程,包括數(shù)據(jù)選擇,數(shù)據(jù)準備、數(shù)據(jù)調(diào)整、挖掘算法的實現(xiàn)等,通過銷售預測,企業(yè)可以制定科學合理的原材料一采購計劃、生產(chǎn)計劃、人員配備計劃、庫存計劃以及營銷計劃。因此,銷售預測決策支持系統(tǒng)對企業(yè)的經(jīng)營決策具有重要的研究意義。 關(guān)鍵字: 數(shù)據(jù)挖掘,銷售預測,神經(jīng)網(wǎng)絡Application of Data Mining in Sales Management Abstract:Face to big number data
2、 which increase day after day of sales department, this paper presents an integrated data mining precession. It includes selection of data, preparation of data regulation of data, implementation of mining algorithms and so on. To the result of sale forecasting, enterprises can rational materials pro
3、curement plan, production schedule, staffing plan. Just make Stock planand marketing plan. So sale forecasting DSS used for supporting sale decision and other decisi are important for the development of enterprises. Key words: Data Mining; Sales Forecasting; Neural Network- 12 -目錄摘要. . 0Abstract. .0
4、第一章 緒論.21.1研究的背景及意義.2第二章 數(shù)據(jù)挖掘技術(shù)介紹. .32. 1數(shù)據(jù)挖掘的定義與目的. .32.2數(shù)據(jù)挖掘的處理過程. . 32.3數(shù)據(jù)挖掘的主要功能. . 42.4數(shù)據(jù)挖掘常用方法. . 52.5數(shù)據(jù)挖掘中適用于銷售預測的方法及特點. . 6第三章 銷售預測.63.1銷售預測的涵義. 63.2銷售預測的作用和重要性. . .73.3預測誤差與預測精度. .7第四章 銷售預測數(shù)據(jù)挖掘模型的建立. . . 84.1 時間序列AR模型預測. . .84.2 BP網(wǎng)絡預測. . . 9第五章 全文總結(jié). . . .115. 1總結(jié). . . .11參考文獻. . . . .11第一
5、章 緒論 1.1研究的背景及意義 進入21世紀以來隨著市場經(jīng)濟的發(fā)展和經(jīng)濟的全球化,世界的經(jīng)濟形勢以及企業(yè)的生存環(huán)境發(fā)生了巨大的變化,經(jīng)濟活動全球化的趨勢加速,顧客的需求日益多樣化、個性化,企業(yè)面臨著越來越殘酷的市場競爭。要想贏得競爭、贏得客戶,在激烈的競爭中取勝,從事商品生產(chǎn)和銷售的單位或個人必須就必須在最快的時間內(nèi),以最低的成本將產(chǎn)品提供給客戶,這使得對市場的變化和本身業(yè)務的發(fā)展前景進行估計、進行正確及時的產(chǎn)品銷售預測及由此產(chǎn)生的可靠的決策,成為現(xiàn)代企業(yè)成功的關(guān)鍵要素。因為管理的關(guān)鍵是決策,而決策的前提是預測,在決策實施過程中,為使決策目標能順利實現(xiàn),就必須通過預測來減少不確定性,增強對未
6、來的預見性。也就是說,企業(yè)管理決策的正確性,關(guān)鍵在于預測的可靠性和科學性。 銷售預測是企業(yè)供應鏈的關(guān)鍵環(huán)節(jié),根據(jù)銷售預測的結(jié)果,企業(yè)才可以制定合理的原材料采購計劃、生產(chǎn)計劃、人員配備計劃、庫存計劃以及營銷計劃。但是,在相當長的時間里,我國許多的企業(yè),銷售預測主要是靠個人經(jīng)驗來進行的,或者根本沒有進行銷售預測研究,生產(chǎn)完全脫離市場,造成產(chǎn)品大量積壓,資源嚴重浪費。 如今,在市場經(jīng)濟條件下,尤其是我國加入世貿(mào)組織之后,企業(yè)管理者通過事實,或者說通過教訓,已逐漸意識到,在市場競爭異常激烈的大環(huán)境下,那種僅憑經(jīng)驗或靠拍腦袋來做決策的方式是行不通的。正確的政策、措施來源于正確的決策,正確的決策來源于對客
7、觀情況的科學了解和預測。 銷售預測是在對影響市場供求變化的諸因素進行系統(tǒng)地調(diào)查和研究的基礎上,運用科學的方法,對未來市場產(chǎn)品的供需發(fā)展趨勢以及有關(guān)的各種因素的變化,進行分析、預見、估計和判斷。沒有準確的市場銷售預測,就不可能有正確的經(jīng)營決策和科學的計劃。然而,準確的預測又是困難的,一方面因為產(chǎn)品銷售量受到諸多因素的影響,對多因素、大量數(shù)據(jù)進行分析,己經(jīng)超出了人腦所能解決的范圍,必須借助于信息、技術(shù);另一方面,因為銷售預測要基于大量的數(shù)據(jù),這些數(shù)據(jù)大部分來源于市場調(diào)研和銷售過程的銷售記錄,因而一般具有較強的實效性和復雜性,因此有效地采集市場調(diào)研數(shù)據(jù)并對其進行處理、轉(zhuǎn)換是對其進行分析的前提,對數(shù)據(jù)
8、處理的及時性和產(chǎn)生規(guī)則的多樣性也有較高的要求,傳統(tǒng)的統(tǒng)計分析方法已經(jīng)不能很好的滿足銷售預測的信息處理需要。這主要表現(xiàn)在對大型數(shù)據(jù)庫處理的速度較慢和產(chǎn)生的信息數(shù)量較少兩個方面,從而造成了對數(shù)據(jù)的浪費。因此,吸收新的數(shù)據(jù)處理方法成為銷售預測的一個要求。 隨著信息時代的到來,國際以及國內(nèi)的信息科學取得了不斷的發(fā)展,產(chǎn)生出了諸多新的成果和理論,這些成果和理論具有廣泛的指導意義和價值。如何將這些理論有機地與實踐相結(jié)合,也成為一項十分有意義的研究課題。目前國內(nèi)大多數(shù)商業(yè)企業(yè)的信息系統(tǒng)一直停留在基本數(shù)據(jù)的收集層面,但決策支持系統(tǒng)還比較落后,甚至有些企業(yè)還沒有意識到它的重要性。有了信息不會分析,它就只是一種簡
9、單的原始數(shù)據(jù),不能成為可供企業(yè)分析、支持決策的信息。而且隨著數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術(shù)的發(fā)展和完善以及在決策支持系統(tǒng)中的應用,基于數(shù)據(jù)挖掘的分析方法也應該服務于銷售預測。 因此將數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)倉庫技術(shù)、決策支持系統(tǒng)的研究成果與銷售預測相結(jié)合是可實現(xiàn)的,應用數(shù)據(jù)挖掘方法對銷售數(shù)據(jù)庫進行分析,提高銷售預測的準確率無疑是十分有意義的。第二章 數(shù)據(jù)挖掘技術(shù)2. 1數(shù)據(jù)挖掘的定義與目的 無論是商業(yè)企業(yè)、科研機構(gòu)或者政府部門,在過去若干年的時間里都積累了海量的、以不同形式存儲的數(shù)據(jù)資料。由于這些資料十分復雜,要從中發(fā)現(xiàn)有價值的信息或知識,達到為決策服務的目的,成為非常艱巨的任務。數(shù)據(jù)挖掘方法的提
10、出,讓人們有能力最終認識數(shù)據(jù)的真正價值,即蘊藏在數(shù)據(jù)中的信息和知識。 數(shù)據(jù)挖掘(Data Mining, DM)。一種比較公認的定義是W.J.Frawley,G.Piatetsky Shapiro等人提出的:數(shù)據(jù)挖掘,就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識。這些知識是隱含的、事先未知的潛在有用信息,提取的知識表示為概念(Concepts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。這種定義把數(shù)據(jù)挖掘的對象定義為數(shù)據(jù)庫。而更廣義的說法是:數(shù)據(jù)挖掘意味著在一些事實或觀察數(shù)據(jù)的集合中尋找模式的決策支持過程。數(shù)據(jù)挖掘的對象不僅是數(shù)據(jù)庫,也可以是文件系統(tǒng)
11、,或其它任何組織在一起的數(shù)據(jù)集合。 數(shù)據(jù)挖掘確切地講是一種決策支持過程,它主要基于人工智能、機器學習、統(tǒng)計學等技術(shù),高度自動化地分析企業(yè)原有的數(shù)據(jù),作出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助企業(yè)的決策者調(diào)整市場策略,減少風險,作出正確的決策。 數(shù)據(jù)挖掘的目的是從大量數(shù)據(jù)中發(fā)現(xiàn)知識,并把這些知識以某種形式表示出來。知識的表示形式通常有: ·概念(Concepts) .規(guī)則(Rules) ·規(guī)律(Regularities) ·模式(Patterns) ·約束(Constraints) ·可視化(Visualizations)這些知
12、識可以直接提供給決策者,用以輔助決策過程,或者提供給領域?qū)<遥拚龑<乙延械闹R體系,也可以作為新的知識轉(zhuǎn)存到應用系統(tǒng)的知識庫中。2.2數(shù)據(jù)挖掘的處理過程 數(shù)據(jù)挖掘過程一般由三個主要的階段組成:數(shù)據(jù)準備、挖掘操作、結(jié)果表達和解釋,如下圖所示。 數(shù)據(jù)準備這個階段又可進一步分成三個子步驟:數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)預處理。數(shù)據(jù)集成將多文件或多數(shù)據(jù)庫運行環(huán)境中的數(shù)據(jù)進行合并處理,解決語義模糊性、處理數(shù)據(jù)中的遺漏和清除臟數(shù)據(jù)等。數(shù)據(jù)選擇的目的是辨別出需要分析的數(shù)據(jù)集合,縮小處理范圍,提高數(shù)據(jù)挖掘的質(zhì)量。預處理是為了克服目前數(shù)據(jù)挖掘工具的局限性。 數(shù)據(jù)挖掘這個階段進行實際的挖掘操作,包括的要點有: (1)
13、決定如何產(chǎn)生假設; (2)選擇合適的工具; (3)發(fā)掘知識的操作; (4)驗證發(fā)現(xiàn)的知識。 結(jié)果表達和解釋根據(jù)最終用戶的決策目的對提取的信息進行分析,把最有價值的信息區(qū)分出來,并且通過決策支持工具提交給決策者。 數(shù)據(jù)挖掘是一門獨立的技術(shù),它的研究還很不成熟,其應用還有較大的局限性。正是這些局限性,促使數(shù)據(jù)挖掘研究進一步發(fā)展。2.3數(shù)據(jù)挖掘的主要功能 數(shù)據(jù)挖掘的主要功能是確定數(shù)據(jù)挖掘任務中要找的模式類型,數(shù)據(jù)挖掘任務一般可以分為描述和預測兩大類,描述性挖掘任務主要是刻劃數(shù)據(jù)庫中數(shù)據(jù)的一般特性,預測性挖掘任務是在當前數(shù)據(jù)上進行推斷,以進行預測。 數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型介紹如下: (
14、1)分類、預測 分類就是通過研究已分類的樣本集的特征,分析樣本集的屬性,建立一個分類函數(shù)或分類模型,通過這個分類模型,未分類的或新的數(shù)據(jù)就可以分派到不同的類別中,達到分類的目的。分類可以用決策樹歸納、貝葉斯網(wǎng)絡、人工神經(jīng)元網(wǎng)絡(如BP網(wǎng)絡等)、粗糙集、遺傳算法、K一最臨近分類和支持向量機等方法。分類可以預測對象的類標記,當要預測的數(shù)據(jù)是數(shù)值數(shù)據(jù)(連續(xù)值),而不是離散的類別標志時,我們可以稱之為預測。預測主要使用回歸方法,當然也可以使用人工神經(jīng)元網(wǎng)絡、遺傳算法、支持向量機等機器學習方法。 (2)關(guān)聯(lián)規(guī)則 數(shù)據(jù)庫中的數(shù)據(jù)之間一般都存在某種關(guān)聯(lián)關(guān)系,即變量之間可能存在某種規(guī)律,關(guān)聯(lián)規(guī)則挖掘的任務就是
15、找出數(shù)據(jù)庫中哪些事物或?qū)傩怨餐霈F(xiàn)的條件。最有影響力的關(guān)聯(lián)規(guī)則挖掘的算法是Rakesh Agrwal等人提出的Apriori算法,近年來,也出現(xiàn)了很多Apriori的改進算法,如Edith Cohen等人提出的不需要剪枝的改進算法,Mohammed J.Zaki提出的可伸縮的改進算法等。 (3)聚類分析 聚類是將對象集合按照相似性歸為若干類別,屬于無指導分類,屬于同一類的對象具有較高的某種相似性,而不同類的對象之間的差別較大。通過聚類,識別密集和稀疏的區(qū)域,發(fā)現(xiàn)全局的分布模式及數(shù)據(jù)屬性之間的相互關(guān)系,幫助人們建立宏觀概念。聚類的方法主要可以分為:劃分方法(partitioning method
16、)、層次方法(hierarchical method)、基于密度的方法(density-based method)、基于網(wǎng)格的方法(grid-based method)和基于模型的方法。其中,劃分方法中用的比較多的是k一平均算法和k一中心點算法。BIRCH和CURE就是比較典型的層次方法,DBSCAN是比較有代表意義的基于密度的方法,ST工NG算法是典型的基于網(wǎng)格的方法,基于模型的方法有統(tǒng)計學方法、人工神經(jīng)元網(wǎng)絡方法(如Kohonen網(wǎng)絡)等。 (4)類/概念描述 數(shù)據(jù)可以與類或概念相關(guān)聯(lián),用匯總的、簡潔的、精確的方式描述每個類和概念是有用的,目的是對數(shù)據(jù)進行濃縮,給出它的總體的綜合描述,實現(xiàn)
17、對原始數(shù)據(jù)的總體把握。這種類或概念的描述稱為類/概念描述。通過類/概念描述使得人們能夠在復雜數(shù)據(jù)庫中了解數(shù)據(jù)的意義以及產(chǎn)生數(shù)據(jù)的過程。這種描述可以通過匯總所研究類的數(shù)據(jù)來獲得(這個過程也叫數(shù)據(jù)特征化)或?qū)⑺芯款惻c其它的比較類進行比較來獲得,或采用上面兩種方法的結(jié)合?;跀?shù)據(jù)立方體的OLAP上卷操作來執(zhí)行指定維的數(shù)據(jù)匯總就是一種很有效的數(shù)據(jù)特征化的方法,數(shù)據(jù)特征化的輸出通常采用如餅圖、柱狀圖、多維數(shù)據(jù)立方體等形式來形象的表現(xiàn)出來。 (5)孤立點分析 數(shù)據(jù)庫中經(jīng)常存在這樣一些數(shù)據(jù)對象,它們與數(shù)據(jù)的一般行為或模型不一致,這些數(shù)據(jù)對象我們就稱之為孤立點。在一般情況下,數(shù)據(jù)挖掘方法會將孤立點視為噪聲或
18、異常而丟棄,但是在特殊場合,如在電子商務領域,探測和分析孤立點顯得比正常數(shù)據(jù)還來的重要。 (6)演變分析 數(shù)據(jù)演變分析(evolution analysis)用來描述行為隨時間變化的對象的規(guī)律或趨勢,并對其建模。時間趨勢分析考慮時間上的變化趨勢,空間趨勢則要根據(jù)某空間維找出變化趨勢。2.4數(shù)據(jù)挖掘常用方法 數(shù)據(jù)挖掘的研究融合了多個不同學科領域的技術(shù)與成果,使的目前的數(shù)據(jù)挖掘方法表現(xiàn)出多種多樣的形式。從統(tǒng)計分析類的角度來說,統(tǒng)計分析技術(shù)中使用的數(shù)據(jù)挖掘模型有線形分析和非線形分析、回歸分析、邏輯回歸分析、單變量分析、多變量分析、時間序列分析、最近序列分析、最近鄰算法和聚類分析等方法。利用這些技術(shù)可
19、以檢查那些異常形式的數(shù)據(jù),然后,利用各種統(tǒng)計模型和數(shù)學模型解釋這些數(shù)據(jù),解釋隱藏在這些數(shù)據(jù)背后的市場規(guī)律和商業(yè)機會。知識發(fā)現(xiàn)類數(shù)據(jù)挖掘技術(shù)是一種與統(tǒng)計分析類數(shù)據(jù)挖掘技術(shù)完全不同的挖掘技術(shù),包括人工神經(jīng)元網(wǎng)絡、支持向量機、決策樹、遺傳算法、粗糙集、規(guī)則發(fā)現(xiàn)和關(guān)聯(lián)順序等。 (1)K-mean算法 K-mean算法用于數(shù)據(jù)挖掘中的聚類,它是以K為參數(shù),把n個對象分為K個簇,在同簇內(nèi)相似度較高,在不同簇之間的相似度較低,每個簇用該簇中對象的平均值來表示。這個算法嘗試找出使平方誤差函數(shù)最小的K個劃分,當結(jié)果集是密集,簇與簇之間的區(qū)別明顯時,效果很好。K-mean算法的特點在于處理大數(shù)據(jù)集時,該算法具有可
20、伸縮性和比較高的效率。 (2) Apriori算法 Apriori算法用于數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則,是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法。算法使用頻繁項集性質(zhì)的先驗知識,通過逐層搜索的迭代方法,k-項集用于探索k+1-項集。其過程為首先找出頻繁1-項集的集合L1,再根據(jù)1-項集找出頻繁2-項集的集合Lz, LZ再用于尋找L3,如此迭代,直到不能找到頻繁k-項集為正,然后在頻繁項集的基礎上生成規(guī)則。(3)人工神經(jīng)元網(wǎng)絡 人工神經(jīng)元網(wǎng)絡模擬人腦神經(jīng)元結(jié)構(gòu),以MP模型和Hebb學習規(guī)則為基礎,建立三大類多種神經(jīng)元網(wǎng)絡,具有非線形映射特性、信息的分布存儲、并行處理和全局集體的作用、高度的自學習、
21、自組織和自適應能力的種種優(yōu)點。前饋神經(jīng)元網(wǎng)絡以感知器網(wǎng)絡、BP網(wǎng)絡等為代表,可以用于分類和預測等方面;反饋式網(wǎng)絡以Hopfield網(wǎng)絡為代表,用于聯(lián)想記憶和優(yōu)化計算;自組織網(wǎng)絡以ART模型、Kohonon模型為代表,用于聚類。 (4)決策樹 決策樹學習是一種通過逼近離散值目標函數(shù)的方法,通過把實例從根結(jié)點排列到某個葉子結(jié)點來分類實例,葉子結(jié)點即為實例所屬的分類。樹上的每個結(jié)點說明了對實例的某個屬性的測試,該結(jié)點的每一個后繼分支對應于該屬性的一個可能值,分類實例的方法是從這棵樹的根結(jié)點開始,測試這個結(jié)點指定的屬性,然后按照給定實例的該屬性值對應的樹枝向下移動。決策樹方法士要應用于數(shù)據(jù)挖掘的分類方
22、面。 (5)遺傳算法 遺傳算法是一種受生物進化啟發(fā)的學習方法,通過變異和重組當前已知的最好假設來生成后續(xù)的假設。每一步,通過使用目前適配值最高的假設的后代替代群體的某個部分,來更新當前群體的一組假設,來實現(xiàn)各個個體的適配值的提高。遺傳算法由三個基本過程組成:繁殖(選擇)是從一個舊種群(父代)選出生命力強的個體,產(chǎn)生新種群(后代)的過程;交叉(重組)選擇兩個不同個體(染色體)的部分(基因)進行交換,形成新個體的過程;變異(突變)是對某些個體的某些基因進行變異的過程。在數(shù)據(jù)挖掘中,可以被用作評估其他算法的適合度。 (6)粗糙集 粗糙集能夠在缺少關(guān)于數(shù)據(jù)先驗知識的情況下,只以考察數(shù)據(jù)的分類能力為基礎
23、,解決模糊或不確定數(shù)據(jù)的分析和處理問題。粗糙集用于從數(shù)據(jù)庫中發(fā)現(xiàn)分類規(guī)則的基本思想是將數(shù)據(jù)庫中的屬性分為條件屬性和結(jié)論屬性,對數(shù)據(jù)庫中的元組根據(jù)各個屬性不同的屬性值分成相應的子集,然后對條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關(guān)系生成判定規(guī)則。所有相似對象的集合稱為初等集合,形成知識的基本成分。任何初等集合的并集稱為精確集,否則,一個集合就是粗糙的(不精確的)。每個粗糙集都具有邊界元素,也就是那些既不能確定為集合元素,也不能確定為集合補集元素的元素。粗糙集理論可以應用于數(shù)據(jù)挖掘中的分類、發(fā)現(xiàn)不準確數(shù)據(jù)或噪聲數(shù)據(jù)內(nèi)在的結(jié)構(gòu)聯(lián)系。 (7)支持向量機 支持向量機(Support Vecto
24、r Machine, SVM)是在統(tǒng)計學習理論的基礎上發(fā)展出來的一種新的機器學習方法它基于結(jié)構(gòu)風險最小化原則上的,盡量提高學習機的泛化能力,具有良好的推廣性能和較好的分類精確性,能有效的解決過學習問題,現(xiàn)己成為訓練多層感知器、RBF神經(jīng)網(wǎng)絡和多項式神經(jīng)元網(wǎng)絡的替代性方法。另外,支持向量機算法是一個凸優(yōu)化問題,局部最優(yōu)解一定是全局最優(yōu)解,這些特點都是包括神經(jīng)元網(wǎng)絡在內(nèi)的其它算法所不能及的。支持向量機可以應用于數(shù)據(jù)挖掘的分類、回歸、對未知事物的探索等方面。2.5數(shù)據(jù)挖掘中適用于銷售預測的方法及特點 傳統(tǒng)的銷售預測方法有定性預測方法和定量預測方法兩種。定性預測方法:經(jīng)驗判斷法:個人經(jīng)驗判斷法、企業(yè)集
25、體經(jīng)驗判斷法、社會集體經(jīng)驗判斷法;市場調(diào)查分析法。定量預測方法:時序預測法:平均平滑法、勢外推法、季節(jié)變動預測法、馬爾可夫時序預測法;因果分析法:一元回歸法、多元回歸法、投入產(chǎn)出法。傳統(tǒng)的銷售預測方法雖然應用廣泛,效果也不錯;但是,難以處理復雜的非線形關(guān)系,難以處理多種復雜影響因素。因此,我們需要現(xiàn)代的新的銷售預測方法,其主要有神經(jīng)網(wǎng)絡、遺傳算法、支持向量機等銷售預測方法。第三章 銷售預測3. 1銷售預測的涵義 預測是指對未來不確定事件的預見和推測。未來事件有確定型與不確定型之分。確定型事件是指該事件發(fā)展結(jié)果只會有一種狀態(tài)。不確定型事件是指該事件發(fā)展過程和結(jié)果可能出現(xiàn)的多種狀態(tài)。 預測按對事件
26、進行預測時間長短劃分,可以分為長期、中期、短期和近期預測。一般說,近期預測是日、周、旬、月的預測;短期預測是季、半年、一年的預測;中期預測是一年至三或五年的預測;長期預測是三或五年及更長時間的預測。企業(yè)則側(cè)重于短期、近期預測;宏觀管理部門則側(cè)重于中期、長期預測,但兩者還需兼顧,不可絕對化。 銷售預測是企業(yè)決策支持系統(tǒng)的重要組成部分。銷售預測是以市場商品購銷為主要對象,預見和推測商品的各項購銷活動、價格和競爭狀況的變化趨勢與結(jié)果。 預測事件之所以不確定,是由于事件的發(fā)展受多種因素影響的結(jié)果。因素多少是不確定的,各種因素對事件影響程度也是變化的,預測時很難把握。尤其偶然因素變化情況和影響程序更難把
27、握,所以事件的未來變化過程和結(jié)果的預測,必然與實際存在一定誤差,但是并非說預測沒有價值,因為現(xiàn)代科學的預測能夠把握住事物的內(nèi)在聯(lián)系和發(fā)展規(guī)律,縮小預測結(jié)果與實際的差距。借助邏輯推理,定性與定量分析,還能找出產(chǎn)生誤差的主要原因和誤差的可能范圍,控制事件的運行。3. 2銷售預測的作用和重要性 在市場競爭日益激烈,客戶需求出現(xiàn)多樣化、特殊化的情況下,公司要提高對客戶的服務水平、降低成本、提高質(zhì)量,同時增強對于市場的響應效率,加強生產(chǎn)、物料規(guī)劃以充分利用公司資源,企業(yè)越來越意識到銷售預測的重要性。預測是對未來產(chǎn)品需求的分析,管理當局可以在預測的基礎上針對未來需求作出決策,利用最少的資源提供最優(yōu)質(zhì)的服務
28、給客戶,獲取最大化的利潤,準確的預測可以幫助管理層面對日益增加的客戶需求與股東權(quán)益最大化之間的矛盾。 銷售預測的作用表現(xiàn)為: (1)提高客戶滿意度。物流的目標之一就是滿足客戶的需要。通過銷售預測,了解客戶的需要,按客戶的需要提供及時有效的服務。 (2)減少失銷現(xiàn)象。失銷成本雖然無法準確計算,但不容忽視。其表現(xiàn)為客戶的丟失和客戶服務水平的下降。 (3)更為有效地安排生產(chǎn)。生產(chǎn)部門的生產(chǎn)計劃往往依據(jù)銷售預測。預測的水平將直接影響生產(chǎn)的有序安排。 (4)減少庫存。由于預測的不準確,往往會產(chǎn)生庫存的積壓,占用資金和產(chǎn)生較高的儲存費用。 (5)減少安全庫存量。企業(yè)一般傾向于通過增加安全庫存來對付需求的不
29、確定性。如果預測準確度提高的話,就可以相應地減少安全庫存量,提高庫存管理水平。對于本人參與的某機械企業(yè)來說,該企業(yè)是外向型企業(yè),90%以上產(chǎn)品用于出口,生產(chǎn)是根據(jù)銷售預測的數(shù)量來安排生產(chǎn),即以銷定產(chǎn),銷售預測的準確性尤為重要,關(guān)系到企業(yè)的經(jīng)濟命脈。3. 3預測誤差與預測精度 預測值與實際值總會有一定的偏離,這種偏離即稱為預測誤差。預測的未來時間越長,預測的可靠性就越低,預測誤差就越易于擴大。在實際工作中,銷售預測結(jié)果往往是為銷售經(jīng)營決策提供依據(jù)的,因而如何評定銷售預測結(jié)果的精確度,如何事先判斷銷售預測誤差,就成為銷售預測工作不可缺少的一環(huán)。 研究預測誤差,一般采用比較法,將預測計算值與實際值相
30、減,其相差的部分稱為預測誤差。如果用X1代表實際值,F(xiàn)1代表預測值,E1代表預測誤差,則 衡量總的預測誤差,常用的有以下幾種統(tǒng)計量1·平均誤差 計算平均誤差雖然比較簡單,但在許多情況下,誤差的總和由于式的正負相互抵消,難以用平均誤差的大小法說明預測結(jié)果的可靠程度,因此一般不采用此法。2·平均絕對誤差 采用平均絕對誤差,克服了誤差正負相互抵消的弊端,根據(jù)E的數(shù)值大小,能夠反映預測結(jié)果的準確程度。3·均方誤差4·標準誤差 均方誤差和標準誤差,本質(zhì)上是相同的,由于均方差是與誤差的平方和有關(guān),不會產(chǎn)生誤差正負相互抵消的問題,因此在預測中,一般都把均方差少的大小作
31、為衡量預測質(zhì)量好壞的標準,即均方差的數(shù)值越小,預測結(jié)果的精度越高;反之,均方差的數(shù)值越大,預測結(jié)果的準確性越低。 在實際工作中,也有用百分比誤差的,它是一種衡量預測精確度的相對尺度,其計算公式為: 上式可用于計算不同時期的百分比誤差。但通常需要了解整個序列的預測精確度,因此要把幾個不同時期的百分比誤差進行綜合,則采用每個誤差絕對值總和的平均值,即平均絕對值百分比誤差,其計算公式為: 第四章 銷售預測數(shù)據(jù)挖掘模型的建立4.1 時間序列AR模型預測 時間序列分析是根據(jù)已知時間序列中的銷售數(shù)據(jù)的變化特征和趨勢,預測未來銷售值。在時間序列模型中,自回歸模型AR是應用最廣的一種預測
32、模型。 式中:t?=1,2,N,時間序列xt為已知數(shù)據(jù),并假定是平穩(wěn)隨機序列;為測量誤差,并假定是白噪聲序列。 建立AR模型的一般步驟為2: (1)對時間序列進行平穩(wěn)性處理。由于AR模型適用于平穩(wěn)時間序列,因此,建立模型之前要對銷售序列數(shù)據(jù)進行平穩(wěn)化預處理,通常采用零均值處理。 (2)AR模型階數(shù)的確定。根據(jù)準則函數(shù)定階法來確定模型的最優(yōu)階數(shù)。確定AR模型階數(shù)的準則包括:FPE準則、AIC準則、BIC準則,其函數(shù)表達式分別表示為:
33、; 在各自準則函數(shù)取得最小值時的階數(shù)為模型的最優(yōu)階數(shù),在最優(yōu)階數(shù)下所建立的模型就是最適用的模型。 (3)AR模型的參數(shù)估計。當模型階數(shù)固定時,用普通最小二乘法可對模型參數(shù)進行估計: (4)AR模型的預報方程。AR模型的l?步預報值為:式中:為在t?時刻根據(jù)t?時刻及之前的數(shù)據(jù)基于AR模型預測第t?+l?時刻的值。 (5)對預測值進行還原。由于對原始數(shù)據(jù)進行了平穩(wěn)性處理,因此,必須對該預測值進行還原,得到實際銷售預測值。
34、0;通過AR模型建立銷售預測模型,就是根據(jù)已知時間序列中的銷售數(shù)據(jù)的變化特征和趨勢,預測未來銷售值。在歷史銷售值與預測銷售值之間建立線性關(guān)系,預測時,輸入預測時間前n個銷售值,便可根據(jù)預測模型計算出預測時間的銷售值。 由于產(chǎn)品的需求往往是由許多因素綜合決定的,而且影響需求的各種因素之間存在著各種錯綜復雜的相互作用,具有非線性的特征。根據(jù)統(tǒng)計分析方法建立的AR模型無法表達這種相互作用。4.2 BP網(wǎng)絡預測 神經(jīng)網(wǎng)絡作為一種非線性自適應系統(tǒng),具有通過自學習提取信息內(nèi)部特征的優(yōu)點,非常適合解決銷售數(shù)據(jù)中的數(shù)據(jù)挖掘問題。BP網(wǎng)絡是目前應用最為廣泛的一種神經(jīng)網(wǎng)
35、絡,具有很強的映射能力,可以實現(xiàn)輸入和輸出間的任意非線性映射。 BP網(wǎng)絡一般由一個輸入層、一個或多個隱含層以及一個輸出層組成,是通過誤差反向傳播學習算法來修正網(wǎng)絡的權(quán)值和閾值。圖1是一個典型的三層BP網(wǎng)絡模型,其中?r為輸入層神經(jīng)元數(shù),s1為隱層神經(jīng)元數(shù),s2為輸出層神經(jīng)元數(shù),f1和f2為傳遞函數(shù),W1ij和b1i是輸入層到隱層的權(quán)值和閾值,W2ki和b2k是隱層到輸出層的權(quán)值和閾值。 BP算法由信息的正向傳遞與誤差的反向傳播兩部分組成。在正向傳遞過程中,輸入信息從輸入層經(jīng)隱含層計算傳向輸出層,如果在輸出層沒有得到期望的輸出,則計算輸出層的誤差變化值,然后反向傳播,通過網(wǎng)絡將誤差信號沿原來的連接通路反傳回來修改各層神經(jīng)元的權(quán)值和閾值直至達到期望目標。 其算法流程如下3:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 暑期教師培訓學習計劃
- 2025年度家庭裝修石材加工及安裝服務合同范本
- 專業(yè)性合同范本
- 辦公裝飾合同范本
- 買賣攤位合同范本
- 2025年度生態(tài)農(nóng)業(yè)項目土地流轉(zhuǎn)合作合同
- 公司家具購買合同范本
- 會議營銷分成合同范本
- 關(guān)于解除兼職合同范本
- 法律盡職調(diào)查報告模板
- 胸腔積液護理查房-范本模板
- 水土保持方案中沉沙池的布設技術(shù)
- 安全生產(chǎn)技術(shù)規(guī)范 第25部分:城鎮(zhèn)天然氣經(jīng)營企業(yè)DB50-T 867.25-2021
- 現(xiàn)代企業(yè)管理 (全套完整課件)
- 走進本土項目化設計-讀《PBL項目化學習設計》有感
- 《網(wǎng)店運營與管理》整本書電子教案全套教學教案
- 教師信息技術(shù)能力提升培訓課件希沃的課件
- 高端公寓住宅項目營銷策劃方案(項目定位 發(fā)展建議)
- 執(zhí)業(yè)獸醫(yī)師聘用協(xié)議(合同)書
- 第1本書出體旅程journeys out of the body精教版2003版
- 2022年肝動脈化療栓塞術(shù)(TACE)
評論
0/150
提交評論