SPSS神經網絡_第1頁
SPSS神經網絡_第2頁
SPSS神經網絡_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SPSS 神經網絡是對 SPSS&nbs sp;Statistics Base 以及附加模塊中傳統(tǒng)統(tǒng)計方 法的一個補充。您可以使用 SPSS 神經網絡發(fā)現數據中間的新關系,然后用傳 統(tǒng)的統(tǒng)計技術檢驗其顯著性。SPSS 神經網絡可以僅僅作為客戶端軟件安裝, 但是為了得到更好的性能和擴展 性,它也可以與 SPSS Statistics Base Sever 一起作為 Client/Server 安裝。為什么要使用神經網絡? 神經網絡是一個非線性的數據建模工具集合, 它包括輸入層和輸出層、 一個或者 多個隱藏層。 神經元之間的連接賦予相關的權重, 訓練算法在迭代過程中不斷調 整這些權重, 從

2、而使得預測誤差最小化并給出預測精度。 您可以設置網絡的訓練 條件,從而控制訓練的停止條件以及網絡結構, 或者讓算法自動選擇最優(yōu)的網絡 結構。在許多領域,您都可以將 SPSS 神經網絡和其他的統(tǒng)計分析過程結合起 來,獲得更深入、清晰的洞察力。例如,在市場研究領域,你可以建立客戶檔案 發(fā)現客戶的偏好; 在數據庫營銷領域, 您可以進行客戶細分, 優(yōu)化市場活動的響 應。在金融分析方面,您可以使用 SPSS 神經網絡分析申請人的信用狀況,探測可 能的欺詐。在運營分析方面, 您也可以使用這個新工具管理現金流、 優(yōu)化供應鏈。 此外,在科學和醫(yī)療方面的應用包括預測醫(yī)療費用、 醫(yī)療結果分析、 預測住院時 間等。

3、從始至終控制整個過程SPSS神經網絡,包括多層感知器(MLP )或者徑向基函數(RBF)兩種方法。 這兩種方法都是有監(jiān)督的學習技術也就是說, 他們根據輸入的數據映射出關系。 這兩種方法都采用前饋結構, 意思是數據從一個方向進入, 通過輸入節(jié)點、 隱藏 層最后進入輸出節(jié)點。 你對過程的選擇受到輸入數據的類型和網絡的復雜程度的 影響。此外,多層感知器可以發(fā)現更復雜的關系, 徑向基函數的速度更快。 MLP 可以發(fā)現更復雜的關系,而通常來說 RBF 更快。使用這兩種方法的任何一種, 您可以將數據拆分成訓練集、 測試集、 驗證集。 訓 練集用來估計網絡參數。 測試集用來防止過度訓練。 驗證樣本用來單獨評

4、估最終 的網絡,它將應用于整個數據集和新數據。您設置的因變量可以是連續(xù)型、分類型或者兩者的組合。如果因變量是連續(xù)型, 神經網絡預測的連續(xù)值是近似于輸入數據的某個連續(xù)函數的 “真實”值。如果因變 量是分類型,神經網絡會根據輸入數據,將記錄劃分為最適合的類別。您可以通過選擇分析中拆分數據集, 網絡結構的排序, 計算方法等調整神經網絡 程序。最后,您可以通過圖形或者表格, 在當前活動的數據集中保存可選的臨時 變量,并且將模型導出成 XML 格式對新的數據進行打分。特性:多層感知器 (MLP)MLP 通過多層感知器來擬和神經網絡。 多層感知器是一個前饋式有監(jiān)督的結構 它可以包含多個隱藏層。一個或者多個

5、因變量,這些因變量可以是連續(xù)型、分類型、或者兩者的結合。如果因變量是連續(xù)型,神經網絡預測的連續(xù)值是輸入數據 的某個連續(xù)函數。如果因變量是分類型,神經網絡會根據輸入數據,將記錄劃分 為最適合的類別。預測: 因子 協(xié)變量 選項“除外”列出 MLP 中需要排除的因子或者協(xié)變量。當因子或者協(xié)變量包含大 量的變量時,這個選項很有用。選項“縮放”對協(xié)變量和因變量進行變換 因變量 (如果需要變換 ):標準化,正態(tài)化,調整的正態(tài)化,或者無 協(xié)變量:標準化,正態(tài)化,調整的正態(tài)化,或者無 選項“拆分”用來設定對當前活動數據集的拆分方法。訓練樣本用來訓練神經網絡、 測試集是一個獨立的數據集,用來跟蹤預測無法來防止過

6、度訓練。 驗證集是另外 一個獨立的數據集,用來評估最后的神經網絡。您可以設定:相對記錄數來隨機分配訓練樣本相對記錄數來隨機分配測試樣本相對記錄數來隨機分配驗證樣本 使用變量對樣本進行拆分 用神經網絡技術探索數據的結果可以用多種圖形格式表示。 這個簡單的條形圖是 多種選擇中的一種。選項“結構”用來設置神經網絡的結構,您可以設定: 是否使用自動選擇結構 神經網絡的隱藏層個數隱藏層單元之間的激活函數(雙曲函數或者 S 型函數) 輸出層單元之間的激活函數(標識,雙曲 , S 型, SoftMax 函數)選項“標準”設定 MLP 的計算參數。例如,訓練類型決定了神經網絡如何處理訓 練數據,包括批處理訓練

7、、在線訓練、小批量訓練。您也可以設置: 每個小批量的訓練記錄數 當選擇自動化結構或者小批量訓練模式時,內存中存儲的最大記錄個數。 優(yōu)化算法決定突觸權重:梯度下降法、共軛梯度下降法 梯度下降優(yōu)化方法的初始學習率 當使用在線或者小批量訓練模式時,梯度下降的學習率下限。 梯度下降優(yōu)化算法的動量率 共軛梯度下降發(fā)的初始 lambda 共軛梯度下降法的 sigma 初始權重區(qū)間 a0-a, a0+a選項“停止訓練 ”決定神經網絡停止訓練的規(guī)則。您可以設置: 預測誤差下降的次數訓練時間或者最大訓練時間最大收斂次數 訓練誤差的相對變化率訓練誤差率準則 選項“缺失”用來控制分類變量(因子和分類因變量)的缺失值

8、是否被作為有效值 使用。選項“打印”指定輸出內容,也可以請求一個敏感性分析。您可以設置: 處理過程設置概要神經網絡的基本信息, 包括因變量、 輸入和輸出單元個數、 隱藏層單元個數、 激 活函數 神經網絡輸出結果的概要信息,包括:總體平均誤差、停止規(guī)則、訓練時間 每個分類因變量的分類表突觸權重,也就是連接第i-1層第j個單元和第i層第k個單元的系數估計值 敏感性分析,用來計算每個預測元對神經網絡的影響的重要性 選項“畫圖”指定輸出的圖形,您可以選擇: 網絡圖 每個因變量的預測值和觀測值圖 連續(xù)型因變量的殘差圖 分類變量的 ROC 曲線 分類因變量的累積收益圖 分類因變量的提升圖 選項“保存”可以

9、將生成的臨時變量保存到當前數據集中。您可以保存: 預測值或者分類預測的偽概率 選項“輸出文件”將神經網絡的結構輸出保存成包含突觸權重的 XML 格式 徑向基函數 (RBF)RBF 程序擬和一個前饋型、有監(jiān)督學習的徑向基函數網絡,包括輸入層、隱藏 層(也就是徑向基函數層)、輸出層。輸入向量通過隱藏層傳遞到徑向基函數。 類似 MLP , RBF 可以進行預測和分類。RBF 程序分兩個階段訓練網絡: 程序通過聚類方法確定徑向基函數。以及每個徑 向基函數的中心和寬度。 估計徑向基函數的連接權重。 在預測和分類中都使用激活函數作為均方誤差函數。 使用普通最小二乘方法求均方誤差的最小值。由于 RBF 訓練過程分兩個階段,因此 ,一般情況下, RBF 網絡的訓練速度優(yōu)于 MLP。MLP 和 RBF 的選項基本相同,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論