PLS的基本性質(zhì)擴展與改進策略:以戰(zhàn)略管理實證數(shù)據(jù)為例_第1頁
PLS的基本性質(zhì)擴展與改進策略:以戰(zhàn)略管理實證數(shù)據(jù)為例_第2頁
PLS的基本性質(zhì)擴展與改進策略:以戰(zhàn)略管理實證數(shù)據(jù)為例_第3頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、PLS 的基本性質(zhì)擴展與改進策略: 以戰(zhàn)略管 理實證數(shù)據(jù)為例作者:王希泉 周海煒 謝小韋論文 關(guān)鍵詞:偏最小二乘回歸 管理 優(yōu)勢 劣勢 論文摘要:偏最小二乘回歸應(yīng)用價值廣泛,在戰(zhàn)略管理 研究中,尤其是以 企業(yè) 樣本為主要分析單位時,偏最小二 乘回歸良好的數(shù)學性質(zhì),如交叉有效性原則、對樣本量需求 小和多重共線性的診斷等優(yōu)勢發(fā)揮的非常明顯。同時偏最小 二乘回歸在組織與管理研究中也存在較明顯的不足,針對不 足運用一個戰(zhàn)略管理領(lǐng)域企業(yè)實地調(diào)研的實例對偏最小二 乘回歸的劣勢進行否證式的說明與論證。偏最小二乘回歸是一種先進的多元統(tǒng)計分析方法,主要 應(yīng)用于建立多因變量的統(tǒng)計關(guān)系。在回歸分析中,當自變量 與因

2、變量的個數(shù)都很多,并且在自變量以及因變量之間都存 在較嚴重的多重共線時,如果采取一般的多元回歸方法,其 分析的可靠性極低, 而采取偏最小二乘 (PLS)回歸分析的建模 方法,可以很好的解決這個問題。1.主成分回歸和偏最小二乘回歸法的基本思想: 主成分回歸基本思想:觀察 n 個樣本點,得到因變量 y 和 p 個自變量 關(guān)系,設(shè)自變量 = ( ) 間的相關(guān)數(shù)矩陣記為R。主成分回歸方法完全撇開因變量 y ,單獨考慮對自變量 集合做主成分提取。其過程是 :1) 求 R 的前 m 個非零特征值 ,以及相應(yīng)的特征向 量;) 求 m 個主成分 :偏最小二乘回歸的基本思想: 首先在自變量集中提取 第一潛因子

3、與其同階的反應(yīng)變量空間的殘差向量 直交,即 給定任意 ,均有擴展性質(zhì) 2 解釋變量空間的潛變量向量 與其同階及以 后的反應(yīng)變量空間的殘差向量 直交,即給定任意 ,且 不 小于 ,均有證明:由擴展性質(zhì) 1 知, ,當 時,有擴展性質(zhì) 3 在第 步計算得到的回歸系數(shù)向量 與其對 應(yīng)的軸 之間有在相關(guān) 文獻 的基礎(chǔ)上,根據(jù)偏最小二乘回歸基本理 論,擴展了部分性質(zhì), 并給出了詳細的證明過程, 性質(zhì)表明, 與其它常見的多元統(tǒng)計分析方法相比,顯示出該方法的獨特 之處。戰(zhàn)略管理企業(yè)調(diào)研實例的檢驗:基于主成份回歸與 PLS 回歸法的比較本次調(diào)查歷時 6 個月,調(diào)查方式以訪問、 E-mail 、傳真 等方式進行

4、,為保證問卷回收率訪問調(diào)查被大量采用,共發(fā) 出問卷 200 余份,回收 146 份,回收率為 %。大部分接受問 卷企業(yè)對各項能力要素都比較看重。其中均值在以上的二項 要素:產(chǎn)品測試方面的專業(yè)水平、嚴格的質(zhì)量管理,反映了 大部分企業(yè)還是認同技術(shù)能力的高低對一個產(chǎn)品的最終影 響。s圖 SEQ 圖 * ARABIC 1 企業(yè)能力各要素的現(xiàn)實表現(xiàn) 直方圖通過聚類分析,將 18 個企業(yè)能力要素聚類為 5 大類。 在此基礎(chǔ)上運用進行回歸分析。戰(zhàn)略管理的實證研究一般運用傳統(tǒng)的因果模型為主,例 如主成份分析法,我們運用戰(zhàn)略管理研究方面企業(yè)核心能力 實地調(diào)研的真實數(shù)據(jù),運用主成份法進行回歸分析。由可以 得出刪去

5、第三個主成分 (PCOMIT= 1)后的主成分回歸方程 (其中 OBS 為 3 的那一行 )為 Y=+ 0. 1197x1+ 0. 1880x2+ +0. 0539x4+ 0. 1082x5 數(shù)據(jù)主成分回歸的結(jié)果見圖 2。這個主成分回歸方程中回歸系數(shù)的符號都是有意義的 各個回歸系數(shù)的方差膨脹因子均小于(見中 OBS為 2的那一行);主成分回歸方程的均方根誤差 (RMSE=) 。圖 SEQ 圖 * ARABIC 基于主成份法分析戰(zhàn)略管理實例的介紹了 PLS 回歸建模方法對于算法中, 給出了一個具體 例子, 計算 出了,PLS 回歸較好地克服了各指標間的多重共 線性問題 ,通過此方法求得指數(shù)更準確

6、、合理。最后,使用 SAS 軟件中的 PLS 過程完成偏最小二乘回歸分析, 輸出結(jié)果 見圖圖 SEQ 圖 * ARABIC 基于最小二乘回歸法的江蘇 企業(yè) 能力要素與企業(yè)自評滿意度關(guān)系上圖的第一部分給出抽取潛在變量的個數(shù)及相應(yīng)的用 于度量擬合效果的預(yù)測殘差平方和(PRESS)的均方根值 , 并指出在 L = 1 時預(yù)測殘差平方和的均方根達最小。輸出的第 二部 分給出第一、二個潛在變量所解釋的變差的百分數(shù)(包括自變量和因變量兩方面 ) ; 輸出的第三部分給出所擬合的模型的信息。其中 OBS 為 2 和的行給出自變量和因變量的均值和 標準差 ; OBS 為 6 的行給出抽取二個潛在因子時的偏最小二

7、 乘估計 ,由估計值可以寫出標準化回歸方程為(Y 和 x z 表示 Y 和 x 的標準化變量 )Y= 0. 1150x1+ 0. 1594x2+ +0. 11970 x4+ 0. 1294x5 以上偏最小二乘回歸方程中回歸系數(shù)的符號都是有意 義的。偏最小二乘回歸的均方根誤差 (需根據(jù)原始變量方程算 出)比普通最小二乘回歸的均方根誤差( RMSE= )有所增大 ,但增加不多。且比主成分回歸方程的均方根誤差為也有所增 大。偏最小二乘回歸對研究很多因變量及很多自變量的相 依關(guān)系時更能顯示其特點 , 此例變量個數(shù)少 , 故沒能看出太 多的優(yōu)點。由實例看出,對于這組數(shù)據(jù)的處理,主成分回歸與偏最 小二乘回

8、歸的計算結(jié)果相比, PLS 的計算結(jié)果更為可靠。且 PLS 可處理小樣本, 30-100 家企業(yè)數(shù)據(jù)的優(yōu)勢使 PLS 在戰(zhàn)略 管理實證中的優(yōu)勢得以充分發(fā)揮。.偏最小二乘回歸的改進策略及推導在多元線性回歸分析中 ,如果出現(xiàn)多重共線性的情況 ,用 偏最小二乘回歸分析解決這個問題有很大的優(yōu)勢 . 然而 , 偏 最小二乘回歸也有它的弱點 ,比如 ,它對影響點是非穩(wěn)健的 ,一 個或幾個影響點的存在 ,可以嚴重改變回歸的結(jié)果 .其次 , 偏 最小二乘回歸的選成份的過程也存在缺點。偏最小二乘回歸的基本的原理是按降序和交叉有效性 原則,順次選擇使 和 的協(xié)方差 盡量大的成分 。從前面提 供的偏最小二乘回歸的計

9、算過程可以看到,對于一個數(shù)據(jù)集 來講,成分實際上就是解釋矩陣 的列的線性組合,而回歸 就是建立在這些成分之上的。在偏最小二乘回歸中,提取成分 的基本思路是使協(xié)方 差 最大。在很多情形下,這樣提取的因子 可以保證對因 變量的解釋能力最強,同時對自變量集合又有最佳綜合能 力。根據(jù)協(xié)方差的計算公式 ,最理想的情況是因為選出成份 與因變量的相關(guān)系數(shù) (與響應(yīng)變量具有較高的相關(guān)性 )和方差 (所選的成份既含有解釋矩陣中較多的信息 ) 都最大而使協(xié)方差達到最大 .在很多情況下 ,兩者兼顧是可以做到的 .但是 , 在某些情況下 ,盡管相關(guān)系數(shù)比較小 ,但由于方差非常大 ,還是 能得到相當大的協(xié)方差 . 相關(guān)

10、系數(shù)比較小 ,回歸的結(jié)果一般 不會令人滿意 .這種情況下 ,不適宜直接使用偏最小二乘法 .這 一現(xiàn)象主要是由于解釋矩陣中含有大量與響應(yīng)變量無關(guān)的 信息造成的 .這些與相應(yīng)變量無關(guān)的信息被提取成具有大方 差和小相關(guān)系數(shù)的成份 ,從而使得入選成份雖然具有較大的協(xié)方差 ,但是仍然對響應(yīng)變量缺乏解釋能力為了說明這個問題,給出一個模擬的例子,具體如下: 考慮模型由于前面提到的偏最小二乘的弱點,得到 3 個估計都接 近于 0。如果偏最小二乘是有效的,那么估計的、 、 的3 個系數(shù)應(yīng)該是我們提出了一種改進的偏最小二乘回歸。針對這樣的情 況,提出的解決辦法是用投影的辦法把解釋矩陣中與響應(yīng)變 量無關(guān)的成分扣除出

11、去,經(jīng)過這樣處理的解釋矩陣便不存在 含有大量與響應(yīng)變量無關(guān)的信息的問題,也就適合使用偏最 小二乘法來處理。具體的過程如下:假定 為單位向量, ,能使 的方差達到最大的向量是 矩陣 的最大特征值對應(yīng)的特征向量。因此尋找那些具有大 方差且與響應(yīng)變量 線性無關(guān)的信息就等價于尋找矩陣 的 具有較大特征值的標準特征向量,剩下所要做的就是將解釋 矩陣 投影到這些標準特征向量所張成的空間的正交補空間 中去。投影后得到的矩陣就是扣除了那些與 無關(guān)的信息的 解釋矩陣,再對響應(yīng)向量 做回歸的時候就可以用偏最小二乘的方法參考 文獻 :1 任若恩 王惠文 . 多元統(tǒng)計數(shù)據(jù)分析 -理論、方法、實 例M. 北京: 國防 工業(yè) 出版社 ; 19972 Wu Lou, .Second-order approach to loca

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論