下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、支持向量機方法在傷寒論方分類建模中的應用 11-05-17 14:42:00 編輯:studa20 作者:孫燕,臧傳新,任廷革,李宇航【關鍵詞】 支持向量機;分類;傷寒論支持向量機(Suport Vector Machine,SVM)方法是20世紀90年代出現(xiàn)的一
2、種新的分類方法,已初步表現(xiàn)出很多優(yōu)于已有方法的性能。有人把SVM方法與其他16種已有的方法作了系統(tǒng)的比較,得出SVM方法最優(yōu)的結論1。利用支持向量機方法訓練得到的分類器具有很好的推廣能力,即使訓練樣本很少,分類器的預測準確率也會很高。1 支持向量機方法 SVM分類器的基本原理是使用一個非線性變換,將不可分的空間映射到一個高維的線性可分的空間,并建立一個具有極小VC維數(shù)的分類器,該分類器僅由大量樣本中的極少量支持向量確定,且具有最大的邊界寬度。支持向量機算法的技巧在于不直接計算復雜的非線性變換,而是計算非線性變換的點積,即核函數(shù),從而大大簡化了計算
3、的過程。 因此,統(tǒng)計學習理論和SVM方法建立了一套較好的有限樣本下機器學習的理論框架和通用方法,有嚴格的理論基礎,其核心思想就是學習機器的復雜性要與有限的訓練樣本相適用,能較好地解決有限樣本、非線性、高維數(shù)和局部極小點等實際問題,能建立穩(wěn)定的預測準確率高的分類器,所以適用于分類模式識別。2 SVM方法在傷寒論方分類識別中的應用 自傷寒論問世以來,研究傷寒的著作有千余種,涉及七百余醫(yī)家。尤其在明清時期,各醫(yī)家在孫思邈“方證同條,比類相附”的啟發(fā)下,運用歸類編次的研究方法,從不同的角度充分揭示了傷寒論辨證論治的規(guī)律
4、,如按方類證、按法分類、按癥類證、按因類證、分經(jīng)審證等等8,大大豐富和發(fā)展了傷寒論的內(nèi)容。 以上都是醫(yī)家們?nèi)藶榈姆诸惙椒?現(xiàn)在我們利用模式識別的方法從不同的角度、不同的側面、不同的層次對傷寒論方進行分類訓練建模,來嘗試對張仲景制方規(guī)律和辨證論治規(guī)律的機器學習建模,不僅可以用更便于現(xiàn)代人理解的形式再現(xiàn)仲景的思維模式,使中醫(yī)學的繼承和學習更加有效,還可以發(fā)現(xiàn)一些隱含的知識,供我們學習借鑒。2.1 數(shù)據(jù)采集 數(shù)據(jù)來源于劉渡舟主編的傷寒論校注,選擇原文中帶有方藥的條文,將其轉換為電子文檔并進行預處理后,利用數(shù)據(jù)庫技術導
5、入專門用于“解析”和“標引”的“中醫(yī)方劑數(shù)據(jù)庫”9。2.2 數(shù)據(jù)一致化處理 由于計算機難以識別不遵循一定模式的數(shù)據(jù),不同的表達則認為是不同的知識,而中醫(yī)學中對同一個藥名、藥物功效、方名、癥狀、證候等數(shù)據(jù)有多種不同的表述方式的現(xiàn)象非常普遍,因此需要對其進行一致化、規(guī)范化處理,去除大量數(shù)據(jù)的噪音影響,保證所得數(shù)據(jù)具有較好的可信度,所得的結果才能反映真實的規(guī)律。 數(shù)據(jù)預處理是利用“解析”和“標引”技術,對采集到的傷寒論方劑數(shù)據(jù)進行處理的過程。所謂“解析”,實質上就是將文獻數(shù)據(jù)結構化、規(guī)范化的過程。我們在“中醫(yī)方劑數(shù)據(jù)
6、庫”對一個方劑解析后的字段可達171個,其中22個大項,149個子項。主要包括文獻位置(書、卷、頁、序)、方名、別名、主治病證、方劑組成、方劑功效、制劑工藝、劑型、服用方法、使用禁忌、加減用法、輔助療法、反應與療效、病機分析等。所謂“標引”,即中醫(yī)學主題詞標引,就是用給定的中醫(yī)學主題詞表中的詞條,對解析好的數(shù)據(jù)內(nèi)容冠以恰當?shù)臉俗R,從而使文獻數(shù)據(jù)標準化、規(guī)范化,其目標是把文字媒體的信息解析后并分門別類的加以標識。這樣的工作是在一種叫做“文獻解析工作單”的電子表格上進行的,這是一項十分繁重的、專業(yè)性很強的的工作,但是很重要,因為信息解析是整個信息活動的基礎,為在大型數(shù)據(jù)庫上進行數(shù)據(jù)挖掘提供良好的土
7、壤。2.3 傷寒論方劑功效的宏觀量化處理 SVM方法是完全基于數(shù)據(jù)的方法,為了與國際通行的軟件兼容,筆者采用與SVMLight類似的數(shù)據(jù)文件格式10。因此必須對傷寒論方劑功效進行定性定量處理,這也是進行分類訓練建模的基礎條件。 經(jīng)過一致化處理后,有關方劑的主要因子,諸如方劑的藥物組成及其臨床表現(xiàn)癥狀和體征等數(shù)據(jù)就可以導入“中醫(yī)方劑分析系統(tǒng)”。通過利用近似推理技術實現(xiàn)了方劑有關因子的宏觀量化,把定性的語言描述轉化為定量的數(shù)字表達,提供量值變化的信息提示,可直觀、動態(tài)地了解方劑組成變化的過程及其影響因素;同時使得每一個方劑因子之間具有了可比性,實現(xiàn)了定性定量的層次,這是目前任何方劑系統(tǒng)都無法做到的。 中醫(yī)學中存在“異病同治”的問題,同一個方劑可以治療不同的疾病和證候,但究竟是方劑的哪些藥物功效在發(fā)揮作用,目前還沒有辦法確定。按照中醫(yī)學的推理規(guī)律,一般認為針對不同的體質和病證,同一方劑就會有不同作用趨向,發(fā)揮不同的功效。因此筆者根據(jù)另一個客觀存在的信息方劑治療的患者的癥狀/體征,建立了功效-癥狀-證候關系庫,實現(xiàn)了方劑針對具體情況下的證候重聚焦,同時也實現(xiàn)主證
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版物流企業(yè)環(huán)保應急處理合作協(xié)議3篇
- 二零二五年度個人消費信貸擔保合同規(guī)范文本
- 書法行業(yè)墨跡技法培訓總結
- 二零二五年度個人投資借款合同范例(高風險投資管理)2篇
- 2025版退換貨協(xié)議書(家電行業(yè))3篇
- 二零二五年度貨運司機租賃及安全協(xié)議3篇
- 二零二五年度贍養(yǎng)老人協(xié)議書(含子女共同贍養(yǎng)責任分擔)6篇
- 2025版金融科技創(chuàng)新項目信托借款合同范本2篇
- 二零二五版施工合同尾款支付擔保協(xié)議范本3篇
- 二零二五年度地基處理土方開挖及運輸綜合服務合同3篇
- 我的消防文員職業(yè)規(guī)劃
- 2025年公司品質部部門工作計劃
- 2024年世界職業(yè)院校技能大賽高職組“市政管線(道)數(shù)字化施工組”賽項考試題庫
- CSC資助出國博士聯(lián)合培養(yǎng)研修計劃英文-research-plan
- 《環(huán)境管理學》教案
- (一模)寧波市2024學年第一學期高考模擬考試 數(shù)學試卷(含答案)
- 父母贈與子女農(nóng)村土地協(xié)議書范本
- 集團母子公司協(xié)議書
- 中醫(yī)病證診斷療效標準
- 南安市第三次全國文物普查不可移動文物-各鄉(xiāng)鎮(zhèn)、街道分布情況登記清單(表五)
- ITSMS-D-038 問題記錄表范本
評論
0/150
提交評論