版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
張遠(yuǎn)鵬
102952014040117考生介紹江南大學(xué)2014年報考攻讀博士學(xué)位研究生普通招考生PPT目錄1. 基本信息2. 學(xué)習(xí)經(jīng)歷主要研究工作及成果攻讀博士期間的科學(xué)研究計劃基本信息姓名張遠(yuǎn)鵬
性別男
(電子照片)政治面貌
群眾出生年月1984.10.12聯(lián)系電話
報考類別定向
報考學(xué)院數(shù)字媒體報考專業(yè)
輕工信息技術(shù)報考導(dǎo)師(組)
王士同研究方向輕工信息技術(shù)
最后學(xué)歷
研究生最后學(xué)位碩士外語語種及水平英語,CET6
外國語
考試
□申請免試
√參加考試本科畢業(yè)學(xué)校
安徽師范大學(xué)學(xué)校層次
省重點本科專業(yè)計算機科學(xué)與技術(shù)
碩士畢業(yè)學(xué)校江南大學(xué)
學(xué)校層次
211碩士專業(yè)計算機應(yīng)用技術(shù)
學(xué)習(xí)經(jīng)歷2002.09-2006.07安徽師范大學(xué)計算機科學(xué)與技術(shù)專業(yè)2006.09-2008.08江南大學(xué)計算機應(yīng)用技術(shù)專業(yè)2008.08-2009.08中國船舶重工業(yè)集團(tuán)第723所2009.08-南通大學(xué)醫(yī)學(xué)信息學(xué)系主要研究工作及成果論文成果:張遠(yuǎn)鵬,凌利峰,耿興云等.關(guān)聯(lián)規(guī)則在電子健康檔案系統(tǒng)中的應(yīng)用[J].中國數(shù)字醫(yī)學(xué),2011,4張遠(yuǎn)鵬,董建成,耿興云等.區(qū)域電子健康檔案系統(tǒng)的分布式應(yīng)用程序框架模型研究[J],醫(yī)學(xué)信息學(xué)雜志,2011,2張遠(yuǎn)鵬,董建成,耿興云等.NET分布式技術(shù)在電子健康檔案系統(tǒng)中的應(yīng)用[J].中國數(shù)字醫(yī)學(xué),2010,10YuanpengZhang,
KuiJiang,
JianchengDong.NegationDetectioninChineseElectronicMedicalRecordBasedonRulesandWordCo-occurrence[C].FrontierandFutureDevelopmentofInformationTechnologyinMedicineandEducation,Volume269,
2014,
pp2215-2220張遠(yuǎn)鵬,王理,董建成.基于規(guī)則和詞共現(xiàn)的中文電子病歷否定檢出[J].計算機應(yīng)用與軟件.已錄用課題成果:2009.09-2012.09南通市科技計劃項目《基于社區(qū)醫(yī)療衛(wèi)生服務(wù)的居民健康檔案應(yīng)用平臺建設(shè)》(XA2009001-1),排名第四,已經(jīng)驗收結(jié)題2011.12-2013.12南通大學(xué)自然科學(xué)基金《基于關(guān)聯(lián)規(guī)則的電子健康檔案海量數(shù)據(jù)的挖掘》,排名第一,在研2013.05-2014.12)江蘇省教育科學(xué)研究院《高校思政課虛擬實驗室建設(shè)的研究與實踐》(2013-R-24890
)排名第三,在研2012.09-2015.09國家自然科學(xué)基金《基于Web的居民電子健康檔案數(shù)據(jù)共享平臺研究》(81271668)排名第八,在研攻讀博士期間的科學(xué)研究計劃一、自我評價本人2008年8月從江南大學(xué)信息工程學(xué)院碩士畢業(yè)以后,就職于中國船舶重工業(yè)集團(tuán)公司第723研究所,主要從事軟件開發(fā)工作,先后參與了多項重大國防軍工項目的研發(fā)工作,如:(1)***型艦顯控分機的操作和控制軟件研發(fā);(2)***型艦顯控分機的數(shù)據(jù)接口軟件的研發(fā);(3)***型艦顯控分機觸控鍵盤軟件的研發(fā);(4)***型艦雙搜索雷達(dá)協(xié)同控制軟件的研發(fā)。目前,這些軟件已經(jīng)投入到艦船實際應(yīng)用。
2009年8月,為了解決和妻子的兩地分居,離開723所,就職于南通大學(xué)醫(yī)學(xué)信息學(xué)系,從事該專業(yè)的教學(xué)和科研工作。直至今日,主要的開發(fā)和科研工作如下:(1)參與南通市重大科技創(chuàng)新項目《南通市居民電子健康檔案共享平臺》的研發(fā)工作;(2)參與2012年度國家自然科學(xué)基金面上項目《基于Web的居民電子健康檔案數(shù)據(jù)共享平臺研究》的申報,并立項(基金號:81271668);(3)主持南通大學(xué)2011年度校級自然科學(xué)研究項目《基于關(guān)聯(lián)規(guī)則的電子健康檔案海量數(shù)據(jù)挖掘》;(4)參與2013江蘇省教育科學(xué)研究院課題《高校思政課虛擬實驗室建設(shè)的研究與實踐》申報,并立項;(5)主持南通大學(xué)杏林學(xué)院(獨立學(xué)院)自然科學(xué)研究項目《.NET平臺的區(qū)域電子健康檔案系統(tǒng)的分布式應(yīng)用程序框架模型研究》;(6)主持南通大學(xué)杏林學(xué)院(獨立學(xué)院)教育研究項目《以社區(qū)醫(yī)療服務(wù)信息化為導(dǎo)向的全科醫(yī)學(xué)專業(yè)教學(xué)改革》。攻讀博士期間的科學(xué)研究計劃二、攻讀博士期間的科學(xué)研究計劃本人目前就職于南通大學(xué)醫(yī)學(xué)院醫(yī)學(xué)信息學(xué)系,所以希望在博士期間,能夠完成和醫(yī)學(xué)信息學(xué)相關(guān)方面的研究。而目前文本中命名實體的識別是人工智能研究的一個重要領(lǐng)域,所以希望能夠結(jié)合自己的工作背景,從中文電子病歷文本中,完成對命名實體的識別工作。隨著臨床信息化的發(fā)展,電子病歷開始在臨床中逐漸普及,如何智能地利用其中的信息也越來越受到關(guān)注,不少臨床決策支持系統(tǒng)(clinicaldecisionsupportsystem,CDSS)都將電子病歷作為重要的知識來源。然而,以自然語言形式存在的病歷信息成為信息智能利用的障礙,如何讓計算機自動匯總患者信息,構(gòu)建和挖掘大型臨床數(shù)據(jù)庫以服務(wù)于臨床決策,成為臨床信息化所亟需解決的問題。攻讀博士期間的科學(xué)研究計劃二、攻讀博士期間的科學(xué)研究計劃在病歷中,命名實體的類別繁多,除了時間、人名、組織機構(gòu)等常見的實體類別外,還有疾病、癥狀、手術(shù)操作、病因、病理、藥品等特有的實體類別。目前,命名實體的識別方法主要有3種:基于詞典的方法、基于規(guī)則的方法、基于機器學(xué)習(xí)的方法?;谠~典的方法,需要建立具有廣泛覆蓋性的命名實體詞典,并添加相應(yīng)的個類,如縮寫、同義詞,變形詞甚至通常錯誤詞等注釋內(nèi)容,配合相應(yīng)的匹配算法來實現(xiàn)對于文本中命名實體的識別,其缺陷是對于出現(xiàn)的新命名實體缺乏兼容能力,往往存在覆蓋率不足的問題,特別是在醫(yī)學(xué)領(lǐng)域,術(shù)語量非常龐大,國內(nèi)尚缺乏能夠有效支撐自然語言處理能力的中文醫(yī)學(xué)術(shù)語詞典?;谝?guī)則的方法,雖然在一定程度上彌補了基于詞典方法不能識別未收錄詞的缺陷,但是對于特定領(lǐng)域需要專業(yè)知識的工程師和專家來說,建立針對性的識別規(guī)則庫,規(guī)則的制定不僅需要消耗大量的時間和人力,而且所制定的規(guī)則可移植性差。相對于前兩種方法,基于機器學(xué)習(xí)的方法具有更好的實用性,通常基于標(biāo)注過的語料進(jìn)行訓(xùn)練,然后基于訓(xùn)練結(jié)果來智能完成對于命名實體的識別。因此,該方法具有很好的移植性,所以希望在讀博期間,能從基于機器學(xué)習(xí)的方法上尋找突破口,提高識別率。攻讀博士期間的科學(xué)研究計劃二、攻讀博士期間的科學(xué)研究計劃在實體命名識別研究中,常用的機器學(xué)習(xí)模型包括支持向量機(supportvectormachine,SVM)、隱馬爾可夫(hiddenMarkovmodel,HMM)、最大熵馬爾可夫(maximumentropyMarkovmodel,MEMM)、條件隨機場(CRF)等。1)支持向量機:將識別問題看作是一個分類問題,通過構(gòu)造一個超平面,以超平面間的距離作為最大邊緣來把訓(xùn)練實例分割為兩類,因此主要處理二元分類。2)隱馬爾可夫:是一種被應(yīng)用得較早的模型,在語音識別中獲得廣泛應(yīng)用,在生物醫(yī)學(xué)領(lǐng)域的實體識別研究中也有使用。3)最大熵馬爾可夫:是一種較早就被應(yīng)用并對NER系統(tǒng)有較大促進(jìn)的指數(shù)線性模型,它解決了隱馬爾可夫的問題,可以任意選擇特征,但由于其在每一節(jié)點都要進(jìn)行歸一化,所以只能找到局部的最優(yōu)值,同時也帶來了標(biāo)記偏見的問題,凡是訓(xùn)練語料中未出現(xiàn)的情況全都忽略。4)條件隨機場:只需要考慮當(dāng)前已經(jīng)出現(xiàn)的觀測狀態(tài)特征,沒有獨立性的嚴(yán)格要求,并很好地解決了MEMM的標(biāo)注偏見問題。它并不在每一個節(jié)點進(jìn)行歸一化,而是對所有特征進(jìn)行全局歸一化,因此可以求得全局的最優(yōu)值。此外,在小規(guī)模的訓(xùn)練數(shù)據(jù)上,它也獲得了理想的效果。攻讀博士期間的科學(xué)研究計劃二、攻讀博士期間的科學(xué)研究計劃目前在生物醫(yī)學(xué)領(lǐng)域,基于條件隨機場得方法用的相對比較多,而且效果也比其他的方法理想。Tsai等利用CRF對GENIAV3.02中的5類實體進(jìn)行識別,其中蛋白質(zhì)的F值達(dá)70.2%,彭春艷等在相似的實驗中達(dá)到了73.7%的F值,這兩個實驗都證明CRF優(yōu)于其他機器學(xué)習(xí)模型。Leaman等對生物醫(yī)學(xué)文獻(xiàn)中的多類實體進(jìn)行識別,總體F值達(dá)81.96%,其中疾病的F值僅為54.84%。而在其隨后針對Arizona疾病語料庫(ArizonaDiseaseCorpus,AZDC)的研究中,疾病的F值提升到了77.9%。同樣,基于AZDC語料庫,F(xiàn)aisal等則采用了一系列針對疾病量身定制的特征,達(dá)到了81.8%的F值。在中醫(yī)學(xué)領(lǐng)域,王世昆等在數(shù)據(jù)清洗和特征空間降維的基礎(chǔ)上,對中醫(yī)病案中的病癥和發(fā)病機理進(jìn)行智能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深度學(xué)習(xí)及自動駕駛應(yīng)用 課件 第6、7章 基于CNN的自動駕駛場景語義分割理論與實踐、循環(huán)神經(jīng)網(wǎng)絡(luò)及自動駕駛車輛換道行為預(yù)測
- 污水處理設(shè)施管網(wǎng)配套設(shè)施合同
- 環(huán)保工程合同模板
- 物流配送計劃生育承諾書模板
- 知識產(chǎn)權(quán)許可使用合同解除協(xié)議
- 移動辦公通訊實施方案
- 企業(yè)員工道德提案管理辦法
- 投資權(quán)益協(xié)議書
- 親子園幼師聘用合同細(xì)則
- 物流公司承運商安全規(guī)范
- 企業(yè)并購的財務(wù)風(fēng)險分析及防范的任務(wù)書
- 慢阻肺健康知識宣教
- 幼兒教育學(xué)基礎(chǔ)(第二版)中職PPT完整全套教學(xué)課件
- 藥品批發(fā)企業(yè)GSP的培訓(xùn)講義教學(xué)課件
- 2023年湖北武漢中考語文真題及答案
- 出國簽證戶口本翻譯模板
- 燒傷病患者的護(hù)理-燒傷病人的護(hù)理
- 對話理論與閱讀教學(xué)
- 第三單元(知識清單)- 高二語文選擇性必修下冊同步備課系列(統(tǒng)編版)
- 機加工安全事故案例演示文稿
- 凱文杜蘭特-英語介紹
評論
0/150
提交評論