2022醫(yī)療健康行業(yè)AI應(yīng)用手冊_第1頁
2022醫(yī)療健康行業(yè)AI應(yīng)用手冊_第2頁
2022醫(yī)療健康行業(yè)AI應(yīng)用手冊_第3頁
2022醫(yī)療健康行業(yè)AI應(yīng)用手冊_第4頁
2022醫(yī)療健康行業(yè)AI應(yīng)用手冊_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

AIContents06*人工智能在醫(yī)療健康領(lǐng)域的發(fā)展與應(yīng)用12OpenVINO?提升醫(yī)療圖像AI推理效率

50

*AI助力打造更為精準(zhǔn)智能的醫(yī)療解決方案13醫(yī)學(xué)影像處理中的圖像分割51*醫(yī)療行業(yè)中更多AI技術(shù)的落地應(yīng)用15U-Net分割網(wǎng)絡(luò)的優(yōu)化方法53*英特爾?架構(gòu)提升機(jī)器學(xué)習(xí)方法效率17DenseU-Net圖像分割方法57第四范式構(gòu)建慢性病預(yù)防與管理閉環(huán)管理方案19東軟eStroke影像平臺59面向英特爾?Python分發(fā)包,助力匯醫(yī)慧影提升20西門子醫(yī)療利用英特爾?深度學(xué)習(xí)加速技術(shù),推進(jìn)診療放射組學(xué)特征選擇效率中的AI應(yīng)用60*衛(wèi)寧健康NLP后結(jié)構(gòu)化平臺提供由AI驅(qū)動的醫(yī)療信息21GE醫(yī)療利用英特爾技術(shù)與產(chǎn)品,優(yōu)化深度學(xué)習(xí)模型,整合解決方案提升CT圖像推理性能61*東軟醫(yī)保借力第四代英特爾?至強(qiáng)?可擴(kuò)展處理器加速22匯醫(yī)慧影利用英特爾技術(shù),構(gòu)建高效協(xié)助診療平臺OCR票據(jù)識別23衛(wèi)寧健康基于英特爾先進(jìn)產(chǎn)品,構(gòu)建高效的智能輔助64基于聯(lián)邦學(xué)習(xí)的AI方法在醫(yī)療行業(yè)中的探索診斷系統(tǒng)65打破數(shù)據(jù)壁壘,提升醫(yī)療AI應(yīng)用效能24致遠(yuǎn)慧圖借力英特爾技術(shù),推出智能遠(yuǎn)程閱片方案67英特爾?軟件防護(hù)擴(kuò)展26AI+Cloud,協(xié)力共建高效醫(yī)學(xué)影像分析能力69聯(lián)邦學(xué)習(xí)在醫(yī)療領(lǐng)域的實(shí)戰(zhàn)27醫(yī)療領(lǐng)域中的醫(yī)學(xué)影像分析69基于聯(lián)邦學(xué)習(xí),開展面向腦部病灶分割的研究28優(yōu)化AI模型效率71*醫(yī)渡云打造基于聯(lián)邦學(xué)習(xí)的多方安全計(jì)算解決方案30AI73*锘崴科技開展基于隱私保護(hù)計(jì)算的GWAS研究32AI技術(shù)加速病理圖像分析74*運(yùn)用OpenFL推動聯(lián)邦學(xué)習(xí)方案落地醫(yī)療領(lǐng)域33醫(yī)療領(lǐng)域中的病理切片分析76*AI技術(shù)加速蛋白質(zhì)結(jié)構(gòu)預(yù)測35基于深度學(xué)習(xí)的病理切片分析方法的優(yōu)化77*AlphaFold2實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)預(yù)測加速37江豐生物利用AI技術(shù)提升高危病篩查效率78*基于英特爾?至強(qiáng)?可擴(kuò)展處理器開展AlphaFold2優(yōu)化39江豐生物以AI技術(shù)助力肺部疾病篩查84*英特爾優(yōu)化方案在AlphaFold2上的實(shí)戰(zhàn)42AI技術(shù)助力加速藥物研發(fā)86*英特爾架構(gòu)產(chǎn)品與技術(shù)為醫(yī)療大模型加速43深度學(xué)習(xí)方法加速藥物篩選87*大模型技術(shù)為智慧醫(yī)療提供新動能45基于英特爾?至強(qiáng)?可擴(kuò)展平臺的優(yōu)化88*英特爾產(chǎn)品與技術(shù)為大模型提供量化和非量化優(yōu)化方案48諾華利用深度學(xué)習(xí)提高藥物研發(fā)效率91*英特爾醫(yī)療大模型優(yōu)化方案在惠每科技的實(shí)戰(zhàn)硬件產(chǎn)品軟件和框架96第四代英特爾?至強(qiáng)?可擴(kuò)展處理器106英特爾?oneAPI工具套件97第三代英特爾?至強(qiáng)?可擴(kuò)展處理器107英特爾?數(shù)據(jù)分析加速庫(oneDAL)100英特爾?至強(qiáng)?CPUMax系列107英特爾?oneAPI數(shù)學(xué)內(nèi)核庫(oneMKL)101GaudiHabana?Gaudi?2108英特爾?深度神經(jīng)網(wǎng)絡(luò)庫(oneDNN)102英特爾?高級矢量擴(kuò)展512(英特爾?AVX-512)108面向英特爾?架構(gòu)優(yōu)化的深度學(xué)習(xí)框架103英特爾?高級矩陣擴(kuò)展(英特爾?AMX)109面向英特爾?架構(gòu)優(yōu)化的TensorFlow擴(kuò)展包(ITEX)104英特爾?軟件防護(hù)擴(kuò)展(英特爾?SGX)110OpenVINO?工具套件105英特爾?SST注:*部分為2023年版本更新內(nèi)容趨勢篇4 5英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊趨勢篇6趨勢篇6

醫(yī)療人工智能的市場趨勢得益于算法的進(jìn)一步成熟、算力的提高以及數(shù)據(jù)的持續(xù)積累,人工智能(Arti?cialIntelligence,AI)得到迅猛發(fā)展,深度學(xué)習(xí)成為其代表,并呈現(xiàn)出應(yīng)用領(lǐng)域日益集中的趨勢。AI技術(shù)最重要的落地領(lǐng)域之一,醫(yī)療行業(yè)與人工智能技術(shù)的結(jié)合也在近年來獲得了市場的巨大青睞。據(jù)弗若斯特沙利文(Frost&Sullivan)20301.1萬1。這一高速增長一方面得益于中國醫(yī)療市場的迫切需求,另一方面則源于近年來醫(yī)療人工智能技術(shù)的發(fā)展以及相關(guān)政策的支持。同時,人工智能技術(shù)與產(chǎn)品的市場化落地也2021828款不2。從全球來看,醫(yī)療人工智能的應(yīng)用細(xì)分領(lǐng)域與中國略有不同。GlobalMarketInsight的統(tǒng)計(jì)數(shù)據(jù),藥物研發(fā)在全球醫(yī)療人工智能市場中的占比最大,達(dá)到35%。緊隨其后的是醫(yī)學(xué)25%40%的增速發(fā)展,預(yù)2024253此外,基因組學(xué)分析是人工智能應(yīng)用的又一重要領(lǐng)域。預(yù)計(jì)到2022年,該細(xì)分市場的規(guī)模僅在中國就將接近300億元人民幣4同時隨之帶來的測序時間縮短以及成本大幅降低,又會為醫(yī)療行業(yè)人工智能的應(yīng)用創(chuàng)造更大的想象空間。隨著人工智能在更多醫(yī)療領(lǐng)域的運(yùn)用,更多醫(yī)療數(shù)據(jù)也參與到各類機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型的訓(xùn)練中來,如何在提升模型性能的同時保證信息安全和隱私保護(hù)也是目前業(yè)界矚目的焦點(diǎn)之一。因此,可信理念也在人工智能與醫(yī)療行業(yè)的結(jié)合中逐漸深入。

值得一提的是,利用人工智能方法來加速蛋白質(zhì)結(jié)構(gòu)預(yù)測也是AlphaFold2為代表的新方案能夠大幅加速蛋白質(zhì)結(jié)構(gòu)解析速度,揭示和呈現(xiàn)有機(jī)體內(nèi)更多的信息秘密,是人工智能在生物學(xué)、醫(yī)學(xué)和藥學(xué)等領(lǐng)域落地的核心發(fā)力點(diǎn)之一。在中國,政策激勵是加速醫(yī)療人工智能應(yīng)用落地的關(guān)鍵因素之一。相關(guān)政府部門陸續(xù)推出了大量政策,從人才培養(yǎng)、技術(shù)創(chuàng)新、標(biāo)準(zhǔn)監(jiān)管、行業(yè)融合、產(chǎn)品落地等多方位推動人工智能發(fā)2018年1工智能標(biāo)準(zhǔn)化白皮書(2018版)4++”“健康中國”措,并表示將重點(diǎn)支持研發(fā)醫(yī)療健康相關(guān)的人工智能技術(shù)、醫(yī)用機(jī)器人、大型醫(yī)療設(shè)備等。202110月,由國家衛(wèi)生健康委、國家中醫(yī)藥管理局印發(fā)的《公立醫(yī)院高質(zhì)量發(fā)展促進(jìn)行動(2021-2025年)智慧醫(yī)院。通過完善智慧醫(yī)院分級評估頂層設(shè)計(jì),鼓勵有條件的公立醫(yī)院加快應(yīng)用智慧服務(wù)軟硬件。20233月由中共中央辦公廳、國務(wù)院辦公廳印發(fā)的《關(guān)于進(jìn)一步完善醫(yī)療衛(wèi)生服務(wù)體系的意見》指“互聯(lián)網(wǎng)+醫(yī)療健康”,加快推進(jìn)互聯(lián)網(wǎng)、人工智能、云計(jì)算等在醫(yī)療衛(wèi)生領(lǐng)域中的應(yīng)用,加強(qiáng)健康醫(yī)療大數(shù)據(jù)共享交換與保障體系建設(shè)。醫(yī)療人工智能的應(yīng)用趨勢人工智能在醫(yī)療健康領(lǐng)域的應(yīng)用非常廣泛,在從醫(yī)學(xué)影像到健康管理、藥物研發(fā)、慢性病管理以及生物學(xué)探索等諸多環(huán)節(jié),都可發(fā)揮關(guān)鍵作用,并已在不同層級與不同細(xì)分領(lǐng)域的醫(yī)療機(jī)”。其中,人工智能用于醫(yī)學(xué)影像等場景致使此類應(yīng)用在減輕醫(yī)生工作量方面的效果并不顯著。英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊趨勢篇71數(shù)據(jù)援引自弗若斯特沙利文在2022年5月25日發(fā)布的報告《醫(yī)療智能行業(yè)白皮書》,https:///content/insight/detail?id=62f1ebd83a1cb46c9a9fd3ca2數(shù)據(jù)援引自中國信息通信研究院發(fā)布的《人工智能白皮書(2022年)》:3GlobalMarketInsightsreport.2018年4月./rengongzhineng/592041.html4前瞻產(chǎn)業(yè)研究院?!?018-2023年中國基因測序行業(yè)市場前瞻與投資戰(zhàn)略規(guī)劃報告》。2018年。/trends/detail/506/180411-e7daa2c4.html未來,人工智能在不同層級的醫(yī)療機(jī)構(gòu)的應(yīng)用方向可能會呈現(xiàn)出更加多元化的趨勢,即在基層醫(yī)院或第三方體檢中心,其應(yīng)則以提高醫(yī)生工作效率為主;在健康管理方面,人工智能以支持單位和個人支付的健康體檢為主要方向;在藥物研發(fā)領(lǐng)域,人工智能應(yīng)用又表現(xiàn)出不同特點(diǎn),需要相關(guān)技術(shù)公司與大型藥企、醫(yī)藥研究機(jī)構(gòu)通力合作來推進(jìn)。雖然人工智能在醫(yī)療健康領(lǐng)域迅速得以應(yīng)用,但源于數(shù)據(jù)、模型等方面的影響,目前仍然面臨諸多挑戰(zhàn):?數(shù)據(jù)量。模型越復(fù)雜,參數(shù)越多,所需要的訓(xùn)練樣本量就越大。但是對許多復(fù)雜的臨床場景而言,所需要的大量可靠數(shù)據(jù)卻并不容易獲得;?數(shù)據(jù)維度。通常而言,數(shù)據(jù)維度越少,對真實(shí)世界的描述能力也越差,但高維數(shù)據(jù)處理面臨著處理效率低、所需計(jì)算量大等問題;?數(shù)據(jù)質(zhì)量。一般而言,健康數(shù)據(jù)的組織化和標(biāo)準(zhǔn)化程度都不高,且數(shù)據(jù)分散、有噪聲。在條件不好的診所與基層醫(yī)院,同時接口數(shù)據(jù)可靠性也很差;?數(shù)據(jù)孤島現(xiàn)象。作為關(guān)乎人們隱私信息的敏感領(lǐng)域,醫(yī)療數(shù)據(jù)泄露風(fēng)險已經(jīng)受到醫(yī)療機(jī)構(gòu)的足夠重視,但由此也催生出不同機(jī)構(gòu)間數(shù)據(jù)相互隔離的數(shù)據(jù)孤島現(xiàn)象。而單一醫(yī)療機(jī)構(gòu)又難以聚集起足夠的高質(zhì)量訓(xùn)練數(shù)據(jù),供AI模型訓(xùn)練學(xué)習(xí)所用;?模型的可解釋性。深度學(xué)習(xí)模型是個黑盒子,對如何得出結(jié)論沒有明確的解釋,其決策模式的權(quán)威性尚待驗(yàn)證;?模型的通用性。首先是模型偏差,比如采用白種人患者數(shù)據(jù)進(jìn)行訓(xùn)練的模型,可能在其他種族患者中效果不佳;還有就是模型互操作性差,即很難建立一個適用于兩種不同電子病歷系統(tǒng)的深度學(xué)習(xí)模型;

針對這些挑戰(zhàn),醫(yī)療和人工智能等領(lǐng)域的專家已經(jīng)提出多項(xiàng)應(yīng)對措施,來優(yōu)化應(yīng)用環(huán)境,提高應(yīng)用實(shí)效:?收集大規(guī)模和多樣化的健康數(shù)據(jù)。廣泛收集來自不同種族、民族、語言和社會經(jīng)濟(jì)地位患者的數(shù)據(jù),并對其進(jìn)行標(biāo)準(zhǔn)化和集成;?提高數(shù)據(jù)質(zhì)量。從提供可靠、高質(zhì)量的數(shù)據(jù)輸入入手,繼之再利用工具提高數(shù)據(jù)收集的質(zhì)量,如進(jìn)行錯誤糾正、發(fā)出關(guān)于缺失數(shù)據(jù)的警告等;?融入臨床工作流程。將深度學(xué)習(xí)融入現(xiàn)有電子病歷系統(tǒng)的管理,提高臨床醫(yī)生的工作效率和數(shù)據(jù)采集的實(shí)時性;?構(gòu)建高維學(xué)習(xí)模型。引入百萬級乃至上億級的規(guī)則,通過高維學(xué)習(xí)模型,大幅提升預(yù)測和識別的準(zhǔn)確率;?法制化規(guī)范化。針對諸如計(jì)算機(jī)黑客篡改數(shù)據(jù),從而影響深度學(xué)習(xí)模型的結(jié)果等信息安全問題,要制定相應(yīng)法規(guī),保護(hù)分析模型。同時,為推動多源醫(yī)療數(shù)據(jù)進(jìn)行更安全的交互、傳輸和聚合,解決因數(shù)據(jù)孤島所造成的高質(zhì)量訓(xùn)練數(shù)據(jù)不足問題,各方專家正積極探索引入聯(lián)邦學(xué)習(xí)方法等安全性更高的數(shù)據(jù)協(xié)作方式和更完善的AI模型訓(xùn)練架構(gòu),以便在降低隱私泄露風(fēng)險的前提下,以更多高質(zhì)量數(shù)據(jù)構(gòu)建起安全可信的多源數(shù)據(jù)協(xié)同方案,提升醫(yī)療AI應(yīng)用效能,使AI技術(shù)更高效、安全地服務(wù)于醫(yī)療健康。

人工智能在醫(yī)療健康領(lǐng)域的應(yīng)用場景醫(yī)療健康是人工智能應(yīng)用落地最具潛力的領(lǐng)域之一,對此業(yè)界已有共識。伴隨著應(yīng)用的不斷深入,人工智能將在以下多種醫(yī)療健康應(yīng)用場景中大顯身手:?慢病管理與疾病監(jiān)測?;诨颊唧w征對(潛在)慢性疾病進(jìn)行風(fēng)險預(yù)估,從而通過早期干預(yù),大大降低患者的醫(yī)療費(fèi)用;?臨床預(yù)測分析。例如,基于電子病歷數(shù)據(jù)評估在院內(nèi)感染疾病的風(fēng)險,根據(jù)運(yùn)營模型預(yù)測患者再入院率,根據(jù)財(cái)務(wù)模型制定捆綁銷售服務(wù)方案等;?慢性病管理。利用數(shù)據(jù)采集方法(例如物聯(lián)網(wǎng)),構(gòu)建基于人工智能方法的慢性病評估及篩查模式,提升慢性病的預(yù)測和早期診斷能力;?病歷搜索與質(zhì)量控制。精準(zhǔn)提取醫(yī)療文本中的關(guān)鍵信息,進(jìn)行醫(yī)學(xué)實(shí)體識別,進(jìn)而實(shí)現(xiàn)靈活的全量電子病歷搜索;

?虛擬現(xiàn)實(shí)助手。通過虛擬現(xiàn)實(shí)會話,參與到患教活動中,幫助患者清楚了解其病因,使醫(yī)患溝通更有效;?智能導(dǎo)診。通過語音、觸屏等多種交互方式,更好地提供院內(nèi)導(dǎo)航、導(dǎo)診、導(dǎo)醫(yī),提升精準(zhǔn)分診、健康咨詢、健康宣教等服務(wù)的水平;?影像輔助診斷。幫助放射科醫(yī)生快速篩除正常影像,提高醫(yī)生的病例處理效率;提高分析影像的準(zhǔn)確度,縮短診斷結(jié)果報告時間,提升醫(yī)療系統(tǒng)的診斷能力;?病理分析。例如,高效、準(zhǔn)確地對送檢物進(jìn)行檢測和分類;?基因組學(xué)分析。用以大幅降低基因測序成本,快速精確實(shí)現(xiàn)規(guī)模龐大的基因組數(shù)據(jù)分析,為疾病的診斷和治療等提供支持;??藥物發(fā)現(xiàn)。加快藥物研發(fā)效率,降低成本。?模型安全。即便是訓(xùn)練有素的圖像處理模型,也有可能因輸就可能極大影響模型對住院死亡率的預(yù)測。

英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊趨勢篇9英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊趨勢篇8 實(shí)戰(zhàn)篇10 11英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇12英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇12實(shí)戰(zhàn)篇12

醫(yī)學(xué)影像處理中的圖像分割傳統(tǒng)醫(yī)學(xué)影像圖像分割方法計(jì)算機(jī)視覺中的圖像分割5是指以圖像中的自然邊界,例如物體輪廓、線條等,將圖像切分為多個區(qū)域,其目的是用于簡化或改變圖像的表現(xiàn)形式,使之更易解讀和分析。在計(jì)算機(jī)方法中,這一過程通常會被解構(gòu)為將圖像中的每個像素加上標(biāo)簽,使具有相同標(biāo)簽的像素有著某種共同視覺特性,例如顏色、亮度、紋理等,由此進(jìn)行的度量或計(jì)算得出的一定區(qū)域的像素特性相似,而鄰接區(qū)域則有著很大的不同。作為計(jì)算機(jī)視覺技術(shù)的重要分支,圖像分割已在醫(yī)學(xué)影像處理、工業(yè)機(jī)器人、智能交通、指紋識別以及衛(wèi)星圖像定位等多個行業(yè)和領(lǐng)域獲得廣泛應(yīng)用。在醫(yī)學(xué)影像處理領(lǐng)域,圖像分割已在諸多病理位置定位、組織體積測量、解剖學(xué)研究、計(jì)算機(jī)輔助手術(shù)、治療方案制定以及臨床輔助診斷等多個細(xì)分領(lǐng)域證明了其價值。傳統(tǒng)的圖像分割方法主要有以下幾種常見方法:?基于聚類的方法:聚類法是基于K-割成K都有著相似的距離偏差,距離偏差通常采用顏色、亮度、紋理、位置等指標(biāo)。該算法具有良好的收斂性;?基于閾值的方法:該方法是通過計(jì)算圖像的一個或多個灰度閾值后,將每個像素的灰度值與閾值相比較,最后進(jìn)行歸類的方法;?基于邊緣的方法:該方法是根據(jù)圖像中自然邊緣的灰度、顏

色、紋理等特性的突變性來對圖像進(jìn)行分割。一般來說,基于邊緣的分割方法依賴于灰度值邊緣檢測,當(dāng)邊緣灰度值呈現(xiàn)階躍型等變化時,判斷為圖像邊緣;?基于區(qū)域的方法:該方法是根據(jù)圖像的相似性來對圖像進(jìn)行分割,其判斷原則是根據(jù)相鄰像素點(diǎn)的灰度、顏色、紋理等特性是否存在相似性,如有相似,則擴(kuò)大像素點(diǎn)的集合?;谏疃葘W(xué)習(xí)的圖像分割方法隨著近年來AI技術(shù)的飛速發(fā)展,尤其是在圖像領(lǐng)域,基于AI技術(shù)的圖像識別、圖像處理應(yīng)用已經(jīng)被用在很多場景中,其對各類醫(yī)學(xué)影像的分析識別能力已經(jīng)超過人類。與卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworkCNN)類似的模型,是目前基于AI的圖像分割技術(shù)中常見的網(wǎng)絡(luò)模型。這其中,全卷積網(wǎng)絡(luò)(FullyConvolutionalNetworkFCN)、U-Net和V-Net是常見的幾種基于深度學(xué)習(xí)的圖像分割方法。FCNCNN的典型用途是對任務(wù)進(jìn)行分類。對圖像處理而言,它的輸出是單個類別標(biāo)簽。在生物醫(yī)學(xué)的圖像分割處理中,期望的輸出應(yīng)該包括定位,即應(yīng)該將類標(biāo)簽分配給每個像素。作為卷積神經(jīng)網(wǎng)絡(luò)的升級擴(kuò)展版本,如圖2-1-1所示,F(xiàn)CN6碼、解碼的網(wǎng)絡(luò)結(jié)構(gòu)模式級聯(lián)了卷積層和池化層。卷積層和最大池化層有效降低了原始圖像的空間維度。同時,F(xiàn)CN使用AlexNet作為網(wǎng)絡(luò)的編碼器,采用多重轉(zhuǎn)置卷積重復(fù)擴(kuò)展的方式,對編碼器最后一個卷積層輸出的特征圖進(jìn)行上采樣,直到特征圖恢復(fù)到輸入圖像的分辨率,因而,可以實(shí)現(xiàn)像素級別的圖像分割。英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇13/推理/學(xué)習(xí)/推理/學(xué)習(xí)2196圖2-1-1FCN方法原理圖5關(guān)于圖像分割的描述,部分參考:Linda.ShapioandGeogeC.ockman(2001):“Compuerision”,pp279-325NewJerseyPrentice-Hall,ISBN0-13-030796-36關(guān)于FCN的相關(guān)技術(shù)描述,摘選自UCBerkeleyjonlong、shelhamer和trevor的論文《FullyConvolutionalNetworksforSemanticSegmentation》:/~jonlong/long_shelhamer_fcn.pdf

inputimageoutputsegmentationmapinputimageoutputsegmentationmapcopyandcropmaxpool2x2up-conv2x2conv1x1

軟硬件配置建議名稱 規(guī)格處理器英特爾?名稱 規(guī)格處理器英特爾?至強(qiáng)?6240處理器或更高超線程ON睿頻加速ON內(nèi)存16GBDDR42666MHz*12及以上存儲英特爾?D5P4320系列及以上操作系統(tǒng)CentOSLinux7.6或最新版本Linux核心3.10.0或最新版本編譯器GCC4.8.5或最新版本Python版本Python3.6或最新版本R1.13.1或最新版本OpenVINO?工具套件2019R1或最新版本Keras版本2.1.3或最新版本

AccessArchitecture,NUMA)技術(shù),以及面向深度神經(jīng)網(wǎng)絡(luò)的英特爾?數(shù)學(xué)核心函數(shù)庫(Intel?MathKernelLibraryforDeepNeuralNetworks英特爾?MKL-DNN),從而為U-Net圖像分割法提供多層次的優(yōu)化。優(yōu)化步驟如下:環(huán)境變量設(shè)置首先,需要對環(huán)境變量進(jìn)行設(shè)置,如以下所示,命令包括:將處理器設(shè)置為性能優(yōu)先的模式,即運(yùn)行在最高頻率,打開處理器的睿頻加速。卷積層2x2過濾器,步長:2解卷積層2x2過濾器,步長:2細(xì)粒度特征轉(zhuǎn)發(fā)5x5x5步長:1元素總和非線性PReLuFCNNet具有一個鮮明的U卷積層2x2過濾器,步長:2解卷積層2x2過濾器,步長:2細(xì)粒度特征轉(zhuǎn)發(fā)5x5x5步長:1元素總和非線性PReLu

醫(yī)學(xué)影像在實(shí)際應(yīng)用中也有其獨(dú)有的特性。我們可以看到,一般胸片影像是胸片CT,而眼底檢查則是眼底OCT,均為針語義信息并非特別豐富。所以高級語義信息和低層級特征就顯U-Net的UU-Net在醫(yī)學(xué)影像分割領(lǐng)域良好的應(yīng)用效果,已在很多部署中得到充分了證明。V-NetNet3DU-Net2-1-3所示,它與U-NetV-Net3D圖像的端到端圖像語義分割,并通過trick來對網(wǎng)絡(luò)進(jìn)行改進(jìn)。

U-Net分割網(wǎng)絡(luò)的優(yōu)化方法基于英特爾?架構(gòu)的優(yōu)化方法將傳統(tǒng)的CNN圖像分割方法用于醫(yī)學(xué)圖像時,往往存在以下困難:CNN通常都是應(yīng)用于分類,生物醫(yī)學(xué)圖像則更關(guān)注分割以及定位的任務(wù);CNN需要獲取大量的訓(xùn)練數(shù)據(jù),而醫(yī)學(xué)圖像很難獲得相應(yīng)較大規(guī)模的數(shù)據(jù)。以往在應(yīng)對上述困難時,通常采用滑窗的方法,即為每一個待分類的像素點(diǎn)取周圍的一部分鄰域輸入。這種方法好處有兩點(diǎn):首先,這一方法能夠在滑窗的同時完成定位工作;其次,每次動作都會取一個像素點(diǎn)周圍的鄰域,可以大大增加訓(xùn)練的數(shù)據(jù)量。但是,這一方法也有兩個缺點(diǎn):一是通過滑窗所取的塊之間有較大的重疊,會導(dǎo)致訓(xùn)練和推理速度變慢;二是網(wǎng)絡(luò)需要在局部準(zhǔn)確性和獲取上下文之間進(jìn)行取舍,因?yàn)槿绻叭〉膲K過大,就需要更多的池化層,定位準(zhǔn)確率會降低,而取的塊過小,則網(wǎng)絡(luò)只能看到很小的一部分上下文。基于英特爾?架構(gòu)平臺開展的一系列優(yōu)化,可以從另一個層面幫助用戶解決以上問題。這些優(yōu)化方法包括:調(diào)整處理器核心數(shù)量、引入非統(tǒng)一內(nèi)存訪問架構(gòu)(NonUniformMemory

KMP_BLOCKTIME1,是設(shè)置某個線程在執(zhí)行完當(dāng)1KMP_AFFINITYCompact,是表示在該模式下,線程綁定按計(jì)算核心的計(jì)算要求優(yōu)先,先綁定同一個核心,再依次綁定同一個處理器上的下一個核心。此種綁定適用于線程之間具有數(shù)據(jù)交換或有公共數(shù)據(jù)的計(jì)算情況,優(yōu)勢在于OMP_NUM_THREADS20,是將并行執(zhí)行線程的數(shù)量設(shè)定為所需的物理核心數(shù)。測試代碼中添加線程控制如上述設(shè)置命令所示,在進(jìn)行tf.Con?gProto()初始化時,我們也可以通過設(shè)置intra_op_parallelism_threads參數(shù)和inter_op_parallelism_threads參數(shù),來控制每個操作符op并行計(jì)算的線程個數(shù)。二者的區(qū)別在于:intra_op_parallelism_threadsopop為單一運(yùn)算符,并且內(nèi)部可以實(shí)現(xiàn)并行時,如矩陣乘法、reduce_sum之類的操作,可以通過設(shè)置intra_op_parallelism_threadsintra代表內(nèi)部。英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇15英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇14圖2-1-3V-Net拓?fù)渌枷雐nter_op_parallelism_threads控制多個運(yùn)算符op之間的并行計(jì)算,當(dāng)有多個運(yùn)算符op,并且它們之間比較獨(dú)立,運(yùn)算符和運(yùn)算符之間沒有直接的路徑Path相連時,TensorFlowinter_op_parallelism_threads參數(shù)來控制數(shù)量的一個線程池。通常而言,intra_op_parallelism_threads設(shè)置為單個處理器的物理核心數(shù)量,而inter_op_parallelism_threads則設(shè)置為1或者2。NUMA特征來控制處理器計(jì)算資源的使用數(shù)據(jù)中心使用的服務(wù)器,通常都是配置兩顆或更多的處理器,NUMA處理器訪問它自己的本地存儲器的速度比非本地存儲器更快一些。為了在這樣的系統(tǒng)上獲取最好的計(jì)算性能,需要通過一些

AVX-512進(jìn)行優(yōu)化的二進(jìn)制文件,從而得到一個經(jīng)過優(yōu)化且與大多數(shù)現(xiàn)代(2011年后)處理器兼容的文件。參考文獻(xiàn):https://www.tensor?/guide/performance/overview?hl=zh_cn/zh-cn/articles/tensor?ow-optimizations-on-modern-intel-architecture更多英特爾?MKL-DNNU-Net基于英特爾?架構(gòu)優(yōu)化后的測試及通過以上四個方面的優(yōu)化,U-Net在基于英特爾?架構(gòu)的處理器平臺上的性能得到了顯著提升,測試結(jié)果如下圖所示7:

OpenVINOmo.py轉(zhuǎn)換成xml文件和bin文件命令如下:通過InferenceEngine來進(jìn)行模型推理命令如下:其中,做推理的代碼包含如下邏輯模塊:

DenseU-Net英特爾?DeepLearningBoost,英特爾?DLBoost)英特爾?至強(qiáng)?可擴(kuò)展處理器從第二代起,不僅以優(yōu)化的微架構(gòu)、更多的內(nèi)核及更快的內(nèi)存通道帶來了計(jì)算性能的提升,更?(VNNI指令集INT8INT8深度學(xué)習(xí)推理加速能力,這一能力U-Net圖像分割方法的執(zhí)行效率。英特爾?深度學(xué)習(xí)加速技術(shù)通過VNNI8位或16位低精度數(shù)值相乘,這對于需要執(zhí)行大量矩陣乘法的深度INT8推理特定指令來加以控制。Numactl就是用于控制進(jìn)程與共享存Linux系統(tǒng)中廣泛使用的計(jì)算資源控制方法。具體使用方法如下所示:圖2-1-4用NUMA特征來控制處理器計(jì)算資源的使用

99.50%優(yōu)化后處理時延大幅降低99.50%優(yōu)化后處理時延大幅降低0.274未優(yōu)化方案

1.000

準(zhǔn)確率

1.2001.0000.8000.6000.4000.2000.000

基于OpenVINO?工具套件的優(yōu)化結(jié)果時的圖像分割結(jié)果,最右列是通過?

75%9寬的減少,也加快了低數(shù)值精度運(yùn)算的速度,從而使系統(tǒng)整體性能獲得大幅提升。與以往的FP32模型相比,INT8模型具有更小的數(shù)值精度和動態(tài)范圍,因此在圖像切割等深度學(xué)習(xí)中采用INT8推理方式,需要著重解決計(jì)算執(zhí)行時的信息損失問題。一般地來講,INT8推理功能可以通過量化校準(zhǔn)的方式來形成待推理的INT8FP32在信息損失最小化的前提下轉(zhuǎn)INT8的目標(biāo)。上述指令表示的是test.py在執(zhí)行的時候只使用了處理器#CPU00-1940-59#CPU0對應(yīng)的近端內(nèi)存。優(yōu)化的為了使用戶在通用處理器平臺上進(jìn)行高效的AI針對眾多主流的深度學(xué)習(xí)開源框架進(jìn)行了大量的優(yōu)化,包括目TensorFlow。通過使用英特爾?MKL-DNN優(yōu)化的多種原語(Primitive),進(jìn)行了優(yōu)化。英特爾?是從的模型時?進(jìn)行編譯還可以創(chuàng)建針對英特爾?高級矢量擴(kuò)展指令集?2?

基于英特爾?架構(gòu)的處理器(包括英特爾?MKL-DNN)優(yōu)化圖2-1-5基于英特爾?架構(gòu)優(yōu)化前后性能對比OpenVINO工具套件英特爾?發(fā)行U-Net為滿足客戶在實(shí)際應(yīng)用場景中的需求,在上述結(jié)果的基礎(chǔ)上,OpenVINO工具套件英特爾?發(fā)行版(以下“OpenVINO?工具套件”)U-Net圖像切割方法實(shí)施了進(jìn)一步的優(yōu)化,具體優(yōu)化步驟如下:模型轉(zhuǎn)換Kerashdf5OpenVINO工具套件的輸入,需要先進(jìn)行格式轉(zhuǎn)換,操作命令如下:

套件優(yōu)化后生成的圖像分割結(jié)果,在準(zhǔn)確率上與未優(yōu)化時基本保持一致,但在推理速度上卻遠(yuǎn)高于未優(yōu)化時8。圖2-1-6基于OpenVINO?工具套件對U-Net的優(yōu)化結(jié)果*更多?

以圖像分析應(yīng)用為例,從高精度數(shù)值向低精度數(shù)據(jù)轉(zhuǎn)換,實(shí)際是一個邊計(jì)算邊縮減的過程。換言之,如何確認(rèn)縮減的范圍是FP32INT8采用根據(jù)數(shù)據(jù)集校準(zhǔn)的方式,來確定映射縮減的參數(shù)。在確定INT8操作列表,對圖形進(jìn)行分析并執(zhí)行量化/FP32有INT8)U8(INT8)的量化,反量化操作則執(zhí)行反向操作。OpenVINOFP32模INT8通常地,通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練好的模型是單精浮點(diǎn)精度的,即FP32,用戶可以將這樣的模型直接部署在實(shí)際應(yīng)用場景中,INT8模型在保證模型英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇17英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇167?至強(qiáng)?1482.40GH/20416GBDD42666MHz*1;?SC2BB480BIOSE5C620.86B.02.01.0008.03192019155CentOSLinux.;Linux3.10.0-95.21.3.el.x86_6gcc.PythonPython3.ensorFlowR1.13.1。

8?至強(qiáng)?1482.40GH/20416GBDD42666MHz*1;?固態(tài)盤SC2BB480BIOSE5C620.86B.02.01.0008.03192019155CentOSLinux.;Linux3.10.0-95.21.3.el.x86_6gcc4.8.PythonPython3.OpeVINO?2019RKera2.1.3。9https:en-usarticles/lowe-numerical-precision-deep-learning-inference-and-training精度的基礎(chǔ)之上可以提供效率更高的模型推理應(yīng)用,通常情況下模型精度的損失小于1%。OpenVINO2018R4FP32模型INT82019R1版本開始,支持基于第二代英特爾?至強(qiáng)?可擴(kuò)展處理器所集成的英特爾?學(xué)習(xí)加速技術(shù)。OpenVINO工具套件中的模型優(yōu)化器基本工作和部署流程為:首先工具套件會將訓(xùn)練好的、基于開放神經(jīng)網(wǎng)絡(luò)交換(OpenNeuralNetworkExchange,ONNX)訓(xùn)練的模型進(jìn)

如圖2-1-9所示,經(jīng)過優(yōu)化,模型的延遲有了大幅度的降低。1對對INT8進(jìn)行優(yōu)化后,處理時延進(jìn)一步降低0.4040.314FP32 INT8 INT81圖2-1-9優(yōu)化后的INT8模型時延性能對比

應(yīng)用案例東軟eStroke影像平臺背景醫(yī)療影像的快速和準(zhǔn)確判讀對醫(yī)院醫(yī)療技術(shù)能力有著一定的要求,同樣也需要專業(yè)的影像醫(yī)生進(jìn)行判讀,十分依賴醫(yī)生的判讀水平。為應(yīng)對這一挑戰(zhàn),醫(yī)療行業(yè)需要一種即便在基層醫(yī)院醫(yī)生判斷水平不足的情況下,仍然可以快速準(zhǔn)確地對相關(guān)醫(yī)學(xué)影像進(jìn)行分析的工具?,F(xiàn)在,基于深度學(xué)習(xí)的醫(yī)學(xué)影像判讀已經(jīng)逐步走入醫(yī)療機(jī)構(gòu),幫助應(yīng)對以上問題。UserApplication Run.XML.binInferenceEngine 行轉(zhuǎn)換和優(yōu)化,生成FP32格式的xml文件和bin文件,其的優(yōu)化包含節(jié)點(diǎn)融合、批量歸一化的去除和常量折疊等方法;然后,通過OpenVINO?工具套件中的轉(zhuǎn)換工具將FP32式的文件轉(zhuǎn)換為INT8格式的xmlUserApplication Run.XML.binInferenceEngine

INT8模型進(jìn)行逐層分析,可以看到相比之前已經(jīng)有了很明顯的提升。但在優(yōu)化之后的模型中,ConcatOps所占據(jù)的執(zhí)行時間還是較長。為了進(jìn)一步提升模型的吞吐量,需ConcatOps進(jìn)行特定優(yōu)化,并且不再使用英特爾?MKL-DNN中的原語,而是要進(jìn)行定制化,詳細(xì)代碼如下所示:

方案與成效eStroke影像平臺具有以下優(yōu)勢:?支持多模態(tài)影像學(xué)設(shè)備。其中包括電子計(jì)算機(jī)斷層掃描(Computed(MagneticResonanceImaging,MRI)16CT1.5TMRI;?實(shí)現(xiàn)全流程自動化。從醫(yī)院設(shè)備掃描序列開始到影像后處理分析,一直到輸出影像診斷報告,均無需人工干預(yù);

圖2-1-11通過TMAX&CBF異常區(qū)域計(jì)算出的病灶區(qū)域??MKL-DNN優(yōu)化)OpenVINO工具套件進(jìn)行了優(yōu)化,U-Net模型的深度學(xué)習(xí)推理在保證準(zhǔn)確性的同時,推理時間得以大幅減少。這對于爭分奪秒的腦卒中診治而言,無2-1-12所示,在推理準(zhǔn)確性基本一致的情況下,采用兩個工具優(yōu)化后的方案與未經(jīng)優(yōu)化的方案72.6%85.4%11。TainaModel TainaModelIR基于10與FP32與FP32相比,INT8處理時延更低0.404

上述優(yōu)化主要的目的是,實(shí)現(xiàn)并行化地批量拷貝數(shù)據(jù)到指定位置。通過此類型的優(yōu)化,模型性能有了進(jìn)一步的提升。此時的模型執(zhí)行時間基本達(dá)到了理想狀況,最終優(yōu)化結(jié)果如圖2-1-10所示:INT8INT8ConcatOps優(yōu)化后,處理時延進(jìn)一步降低0.4040.3140.147

?能夠接入互聯(lián)網(wǎng)醫(yī)療診治技術(shù)應(yīng)用研究平臺等外部診療系統(tǒng)。支撐開展遠(yuǎn)程急救、移動急救、高危人群智能預(yù)警及干預(yù)、疾病聯(lián)合救治、虛擬手術(shù)等技術(shù)研發(fā)和工程化。eStrokeeStroke臺對灌注成像的各個參數(shù),包括CBFCBVMTT所示,進(jìn)一步推理出用于醫(yī)學(xué)診斷的病灶所在區(qū)域。

1.000

準(zhǔn)確率

1.20099.50%優(yōu)化后處理時延大幅降低99.50%優(yōu)化后處理時延大幅降低0.2740.1460.8000.6000.4000.2000.000FP32

INT8

未優(yōu)化方案基于英特爾?架構(gòu)的處理器(包括英特爾?MKL-DNN)基于OpenVINO工具套件英特爾?發(fā)行版優(yōu)化圖2-1-8FP32與INT8的時延性能對比通過對兩種模型進(jìn)行性能分析可以看出,F(xiàn)P32模型中的重

FP32

INT8

INT8優(yōu)化1 INT8優(yōu)化2排序操作(ReorderOps)INT8(ResampleOps)FP32的操作,連接操作(ConcatOps)執(zhí)行時間過長,而本來占比最高的卷積操作(ConvolutionOps)在整個模型運(yùn)行中占據(jù)的時間比例反而少。因此,需對其進(jìn)行進(jìn)一步的優(yōu)化。

圖2-1-10進(jìn)一步優(yōu)化后的INT8模型時延性能對比從性能分析可以獲知,此時模型運(yùn)行占比最高的原語成了卷積操作,完全符合本實(shí)例中DenseU-Net模型本應(yīng)有的效果。英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇19英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇1810https:/latest_docs_MO_DG_Deep_Learning_Model_Optimize_DevGuide.html

11?至強(qiáng)?1482.40GH/20416GBDD42666MHz*1;?固態(tài)盤SC2BB480BIOSE5C620.86B.02.01.0008.03192019155CentOSLinux.;Linux3.10.0-95.21.3.el.x86_6gcc.ensorFlo&4.8.OpeVINPythonPython3.;ensorFlowR1.13.OpeVINO?2019RKera2.1.3。?AI背景與挑戰(zhàn)過去,醫(yī)生往往需要憑借經(jīng)驗(yàn)來對MRI影像進(jìn)行判讀,不僅費(fèi)時費(fèi)力,且錯誤率較高,在解釋圖像時也容易受到主觀因素的影響,導(dǎo)致漏診和誤診。AIAIAI能力真正應(yīng)用到醫(yī)療實(shí)踐中,還面臨著一系列的挑戰(zhàn)。首先,AI應(yīng)用對臨床診療帶來延遲。AI應(yīng)用需要與各類檢查AI推理具備高吞吐、低延AI的醫(yī)療系統(tǒng)服務(wù)更多患者。其次,AI并提高測量和診斷之間的一致性和準(zhǔn)確性。為此,西門子醫(yī)療與英特爾一起,基于通用處理器平臺來開MRIAI推理工作。雙方不僅利用深度學(xué)習(xí)的方法對來自MRIAI判讀研究,同時基于第二代英特爾?至強(qiáng)?可擴(kuò)展處理器以及OpenVINO工具套件等,進(jìn)行了優(yōu)化工作,使推理速度大幅提升,為臨床醫(yī)學(xué)診療提供了強(qiáng)有力的支撐。

方案簡介及實(shí)施效果在本案例中,西門子醫(yī)療與英特爾一起合作,優(yōu)化了基于第二代英特爾?至強(qiáng)?可擴(kuò)展處理器構(gòu)建的醫(yī)療檢測和量化模型。AIDenseU-Net,可對檢測對象進(jìn)行語義分割。AIMRI圖像的堆疊,輸出則是檢測對象的不同區(qū)域以及結(jié)構(gòu),其中每個結(jié)構(gòu)都會被顏色編碼。這樣可以將原先需要人工識別標(biāo)注的過程智能化,從而加快影像2-1-13所示。第二代英特爾?至強(qiáng)?AI模型的推理提供了?AI??訓(xùn)練模在本案例中,深度神經(jīng)網(wǎng)絡(luò)(例如DenseU-Net)經(jīng)過訓(xùn)練后被用以識別檢測對象區(qū)域,神經(jīng)網(wǎng)絡(luò)的權(quán)值通常采用浮點(diǎn)數(shù)值(FP32)來表示,因此模型通常情況下會通過FP32精度來進(jìn)行訓(xùn)練和推理。但I(xiàn)NT8同樣可以在損失很小的準(zhǔn)確率(通常<0.5%,本案例中可達(dá)到<0.001%)情況下來提升推理速度12。

通過英特爾?OpenVINO工具套件提FP32INT8的轉(zhuǎn)換工具,英特爾幫助西門子醫(yī)療實(shí)現(xiàn)了在保持準(zhǔn)確率的情況下,以更高的速度來進(jìn)行推理運(yùn)算的能2-1-14INT8模型前后輸出的圖像,可以直觀地看到,兩者的精度基本一致。ONNXoutput Input IEint8output圖2-1-14使用INT8模型前后的輸出精度對比從推理速度來看,該方案在基于第二代英特爾?至強(qiáng)?可擴(kuò)展處理器、英特爾?OpenVINO工具套件進(jìn)行優(yōu)化后,面向MRIAI分析能力得以大幅增強(qiáng)。一方面,MRI影像的處理速度獲得了顯著增強(qiáng),達(dá)到了200FPS(幀每秒)MRI在臨床上的近實(shí)時應(yīng)用開辟了可能;另一方面,優(yōu)化后的解決方案,在量化和執(zhí)行模型時,在幾乎沒有降低精度的情況下,性能可以提升到未優(yōu)化方案的13。

GE,優(yōu)化深度學(xué)習(xí)模型,提升CT圖像推理性能背景CT檢查是現(xiàn)代醫(yī)學(xué)中最常用的檢查手段之一。其通過X射線束對人體層面進(jìn)行掃描,并得到相關(guān)部位的斷面或立體圖像,從而發(fā)現(xiàn)人體的病變情況。CT檢查雖然有著極為重要的臨床意義,但CT切片圖像的檢查在傳統(tǒng)上往往依賴經(jīng)驗(yàn)豐富的醫(yī)生進(jìn)行人工讀片,不僅效率較低,且受醫(yī)生主觀性的影響也會帶來誤診、漏診?,F(xiàn)在,通用電氣醫(yī)療集團(tuán)(“GE醫(yī)療”)正利用深度CT切片圖像進(jìn)行分類和標(biāo)記,這更便于醫(yī)生2018年的醫(yī)學(xué)成像光學(xué)會議(SPIE)上,GE醫(yī)療發(fā)表了一篇關(guān)于基于AICTPython語言、TensorFlowKerasAI過與英特爾開展的深入技術(shù)合作,雙方正利用英特爾?至強(qiáng)?處理器、英特爾?深度學(xué)習(xí)部署工具Toolkit,英特爾?DLDT)CT推理的解決方案。方案與成效方案中引入了英特爾?DLDT來優(yōu)化深度學(xué)習(xí)模型,并在英特爾?至強(qiáng)?平臺上展現(xiàn)出更好的推理性能。英特爾?DLDT是OpenVINO?工具套件中,專門用于深度學(xué)習(xí)模型的推理加速部件。通過該工具,訓(xùn)練收斂的模型可以在多種英特爾?平臺上獲得更高的數(shù)據(jù)處理能力,以及更低的數(shù)據(jù)處理延時。其可以對多種主流深度學(xué)習(xí)開源框架訓(xùn)練好的模型進(jìn)行轉(zhuǎn)換和優(yōu)化,生成獨(dú)立于深度學(xué)習(xí)框架的bin文件和xml文件。其中bin文件用于存放深度學(xué)習(xí)模型的權(quán)重,以二進(jìn)制形式存儲,而xml文件則描述深度學(xué)習(xí)模型的網(wǎng)絡(luò)結(jié)構(gòu),二者結(jié)合起來共同解析模型。這使得模型的表征文件不依賴于任何深度學(xué)習(xí)框架,可以更方便地進(jìn)行部署。同時,在生成這兩個文件的過程中,還會對模型進(jìn)行常量折疊、Batch層融合、水平方向?qū)尤诤?、無效節(jié)點(diǎn)消除等模型優(yōu)化操作。檢查AI系統(tǒng)四個腔室的量化圖檢查AI系統(tǒng)四個腔室的量化英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇21英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇2012JournaloftheAmericanCollegeofCardiol英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇21英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇20

13?至強(qiáng)?82802.70GH/28/56;HOurbO;192GBDD4293?固態(tài)盤SC2G4BIOSE5C620.86B.02.01.0008.03192019155CentOSLinux.6.181Linux4.1.5-1.el.elrepo.x86_6gcc4.8.OpeVINO?2019RDenseU-Net。2-1-15所示,英特爾?DLDTGETensorFlow等框架訓(xùn)練得到的模型。深度學(xué)習(xí)訓(xùn)練框架深度學(xué)習(xí)訓(xùn)練框架訓(xùn)練模型基于英特爾?DLDT技術(shù)的模型優(yōu)化器GE醫(yī)療CTAI增強(qiáng)應(yīng)用基于邊緣的推理引擎優(yōu)化后模型英特爾?MKL-DNN實(shí)時數(shù)據(jù)英特爾?至強(qiáng)?處理器2-1-15部署有英特爾?DLDTGECTAI增強(qiáng)應(yīng)用利用英特爾?DLDT對模型進(jìn)行轉(zhuǎn)換和優(yōu)化后,可將優(yōu)化后的GECTAI增強(qiáng)應(yīng)用中,該應(yīng)用在英特爾?至強(qiáng)?處理器和英特爾?MKL-DNN的基礎(chǔ)上,構(gòu)建了基于邊緣的強(qiáng)大推理引擎。為了驗(yàn)證這一優(yōu)化方案的實(shí)際效能,雙方進(jìn)行了一系列的性能8,834CT掃描圖像。GE醫(yī)療希望在4個處理器核心的情況下,使推理引擎每秒可處理的圖像數(shù)量達(dá)到100張。測試結(jié)果顯示,在只啟動單核心的英特爾?至強(qiáng)?2650v414倍。同時,英特爾?至強(qiáng)?GE2-1-16所示,在使用了4個處理器核心后,推理引擎每秒可處理的圖像數(shù)量提升到了596張,近6倍于最初的期望值。14

■背景醫(yī)學(xué)上,可以通過超聲波、X光檢測、核磁共振成像以及其他醫(yī)學(xué)影像技術(shù)來進(jìn)行輔助診斷。前文也提到,影像的判讀需要醫(yī)生具有豐富的經(jīng)驗(yàn)以及橫跨多學(xué)科的知識儲備。擁有這些技能的醫(yī)生,即便在一些大型醫(yī)院也數(shù)量不足,而小型社區(qū)醫(yī)院或邊遠(yuǎn)地區(qū)醫(yī)療機(jī)構(gòu)則更為稀缺。同時,雖然醫(yī)療影像數(shù)量的增長與計(jì)算機(jī)圖像技術(shù)的成熟,推動了計(jì)算機(jī)醫(yī)療影像分析解決方案的出現(xiàn),但由于傳統(tǒng)圖像診斷支持系統(tǒng)的準(zhǔn)確率達(dá)不到人工識別的水平,所以醫(yī)生往往只會用其作為分析診斷前的單一篩查分類和預(yù)判斷。另外,由于缺乏統(tǒng)一的數(shù)據(jù)互聯(lián)互通標(biāo)準(zhǔn),在面對治療期內(nèi)同一患者由多位醫(yī)生診治的場景時,也會帶來溝通成本上升。為幫助醫(yī)療機(jī)構(gòu)獲得更具效能的智能化輔助診療平臺,作為以人工智能賦能分級診療和精準(zhǔn)醫(yī)療為使命的高新技術(shù)企業(yè),匯醫(yī)慧影與英特爾展開深入合作,通過引入OpenVINO工具套件以及其他先進(jìn)軟硬件產(chǎn)品,構(gòu)建基于深度學(xué)習(xí)方法的輔助診療解決方案(DrTuringAI),并已在一些疾病的早期篩查和診斷等應(yīng)用中,獲得了令人滿意的效果?!龇桨概c成效作為全新基于深度學(xué)習(xí)方法的智能圖像輔助診斷方法,Dr.TuringAI新方案可以運(yùn)用于病灶早期篩查和診斷的全流程,并以統(tǒng)一良好的數(shù)據(jù)連通性,幫助醫(yī)務(wù)人員提高圖像分析、診

圖2-1-17基于RetinaNet模型構(gòu)建的方案?工具套件中內(nèi)置的OpenVINO工具套件中的模型優(yōu)化器(ModelOptimizer)IR文件,并輸入推理引擎(InferenceEngine)中進(jìn)行推理,再利用其內(nèi)置的量化工具(CalibrationFP32模型量化為INT8類型來提高推理速度。2-1-18所示,采用OpenVINO?工具套件對FP32模型3.02OpenVINOINT88.24倍,0.17%15。

■背景在肺部疾病的臨床診斷工作中,CT影像不僅是重要的診斷依據(jù),也給擬定治療方案提供了關(guān)鍵信息。將AI引入智能輔助診斷,可以幫助醫(yī)療機(jī)構(gòu)有效應(yīng)對這一挑戰(zhàn)。為此,衛(wèi)寧健康科技集團(tuán)股份有限公司(以下簡稱:衛(wèi)寧健康)與英特爾和AMAX一起,基于深度學(xué)習(xí)方法,構(gòu)建了全新的智能輔助診斷系統(tǒng)。系統(tǒng)中的智能輔助診斷模型與放射信息管理系統(tǒng)(RadiologyInformationSystem,RIS)和影像歸檔和通信系統(tǒng)(PictureArchivingandCommunicationSystems,PACS)相互連通,可將相關(guān)影像學(xué)定量的表現(xiàn)插入RIS報告中,并通過三維智能重建,展現(xiàn)病理組織同周圍組織、血管的關(guān)系,能更有效地輔助醫(yī)生觀察疑似癥狀。為使系統(tǒng)具有更優(yōu)的部署和運(yùn)行效能,衛(wèi)寧健康選擇了基于第二代英特爾?至強(qiáng)?可擴(kuò)展處理器,以及內(nèi)置OpenVINO?工具套件的AMAX深度學(xué)習(xí)一體機(jī)做為基礎(chǔ)設(shè)施。新的處理器不僅擁有強(qiáng)大的通用計(jì)算能力,還集成了英特爾?AVX-512、英特爾?DLBoost等創(chuàng)新技術(shù),能夠很好兼顧通用計(jì)算能力和并行計(jì)算能力,為人工智能訓(xùn)練提供了卓越的性能。而OpenVINO?工具套件包含了大量由英特爾調(diào)優(yōu)和封裝的預(yù)訓(xùn)練模型,便于用戶直接調(diào)用。同時,用戶還可使用OpenVINO?模型轉(zhuǎn)換器進(jìn)行數(shù)值類型轉(zhuǎn)化來提升效率(詳見1.3.2節(jié)描述)。期望值 1核

5.964.053.011.482核心 3核心 44.053.011.48

斷、臨床檢測支持及疾病管理效率,顯現(xiàn)多項(xiàng)優(yōu)勢:影像分析更為準(zhǔn)確,并提供多種自動標(biāo)識能力;圖像輔助分析速度更快,提升醫(yī)生閱片效率;提供基于美國放射學(xué)會標(biāo)準(zhǔn)的結(jié)構(gòu)化圖像報告;可在病灶圖像報告和數(shù)據(jù)系統(tǒng)中自動更新患者信息。

9 8.24X3.02X13.02X176543210原始KerasFP32 引入OpenVINO?優(yōu)化FP32模型引入OpenVINO?優(yōu)化INT8模圖2-1-18OpenVINO?工具套件帶來的推理效率優(yōu)化

如圖2-1-19所示,在后續(xù)的分割、檢測、去假陽性這三種任務(wù)場景中的測試數(shù)據(jù)表明,OpenVINO?工具套件可將推理速度提升10-30倍16。圖2-1-16多核心帶來了推理性能的穩(wěn)步擴(kuò)展

的目標(biāo)檢測卷積網(wǎng)絡(luò)模型

英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇23英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇2214?至強(qiáng)?E5-2650v2.20GH/12/4;HOurbO;264G480GCentOSLinux.4.170Linux3.10.0-693.el.x86_6gcc4.8.;工作負(fù)載:包含了8,834個CT掃描圖像的數(shù)據(jù)集。

:docsaibuilders/huiying-medical-technology-optimizes-breast-cancer-early-screening-and-diagnosis-with-intel-ai-technologies.pd::雙路英特爾?至強(qiáng)?8268290GHz;/:2448;OpeVINO?2019R2。?至強(qiáng)?624018/36?固態(tài)盤D3-S451BIOSE5C20.86B.02.1.010.10202071ucode:0400002CentOSernel:5.6.4-1.el8.elrepo.x86_6Porcgcc.MKLDNNv0.20.FP335x3x96x512x513DU-NeLinuxPorc1.3.DefaultNumaOF1LinuxPorc1.3.)OptimiedNumaO36OpeVIN21.3.36。在傳統(tǒng)醫(yī)療信息系統(tǒng)中,醫(yī)院會將采集到的醫(yī)學(xué)影像暫存到圖再將處理結(jié)果返回到醫(yī)院的應(yīng)用軟件上,幫助醫(yī)生進(jìn)行疾病診2-1-20所示,在這一過程中,結(jié)果的反饋速度可能受到網(wǎng)絡(luò)因素以及推理速度的制約,影響診療效率。傳統(tǒng)影像處理方案傳統(tǒng)影像處理方案醫(yī)學(xué)影像采集 圖像倉庫云數(shù)據(jù)中心 診療應(yīng)用優(yōu)化影像處理方案傳輸優(yōu)化策略圖像倉庫醫(yī)學(xué)影像采集邊緣推理診療應(yīng)用圖2-1-20智能遠(yuǎn)程閱片新舊方案對比以下簡稱“致遠(yuǎn)?工具套件I推理能力,讓方案在邊緣側(cè)就完成模型的壓縮、加速和推理過程,降低網(wǎng)絡(luò)傳輸帶來的延遲。另一方面,在醫(yī)學(xué)影像分析場景常用的深度學(xué)習(xí)模型中,采用INT8等低精度定點(diǎn)計(jì)算方式,可以更高效地利用高速緩存,減少帶寬瓶頸,并更大限度地利用處理器計(jì)算資源,提升模型的推理速度。因此,致遠(yuǎn)慧圖充分運(yùn)用英特爾?架構(gòu)的處理器特性,借助OpenVINO?工具套件實(shí)施模型優(yōu)化。11O?工具套件會將訓(xùn)練好的模型假設(shè)使用提供的工具轉(zhuǎn)換為ONNXbin和xmlAnnotationConvert

ResNet34256*256OCTNORMAL、CNV、DME、DRUSEN四分類torch.onnxONNX格式的代碼示例如下:使用ModelOptimizer工具,生成IR文件命令如下:2-1-22IRFP32格式,包括resnet34.xmlresnet34.bin兩個文件。圖2-1-22使用ModelOptimizer工具生成的IR文件工具數(shù)據(jù)集&標(biāo)注Json格式torch.onnx ModelOptimizer工具 工具FP32模型 ONNX格式 IR工具數(shù)據(jù)集&標(biāo)注Json格式torch.onnx ModelOptimizer工具 工具FP32模型 ONNX格式 IR文件 模型量化 INT8模型Calibrate工具圖2-1-23數(shù)據(jù)集的組織格式

標(biāo)注轉(zhuǎn)化命令如下:轉(zhuǎn)化完成后,可以得到一個json文件:OpenVINOCalibrate工FP32INT8,來進(jìn)一步提升模型的推理速度。本文中采用的resnet34.yml中包括模型的定義和權(quán)重、模型的任務(wù)類型,以及使用的框架、使用的數(shù)據(jù)集等。文件如下所示:de?nition.ymllaunchers的框架和設(shè)備,以及各種accuracytop1評價指標(biāo)。文件如下所示:Calibrate工具量化命令如下:OpenVINOAI應(yīng)用能更充分挖掘基于英特爾?架構(gòu)的處理器的計(jì)算資源。INT8模型后,在基本不影響準(zhǔn)確率的情況下,推理速度能獲得顯著提升,有效地縮短了影像處理的響應(yīng)時間,能夠幫助醫(yī)療機(jī)構(gòu)提高診療效率。

小結(jié)醫(yī)療圖像分割、目標(biāo)檢測是AI應(yīng)用于醫(yī)療方向的重要分支。良好的圖像分割模型,能有效幫助醫(yī)療機(jī)構(gòu)提高醫(yī)學(xué)影像判讀效率,進(jìn)而增強(qiáng)臨床診療能力以及減少病患等待時間,彌補(bǔ)因醫(yī)療機(jī)構(gòu)影像科資源缺乏帶來的多種問題。AI在其他圖像處理領(lǐng)域的應(yīng)用不同,醫(yī)療領(lǐng)域的圖像分割對時效性要求更高,留給病患的黃金診療窗口往往只有數(shù)十分鐘。因此,如果圖像分割A(yù)I應(yīng)用的推理效率不夠高,就有可能延誤寶貴的搶救時間。來自多個行業(yè)、多個場?至強(qiáng)??至強(qiáng)?可擴(kuò)展處理器,以及英特爾?深度學(xué)習(xí)加速指令集、OpenVINO工具套件等產(chǎn)品和技術(shù),可以有效提升深度學(xué)習(xí)模型的推理效率?;诓粩鄤?chuàng)新的產(chǎn)品與技術(shù),英特爾也將AI應(yīng)用的創(chuàng)新和落地,使科技更好地服務(wù)于人們的健康生活。英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇25英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇24圖2-1-21借助OpenVINO?工具套件開展模型優(yōu)化醫(yī)療領(lǐng)域中的醫(yī)學(xué)影像分析

“云技術(shù)+大數(shù)據(jù)”在醫(yī)學(xué)影像分析中的應(yīng)用英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇I+英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇實(shí) 力戰(zhàn)篇26

醫(yī)學(xué)影像分析面臨挑戰(zhàn)眾所周知,高水平診療的前提,是對病情的準(zhǔn)確掌握和精準(zhǔn)分析。古時,醫(yī)技高明的大夫以望、聞、問、切來獲取和推斷病情。今天,通過各類醫(yī)療設(shè)備和信息系統(tǒng),尤其是醫(yī)學(xué)影像設(shè)目前,在大中型醫(yī)療機(jī)構(gòu)中,X光機(jī)、CT機(jī)、核磁共振等設(shè)備已逐漸普及,即便在基層醫(yī)療機(jī)構(gòu),患者也能進(jìn)行各類醫(yī)學(xué)影像檢查。不僅具備臨床醫(yī)學(xué)、醫(yī)學(xué)影像學(xué)等方面的專業(yè)知識,還必須熟練掌握放射學(xué)、CT、核磁共振、超聲學(xué)等相關(guān)技能,同時,還需具備運(yùn)用各種影像分析技術(shù)進(jìn)行疾病診斷的能力。因此,雖然醫(yī)學(xué)影像設(shè)備在醫(yī)療機(jī)構(gòu)已相當(dāng)普及,但在一些邊片”的尷尬境地。以一些省份為例,很多醫(yī)學(xué)影像設(shè)備已部署到縣、社區(qū)一級的醫(yī)療機(jī)構(gòu),但病人接受檢查后,當(dāng)?shù)蒯t(yī)院卻依然無法做出精準(zhǔn)的判斷和分析,需要將影像文件通過拍照、掃描等方式傳給上一級醫(yī)療機(jī)構(gòu)。有時會因?yàn)橛跋裎募馁|(zhì)量得不到保障乃至失真,造成病情的延誤或誤判。不僅如此,由于各醫(yī)療機(jī)構(gòu)的信息化系統(tǒng)彼此獨(dú)立,且數(shù)據(jù)標(biāo)準(zhǔn)未完全統(tǒng)一。例如各個PACS上存儲的醫(yī)學(xué)影像數(shù)據(jù)幾乎沒有連通,形成了一個個信息“孤島”,這些都會造成偏遠(yuǎn)地區(qū)患者在基層醫(yī)療機(jī)構(gòu)得不到有效的病情分析,長途奔波到大醫(yī)院后,卻還需要接受重復(fù)檢查的怪現(xiàn)象,存在引發(fā)醫(yī)患矛盾的風(fēng)險。

云計(jì)算技術(shù)的快速發(fā)展,讓信息孤島問題逐漸得以解決,如圖2-2-1所示,越來越多的醫(yī)療機(jī)構(gòu)開始將相關(guān)醫(yī)技設(shè)備及醫(yī)療服務(wù)過程都通過云的方式鏈接起來,并在其上構(gòu)建全醫(yī)技協(xié)同平臺、影像協(xié)同平臺等能力和應(yīng)用,以平臺即服務(wù)(PlatformasaService,PaaS)或軟件即服務(wù)(Softwareasaservice,SaaS)的方式滿足各層級醫(yī)療機(jī)構(gòu)的不同需求。以全醫(yī)技協(xié)同服務(wù)平臺為例,通過接入云服務(wù),各級醫(yī)療機(jī)構(gòu)能夠獲得跨終端、跨平臺的全醫(yī)技功能應(yīng)用。而影像協(xié)同平臺則能夠讓來自大、中型醫(yī)療機(jī)構(gòu)的醫(yī)學(xué)影像專家隨時隨地處理從不同地區(qū)傳來的影像數(shù)據(jù),并對疑難雜癥進(jìn)行協(xié)同會診,來實(shí)現(xiàn)醫(yī)療資源的高效共享。以醫(yī)學(xué)影像數(shù)據(jù)為例,基于云計(jì)算和大數(shù)據(jù)技術(shù)的互聯(lián)互通,不僅讓各醫(yī)療機(jī)構(gòu)可以規(guī)避過度檢查、重復(fù)治療等問題,還有力地打破了數(shù)據(jù)孤島現(xiàn)象,建立起無邊界醫(yī)療全連接,提高了醫(yī)療服務(wù)質(zhì)量。同時,通過影像數(shù)據(jù)的積累和分析,也讓基于AI的醫(yī)學(xué)影像分析應(yīng)用日趨走向成熟?,F(xiàn)在,基于云技術(shù)+AI的醫(yī)學(xué)影像分析已逐漸在各個醫(yī)療機(jī)構(gòu)獲得部署,并獲得良好反饋。基于AI的醫(yī)學(xué)影像分析通過云服務(wù)和大數(shù)據(jù)系統(tǒng)匯集的海量數(shù)據(jù),讓目標(biāo)偵測神經(jīng)網(wǎng)AIAI斷系統(tǒng)能夠更有效地幫助醫(yī)療機(jī)構(gòu)提升診療能力。現(xiàn)在,在醫(yī)學(xué)影像AI分析應(yīng)用中,部分醫(yī)療機(jī)構(gòu)正利用低劑量CT對病灶進(jìn)行智能化輔助診斷。實(shí)踐數(shù)據(jù)顯示,其定量的監(jiān)測敏感度(探測率)已達(dá)到95%,篩查時間也由人工所需英特爾中國醫(yī)療健康行業(yè)AI英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇27乳腺乳腺中心病理中心眼科中心齒科中心影像 超聲中心 中心介入中心...內(nèi)鏡 核醫(yī)學(xué) 人中心 中心 中心電 放療中心 中心圖2-2-1云服務(wù)將醫(yī)技設(shè)備聚合起來10多分鐘縮短到秒級17AI由醫(yī)生執(zhí)行進(jìn)一步診斷,效率和精準(zhǔn)度都獲得了大幅提升。AI分析應(yīng)用中,目標(biāo)偵測神經(jīng)網(wǎng)絡(luò)正被廣X光片、CT成像

軟硬件配置建議對于基于AI的醫(yī)療影像分析方案構(gòu)建,可以參考以下基于英特爾?架構(gòu)平臺的軟硬件配置來完成。

在英特爾?至強(qiáng)?可擴(kuò)展處理器平臺上,以單幅胸部Dicom至強(qiáng)?5倍。名稱 規(guī)格處理器名稱 規(guī)格處理器英特爾?至強(qiáng)?金牌6240處理器或更高超線程ON睿頻加速ON內(nèi)存16GBDDR42666MHz*12及以上存儲英特爾?固態(tài)盤D5P4320系列及以上操作系統(tǒng)CentOSLinux7.6或最新版本Linux核心3.10.0或最新版本編譯器GCC4.8.5或最新版本Ca?e版本?

使用Xbyakjust-in-time(JIT)為一種x86/x64JIT匯編程序,Xbyak對英特爾?架構(gòu)下的MMX技術(shù)、英特爾?流式單指令多數(shù)據(jù)擴(kuò)(Intel?StreamingSIMDExtensions,英特爾?SSE)英特爾?AVX等醫(yī)學(xué)影像進(jìn)行高效、準(zhǔn)確的病灶檢測。目標(biāo)偵測神經(jīng)網(wǎng)絡(luò)典型的目標(biāo)偵測神經(jīng)網(wǎng)絡(luò)有R-CNN、FastR-CNN、SPP-NET、R-FCN18等。R-FCN是近年來在醫(yī)學(xué)影像分析領(lǐng)域常見的目標(biāo)偵測神經(jīng)網(wǎng)絡(luò)模型。R-FCN2-2-2所示,首先,對需要處

100%19%面向英特爾?Ce11019%

面向英特爾?Ca?e1.1.6

面向英特爾?Ca?e在代碼實(shí)施過程中提高矢量化率;對和(OpenMP)進(jìn)行代碼矢量化。矢量化率的提高,有利于SIMD對代碼進(jìn)行矢量化處理,也能有效提升深度學(xué)習(xí)模型中池化層的性能。常規(guī)代碼優(yōu)化理的影像圖片進(jìn)行預(yù)處理操作后,送入一個預(yù)先訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)(CNN)ResNet-101網(wǎng)絡(luò)。在該網(wǎng)絡(luò)最后一個卷積層獲得的特征地圖(featuremap)3個1個分支是將特征地圖導(dǎo)入?yún)^(qū)域生成網(wǎng)絡(luò)(RegionProposal(RegionOf2個分支是在該特征地圖上獲得一個用于分類的多維位置敏感得分映射(position-sensitivescoremap)3個分支就是在該特征地圖上獲得一個用于回歸ROI池化操作(Position-SensitiveROIPooling),由此獲得對應(yīng)的類別和位置信息。RolsRolsconvper-RolconvconvRolsvotepoolfeaturemapsRPN圖2-2-2典型的R-FCN結(jié)構(gòu)與其他目標(biāo)偵測神經(jīng)網(wǎng)絡(luò)模型,例如FasterR-CNN相比,R-FCN具有檢測速度更快,檢測精度也更高等特點(diǎn)19。

優(yōu)化AI模型效率基于英特爾?架構(gòu)平臺的優(yōu)化包括英特爾?至強(qiáng)?可擴(kuò)展處理器、第二代英特爾?至強(qiáng)可擴(kuò)展處理器等在內(nèi)的英特爾?架構(gòu)平臺,不僅可為基于Cloud的智能醫(yī)療影像分析系統(tǒng)帶來強(qiáng)大的通用計(jì)算能力,更可為其提供亟需的并行計(jì)算能力。在深度學(xué)習(xí)模型的推理過程中,往往對并行計(jì)算能力有著較高要求,而英特爾?至強(qiáng)?可擴(kuò)展處理器通過引入英特爾?AVX-512,提供了更高效的單指令多數(shù)據(jù)流(SingleInstructionMultipleData,?英特爾?MKL)、英特爾?MKL-DNNAI模型的工作效率,其主要通過以下三個方面來提升人工智能模型性能:使用CacheBlocking對神經(jīng)網(wǎng)絡(luò)中的常用算子進(jìn)行并行化與向量化優(yōu)化;Winograd算法級優(yōu)化。而全新的第二代英特爾?至強(qiáng)?可擴(kuò)展處理器中加入的英特爾?INT8佳的性能表現(xiàn)。

圖2-2-3單幅胸部Dicom數(shù)據(jù)執(zhí)行R-FCN模型處理比較面向英特爾?架構(gòu)優(yōu)化的Ca?e?專門面向英特爾?架構(gòu)進(jìn)行了大量優(yōu)化,并加入了對英特爾???為了使英特爾?架構(gòu)處理器的計(jì)算資源得以充分利用,一般在執(zhí)行推理之前還可以進(jìn)行一些環(huán)境變量的設(shè)置,例如:這里OMP_NUM_THREADS是指定要使用的線程數(shù)。BLVCCa?e實(shí)施的性能分析,面向英特爾?架構(gòu)優(yōu)化Ca?e進(jìn)行了以下幾個方面的優(yōu)化。代碼矢量化優(yōu)化優(yōu)化內(nèi)容包括:將基本線性代數(shù)子程序(BLAS)庫從自動調(diào)優(yōu)線性代數(shù)系統(tǒng)(ATLAS)切換至英特爾?MKL-DNN,從而使通用矩陣乘法(GEMM)等優(yōu)化后,更適用于矢量化、多線程化的工作負(fù)載,并提高緩存量;

優(yōu)化內(nèi)容包括:降低編程復(fù)雜性;減少計(jì)算數(shù)量;展開循環(huán)。例如在代碼優(yōu)化過程中采用一些標(biāo)量優(yōu)化技巧,代碼如下:其代碼片段的第三行,關(guān)于h_im如下所示:■基于英特爾?架構(gòu)處理器的其他優(yōu)化措施優(yōu)化內(nèi)容包括:改進(jìn)im2col_cpu/col2im_cpu執(zhí)行效率,im2col_cpu函GEMMim2col_cpu實(shí)施BLVCCa?e代碼中英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇29英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇29英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇2818R-FCN相關(guān)技術(shù)描述,援引自JifengDai,YiLi,KaimingHeJianSun,R-FCN:ObjectDetectionviaRegion-basedFullyConvolutional/pdf/1605.06409v2.pdf19R-FCNJifengDai,YiLi,KaimingHeJianSun,R-FCN:ObjectDetectionviaRegion-basedFullyConvolutional/pdf/1605.06409v2.pdf

202019410路英特爾?至強(qiáng)?6148/40搭載192GB內(nèi)存(12slots/16GB/7.6,BIOS:SE5C620.86B.02.01.0008.031920191559(uncode:0x200005e),Kurnel版本,編譯器GCC4.8.5?MKL-DNN0.12?MKL-DNN0.18版本,?Ce11,對比組使用面向英特爾?Ce11.6.Minibch=1配置下完成。21該版本源代碼請?jiān)斠?BVLC/ca?e22該版本源代碼請?jiān)斠?intel/ca?e其中的四次算術(shù)運(yùn)算(兩次加法和兩次乘法),可替換為單次索引遞增運(yùn)算來提升運(yùn)算效率;降低歸一化批處理的復(fù)雜性;/系統(tǒng)的優(yōu)化方法;每個計(jì)算線程鎖定一個核心,避免線程移動,可設(shè)置如下環(huán)境變量來實(shí)現(xiàn)。通過緊密設(shè)置相鄰線程,可提高GEMM操作性能,因?yàn)樗芯€程都可共享相同的末級高速緩存(LLC),從而可將之前預(yù)取的緩存行重復(fù)用于數(shù)據(jù),提高效率。OpenMP實(shí)現(xiàn)代碼并行化OpenMPOpenMPparallel可以擴(kuò)展到兩個for-loop嵌套語句,再將批量迭代圖像和圖像通道兩個循環(huán)合并成一個循環(huán),并對該循環(huán)進(jìn)行并行化處理。通過一系列的優(yōu)化方法和技巧,面向英特爾?架構(gòu)優(yōu)化的Ca?eBLVCCa?e有了長足的提升。一項(xiàng)測試表明,面向英特爾?Ca?e,工作負(fù)載執(zhí)行時間可縮短至原來的10%,而整體執(zhí)行性能則提升到原來的10倍23。*更多面向英特爾?Ca?e的技術(shù)細(xì)節(jié),請參閱本手冊技術(shù)篇相關(guān)介紹。

AI,背景后分析能力上也參差不齊。同時,數(shù)據(jù)沒有互聯(lián)互通,也使醫(yī)療資源的利用效率難以通過資源共享得到有效提升。專注醫(yī)學(xué)20年的西安盈谷網(wǎng)絡(luò)科技有限公司(以下簡稱“西安盈谷”AI技術(shù)結(jié)合起來,形成高效、智能的醫(yī)療智能化輔助診斷能力,助力廣大醫(yī)療機(jī)構(gòu)提升診療效率及質(zhì)量。在西安盈谷看來,要解決醫(yī)學(xué)影像分析處理能力發(fā)展不均衡的AIAI兩大能力,來逐漸消除各級醫(yī)療機(jī)構(gòu)在醫(yī)學(xué)影像分析能力上的差異。為此,西安盈谷通過醫(yī)真云的部署,利用創(chuàng)新的醫(yī)技設(shè)備物聯(lián)CloudIDT服務(wù),在提高檢出率、降低決策時間、提高工作效率等多個方面都收效顯著。為幫助西安盈谷更好地推動這一系統(tǒng)的部署落地,英特爾為其提供了英特爾?至強(qiáng)?可擴(kuò)展處理器等最新一代平臺產(chǎn)品與CloudIDT?架構(gòu)平臺的遷移,以及對于Ca?eTensorFlow等深度學(xué)習(xí)框架的部署和優(yōu)化。通過雙方的協(xié)作和努力,全新的醫(yī)療智能化輔助診斷系統(tǒng)已經(jīng)在篩查時間、準(zhǔn)確率等多個指標(biāo)維度上獲得了用戶的一致好評。

方案與成效在新方案中,一方面,西安盈谷基于目標(biāo)偵測神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了一系列醫(yī)學(xué)影像分析處理應(yīng)用,并采用英特爾?架構(gòu)處理CloudIDT@iMAGES核心圖2-2-4云端PET-CT融合如圖2-2-4所示,結(jié)合基于英特爾?架構(gòu)的處理器提供的強(qiáng)勁算力,以及@iMAGES核心引擎提供的基于云端的強(qiáng)大正電子發(fā)射計(jì)算機(jī)斷層顯像(PositronEmissionTomographyCT,PET-CT)融合能力,不僅能夠提供基于形態(tài)學(xué)和功能的“熱力圖”,還可以對影像做出半定量化的標(biāo)準(zhǔn)化攝取值(StandardUptakeValueSUV)分析,而這些影像又可通CloudIDT智能系統(tǒng)中的R-FCN目標(biāo)偵測神經(jīng)網(wǎng)絡(luò),進(jìn)一步執(zhí)行疾病的鑒別和定量分析。在出色的硬件性能基礎(chǔ)上,英特爾還通過對Ca?e、TensorFlow等人工智能框架的優(yōu)化,進(jìn)一步提升了西安盈谷CloudIDT智能系統(tǒng)的執(zhí)行效率。通過對R-FCN模型的優(yōu)化,模型裁剪融合帶來了近30%的性能提升,而進(jìn)一步優(yōu)化OpenMP多線程實(shí)現(xiàn)方案后,性能再度提升40-50%24。此外,英特爾?至強(qiáng)?可擴(kuò)展處理器在通用計(jì)算能力和并行計(jì)算能力兩方面的算力支撐,也可助力智能系統(tǒng)將原先分散在不同平臺的任務(wù)處理,例如數(shù)據(jù)統(tǒng)計(jì)與模型推理,合并到一起,進(jìn)而讓用戶不僅能在其私有云中部署更多的虛擬機(jī),還能降低總擁有成本(TotalCostofOwnership,TCO)。

小結(jié)以數(shù)據(jù)驅(qū)動醫(yī)療信息化的美好明天,是英特爾與西安盈谷等合作伙伴的共同心愿?;谠朴?jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)以及AI等技術(shù)領(lǐng)域,針對醫(yī)療信息化、智能化的應(yīng)用目前已經(jīng)得到了廣泛的開展和探索,并在醫(yī)學(xué)影像數(shù)據(jù)實(shí)時計(jì)算展現(xiàn)、醫(yī)學(xué)視覺類數(shù)據(jù)人工智能研究等多個方面都獲得了突破,在各個醫(yī)療機(jī)構(gòu)的實(shí)際部署和實(shí)施中都獲得了良好的反饋。AI框架在基于英特爾?架構(gòu)的平臺上的潛?Ca?eOpenMP并行BLVCCa?e獲得巨大提CloudIDT智能應(yīng)用、醫(yī)學(xué)影像處理及分@iMAGES核心引擎等應(yīng)用結(jié)合后,已在一大批關(guān)“AI+Cloud”第二代英特爾?至強(qiáng)?可擴(kuò)展處理器、英特爾?傲騰持久內(nèi)存等英特爾技術(shù)與產(chǎn)品的涌現(xiàn),相信基于英特爾?架構(gòu)平臺構(gòu)建的醫(yī)療影像分析解決方案會輸出更強(qiáng)大的性能表現(xiàn)以及更高AI能力。未來,英特爾還計(jì)劃與更多合作伙伴繼續(xù)深入開展合作,將更多、更先進(jìn)的產(chǎn)品與技術(shù)與醫(yī)療信息化進(jìn)程結(jié)合起來,推動精準(zhǔn)醫(yī)療、智慧醫(yī)療的前行,讓信息化、數(shù)字化和智能化更有效地提升醫(yī)療服務(wù)水平,為患者帶去更舒心和貼心的醫(yī)療健康服務(wù)。英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇31英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇31英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇30《Ca?e*OptimizedforIntel?Architecture:ApplyingModernCodeTechniques》:/en-us/articles/ca?e-optimized-for-intel-architecture-applying-modern-code-techniques。

24??;??Sx?e。英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇32英特爾中國醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊實(shí)戰(zhàn)篇32實(shí)戰(zhàn)篇32

醫(yī)療領(lǐng)域中的病理切片分析傳統(tǒng)病理切片分析方法面臨挑戰(zhàn)病理切片是將部分病變組織或臟器,經(jīng)過一系列處理后形成微病理科醫(yī)生通過顯微鏡對病理切片進(jìn)行鏡檢,觀察病理變化,并作出病理診斷和預(yù)后評估。病理切片檢查是一項(xiàng)非常復(fù)雜和具有挑戰(zhàn)性的工作,而想要成為病理學(xué)方面的專家,更是需要具備多年的讀片經(jīng)驗(yàn)與數(shù)萬張切片的閱片積累以及具有豐富專業(yè)知識。然而,據(jù)統(tǒng)計(jì),目前全國病理科醫(yī)生還不足萬人25。此外,人工檢查不免帶有較大主觀性,由不同病理科醫(yī)生對同一患者的病理切片作出的診斷,也經(jīng)常會存在差異,這可能導(dǎo)致誤診、漏診等現(xiàn)象產(chǎn)生。同時,在實(shí)際的病理切片檢查中,40倍的放大倍數(shù)進(jìn)行數(shù)字化后,單個病理切片的像素點(diǎn)可能超過百萬像素。病理科醫(yī)生需要連續(xù)觀察多不僅費(fèi)時費(fèi)力,還容易出現(xiàn)錯漏。且較長的閱片時間也會導(dǎo)致病患等待時間長,有可能會造成病情的延誤?;贏I的病理切片分析方法隨著基于AI的圖像處理與分析技術(shù)獲得巨大進(jìn)步,各個醫(yī)療機(jī)構(gòu)均不遺余力地開展了基于深度學(xué)習(xí)或機(jī)器學(xué)習(xí)的病理切片分析方法,并取得了良好的成效。例如通過ResNet50網(wǎng)絡(luò)進(jìn)行的深度學(xué)習(xí)模型訓(xùn)練,可用于執(zhí)行高危病的病理組織辨識工作。盡管其得到的病灶預(yù)測熱學(xué)圖依然存在噪聲等問題,但已經(jīng)可以像病理科醫(yī)生一樣,以不同的放大倍數(shù)來檢查病理切片圖像。實(shí)驗(yàn)表明,醫(yī)療機(jī)構(gòu)有可能通過訓(xùn)練一個深度網(wǎng)絡(luò)模型,使其不僅能夠具備專業(yè)的檢測技術(shù),還能有超快的檢測速度和無限的工作時間。來自紐約大學(xué)的一項(xiàng)最新研究成果表明,利用大量數(shù)字化病理切片圖像訓(xùn)練的Inceptionv3深度學(xué)習(xí)模型,識別病灶組織和正常組織的準(zhǔn)確率已達(dá)到99%26?,F(xiàn)在,基于CNN的分類算法以及目標(biāo)偵測算法都已經(jīng)獲得了長足的發(fā)展。作為深度學(xué)習(xí)的代表方法之一,CNN的典型代表,例如LeNet、ZFNet、VGGNet和ResNet等,已經(jīng)被廣泛地運(yùn)用于圖像分類、目標(biāo)定位和圖像分析等領(lǐng)域。

分類卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)療圖像的檢測結(jié)果中,往往會出現(xiàn)明顯的分類情況,例如陰性為正常,陽性為非正常??梢钥闯?,此時檢測所期望01,這就構(gòu)成了一個能夠有效幫助醫(yī)療機(jī)構(gòu)先初步、定性地篩選出有問題的區(qū)域或組織,然后再進(jìn)行定量的分析和判讀。典型的二分類算法,如邏輯回歸,是一種廣義的線性回歸分析模型。以根據(jù)病理切片圖片來預(yù)測患者是否患病為例,假設(shè)隨x個即可判定患病,xy=年齡(n)*a+初始值(b),y>=x時,判為患病。而在實(shí)際場景中,這一函數(shù)會復(fù)雜得多,例如除了年齡以外,異常細(xì)胞的大小、狀態(tài)等也可能成為判斷依據(jù),此時,線性函數(shù)就會變成一個多元線性函數(shù),例如y=n*a+m*c+o*d……+b如前所述,分類問題需要輸出一系列離散的結(jié)果,因此需要在線性函數(shù)上加上一個激活函數(shù),使其輸出結(jié)果呈離散化。而對于神經(jīng)網(wǎng)絡(luò)而言,激活函數(shù)的作用是能夠給神經(jīng)網(wǎng)絡(luò)加入一些非線性因素,使神經(jīng)網(wǎng)絡(luò)可以更好地解決較為復(fù)雜的問題。常Sigmoid函數(shù)、tanh函數(shù)、ReLU函數(shù)等。另外,邏輯回歸會采用梯度下降迭代求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論