GPU技術(shù)大會資料_第1頁
GPU技術(shù)大會資料_第2頁
GPU技術(shù)大會資料_第3頁
GPU技術(shù)大會資料_第4頁
GPU技術(shù)大會資料_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

#2011年英偉達GPU技術(shù)大會亞洲站簡介本次大會是英偉達GPU技術(shù)大會(GTC)全球系列活動中的下一場重要盛會。大會將聚焦GPU計算在科學、學術(shù)界以及商業(yè)領(lǐng)域中促成的最新進步與研究項目。它不僅能夠讓人們更加深入地認識高性能計算,而且能夠?qū)⑦@些使用GPU解決重大計算難題的科學家、工程師、研究員以及開發(fā)者聯(lián)系在一起。此前英偉達在以色列、日本、新加坡以及臺灣等地舉辦了多場GTC盛會,吸引了數(shù)以千計各行各業(yè)以及各個學科的與會者。在這些GTC盛會成功經(jīng)驗的基礎(chǔ)之上,GPU技術(shù)大會亞洲站將于12月14-15日在北京國家會議中心舉行。為期兩天的GPU技術(shù)大會亞洲站,旨在分享GPU給科學和計算帶來的變革性的影響。在兩天的繁忙日程大會中,英偉達?(NVIDIA?)首席執(zhí)行官兼聯(lián)合創(chuàng)始人黃仁勛將發(fā)表主題演講,為大家介紹英偉達最新的GPU計算技術(shù)以及未來愿景。期間還將包括主題演講、圓桌討論會、展示會、新興企業(yè)峰會、學術(shù)海報、專題報告以及60場以上的講習會,專門面向利用GPU處理復雜計算難題的開發(fā)商、程序員以及研究科學家。在GPU技術(shù)大會亞洲站上,來自頂尖科學研究機構(gòu)的科學家們將參與到一系列演講、技術(shù)分享會、輔導課程、小組論壇和圓桌討論會中。他們旨在向與會者分享GPU如何改變高性能計算(HPC)行業(yè)以及GPU如何幫助加速解決學者、研究人員、科學家以及開發(fā)者所面臨的復雜計算難題。活動期間還將召開兩場重要的研討會。億億次級(Exascale)研討會將由東京工業(yè)大學、中國科學院過程工程研究所、瑞士國家超級計算中心以及英偉達聯(lián)合主講;GPU加速基因組研討會將匯集來自北京基因組研究所(BGI)、南開大學、德國美因茨大學以及上海交通大學等機構(gòu)的著名科學家。除了主題演講和教育性會議以外,還有新興企業(yè)與技術(shù)峰會以及英偉達?CUDA?學生研討會。在峰會上,大有前景的企業(yè)將與大家分享可改變當今計算機行業(yè)面貌的最新技術(shù)。在英偉達?CUDA?學生研討會上,你會發(fā)現(xiàn)高性能計算領(lǐng)域的明日之星。GPU技術(shù)大會亞洲站的亮點如下:億億次級(Exascale)計算研討會針對生物醫(yī)學以及生物信息學的并行計算會議展示GPU在加速石油勘探中發(fā)揮重要作用的會議中科院過程工程研究所葛蔚教授表示:“億億次級計算是我們要逾越的下一道鴻溝,只有這樣,將來才能夠在幾乎所有科學領(lǐng)域中實現(xiàn)進步。想要實現(xiàn)這一有價值的目標,必須依靠全球協(xié)作來將所需的計算性能推向更高的高度。GPU技術(shù)大會讓重要的研究員、學術(shù)專家以及技術(shù)專家齊聚一堂,有助于令這一目標成為現(xiàn)實?!比A大基因高性能計算應用性能優(yōu)化主管王丙強先生指出“在基因組學領(lǐng)域中,GPU計算有潛力大幅加快創(chuàng)新節(jié)奏以及擴大創(chuàng)新范圍。從遺傳作圖到DNA定序,如果應用到最新研究項目上的性能提升一個數(shù)量級,那么將讓研究員與科學家能夠?qū)崿F(xiàn)迄今為止不可能實現(xiàn)的新一代突破?!盙PU技術(shù)大會亞洲站將吸引整個GPU計算生態(tài)系統(tǒng)的專家與創(chuàng)新人員,其中包括利用GPU解決計算難題的工程師、研究員和開發(fā)人員以及實現(xiàn)這種創(chuàng)新的解決方案供應商。大會涵蓋的研究領(lǐng)域包括:計算研究、超級計算、能源勘探、氣候與天氣、核能替代能源、數(shù)據(jù)分析與金融、航天自動化設(shè)計以及生命科學。在大會上發(fā)表演講的機構(gòu)和企業(yè)包括:華大基因中國科學院過程工程研究所惠普實驗室(HPLabs)A哈佛大學德國約翰內(nèi)斯古滕博格美因茨大學(JohannesGutenbergUniversityMainz)美國橡樹嶺國家實驗室(OakRidgeNationalLaboratory)南開大學國家超級計算應用中心(NCSA)斯倫貝謝公司上海交通大學瑞士國家超級計算中心,蘇黎世理工學院(SwissNationalSupercomputingCenter,ETHZurich)東京工業(yè)大學(TokyoInstituteofTechnology)清華大學微電子學研究所大會期間,所有技術(shù)分享會和主題演講都將配備中、英文的同聲傳譯。GPU技術(shù)大會亞洲站的贊助商包括戴爾、惠普、聯(lián)想、Supermicro、華碩、CAPS、Hynix、麗臺、浪潮、ThePortlandGroup(PGI)、Mathworks、常州庫達科技發(fā)展有限公司、吉浦迅科技和北京金捷諾科技有限公司等。如需了解GPU技術(shù)大會亞洲站日程安排的更多信息,敬請訪問或/page/home-en.html大會日程安排E:U:9:U.9:3010:00I..ii-ctiunii2;oa憎卸i^aai3;3avrr^:3ZiS:Q:15:3:1£:03-5.3Z'7.0:'7.31=.0:-3.3Z'j.Q:11:00^12:00開幕演講9:30-11:00杜交午髦風震覽12:00-14:00iSCHDAT疔專題演講瑪尾酒會

屣題海報展云

15:00-19:3&2011年12月15日-辛于裝心"、珈巒懣吊柱到豎記0:00-9:00社交年餐涇務顎12:00^14:0014:001530大會議程GPU技術(shù)大會讓全世界的人們不僅能夠更加深入地了解高性能計算,而且可以認識到高性能計算在科學發(fā)展、可視化以及技術(shù)創(chuàng)新等方面的重要性。GPU技術(shù)大會亞洲站包含技術(shù)討論會、專題報告會以及研討會等世界級教育性內(nèi)容,讓來自各行各業(yè)的思想領(lǐng)袖能夠齊聚一堂、相互交流。議程包括:>算法與數(shù)值技術(shù)天文學與天體物理學生物信息學>氣候與天氣建模集群管理>計算流體力學計算物理學>計算結(jié)構(gòu)力學數(shù)據(jù)庫、數(shù)據(jù)挖掘、商業(yè)情報開發(fā)工具與庫電氣設(shè)計與分析能源勘探生命科學A并行編程語言超級計算目前已經(jīng)確認出席大會的公司/機構(gòu)有華犬基因北京大學CAPS長安大學中國氣象局中國科學院過程物理研究所中國科學院軟件所哈佛大學惠普實驗室美因茨大學徽軟公司臺灣丈學英諱達公司上海汽車集團股份有■限公司上海交通大學華南理工大學Portland集團清華大學東京工業(yè)犬學美國威斯康星大學西方地球物理公司請了解如下不斷壯大的已確認的演講嘉賓隊伍開慕演講黃仁勛先生將作大會發(fā)言不要錯過這個由英偉達公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官黃仁勛先生以及特邀嘉賓帶來的精彩的大會開幕式演講。了解GPU計算的未來,并預覽來自各行業(yè)的顛覆性技術(shù)和精彩演示。黃仁勛簡介美籍華人,出生臺北。1993年創(chuàng)辦NVIDIA今天全球最大顯卡芯片廠商之一。2001年黃仁勛在《財富》“40歲以下最富40人”排名第12位,位列在籃球明星喬丹之前。黃仁勛為人不張揚,國內(nèi)很少有人知道這位杰出華人的成功之路。其實他的成績已經(jīng)足夠與王安、王嘉廉和楊致遠等華人IT精英并駕齊驅(qū)。百億億次級(Exascale)計算主題演講高效百億億次級(Exascale)計算研討會本次研討會將由英偉達公司Tesla首席技術(shù)官史蒂夫斯科特(SteveScott)先生主持。在這次研討會上,與會者將討論未來的超級計算和相關(guān)的可擴展科學應用。加入我們,與來自亞洲,美國和歐洲等世界領(lǐng)先的計算科學家分享他們在百億億次級(Exascale)計算方面的計劃,見解及豐碩成果。TSUBAME2?0超級計算機上千萬億次級的生物流體模擬SimoneMelchionna,研究員,意大利國家研究理事會本講座中,我們將呈現(xiàn)對真實的生物流體現(xiàn)象的多尺度模擬的計算框架。這種模擬涉及到數(shù)以億計的細胞相互作用并與周圍的流體組成懸浮。我們采用的方法被用來模擬人類冠狀動脈的血流,其空間分辨率可與紅血細胞的大小相媲美。在配備有4,000顆英偉達(NVIDIA)M2050GPU集群的TSUBAME2.0超級計算機上,我們的模擬表現(xiàn)出了出色的可擴展性,并達到接近1千萬億次的總性能,這代表了對具臨床意義的生物流體演變現(xiàn)象的預測能力。同時我們也將介紹用來實現(xiàn)以上這些結(jié)果的新穎的數(shù)學模型,計算算法,硬件技術(shù),代碼調(diào)整和優(yōu)化。化學工程中,從自由基到反應器的跨規(guī)模超級計算葛蔚教授,中國科學院過程工程研究所化學工程的基本挑戰(zhàn)之一是從確立化學產(chǎn)品特性的分子結(jié)構(gòu),到生產(chǎn)這些化學產(chǎn)品的反應器或設(shè)備間存在巨大的差異。這個差異是從10-10m和10-15S到101m和103s的數(shù)量級的差異,有時甚至更大。Exascale系統(tǒng)的超級計算能力提供了鏈接所有這些尺度的一個獨特機會。舉例說明,物理模型和數(shù)學模型的協(xié)同設(shè)計,以及計算機軟件和硬件的設(shè)計,已經(jīng)能讓要求嚴格的分子動力學(MD)模擬在三個維度的微米級達到真正petaflops級的持續(xù)性能表現(xiàn)。例如,使用1,728顆GPU的Mole-8.5系統(tǒng),能在每天0.77納秒的速度下模擬由300萬個原子或自由基水溶液組成的一個完整的流感病毒粒子H1N1。當天河-1A系統(tǒng)使用其所有CPU和GPU時,可以petaflops(千萬億次浮點運算)速度模擬超過100億元的原子組成的晶體硅。在這些例子中,我們可以建立通用的軟件和硬件平臺來進行離散模擬,為化學工程中,尤其是涉及到令人驚嘆的納米和微觀尺度結(jié)構(gòu)的跨尺度模擬提供一個功能強大的工具。GPU正在超級計算領(lǐng)域掀起革命Wen-MeiHwu教授,美國伊利諾伊大學厄巴納-香檳分校在世界上所有頂級超級計算機的設(shè)計中,功耗已成為一大制約因素。我們已經(jīng)看到大量記錄表明,利用GPU的集群比傳統(tǒng)的僅用CPU集群,能達到高得多的每瓦性能。因此,越來越多的世界頂級超級計算機目前在使用GPU。這一變化需要超級計算機應用程序開發(fā)也進行一個重大轉(zhuǎn)變。在過去,超級計算機應用程序開發(fā)的重點主要集中在越來越多的節(jié)點上的分區(qū)工作,使每個節(jié)點的執(zhí)行保持順序進行。隨著超級計算機向GPU的轉(zhuǎn)變,應用程序必須支持每個節(jié)點內(nèi)大量高精度的并行執(zhí)行。這需要新的物理模型,數(shù)值算法,基本庫,編程環(huán)境和編程技術(shù)。一個主要的挑戰(zhàn)是實現(xiàn)未來的可擴展性:這些應用程序必須能夠在未來的硬件并行性和數(shù)據(jù)規(guī)模上有效縮放。否則這些投資將在短短幾年內(nèi)失去價值。在這次講座中,胡教授將會討論以上課題的最新進展,給科學和工程研究帶來的影響,以及未來的研究機會。他將會以實際應用中的案例研究來說明所涉及的工作和其影響的深度。Tsubame2.0:滿負荷運行具有4,000顆GPU的超級計算機SatoshiMatsuoka教授,東京工業(yè)大學全球科學信息與計算中心Tsubame2.0自2011年11月1日投入使用以來,一直處于滿負荷生產(chǎn)而且很少中斷運行。我們遇到的諸多挑戰(zhàn)中包括實現(xiàn)機器的穩(wěn)定性,使成千上萬的GPU達到最高性能,以及制定滿足2000個多種用戶的調(diào)度模型。其中最大的挑戰(zhàn)之一,是應對福島災難后的大幅度電力短缺,這要求Tsubame2能在遵守國家的峰值功率守恒的硬性規(guī)定時,同時滿足用戶的計算任務。TSUBAME2.0獲得的榮譽涵蓋大量的應用程序和系統(tǒng)研究成果,包括在SC11(超級計算峰會2011)入圍的兩個戈登貝爾獎。這為我們未來幾年內(nèi)努力實現(xiàn)exascale提供了寶貴的經(jīng)驗。CAE/CFD主題演講以連續(xù)離散方法實時模擬仿真氣固煥發(fā)葛蔚教授,中國科學院過程工程研究所目前,主流的氣固兩相流模擬方法是假設(shè)氣相和固相都是連續(xù)的,這樣可以節(jié)約計算成本。然而,固相的內(nèi)在離散性卻并不容易獲得這一連續(xù)性假設(shè)。另一方面,固相的直接離散形式雖然較為合理和簡單,卻遠遠超出了目前的計算技術(shù)的能力。近年來,粗粒度(CG)的離散模型為產(chǎn)業(yè)級規(guī)模的離散型固相模擬提供了可行性方案。在高度并行的單指令多數(shù)據(jù)(SIMD)模式下,計算顆粒的演變能充分展示附著性的本地的運算,而這類運算最適合使用如GPU的多核處理器來進行。氣體的流動則可以有以下幾種模擬方法來解決:傳統(tǒng)的有限差分(FD),有限體積(FV)的方法,或LBM的方法。模擬尺度與在粒子的規(guī)模相比或高或低,分別適合CPU或GPU。我們將在講座中介紹在中國科學院過程工程研究所使用Mole-8.5系統(tǒng)對氣-固系統(tǒng)進行的準實時仿真實驗,并探討在近期實現(xiàn)實時仿真的可能性。利用GPU進行儲層流動的多尺度離散模擬XiaoweiWang,中國科學院過程工程研究所本報告介紹了與石油采收率相關(guān)的兩部分的研究:在縫洞型儲層中進行流體的多尺度模擬,以及在規(guī)??锥嗫捉橘|(zhì)流動的流體直接模擬。因為有大尺寸的裂縫和洞穴之間的差距,在縫洞儲層的復雜流動有多尺度的特點。通過微觀尺度模擬兩相在不同類型單一的斷層和洞穴相結(jié)合的流量,我們可以探索水油混溶位移機制。隨著多尺度耦合方法,我們可以對工程級規(guī)模的注水操作進行模擬。我們還對孔隙大規(guī)模流動進行直接模擬,對一系列巖石樣本計算了透氣性和相對滲透率。這些模擬結(jié)果與實驗結(jié)果一致,對于油藏的開發(fā)是非常有價值的方法。所有上述模擬都應用了GPU,效果顯著。從沙動力學到坦克動力學:使用GPU計算,推進創(chuàng)新的步伐,改進機械工程設(shè)計DanNegrut,美國威斯康星大學本講座將探討CPU/GPU異構(gòu)計算的使用,采用了自主開發(fā)的異構(gòu)計算模板(HCT)進行基于物理的機械系統(tǒng)模擬。異構(gòu)計算模板包括五大部件:先進的基于物理的建模技巧(生成相關(guān)的物理方程式);算法支持(解算這些方程式);接近度計算(大部分為碰撞檢測);區(qū)域分解/數(shù)據(jù)交換(針對多節(jié)點分布式CPU/GPU計算);以及后期處理/可視化。這五大部件構(gòu)成了一個計算框架,能夠分析很多不同類型的具有成百上千萬交互元素的機械系統(tǒng)示例應用程序包括砂粒地形模擬、履帶車和輪式車移動性研究(坦克、火星登陸器等)、流固耦合分析以及非線性有限元分析。Particleworks:基于粒子方法的CAE軟件在GPU上全面實施YoshiakiHanada,ShinyaKitaoka,Prometech軟件公司在這個講座里,我們將介紹在應用軟件Particleworks中GPU的完整的實現(xiàn)。Particleworks是一個基于粒子方法的流體CAE仿真工具。我們將提供性能測試結(jié)果,并與基與CPU執(zhí)行的案例進行比較。這些案例均來自于具有行業(yè)規(guī)模的Particleworks用戶。在日本,Prometech軟件公司一直通過和日本各大汽車公司以及材料公司合作,不斷發(fā)展Particleworks。Particleworks提供全方位的解決方案,包括牛頓和非牛頓流體的解決方案,來解決粘度,湍流,表面張力,傳熱和其他一些流體流動的數(shù)量。本演講將描述一個基于粒子模擬的基本理論,以及利用GPU發(fā)展優(yōu)化Particleworks,并解決潛在的性能瓶頸。在基于GPU的超級計算機上進行2.0petaflops的有限差分應用TakayukiAoki,東京工業(yè)大學全球科學信息與計算中心自2010年11月起,在東京工業(yè)大學已經(jīng)開始在具有4,224顆NVIDIATeslaM2050GPU的多GPU的超級計算機TSUBAME2.0上進行幾個大型有限差分的應用開發(fā)和運行。高性能的內(nèi)存訪問可以通過主板內(nèi)存實現(xiàn),定期結(jié)構(gòu)網(wǎng)格的有限差分計算非常適合GPU計算。在一個顯式時間積分中,我們引用了一項技術(shù),使GPU到GPU與計算的通信與大規(guī)模的應用重迭,以達到隱藏通信開銷的目的。為樹突狀固化的Al-Si二元合金進行相場模擬運行。在我們的最高配置4,096x6,500x10,400下,配有4,000顆GPU及16,000顆CPU的TSUBAME2.0達到了單精度2.0petaflops的運算速度。持續(xù)模擬性能已達到45%的峰值性能。我們也將展示用氣液兩相流以及LatticeBoltzmann方法的結(jié)果。應用在非結(jié)構(gòu)化網(wǎng)格上的快速,可擴展高階可壓縮流求解器PatriceCastonguay,斯坦福大學這個講座將向大家展示具有可擴展性和高效的高階非結(jié)構(gòu)化可壓縮流體的GPU求解器。此求解器在張量乘積和單一元素情況下利用能量穩(wěn)定的通量重構(gòu)方法,可以對復雜的幾何形狀下的流動實現(xiàn)任意階精度。由于能量穩(wěn)定的通量重構(gòu)方法以及本地元素的特性要求很高的計算強度,他們非常地適合用GPU來解決問題。單GPU的求解器在這項任務中達到45倍于同代CPU的串行計算速度。此外,多GPU求解器能很好地擴展,在32顆GPU上運行時,四面體單元的6階精確模擬達到2.8萬億次浮點運算(雙精度)的持續(xù)性能。在這次講座中,我們將對用來達到這種性能的技術(shù)進行討論,并提出性能分析。根據(jù)作者的了解,上述流體求解器是第一個GPU集群上的混合非結(jié)構(gòu)化網(wǎng)格高階三維可壓縮納維-斯托克斯求解器.Fermi上的雷諾平均(RANS)CFD解算器JamesLin,上海交通大學Sheep-NS3D是上海交通大學自主研發(fā)的CFD程序。它采用有限體積方法的針對結(jié)構(gòu)化網(wǎng)格的納維-斯托克斯(雷諾平均)方程可用于機翼模型的設(shè)計。在本講座中,我們將展示CUDA版Sheep-NS3D程序的設(shè)計和未來優(yōu)化,它將給標準M6機翼模型的設(shè)計帶來20倍的提速并將單個FermiC2050上來自中國商用飛機有限責任公司的機翼模型候選者的設(shè)計速度提升37倍。上汽使用GPU加速汽車設(shè)計翁洋,上汽技術(shù)中心在本講座中,演講者將分享在車輛結(jié)構(gòu)設(shè)計使用GPU加速解算的一些經(jīng)驗。這些模擬演示使用ABAQUS標準版。在某些情況下,GPU和CPU協(xié)同合作可以節(jié)省設(shè)計時間,特別是對一些優(yōu)化任務。GPU加速大型的CFD-DEM的三維氣固流化床耦合模擬FeiguoChen,助理教授,中國科學院過程工程研究所CFD-DEM耦合模擬被廣泛用于研究氣固流化床的復雜的大規(guī)模結(jié)構(gòu)。但是嚴苛的計算要求又限制了DEM模擬在工業(yè)規(guī)模級反應器上的應用。我們?nèi)鎸嵤┝嘶诓⑿蠫PU運算的CFD-DEM方法來實現(xiàn)三維氣固流化床的大型模擬??梢栽谶@個米級的三維立方反應器中跟蹤超過108個DEM單元。跟蹤粒子的數(shù)量遠遠超過以往研究中基于傳統(tǒng)的CPU計算所能達到的數(shù)量。我們通過GPU運算開發(fā)了集群-DEM模型來模擬工業(yè)化的FCC流化床,并且研究了其復合流結(jié)構(gòu)和氣泡表現(xiàn)。GPU的出色性能加強了CFD-DEM耦合方法在工業(yè)氣固反應器模擬上的能力。氣候』天氣專題演講為什么混合動力系統(tǒng)在仿真科學上應用良好ThomasSchulthess,蘇黎世聯(lián)邦理工學院,瑞士國家超級計算機中心五年前,在仿真科學領(lǐng)域的GPU應用主要還是實驗性的。它只能解決部分可以容忍低精度和故障的課題。兩年前,由于引進ECC內(nèi)存以及更好的雙精度浮點運算性能,GPU的應用已經(jīng)發(fā)生了爆炸性的增長。我們現(xiàn)在看到GPU在不同領(lǐng)域的生產(chǎn)模擬中得到應用,如生命科學,材料科學和化學,天體物理學,生物醫(yī)學工程,以及地震成像和氣候/天氣模擬。盡管這需要花重大投資對軟件進行重構(gòu),以適應GPU混合系統(tǒng),但這種爆炸性的增長還是發(fā)生了。為什么?我將著重討論幾個在橡樹嶺國家實驗室(ORNL)和瑞士平臺開發(fā)的,在材料科學,氣象學,地球物理學,天體物理學等領(lǐng)域內(nèi)的高生產(chǎn)率和高性能計算(HP2C,見www.hp2c.ch)的應用。這些應用將從算法角度解釋GPU混合節(jié)點的成功。除了結(jié)構(gòu)因素,重建編程模型的需求也激勵了算法的重新設(shè)計,以及應用程序代碼的重構(gòu)。即使在傳統(tǒng)的多核心處理器上,這些都能提高效率。算法和代碼重構(gòu)是HP2C平臺的核心內(nèi)容之一。統(tǒng)一建模系統(tǒng)無縫天氣和季風氣候預測SubodhKumar,印度技術(shù)大學,印度新德里我們將介紹一項目前正在進行的工作,設(shè)計和開發(fā)一個基于GPU的統(tǒng)一建模系統(tǒng)對季風做無縫的天氣和氣候預測。該系統(tǒng)的設(shè)計是能夠處理不同的時間和空間尺度的大氣現(xiàn)象,這些對于天氣和區(qū)域氣候準確預測至關(guān)重要,特別是在季風情況下。我們的重點是利用準確的模擬二十面體六邊形網(wǎng)格達到高分辨率模型。我們還開發(fā)了對多尺度濕潤對流過程,云微物理和降水,輻射傳輸,水文和陸面過程,大氣和海洋湍流的參數(shù)化。從LMDZ模型的核心開始,我們從頭開始開發(fā)一個適合GPU和CPU并行高效計算的版本。我們的系統(tǒng)設(shè)計的另一個目標是擺脫低層次的編程,即使用一種編程模型,自動分配計算任務給所有可用的CPU和GPU。我們正在開發(fā)一個編程API以統(tǒng)一CPU和GPU的并行代碼開發(fā)?;贕PU的水平500米分辨率天氣模式TakayukiAoki,東京工業(yè)大學全球科學信息與計算中心數(shù)值天氣預報是在高性能計算的主要應用之一,它要求在細粒度網(wǎng)格上進行快速高精度的模擬。為了使天氣預報代碼的運行時間大大縮短,我們必須為使用GPU計算進行用CUDA的全部代碼重寫。日本氣象廳正在開發(fā)的高分辨率中尺度大氣模型ASUCA是為下一代的氣象預報服務的,這一模型已經(jīng)完全移植到CUDA。我們用3990顆GPU(圖形處理器)達到了單精度14368x14284x48分辨率的下的145萬億次浮點運算,使用437顆GPU以500米水平分辨率的運行覆蓋整個日本。GPU計算在數(shù)值空間天氣建模中的應用XueshangFeng教授,中國科學院空間天氣學國家重點實驗室空間天氣是指太陽和太陽風,磁層,電離層和熱層的情況可以影響航天器和地面技術(shù)系統(tǒng)的性能和可靠性,并影響人類生命或健康??臻g天氣有兩個重點:科學的研究和應用。要實現(xiàn)對惡劣空間天氣事件的實時或超實時的數(shù)值預報,并評估其對地球空間環(huán)境的影響,高性能計算模型是必不可少的。這次講座的主要目的是介紹可編程GPU在數(shù)值空間天氣建模中的應用及其結(jié)果的可視化。作為一個案例研究,GPU編程已經(jīng)在我們太陽系-星際-CESE磁流體模型(SIP-CESEMHD模型)中進行應用,同時對日冕的數(shù)值研究可使模型產(chǎn)生的數(shù)值計算結(jié)果可視化。我們對已有硬件的初步測試達到了比傳統(tǒng)的軟件快大約10倍的結(jié)果。這項工作代表了GPU在空間天氣研究領(lǐng)域的一項新穎應用。程序開發(fā)專題演講CUDAC語言基礎(chǔ)CliffWoolley,英偉達公司以C或C++為背景,本講座將涵蓋作為CUDAC/C++編程初學者的您所需了解的一切內(nèi)容。我們將通過大量代碼示例為您介紹使用CUDA進行并行編程的基礎(chǔ)知識,從"Hello,World"CUDAC程序開始。本講座還將帶您初步了解各種CUDAAPI和在CUDA應用中利用它們的最佳方式。CUDA函數(shù)庫以及生態(tài)系統(tǒng)CliffWoolley,英偉達公司這一講座將對GPU計算編程語言和軟件庫中快速發(fā)展的部分做一個介紹。我們介紹一些用于編譯、調(diào)試、性能分析的商業(yè)工具,同時也會介紹它們?nèi)绾问褂昧薔VIDIA技術(shù)。這個講座也會重點介紹很多供應商為了集群管理和監(jiān)控混合節(jié)點,將GPU支持添加入通用工具里。在GPU上OpenCV的計算機視覺JamesFung,NVIDIA了解OpenCV這個最知名的計算機視覺庫上的最新內(nèi)容!隨著GPU庫模塊的不斷增加,其功能允許運行比在CPU上更快的高品質(zhì)計算機視覺算法,有時甚至是實時的。本講座將提供OpenCV中GPU模塊功能的概述,一些新增的算法也將在CUDA運用細節(jié)中展示。基于分析的CUDA優(yōu)化技術(shù)王鵬,英偉達公司本講座將討論通過基于分析的過程進行性能優(yōu)化。演講中將介紹三個限制內(nèi)核性能的基本因素:指令吞吐量、內(nèi)存吞吐量和延遲。在本講座中我們將說明:如何使用性能分析工具和源代碼插入評估性能限制因素的影響;每個限制因素應該采用哪些優(yōu)化措施;如何確定何時達到硬件極限。演講者將通過一些實例闡明自己的優(yōu)化理念,這些理念既適用于CUDA也適用于OpenCL開發(fā)。本講座假定與會者已經(jīng)熟悉了一些基本的優(yōu)化技巧。GPU輔助的生物信息學相關(guān)研究胡曉菡,英偉達公司會議將詳細介紹在生物信息學中的一項由GPU加速的應用。講座由兩部分組成。第一部分,我們會介紹一款GPU加速的窮舉SNP-SNP交互模型。此方法要求高度的并行性,因此可以通過CUDA輕松實現(xiàn),如果有好的優(yōu)化,我們可以達到非常好的加速效果。這一講座也會回顧相互作用分析中如何混合跨平臺數(shù)據(jù),并在第二部分給出了基于隱式馬爾可夫模型的解決方案,該部分將介紹一個基于GPU的歸因工具的原型。C++AMP:將大規(guī)模并行引向主流YossiLevanoni,微軟公司微軟最近公布了C++AMP(加速大規(guī)模并行)語言,它由一個C++編程模型、C++語言支持和開發(fā)者工具組成——所有這些工具都用于在C++中表達數(shù)據(jù)并行。C++AMP將在下一版的VisualStudio中發(fā)布,目前可在VisualStudio11開發(fā)者預覽版中試用。用CUDA-GDB來分析和調(diào)試CUDA應用程序AlbanDouillet,英偉達公司CUDA-GDB是Linux和Mac平臺上的英偉達調(diào)試程序??蓪崿F(xiàn)對主機代碼和設(shè)備代碼的無縫操作,CUDA-GDB使您能監(jiān)測GPU內(nèi)存、GPU注冊器和您應用的源變量。通過使用有條件和無條件的斷點,調(diào)試程序可以快速聚集到可能出現(xiàn)問題的程序段。本講座將使用CUDA-GDB來分析和調(diào)試一個樣例CUDA應用程序。用英偉達“VisualProfit行性能優(yōu)化AlbanDouillet,英偉達公司英偉達可視化計算性能分析器幫助您優(yōu)化您的CUDA應用程序以獲得最佳性能。4.1版進行了完全更新,可視化計算性能分析器提供了一個集成的時間線允許您可視化CPU和GPU上應用程序的行為。利用時間線和從GPU性能計數(shù)器收集的數(shù)據(jù),計算性能分析器將分析您的應用程序,發(fā)現(xiàn)性能瓶頸并提出優(yōu)化建議,助您提升性能。本講座將使用英偉達可視化計算性能分析器來分析和優(yōu)化一個樣例CUDA應用程序的性能?;谀J降臄?shù)據(jù)并行編程王鵬,英偉達公司本講座將討論數(shù)據(jù)并行編程中的基本并行模式和基本命令。簡要介紹各種基本命令及其實現(xiàn)之后,我們將討論如何通過實現(xiàn)其底層模式快速、高效地解決并行編程問題。講座中將使用真實示例來說明各種技巧,包括分子動力學中的基數(shù)排序、元胞列表構(gòu)建和粒子代碼中的MPI幾何計算。利用ParallelNsight在MicrosoftVisualStudio中進行調(diào)試和分析王選,英偉達公司英偉達ParallelNsight使您能夠在熟悉的MicrosoftVisualStudio環(huán)境中利用GPU的力量。本講座中,您將了解如何使用ParallelNsight來開發(fā)GPU計算。學習如何使用強大的ParallelNsight調(diào)試程序,利用GPU斷點以及直接內(nèi)存和變量檢測功能來發(fā)現(xiàn)CUDAC/C++內(nèi)核中的錯誤。了解ParallelNsight如何顯示整個系統(tǒng)的性能特征,允許您創(chuàng)建高效的GPU算法。GRAPES天氣代碼的移植和GPU平臺上的優(yōu)化周斌,英偉達公司本講座中,我們將討論GRAPES氣象模型以及基本的GPU平臺移植技巧。講座內(nèi)容涵蓋基本的入門知識以及基本的優(yōu)化技巧。講座中還將討論MPI+CUDA模式。講座還會講解四個不同的模塊,包括GCR、Radiation、WSM6和PBL。講座將探討性能優(yōu)化問題并展示優(yōu)化結(jié)果。這將是一個很好的示例,為您展示真實的科學應用程序移植過程。CUDA基本優(yōu)化技術(shù)周斌,英偉達公司本講座將講解如何對CUDA內(nèi)核代碼進行基本的優(yōu)化。在本講座中,我們將討論下列主題:內(nèi)核啟動配置;全局內(nèi)存吞吐量;共享內(nèi)存訪問;指令吞吐量和控制流;內(nèi)存PCI-E吞吐量和內(nèi)存拷貝時的重疊內(nèi)核執(zhí)行。本講座假定與會者熟悉基本的CUDA概念和GPU架構(gòu)。編程GPU實現(xiàn)高性能和可移植性MichaelWolfe,波特蘭集團利用GPU獨特的架構(gòu)優(yōu)勢,編程人員可以實現(xiàn)巨大的性能收益。某些部分的工作需要編程人員的創(chuàng)造性,但是其他部分的工作只是機械性的,適合采用軟件工具自動完成。在本講座中,我們將比較使用PGI加速器編程模型指令的高級GPU編程和使用CUDA或OpenCL的低級GPU編程,我們將探索四方面的內(nèi)容。我們將探討一些富有創(chuàng)造性的共性問題,比如算法和數(shù)據(jù)結(jié)構(gòu)設(shè)計,這些都與編程模型無關(guān)。我們將討論編程工作,編寫該程序的成本以及實現(xiàn)良好性能需要多少訓練。我們將利用高級和低級編程展現(xiàn)實際的可交付的性能。最后,我們將研究一下將程序移植到下一代GPU上需要多少功夫。編寫代碼,求存于多核革命中FrancoisBodin,CAPS公司GPU架構(gòu)及多核技術(shù)的發(fā)展推動了處理器市場的迅速進步。這種迅猛的發(fā)展令軟件開發(fā)更為復雜。而且,編程方式對未來應用程序性能和可移植性的影響難以預測。使用指令給串行語言(例如C/C++/Fortran)做注解看似很有前景。它們對低層次的并行性細節(jié)編程進行抽象,同時保護了代碼資產(chǎn)免受處理器架構(gòu)變革的影響。在本講座中,我們將描述如何使用HMPP(異構(gòu)多核并行編程)API,基于指令的方法之一,來編程異構(gòu)計算節(jié)點。我們特別關(guān)注了如何以統(tǒng)一的方式利用GPU/CPU以及如何盡量減少代碼調(diào)優(yōu)問題。我們還將話題延伸到了庫的使用,這是目前處理GPU和多核問題時所涉及的一個重要因素。能源開發(fā)專題演講加快石油和天然氣的發(fā)現(xiàn)DickBland,惠普公司我們將討論整個石油/天然氣工作流程中英偉達公司(NVIDIA)與惠普公司(HP)技術(shù)解決方案帶來的商業(yè)利益,包括提供更大的吞吐量,更清晰的地下圖像,縮短生產(chǎn)周期,和改善總體擁有成本等相關(guān)的詳細信息。我們將討論與GPU計算帶來的客戶成功,以及惠普/英偉達公司如何使您的公司受益。圍繞石油/天然氣應用創(chuàng)立的惠普/英偉達聯(lián)合設(shè)計中心,可轉(zhuǎn)變對全球資產(chǎn)團隊的解決方案交付方式,并符合行業(yè)標準的基礎(chǔ)設(shè)施和數(shù)據(jù)安全要求。我們將突出介紹基于GPU的大規(guī)模生產(chǎn)環(huán)境的參考架構(gòu),以及惠普/英偉達解決方案帶來的價值。.使用多GPU系統(tǒng)擴大3D彈性應用程序TyMcKercher,英偉達公司了解彈性三維地震應用如何受益于以加速指令為基礎(chǔ)的方法,以及這些應用如何通過多GPU的集群系統(tǒng)被擴大規(guī)模使用。新的地震數(shù)據(jù)采集技術(shù)能收集橫波和縱波數(shù)據(jù),這些數(shù)據(jù)可用在三維彈性方程中來更精確地模擬波的傳播。本講座將分享從性能和功效兩方面的實驗結(jié)果,并比較不同的系統(tǒng)配置。在石油和天然氣勘探中利用GPU和HPCAnthonyLichnewsky,斯倫貝謝公司本講座將介紹石油和天然氣業(yè)如何大力推廣GPU的應用,以解決世界各地的新出現(xiàn)的和復雜的地質(zhì)環(huán)境。第一部分將對石油行業(yè)的地緣政治因素做一個概述。然后,我會講述在地震建模,成像和反轉(zhuǎn)中的計算挑戰(zhàn)。最后,我將展示如何在當前的生產(chǎn)應用程序中利用GPU的技術(shù)優(yōu)勢。用GPU/CPU的協(xié)同計算技術(shù)進行地震數(shù)據(jù)疊前遷移劉宏偉,研究工程師,北京GeoStar科技有限公司與中國科學院地質(zhì)與地球物理研究所數(shù)據(jù)疊前時間偏移和深度偏移是地震資料處理中最耗時的部分。隨著勘探和生產(chǎn)的不斷深化現(xiàn)有的計算機資源已無法滿足需要。自2008年以來,GeoStar已開發(fā)了基于GPU/CPU協(xié)同計算的疊前地震數(shù)據(jù)遷移技術(shù),包括不對稱的行程時間的疊前時間偏移,單程波的疊前深度偏移,以及逆時偏移。這些技術(shù)已廣泛應用于中國的各大油田,并取得了令人滿意的結(jié)果。這個演講將主要解釋這些技術(shù)的應用。通用主題講座實驗室里的桌面超級計算機:使用CUDA增強交互式物理實驗PeterLu,哈佛大學很多通用GPU(GPGPU)應用統(tǒng)帥著大型計算機集群里成百上千個GPU,來進行大型模擬的計算,這些計算本身通常比原始數(shù)據(jù)大許多倍。然而,在實驗室中,許多實驗應用有大量的原始數(shù)據(jù)。如果將這些大量數(shù)據(jù)遷移到一個遠程計算機群集,遷移所需的時間會比需要的分析時間更長。英偉達GPU可將超級計算帶給這些數(shù)據(jù),以此高速產(chǎn)生大量分析結(jié)果,以指導后續(xù)實驗。這種互動式的反饋回路可以提高科學研究的質(zhì)量。我將介紹一系列使用CUDA的GPGPU的技術(shù)應用,用以在實驗室中的圖像和數(shù)據(jù)分析,包括游泳的細菌,擴散膠體,光斷層掃描分析,和國際空間站里相分離的液氣板載的膠體混合物。GPU加速的大型商業(yè)智能和分析Dr.RenWu,惠普實驗室GPU已經(jīng)被廣泛應用在許多不同領(lǐng)域并取得了巨大成功。在本講座中,我將分享我們在惠普實驗室工作使用的一些GPU加速器來進行大型深度分析。這是一個相對較少探討的領(lǐng)域,但它充滿潛力。我們的研究結(jié)果顯示,與單純使用CPU相比,GPU可以帶來巨大的性能優(yōu)勢。中國和其他國家的天文物理GPU超級計算-星系,黑洞,引力波RainerSpurzem,中國科學院國家天文臺新建成的強大的超級計算機中大量使用通用了圖形處理器(GPU)。借助這種新型超級計算機,中國在世界上速度最快的超級計算機排名中名列前茅。本講座將回顧位于北京的中國科學院和國家天文臺應用這種GPU集群進行的研究,并討論當前和未來的計算機模擬,數(shù)據(jù)處理應用。我們將展示基于粒子和網(wǎng)格的算法,在天體物理學中使用數(shù)百成千上萬的GPU進行平行的信息傳遞環(huán)境中運行單一的應用程序,有些具有詳細的時序模型。我們也將討論GPU和FPGA加速計算的未來前景以及在ICCS(國際計算科學中心)的國際合作。GPU和其他“綠色"的超級計算機硬件是達到Exascale(億億次級)超級計算的踏腳石。另外我們也將展示天體物理計算機模擬的應用程序,模擬超大質(zhì)量黑洞的星系核致密星團。我們使用基于厄米計劃和塊步驟的大型高精確度的直接N體模擬,同時進行大量的跨節(jié)點運算和小規(guī)模跨每個節(jié)點上的跨GPU線程處理器運算。通過使用1600顆費米C2050GPU,我們的實驗性能持續(xù)超過350Tflops。我們將展示對中國最大的GPU集群的研究和性能模型,這個GPU集群使用7000顆費米GPU達到了Pflops級別的性能。我們的模擬將演示相對論中的黑洞整合,并對后牛頓理論修正的,引力和引力輻射產(chǎn)生宇宙背景的相關(guān)性有所觸及。我們也將討論這些研究與脈沖星計時帶,以及基于中國和歐洲的引力波的新空間的頻段的相關(guān)性。用GPU進行大規(guī)模并行邏輯模擬鄧仰東,副教授,清華大學微電子學研究所隨著集成電路快速增長的復雜性,基于邏輯仿真的設(shè)計驗證已經(jīng)成為當前集成電路(C)設(shè)計流程的瓶頸。本講座將回顧我們近期的一些工作,這些工作使用GPU來加速寄存器傳輸級(RTL)和門級邏輯仿真的工作。我們的仿真框架以分布式數(shù)據(jù)結(jié)構(gòu)來管理各類仿真工作。我們還引入了一個充滿動態(tài)的GPU內(nèi)存分配器來有效地管理GPU的內(nèi)存資源。在模擬運行期間,GPU的運作是由異步并行仿真協(xié)議來保證足夠的并行處理。此外,實驗結(jié)果表明,GPU的模擬器顯著超越了相應的CPU的同行。這項工作證明了現(xiàn)代GPU徹底變革IC驗證領(lǐng)域的潛力。流體模擬的ADI方法:擴展到多個GPUNikolaiSakharnykh,英偉達公司開發(fā)技術(shù)工程師學習大規(guī)模3D范圍的交替方向隱式法(ADI)的多GPU實現(xiàn)。探討一個ADI方法應用于直接流體數(shù)值仿真的案例。為了模擬復雜流,直接的方法需要一個極其大的網(wǎng)格,大到一臺設(shè)備的內(nèi)存都不夠用。因此,在多GPU和多節(jié)點中起到平衡作用的高效率的負荷對于直接流體仿真代碼就是相當必要的了。輸入幾何的復雜邊界會給分布式記憶系統(tǒng)帶來麻煩。在這一講座中,我們會詳細講解一個適用于各種大小的系統(tǒng)的新穎的三對角線方法。最后,也會討論對不同的輸入幾何的綜合性能分析和未來可能的改進方向。在天河-1號上進行晶體硅的千萬億次的分子動力學模擬侯超豐,助理教授,中國科學院過程工程研究所由于大規(guī)模的分子動力學(MD)模擬晶體硅的需要,高效率和可擴展性的鍵序相互作用勢(BOP)代碼得到了發(fā)展。使用天河-1A中所有的7168顆GPU,使用Tersoff作用勢模擬晶體硅達到單精度1.87Pflops,這也許是到目前為止最高性能的MD模擬報告。此外,通過整合天河-1A和86016顆CPU核心,我們的晶體硅表面重建模擬取得了單精度1.17Pflops和雙精度92.1Tflops的可持續(xù)成績,涉及單向亞毫米尺度的1,112億原子晶體硅。生命科學及基因主題3寅講了解貝葉斯基因網(wǎng)絡的算法JamesLin,上海交通大學分子生物學家利用貝葉斯網(wǎng)絡來檢測基因表達的依賴關(guān)系。DNA微矩陣收集的大量基因表達數(shù)據(jù)需要更快的學習算法。在本講座中,我們將展示基于CUDA的用于學習貝葉斯網(wǎng)絡的"稀疏候選者"算法的設(shè)計和未來優(yōu)化。通過使用業(yè)內(nèi)公司的數(shù)據(jù)集測試,該算法在一個四核M2050GPU服務器節(jié)點上將速度提升了約34倍。并行宏基因組:適用于宏基因組數(shù)據(jù)分析的高性能計算管道蘇曉泉,中國科學院青島生物能源與過程研究所宏基因組學方法直接對微生物社區(qū)進行序列分析。通常在同一社區(qū)中不同微生物種群有超過幾百種基因組,宏基因組數(shù)據(jù)分析的主要計算任務包括該微生物社區(qū)中這些基因組的分類和功能研究。宏基因組數(shù)據(jù)分析既是數(shù)據(jù)密集的也是計算密集的,需要極強的計算能力。因此,必須開發(fā)先進的計算方法和管道以滿足高效分析的這種需求。在本講座中,我們提出了并行-宏基因組的概念,它是一個基于GPU和多核CPU的開源管道,用于宏基因組數(shù)據(jù)分析,支持多個宏基因組數(shù)據(jù)集的高效并行分析。在并行-宏基因組中,在GPU計算和多核CPU計算優(yōu)化的基礎(chǔ)上,基于相似度的數(shù)據(jù)庫搜索可以并行操作。實驗表明與傳統(tǒng)宏基因組數(shù)據(jù)分析方法相比,并行-宏基因組的速度至少提高了15倍,而且結(jié)果的準確性相同。異構(gòu)計算機架構(gòu)加速量子化學計算RyotaKoga,X-Ability公司如哈特里-??耍℉F),密度泛函理論(DFT)或片斷分子軌道(FMO)的計算量子化學mehods需要大量的計算資源。在這項研究中,他們通過使用圖形處理器GPU)和最新的CPU矢量指令集(AVX)來加速。在用PRISM的算法來評估電子斥力積分矢量時盡可能利用AVX。我們發(fā)現(xiàn),這一新方案,使得在HFFock矩陣形成比以往(多CPU方案)多2至3倍的速度。庫侖和DFT的交換關(guān)聯(lián)勢用GPU進行評估,完成4倍左右的整體加速。方案被用來加速FMO。我們發(fā)現(xiàn),我們的新算法和GPU都非常適合計算環(huán)境的靜電勢。總的計算時間縮短到約1/3。我們也將提供對于ER(高性能自由能計算方法)及基于FMO的MD組合的評價。生物信息學在GPU上的算法和工具BertilSchmidt,JohannesGutenberg,美因茨大學生物序列數(shù)據(jù)的巨大增長已經(jīng)引起生物信息學迅速向數(shù)據(jù)密集型的計算科學方向發(fā)展。因此生物信息學的應用程序所需要的計算能力正在迅速增長。最近,以GPU為代表的平行加速器技術(shù)的出現(xiàn),使人們有可能顯著減少許多生物信息學應用程序的執(zhí)行時間。在本講座中,我將介紹基于CUDA編程模型的可擴展的GPU算法的設(shè)計和實施,這些將加快重要的生物信息學應用。同時我將會重點介紹新一代測序(NGS)數(shù)據(jù)的算法和工具。華大基因應用GPU加速生命科學研究王丙強博士,華大基因DNA雙螺旋結(jié)構(gòu)測序被數(shù)字化后,用大量的計算研究來發(fā)現(xiàn)生命的奧秘現(xiàn)在變得更為可行。由于產(chǎn)生了大量的數(shù)據(jù),如何有效地處理,分析以及存儲這些數(shù)據(jù)成為一個重大的挑戰(zhàn)。通過整合現(xiàn)有的開放代碼源GPU加速生物信息學工具,華大基因研究人員能夠以更低的成本和更高產(chǎn)量完成他們的分析。與此同時,一些必不可少的工具也發(fā)展起來,包括校直和變異檢測。與傳統(tǒng)的方法相比,GPU加速一般能達到10-50倍的速度提升。GPU加速的SNP檢測和MAF計算MianLu,香港科技大學本講座中,我們將報告兩個高性能的由GPU加速的基因組數(shù)據(jù)分析工具:GSNP和GAMA。GSNP是用來檢測單個核苷酸的DNA變異。達到高性能是通過數(shù)據(jù)結(jié)構(gòu)的優(yōu)化,內(nèi)存使用的減少,以及有效的GPU資源利用率,例如共享內(nèi)存。GAMA用來計算DNA次要等位基因頻率。我們將原來的迭代更新算法優(yōu)化成一個嵌套循環(huán)算法,它可以更好地匹配的數(shù)據(jù)并行GPU架構(gòu)。因此,與優(yōu)化的單線程CPU相比,GSNP和GAMA可以分別實現(xiàn)高達約50倍和47倍的加速。量子色動力學(QCD)中的GPU應用趙挺偉,國立臺灣大學要了解在亞原子水平的強相互作用,是一個科學的重大挑戰(zhàn)?,F(xiàn)在我們知道,強相互作用的基本理論是量子色動力學(QCD)。然而,從QCD的開始,提取在QCD物理觀測數(shù)據(jù)需要非常大的計算量及最先進的的超級計算機。在本講座中,我將概述QCD的突出特點是與高性能計算(HPC)的相關(guān)性,并解釋GPU在大型的量子色動力學模擬中的重要作用。此外,我將講解我目前的新戰(zhàn)略,來非微擾地計算QCD,系統(tǒng)性地提升QCD基本原理,并最終達到QCD基本原理的高精度預測。利用GPU進行大型分子模擬生物分子系統(tǒng)YingRen,助理教授,中國科學院過程工程研究所GPU給大型科研應用提供了前所未有的計算能力,也使得傳統(tǒng)的基于CPU的MD仿真有機會提高速度。在這一講座中,我們會介紹如何在我們的基于GPU的高性能計算機Mole-8.5的硬件平臺上開發(fā)分子模擬軟件來高效地模擬巨分子。然后應用這款軟件,在原子層面上探究整個流感病毒,并且從動力學和熱力學觀點來研究蛋白質(zhì)折疊。也會討論這種運算在生物系統(tǒng)的進一步應用的可能。Tsubame2.0上為宏基因組分析建立的超高速計算通道YutakaAkiyama,東京工業(yè)大學教授在Tsubame2.0超級計算機上,我們已經(jīng)建立為宏基因組的分析建立了完全自動化的計算通道,可以實時處理下一代的定序器中的龐大數(shù)據(jù)。我們在計算通道中,有兩個不同的序列同源性搜索工具可以選擇:1)BLASTX,在許多的宏基因組研究中被使用的標準同源搜索軟件;2)GHOSTM,我們自主開發(fā)的基于CUDA的GPU加速的同源搜索軟件。GHOSTM表現(xiàn)出了遠高于BLAT的靈敏度,并且足夠用來作宏基因組分析。在這條計算通道中,我們對從污染土壤中的7千1百萬Solexaread進行了一個宏基因組分析。結(jié)果顯示,計算通道的加速幾乎與計算核心的數(shù)目成線性正比。當我們使用BLASTX作為同源性搜索程序,用16,008顆CPU核心(1,334節(jié)點),計算通道可達到約每小時2千4百萬次的讀取速度。當我們使用GHOSTM作為同源性搜索程序,在2,520顆GPU(840節(jié)點)配置下,通道可實現(xiàn)每小時約6千萬次的讀取速度。這些結(jié)果表明該計算通道可以在幾個小時內(nèi)處理從下一代定序器單一運行中獲得的基因組信息,而這一結(jié)果甚至可以用我們以NR-AA數(shù)據(jù)庫的6幀的氨基酸序列比較的敏感同源性搜索協(xié)議為基礎(chǔ)。編程GPU實現(xiàn)高性能和可移植性MichaelWolfe,波特蘭集團利用GPU獨特的架構(gòu)優(yōu)勢,編程人員可以實現(xiàn)巨大的性能收益。某些部分的工作需要編程人員的創(chuàng)造性,但是其他部分的工作只是機械性的,適合采用軟件工具自動完成。在本講座中,我們將比較使用PGI加速器編程模型指令的高級GPU編程和使用CUDA或OpenCL的低級GPU編程,我們將探索四方面的內(nèi)容。我們將探討一些富有創(chuàng)造性的共性問題,比如算法和數(shù)據(jù)結(jié)構(gòu)設(shè)計,這些都與編程模型無關(guān)。我們將討論編程工作,編寫該程序的成本以及實現(xiàn)良好性能需要多少訓練。我們將利用高級和低級編程展現(xiàn)實際的可交付的性能。最后,我們將研究一下將程序移植到下一代GPU上需要多少功夫。GPU計算分析復雜性狀的優(yōu)勢JunZhu教授,浙江大學生物信息學研究所主任,一些最重要的農(nóng)藝性狀和人類疾病都帶有復雜的特性,而這些特性是由基因網(wǎng)絡控制的,其中包括基因相互作用(上位顯性)和基因環(huán)境相互作用(GE)。根據(jù)全基因組關(guān)聯(lián)研究(GWAS),一些新的統(tǒng)計方法和軟件已經(jīng)被開發(fā)出來,用來作復雜性狀的遺傳結(jié)構(gòu)分析。當需要處理大量的映射群體和巨量的分子信息,GPU計算與CPU計算相比有明顯的優(yōu)勢。我們將展示兩款新開發(fā)的基于GPU的軟件,QTLNetwork3.0和GWAS-GMDR,用來對人類,作物和小鼠中帶有上位顯性和GE的復雜性狀作基因映射。在GPU集群實施MrBayesXiaoguangLiu教授,南開大學MrBayesian是一種流行的種系推斷軟件,用以建議一組已知DNA序列物種的"生命樹”。在MrBayes中,Metropolis的并行版本,加上馬爾可夫鏈蒙特卡洛(MC3)算法已經(jīng)證明可以在各種平臺上運行。我們將對與GPU的并行實施的MrBayesMC給出一個評估。與序列MrBayesMC3相比,使用單一GPU加速,我們可以在足夠大的數(shù)據(jù)集上達到20倍以上的提速,而且在GPU集群上加速接近線性。學生研討會英偉達TMCUDATM學生研討會是一個面向大學生通過利用CUDATM編程應用成果的展示及交流的平臺,我們將邀請從本屆CUDA競賽獲獎選手中挑選出的6位大學同學介紹并展示他們的CUDA成就。此外,我們也有幸邀請到7位知名評委老師親臨現(xiàn)場,這些教授將對學生作品發(fā)表評論,還將針對如何在各種科研項目中有效利用GPU這一議題展開討論。邀請到的評委如下:>鄧仰東-清華大學>陳一峯-北京大學>柳有權(quán)-長安大學>林新華-上海交通大學>葛蔚-中國科學院過程物理研究所>劉瑩-中國科學院研究生院>陳虎-華南理工大學英偉達?CUDA?學生研討將會于12月14日星期三下午舉行。與會者不僅能在研討會上與CUDA程序競賽中獲獎的學生進行互動交流,并且也能參加大會于當日上午安排的一場精彩的主題演講會,領(lǐng)略未來發(fā)展趨勢和最新GPU平行計算的發(fā)展進程。新興企業(yè)與技術(shù)峰會基于GPU技術(shù)正日益擴張于全新行業(yè)及應用領(lǐng)域。在本次新興公司高峰論壇上,我們將邀請到那些發(fā)展前景良好的企業(yè)分享自己的成功經(jīng)驗,展示如何利用最新技術(shù)在當今計算機行業(yè)中掀起革新。會議涵蓋的主要內(nèi)容包括企業(yè)展示和精彩絕倫的產(chǎn)品演示兩大環(huán)節(jié)。這次峰會將為諸多新興企業(yè)、投資者、關(guān)鍵決策者、一流的消費者媒體、企業(yè)媒體以及貿(mào)易媒體提供一個與同儕交流合作的寶貴機會。峰會還將包含了一個“CEO講壇”環(huán)節(jié)。受邀的CEO將有機會直接面向投資者、分析師以及技術(shù)領(lǐng)袖,生動展示自己的公司、產(chǎn)品以及戰(zhàn)略研究,來賓也能暢所欲言向CEO提出個人見解或極具價值的反饋意見。新興公司高峰論壇將于12月14日星期三下午舉行,峰會將向持有全程大會通行證以及單日(12月14日)研討會通行證的與會人員開放。請了解如下峰會議程:

時間詳細14:00英偉達(NVIDIA?)業(yè)務開發(fā)副總裁JeffHerbst致歡迎辭14:30CEO講壇Acceleware公■司15:00CEO講壇優(yōu)必達公司15:30CEO講壇庫達科技發(fā)展有限公司16:00休息16:30CEO講壇MirriAd公司1700CEO講壇Geomagic公司17:30CEO講壇奇藝岡1800大會總結(jié):f展覽盧酒會Q&A什么是GPU大會?GPU技術(shù)大會(GTC)讓全世界的人們不僅能夠更加深入地了解GPU計算與可視化,而且可以認識到它們在未來科學以及技術(shù)創(chuàng)新等方面的重要性。GPU技術(shù)大會包含為時數(shù)百個小時的技術(shù)討論會、專題報告會、小組討論會以及有主持人的圓桌討論會等世界級教育性內(nèi)容,讓來自各行各業(yè)的思想領(lǐng)袖能夠齊聚一堂、相互交流。哪些人出席該大會?各界人士一致認為,對仰仗GPU來解決重大計算難題的科學家、工程師、研究員以及開發(fā)者來說,GPU技術(shù)大會是一個十分重要的資源。GPU技術(shù)大會的與會者來自世界各地并涵蓋了HPC涉及的幾乎每一種職業(yè),其中包括開發(fā)者、學者/研究員以及企業(yè)高管等等。與會者來自各個縱向行業(yè),例如金融、政府部門、生命科學、能源、計算機軟件開發(fā)、制造以及學術(shù)等等。為什么要出席該大會?一些人正在研究最復雜的計算難題,而有些人則有興趣了解并行編程以便大幅提升應用程序的速度。對這些人來說,GPU技術(shù)大會是一場不容錯過的盛事。通過豐富多彩沉浸式的學習,大會能夠提供:不同凡響的科學內(nèi)容,展示GPU改變行業(yè)面貌的影響力驚人的演示內(nèi)容,其中包含大量商業(yè)應用>接觸到并行計算領(lǐng)域中所有行業(yè)翹楚的機會市場上最具創(chuàng)新精神的產(chǎn)品和解決方案展示高效協(xié)作以及與同儕交流的寶貴機會人們對GPU技術(shù)大會的評價FrankChambers是GPU技術(shù)大會的一名與會者,他選用GPU來運行自己的有限元分析工作。他表示:“不要欺騙自己。GPU的確是一種能夠改變行業(yè)面貌的產(chǎn)品。我們在這里所見識到的巨大飛躍就好像從螺旋槳升級到噴氣發(fā)動機一樣。”—摘自InsideHPC(2010年9月22日)如果說本周英偉達?(NVIDIA?)公司的GPU技術(shù)大會能夠說明什么的話,那就是GPU計算已經(jīng)成長起來了。由于出席了去年的大會,我們驚奇地發(fā)現(xiàn),在2010年里,認真對待GPU技術(shù)的學術(shù)研究人員和企業(yè)已經(jīng)大幅增多。—摘自HPCWire演講者的專業(yè)素質(zhì)、展示內(nèi)容的高質(zhì)量以及著重聚焦應用確實令我感到震驚。這一盛會所凝聚的信息既有啟迪作用又十分實用。在技術(shù)與高級計算領(lǐng)域,這絕對是一場頂級的大會,同時也是一場最重要的大會?!猅heExascaleReport首席執(zhí)行官兼資深調(diào)査記者MikeBernhardt繼去年參會之后,我今年又帶來了一位同事。我希望明年至少能帶兩個人來出席會議。調(diào)整戰(zhàn)略討論會以及算法討論會太棒了,能夠與主要的英偉達工程師進行交流真是太好了。我覺得參加該大會非常值得?!猂inconResearch公司工程師BobArendt在我出席過的大會中,這是組織和實施得最好的一個。每年我都會在這里結(jié)識大量重要的新朋友,為我的研究工作制定了新的方向??偟膩碚f,GPU技術(shù)大會做得非常好,我期待著參加明年的下一屆大會!哈佛大學博士后研究員PeterLu總的來說,2010年GPU技術(shù)大會是一次愉快的體驗,我聽到了諸多有趣而實用的談話、得出了全新的深刻見解以及工作方向、見到了杰出的人物而且過得十分愉快!荷蘭萊頓大學研究員/博士生AnaBalevic自從我跟每個人講述大會見聞以及展示大會指南之后,我的許多同事都感嘆當時如果跟我一同參會就好了。美國約翰霍普金斯大學應用物理實驗室資深專業(yè)工作人員MichaelSchwartz全球GPU技術(shù)大會報道GPU技術(shù)大會包括在世界各地舉辦的一系列研討會以及活動,旨在滿足全球并行計算社區(qū)對教育與交流的需求。亞洲亞洲GPU技術(shù)大會(GTCAsia),2011年12月14-15日,中國北京中國地區(qū)的GTC大會將聚焦GPU計算領(lǐng)域中最新的科研以及商業(yè)應用。兩天的大會議程將包括主題演講、圓桌討論會、學術(shù)海報、為時超過60個小時的會議以及英偉達?(NVIDIA?)工程研究人員的專題報告會。中國地區(qū)的GTC大會是一場針對開發(fā)者、程序員、學者以及研究科學家的重要盛會,這些人群正研究著各行各業(yè)以及學術(shù)界的復雜計算難題。日本地區(qū)GTC研討會,2011年7月22日,東京這場為期一天且引人入勝的盛會讓頂尖的研究員、科學家以及行業(yè)領(lǐng)袖齊聚一堂,共同聚焦GPU計算領(lǐng)域中的關(guān)鍵研究課題、發(fā)展趨勢以及機遇。該研討會包括英偉達主題演講、贊助商會議、專題報告會以及同東京工業(yè)大學共同主辦的深度技術(shù)討論會。新加坡GTC研討會,2011年5月12日新加坡GTC研討會讓研究員、開發(fā)者、高性能計算(HPC)專業(yè)人士以及GPU計算專家齊聚一堂,分享知識以及最佳的實踐經(jīng)驗。該GTC研討會展示了GPU技術(shù)如何改變科學計算的行業(yè)面貌。臺灣GTC研討會,2011年5月19日,臺北臺灣GTC研討會讓當?shù)匮芯繂T、學術(shù)界合作伙伴以及HPC專業(yè)人士能夠分享知識、相互交流運用GPU從事項目研究的心得,這些項目包括天氣模擬、災難控制、天體物理學模擬、醫(yī)學成像以及基因定序。該研討會還探討了最近在中國發(fā)展CUDA卓越中心(CCOE)以及中國高性能計算100強等話題。北美GPU技術(shù)大會,2012年5月14-17日,美國加利福尼亞州圣何塞市GPU技術(shù)大會在活動日程中是一場旗艦級盛會。該大會讓整個GPU生態(tài)系統(tǒng)的人們齊聚一堂,其中包括來自學術(shù)界、政府部門以及業(yè)內(nèi)的人士,共同領(lǐng)略為期一周并且融教育、探索以及交流于一體的世界級大會內(nèi)容。歐洲與中東GPU技術(shù)峰會,2011年5月30日,以色列特拉維夫市GPU技術(shù)峰會是新興企業(yè)分享GPU全新應用的首選盛會。這些全新應用正在掀起計算行業(yè)的革命。該峰會還包含面向初學者以及專家的英偉達?(NVIDIA?)CUDA?會議。2011年CPU技術(shù)大會(亞洲站)相關(guān)新聞稿:英偉達?(NVIDIA?)GPU技術(shù)大會魅力無窮-2011年12月全球頂尖計算科學家齊聚北京參會。大會將包含諸多展示會,專家將在會上展示GPU如何在醫(yī)學、工程以及其它關(guān)鍵領(lǐng)域中掀起革命。2011年8月30日—美國加利福尼亞州圣克拉拉市—英偉達公司今天宣布了GPU技術(shù)大會亞洲站(GTCAsia)的舉辦日期和地點。該大會是英偉達GPU技術(shù)大會(GTC)全球系列活動中的下一場重要盛會。大會將聚焦GPU計算在科學、學術(shù)界以及商業(yè)領(lǐng)域中促成的最新進步與研究項目。英偉達近期在以色列、日本、新加坡以及臺灣等地舉辦了多場GTC盛會,吸引了數(shù)以千計各行各業(yè)以及各個學科的與會者。在這些GTC盛會成功經(jīng)驗的基礎(chǔ)之上,GPU技術(shù)大會亞洲站將于12月14-15日在北京國家會議中心舉行。為期兩天的繁忙日程將包括主題演講、圓桌討論會、展示會、新興企業(yè)峰會、學術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論