超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件

上傳人：塞*** IP屬地：貴州上傳時(shí)間：2023-09-18 格式：PPT 頁(yè)數(shù)：36 大小：621.66KB 積分：25 舉報(bào) 版權(quán)申訴

超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第2頁(yè)

超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第3頁(yè)

超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第4頁(yè)

超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第5頁(yè)

已閱讀5頁(yè)，還剩31頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)導(dǎo)論主編：丁躍潮計(jì)算機(jī)導(dǎo)論主編：丁躍潮第10章計(jì)算機(jī)前沿研究及發(fā)展趨勢(shì)10.1新型計(jì)算機(jī)系統(tǒng)

10.2計(jì)算理論發(fā)展

計(jì)算機(jī)科學(xué)與技術(shù)是科技領(lǐng)域最活躍、發(fā)展最快的科學(xué)，也是現(xiàn)代生產(chǎn)力中最活躍的部分。從電子產(chǎn)品的換代到軟件和相關(guān)書刊的更新，從計(jì)算機(jī)的在日常事務(wù)中的作用到計(jì)算機(jī)在尖端科技的上的應(yīng)用，無(wú)不體現(xiàn)出日新月異的景象。這些給世界帶來(lái)了燦爛的文明—信息時(shí)代和網(wǎng)絡(luò)經(jīng)濟(jì)，而計(jì)算機(jī)在經(jīng)濟(jì)和社會(huì)各領(lǐng)域的應(yīng)用促進(jìn)了計(jì)算機(jī)科學(xué)的發(fā)展，計(jì)算機(jī)的研究永無(wú)止境。2第10章計(jì)算機(jī)前沿研究及發(fā)展趨勢(shì)10.1新型計(jì)算機(jī)系統(tǒng)10.1新型計(jì)算機(jī)系統(tǒng)

現(xiàn)代計(jì)算機(jī)理論的奠基人是圖靈，他提出了通用機(jī)的概念，描述了計(jì)算步驟的數(shù)學(xué)模型。美國(guó)數(shù)學(xué)家馮·諾伊曼提出計(jì)算機(jī)可以使用二進(jìn)制，計(jì)算機(jī)的指令和數(shù)據(jù)都可以存儲(chǔ)在機(jī)內(nèi)，這奠定了計(jì)算機(jī)軟件的理論基礎(chǔ)。在馮·諾伊曼的主持下，1949年誕生了第一臺(tái)存儲(chǔ)程序的計(jì)算機(jī)，又稱第一代機(jī)，這臺(tái)計(jì)算機(jī)為后來(lái)的計(jì)算機(jī)發(fā)展奠定了基礎(chǔ)。半個(gè)多世紀(jì)以來(lái)，雖然計(jì)算機(jī)的系統(tǒng)結(jié)構(gòu)發(fā)生了翻天覆地的變化，電子學(xué)及其相關(guān)科學(xué)的發(fā)展，使計(jì)算機(jī)的總線、CPU、存儲(chǔ)器、外部設(shè)備都改進(jìn)到了接近巔峰的狀態(tài)，但仍然是在原來(lái)的系統(tǒng)結(jié)構(gòu)框架之下，現(xiàn)有芯片制造方法將在未來(lái)10多年內(nèi)即2020年左右達(dá)到極限。如果人們想要極大地?cái)U(kuò)展電子元件的能力，使之克服摩爾定律的限制，那么很可能需要在目前的計(jì)算設(shè)計(jì)上做根本改變，采用全新計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)。為此，世界各國(guó)研究人員正在加緊開發(fā)新型計(jì)算機(jī)。隨著生物學(xué)、物理學(xué)和化學(xué)的發(fā)展，多種新型計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)已見雛形。哪種結(jié)構(gòu)類型將主導(dǎo)第六代計(jì)算機(jī)，尚待今后的研究成果確定。310.1新型計(jì)算機(jī)系統(tǒng)現(xiàn)代計(jì)算機(jī)理論的奠基人是圖靈，他提10.1.1生物計(jì)算機(jī)以生物界處理問題的方式為模型的計(jì)算機(jī)都屬于生物計(jì)算機(jī)，而狹義的生物計(jì)算機(jī)主要是指利用生物化學(xué)反應(yīng)算法或具有生物分子、超分子芯片的計(jì)算機(jī)。廣義的生物計(jì)算機(jī)還包括自動(dòng)機(jī)模型、仿生算法等類型。生物計(jì)算機(jī)目前主要有以下幾類：(1)生物分子或超分子芯片生物分子或超分子芯片立足于傳統(tǒng)計(jì)算機(jī)模式，從尋找高效、體微的電子信息載體及信息傳遞體入手，目前已對(duì)生物體內(nèi)的小分子、大分子、超分子生物芯片的結(jié)構(gòu)與功能做了大量的研究與開發(fā)。生物分子計(jì)算機(jī)中的生物分子，在電流的作用下同樣可以產(chǎn)生“開”和“關(guān)”的兩種狀態(tài),并能貯存、輸出“0”和“1”這樣的二進(jìn)制信息。因此,可以像電子計(jì)算機(jī)一樣進(jìn)行運(yùn)算和信息處理。組成生物計(jì)算機(jī)的蛋白質(zhì)分子,直徑只有頭發(fā)絲的五千分之一，體積僅手指頭粗細(xì)的一只生物計(jì)算機(jī),其貯存信息的容量可以比現(xiàn)在的普通電子計(jì)算機(jī)大1千萬(wàn)倍。而且由于生物分子非常微小、彼此之間的距離又非常近,所以傳遞信息和計(jì)算速度非?？?。

410.1.1生物計(jì)算機(jī)以生物界處理問題的方式為模型10.1.1生物計(jì)算機(jī)(續(xù)1)(2)自動(dòng)機(jī)模型和仿生算法以自動(dòng)理論為基礎(chǔ)，致力與尋找新的計(jì)算機(jī)模式，特別是特殊用途的非數(shù)值計(jì)算機(jī)模式。目前研究的熱點(diǎn)集中在基本生物現(xiàn)象的類比，如神經(jīng)網(wǎng)絡(luò)、免疫網(wǎng)絡(luò)、細(xì)胞自動(dòng)機(jī)等。不同自動(dòng)機(jī)的區(qū)別主要是網(wǎng)絡(luò)內(nèi)部連接的差異，其基本特征是集體計(jì)算，又稱集體主義，在非數(shù)值計(jì)算、模擬、識(shí)別方面有極大的潛力。以生物智能為基礎(chǔ)，用仿生的觀念致力于尋找新的算法模式，雖然類似于自動(dòng)機(jī)思想，但立足點(diǎn)在算法上，不追求硬件上的變化。人工智能的“結(jié)構(gòu)模擬”學(xué)派(或稱為“聯(lián)結(jié)主義”學(xué)派)對(duì)計(jì)算神經(jīng)網(wǎng)絡(luò)的研究取得了突出的成果，主張從結(jié)構(gòu)方面模擬、延伸、擴(kuò)展人的智能，用“電腦”模擬“人腦”神經(jīng)系統(tǒng)的聯(lián)結(jié)機(jī)制。神經(jīng)網(wǎng)絡(luò)就是由許多神經(jīng)元互連在一起所組成的神經(jīng)結(jié)構(gòu)。把神經(jīng)元之間相互作用的關(guān)系進(jìn)行數(shù)學(xué)模型化就可以得到神經(jīng)網(wǎng)絡(luò)模型。目前應(yīng)用較多的代表性模型有：M-P神經(jīng)細(xì)胞模型、BP神經(jīng)網(wǎng)絡(luò)模型、Hopfield神經(jīng)網(wǎng)絡(luò)模型。

510.1.1生物計(jì)算機(jī)(續(xù)1)(2)自動(dòng)機(jī)模型和仿生算法10.1.1生物計(jì)算機(jī)(續(xù)2)

(3)生物化學(xué)反應(yīng)算法立足于可控的生物化學(xué)反應(yīng)或反應(yīng)系統(tǒng)，利用小容積內(nèi)同類分子高拷貝數(shù)的優(yōu)勢(shì)，追求運(yùn)算的高度并行化，從而提供運(yùn)算的效率。DNA計(jì)算機(jī)屬于此類，將在下文介紹分子計(jì)算機(jī)時(shí)予以介紹。上海交通大學(xué)2004年在試管中完成了DNA計(jì)算機(jī)的雛形研制工作。由于生物具有自我修復(fù)功能，生物芯片一旦出現(xiàn)故障，不需要人工修理也可以進(jìn)行自我修復(fù)。所以，生物計(jì)算機(jī)具有“半永久性”和很高的可靠性。再者，生物計(jì)算機(jī)的元件是由有機(jī)分子組成的生物化學(xué)元件，它們是利用化學(xué)反應(yīng)工作的，所以，只需要很少的能量就可以工作了。因此，不會(huì)像電子計(jì)算機(jī)那樣，工作一段時(shí)間后，機(jī)體會(huì)發(fā)熱，而且它的電路間也沒有信號(hào)干擾。除了DNA計(jì)算外，生物計(jì)算還有另一個(gè)發(fā)展方向，即在半導(dǎo)體芯片上加入生物分子芯片，將硅基與碳基結(jié)合起來(lái)的混合技術(shù)。例如，硅片上長(zhǎng)出排列特殊的神經(jīng)元的“生物芯片”已被生產(chǎn)出來(lái)。盡管這些生物計(jì)算實(shí)驗(yàn)離實(shí)用還很遙遠(yuǎn)。610.1.1生物計(jì)算機(jī)(續(xù)2)(3)生物化學(xué)反應(yīng)算法610.1.2光計(jì)算機(jī)

光計(jì)算機(jī)是用光束代替電子進(jìn)行運(yùn)算和存儲(chǔ)，它以不同波長(zhǎng)的光代表不同的數(shù)據(jù)，以大量的透鏡、棱鏡和反射鏡將數(shù)據(jù)從一個(gè)芯片傳送到另一個(gè)芯片。這種傳送方式稱為自由空間光學(xué)技術(shù)。自由空間光學(xué)技術(shù)的原理非常簡(jiǎn)單。首先，將硅片內(nèi)的電子脈沖轉(zhuǎn)換為極細(xì)的閃爍光束，“接通”表示“1”，“斷開”表示“0”。然后，將數(shù)據(jù)流通過反射鏡和棱鏡網(wǎng)絡(luò)投射到需要數(shù)據(jù)的地方。在接收端，透鏡將每根光束聚焦到微型光電池上，由光電池將閃光重新轉(zhuǎn)換成一系列電子脈沖。光計(jì)算機(jī)有三大優(yōu)勢(shì)。一是光子的傳播速度無(wú)與倫比，電子在導(dǎo)線中的運(yùn)行速度與其相比就像蝸牛爬行那樣，而采用硅－光混合技術(shù)后，其傳送速度就可達(dá)到每秒萬(wàn)億字節(jié)。二是光子不像帶電的電子那樣相互作用，因此經(jīng)過同樣窄小的空間通道可以傳送更多數(shù)據(jù)。三是光無(wú)須物理連接。如能將普通的透鏡和激光器做得很小，足以裝在微芯片的背面，那么明天的計(jì)算機(jī)就可以通過稀薄的空氣傳送信號(hào)了。710.1.2光計(jì)算機(jī)光計(jì)算機(jī)是用光束代替電子進(jìn)行運(yùn)算和存10.1.3量子計(jì)算機(jī)

量子計(jì)算機(jī)是利用原子所具有的量子特性進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理的一種物理裝置。量子計(jì)算機(jī)是一種全新概念的計(jì)算機(jī)，基于量子的相干性，因而它具有高度的并行計(jì)算能力。與經(jīng)典計(jì)算機(jī)相比，量子計(jì)算機(jī)在存儲(chǔ)容量、運(yùn)算速度上都會(huì)有指數(shù)數(shù)量級(jí)的提高。因此，量子計(jì)算機(jī)的研究在國(guó)際上引起高度關(guān)注。如對(duì)一個(gè)129位數(shù)的因子分解，用1600臺(tái)超級(jí)計(jì)算機(jī)與互連網(wǎng)進(jìn)行運(yùn)算要花8個(gè)多月才能破譯，而用一臺(tái)量子計(jì)算機(jī)幾秒鐘就輕易解決了。據(jù)介紹，具有5000個(gè)量子位的量子計(jì)算機(jī)，可以在３０秒內(nèi)解決傳統(tǒng)超級(jí)計(jì)算機(jī)要１００億年才能解決的大數(shù)因子分解問題。量子計(jì)算機(jī)的輸入用一個(gè)具有有限能級(jí)的量子系統(tǒng)來(lái)描述，最小的信息單元是一個(gè)量子比特(quantumbit)。量子比特不只是開、關(guān)兩種狀態(tài)，而是以多種狀態(tài)同時(shí)出現(xiàn)。處于量子狀態(tài)的粒子能夠進(jìn)入“超態(tài)”，即同時(shí)沿上、下兩個(gè)方向自旋。這一狀態(tài)可代表1、0以及中間的所有可能數(shù)值。810.1.3量子計(jì)算機(jī)量子計(jì)算機(jī)是利用原子所具有的量子10.1.4分子計(jì)算機(jī)

分子計(jì)算機(jī)用單個(gè)分子或單個(gè)電子代替硅晶體管，起到類似邏輯門和電子開關(guān)的作用，從而進(jìn)行運(yùn)算。近年來(lái)，分子級(jí)電子元件領(lǐng)域中取得了進(jìn)展，該領(lǐng)域的出現(xiàn)有一個(gè)前提，即有可能制造出單個(gè)的分子，其功能與三極管、二極管及今天的微電路的其他重要部件完全相同或相似?；瘜W(xué)家、物理學(xué)家和工程師已經(jīng)在一系列出色的示范試驗(yàn)中顯示：?jiǎn)蝹€(gè)的分子能傳導(dǎo)和轉(zhuǎn)換電流，并存儲(chǔ)信息。DNA計(jì)算機(jī)將是分子計(jì)算機(jī)發(fā)展的方向之一。20世紀(jì)70年代，人們發(fā)現(xiàn)脫氧核糖核酸（DNA）分子是一條雙螺“長(zhǎng)鏈”，鏈上布滿了“珍珠”即核苷酸，DNA分子計(jì)算機(jī)就是用這些“珍珠”的排列來(lái)表示各種信息。DNA處于不同狀態(tài)時(shí)可以代表信息的有或無(wú)。DNA分子中的遺傳密碼相當(dāng)于存儲(chǔ)的數(shù)據(jù)，DNA分子間通過生化反應(yīng)，從一種基因代碼轉(zhuǎn)變?yōu)榱硪环N基因代碼。反應(yīng)前的基因代碼相當(dāng)于輸入數(shù)據(jù)，反應(yīng)后的基因代碼相當(dāng)于輸出數(shù)據(jù)。如果能控制這一反應(yīng)過程，那么就可以制作成功DNA計(jì)算機(jī)。當(dāng)計(jì)算機(jī)計(jì)算時(shí)，幾種生物酶則充當(dāng)加、減、乘、除。DNA計(jì)算機(jī)通過生物化學(xué)反應(yīng)得出計(jì)算的結(jié)果。910.1.4分子計(jì)算機(jī)分子計(jì)算機(jī)用單個(gè)分子或單個(gè)電子代10.2計(jì)算理論的發(fā)展

10.2.1人工智能智能是個(gè)體有目的的行為，合理的思維，以及有效的、適應(yīng)環(huán)境的綜合能力。智能是個(gè)體認(rèn)識(shí)客觀事物和運(yùn)用知識(shí)解決問題的能力。人工智能（ArtificialIntelligence）簡(jiǎn)稱AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能（HumanIntelligence）的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是由多學(xué)科滲透產(chǎn)生的綜合性邊緣學(xué)科。人工智能的研究目標(biāo)就是探討智能的基本機(jī)理，研究如何利用各種自動(dòng)機(jī)來(lái)模擬人的某些思維過程和智能行為，用機(jī)器來(lái)代替人的部分腦力勞動(dòng)，包括用計(jì)算機(jī)進(jìn)行復(fù)雜推理、自動(dòng)求解某些復(fù)雜問題。

1010.2計(jì)算理論的發(fā)展10.2.1人工智能1010.2.1人工智能(續(xù))人工智能在以下方面取得了成就，并且研究正在深入：1)專家咨詢系統(tǒng)：主要由知識(shí)庫(kù)、數(shù)據(jù)庫(kù)和推理機(jī)制組成。如：數(shù)學(xué)專家系統(tǒng)，化學(xué)專家系統(tǒng)、中醫(yī)專家系統(tǒng)等。2)模式識(shí)別：用特征識(shí)別和關(guān)系識(shí)別，先對(duì)文字、聲音、圖形、圖象、物體等信息加以分析，然后與模式對(duì)比識(shí)別。有效的應(yīng)用已有文字識(shí)別、語(yǔ)言識(shí)別和理解、人的面孔和指紋識(shí)別、醫(yī)療診斷等。3)機(jī)器人：模擬人的部分功能的自動(dòng)機(jī)器。分工業(yè)機(jī)器人和智能機(jī)器人，人工智能主要研究智能機(jī)器人。智能機(jī)器人具有各種傳感器（感覺器）和學(xué)習(xí)能力。4)數(shù)學(xué)定理的證明：大大減輕人的腦力勞動(dòng)。四色問題又稱四色猜想，即：如果相鄰兩國(guó)用不同顏色涂上，地圖只需要四種顏色就夠了。5)博奕：由計(jì)算機(jī)與人下棋、打牌等。IBM的“深藍(lán)”系統(tǒng)戰(zhàn)勝了國(guó)際象棋大師卡斯帕諾夫，就是計(jì)算機(jī)的機(jī)器智能水平的一次榮譽(yù)記錄，也是聰明的人工智能軟件的一個(gè)成功范例。6)人工智能計(jì)算機(jī)：對(duì)正在研制中的新型電子計(jì)算機(jī)，有人稱為第五代計(jì)算機(jī)，是一種更接近人的人工智能計(jì)算機(jī)。1110.2.1人工智能(續(xù))人工智能在以下方面取得了10.2.2數(shù)據(jù)挖掘

數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程，這些模型和關(guān)系可以用來(lái)作出預(yù)測(cè)。數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)大部分情況下，數(shù)據(jù)挖掘都要先把數(shù)據(jù)從數(shù)據(jù)倉(cāng)庫(kù)中拿到數(shù)據(jù)挖掘庫(kù)或數(shù)據(jù)集市中（見圖10-1）。從數(shù)據(jù)倉(cāng)庫(kù)中直接得到進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多，如果數(shù)據(jù)在導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)時(shí)已經(jīng)清理過，那很可能在做數(shù)據(jù)挖掘時(shí)就沒必要再清理一次了，而且所有的數(shù)據(jù)不一致的問題都已經(jīng)被解決了。1210.2.2數(shù)據(jù)挖掘數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量10.2.2數(shù)據(jù)挖掘(續(xù)1)

數(shù)據(jù)挖掘庫(kù)可能是數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)邏輯上的子集，而不一定非得是物理上單獨(dú)的數(shù)據(jù)庫(kù)。但如果數(shù)據(jù)倉(cāng)庫(kù)的計(jì)算資源已經(jīng)很緊張，那最好還是建立一個(gè)單獨(dú)的數(shù)據(jù)挖掘庫(kù)。數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)(續(xù))1310.2.2數(shù)據(jù)挖掘(續(xù)1)數(shù)據(jù)挖掘庫(kù)可能是數(shù)據(jù)倉(cāng)庫(kù)的一10.2.2數(shù)據(jù)挖掘(續(xù)2)

數(shù)據(jù)挖掘和在線分析處理（OLAP）

OLAP是決策支持領(lǐng)域的一部分。傳統(tǒng)的查詢和報(bào)表工具是告訴你數(shù)據(jù)庫(kù)中都有什么（Whathappened），OLAP則更進(jìn)一步告訴你下一步會(huì)怎么樣（Whatnext）、如果我采取這樣的措施又會(huì)怎么樣（Whatif）。用戶首先建立一個(gè)假設(shè)，然后用OLAP檢索數(shù)據(jù)庫(kù)來(lái)驗(yàn)證這個(gè)假設(shè)是否正確。數(shù)據(jù)挖掘與OLAP不同的地方是，數(shù)據(jù)挖掘不是用于驗(yàn)證某個(gè)假定的模式（模型）的正確性，而是在數(shù)據(jù)庫(kù)中自己尋找模型，在本質(zhì)上是一個(gè)歸納的過程。數(shù)據(jù)挖掘和OLAP具有一定的互補(bǔ)性。在利用數(shù)據(jù)挖掘出來(lái)的結(jié)論采取行動(dòng)之前，你也許要驗(yàn)證一下如果采取這樣的行動(dòng)會(huì)給公司帶來(lái)什么樣的影響，那么OLAP工具能回答你的這些問題。

1410.2.2數(shù)據(jù)挖掘(續(xù)2)數(shù)據(jù)挖掘和在線分析處理（OL10.2.2數(shù)據(jù)挖掘(續(xù)3)

數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)數(shù)據(jù)挖掘利用了人工智能（AI）和統(tǒng)計(jì)分析的進(jìn)步所帶來(lái)的好處。這兩門學(xué)科都致力于模式發(fā)現(xiàn)和預(yù)測(cè)。數(shù)據(jù)挖掘不是為了替代傳統(tǒng)的統(tǒng)計(jì)分析技術(shù)。相反，它是統(tǒng)計(jì)分析方法學(xué)的延伸和擴(kuò)展。大多數(shù)的統(tǒng)計(jì)分析技術(shù)都基于完善的數(shù)學(xué)理論和高超的技巧，預(yù)測(cè)的準(zhǔn)確度還是令人滿意的，但對(duì)使用者的要求很高。而隨著計(jì)算機(jī)計(jì)算能力的不斷增強(qiáng)，我們有可能利用計(jì)算機(jī)強(qiáng)大的計(jì)算能力只通過相對(duì)簡(jiǎn)單和固定的方法完成同樣的功能。一些新興的技術(shù)同樣在知識(shí)發(fā)現(xiàn)領(lǐng)域取得了很好的效果，如神經(jīng)元網(wǎng)絡(luò)和決策樹，在足夠多的數(shù)據(jù)和計(jì)算能力下，它們幾乎不用人的關(guān)照自動(dòng)就能完成許多有價(jià)值的功能。數(shù)據(jù)挖掘就是利用了統(tǒng)計(jì)和人工智能技術(shù)的應(yīng)用程序，它把這些高深復(fù)雜的技術(shù)封裝起來(lái)，使人們不用自己掌握這些技術(shù)也能完成同樣的功能，并且更專注于自己所要解決的問題。

1510.2.2數(shù)據(jù)挖掘(續(xù)3)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)1510.2.2數(shù)據(jù)挖掘(續(xù)4)

數(shù)據(jù)挖掘應(yīng)用由于數(shù)據(jù)挖掘帶來(lái)的顯著的經(jīng)濟(jì)效益，使數(shù)據(jù)挖掘越來(lái)越普及。數(shù)據(jù)挖掘不僅能用于控制成本，也能給企業(yè)帶來(lái)效益。很多企業(yè)都在利用數(shù)據(jù)挖掘技術(shù)幫助管理客戶生命周期的各個(gè)階段，包括爭(zhēng)取新的客戶、在已有客戶的身上賺更多的錢、和保持住好的客戶。如果能夠確定好的客戶的特點(diǎn)，那么就能提供為客戶提供針對(duì)性的服務(wù)。比如，已經(jīng)發(fā)現(xiàn)了購(gòu)買某一商品的客戶的特征，那么就可以向那些具有這些特征但還沒有購(gòu)買此商品的客戶推銷這個(gè)商品；找到流失的客戶的特征，就可以在那些具有相似特征的客戶還未流失之前進(jìn)行針對(duì)性的彌補(bǔ)，因?yàn)楸Ａ粢粋€(gè)客戶要比爭(zhēng)取一個(gè)客戶便宜得多。

1610.2.2數(shù)據(jù)挖掘(續(xù)4)數(shù)據(jù)挖掘應(yīng)用1610.2.2數(shù)據(jù)挖掘(續(xù)5)

數(shù)據(jù)挖掘的步驟(1)定義商業(yè)問題。在開始知識(shí)發(fā)現(xiàn)之前，最先的、最重要的要求就是了解數(shù)據(jù)和業(yè)務(wù)問題，搞清楚到底想干什么。(2)建立數(shù)據(jù)挖掘庫(kù)。應(yīng)該把要挖掘的數(shù)據(jù)都收集到一個(gè)數(shù)據(jù)庫(kù)中。(3)分析數(shù)據(jù)。瀏覽分析這些數(shù)據(jù)，產(chǎn)生初步的認(rèn)識(shí)和處理方向。(4)準(zhǔn)備數(shù)據(jù)。這是建立模型之前的最后一步數(shù)據(jù)準(zhǔn)備工作，包括選擇變量、選擇記錄、創(chuàng)建新變量和轉(zhuǎn)換變量。(5)建立模型。建立模型是最重要的工作，也是一個(gè)反復(fù)的過程。建立模型是為了預(yù)測(cè)或分類。(6)評(píng)價(jià)模型。模型建立好之后，必須評(píng)價(jià)其結(jié)果、解釋其價(jià)值。(7)實(shí)施和改進(jìn)。模型建立好后，可以投入實(shí)用，記載使用情況。1710.2.2數(shù)據(jù)挖掘(續(xù)5)數(shù)據(jù)挖掘的步驟1710.2.3人工神經(jīng)網(wǎng)絡(luò)

所謂人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks，簡(jiǎn)寫為ANN或ANNs）是指為了模擬生物大腦的結(jié)構(gòu)和功能而構(gòu)成的一種信息處理系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)并行、分布處理結(jié)構(gòu)，是由處理單元(人工神經(jīng)元)及稱為聯(lián)接的無(wú)向訊號(hào)通道互連組成的網(wǎng)絡(luò)。它是從微觀結(jié)構(gòu)和功能上對(duì)人腦的抽象、簡(jiǎn)化，是模擬人類智能的一條重要途徑，反映了人腦功能的若干基本特征，如并行信息處理、學(xué)習(xí)、聯(lián)想、模式分類、記憶等。簡(jiǎn)單地講，它是一個(gè)數(shù)學(xué)模型，可以用電子線路來(lái)實(shí)現(xiàn)，也可以用計(jì)算機(jī)程序來(lái)模擬，是人工智能研究的一種方法。傳統(tǒng)的人工智能技術(shù)是基于物理符號(hào)系統(tǒng)的，而人工神經(jīng)網(wǎng)絡(luò)技術(shù)是基于聯(lián)接主義觀點(diǎn)的。人工神經(jīng)網(wǎng)絡(luò)是對(duì)人腦或自然神經(jīng)網(wǎng)絡(luò)（NaturalNeuralNetwork）若干基本特性的抽象和模擬。人工神經(jīng)網(wǎng)絡(luò)的模型現(xiàn)在有數(shù)十種之多，應(yīng)用較多的典型的神經(jīng)網(wǎng)絡(luò)模型有BP網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)、ART網(wǎng)絡(luò)和Kohonen網(wǎng)絡(luò)。1.什么是神經(jīng)網(wǎng)絡(luò)1810.2.3人工神經(jīng)網(wǎng)絡(luò)所謂人工神經(jīng)網(wǎng)絡(luò)(Artific2.神經(jīng)元及其行為機(jī)理神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)在于神經(jīng)元。神經(jīng)元是腦組織的基本單元,人腦是由大約10億個(gè)神經(jīng)元組成的巨系統(tǒng)。在人體內(nèi)，神經(jīng)元的結(jié)構(gòu)形式并非是完全相同的；但是，無(wú)論結(jié)構(gòu)形式如何，神經(jīng)元都是由一些基本的成份組成的。從圖中可以看出：神經(jīng)元是由細(xì)胞體、樹突和軸突三部分組成。192.神經(jīng)元及其行為機(jī)理神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)在于神經(jīng)元。神經(jīng)元是腦10.2.3人工神經(jīng)網(wǎng)絡(luò)

細(xì)胞體：由細(xì)胞核、細(xì)胞質(zhì)和細(xì)胞膜組成，是神經(jīng)元活動(dòng)的能量供應(yīng)地，在這里進(jìn)行新陳代謝等各種生化過程。軸突：由細(xì)胞體外伸出的最長(zhǎng)的分支組成，是把神經(jīng)元興奮的信息傳出到其它神經(jīng)元的出口。有興奮型與抑制型兩種。樹突：由細(xì)胞體外伸出的較短的分支組成，是接受從其它神經(jīng)元傳入的信息的入口。根據(jù)神經(jīng)生理學(xué)的研究，已經(jīng)發(fā)現(xiàn)神經(jīng)元有4種生物行為：①能處于抑制或興奮狀態(tài)；②能產(chǎn)生爆發(fā)和平臺(tái)兩種情況；③能產(chǎn)生抑制后的反沖；④具有適應(yīng)性。2010.2.3人工神經(jīng)網(wǎng)絡(luò)細(xì)胞體：由細(xì)胞核、細(xì)胞質(zhì)和細(xì)胞膜10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)1)

突觸是一個(gè)神經(jīng)元與另一個(gè)神經(jīng)元之間相聯(lián)系并進(jìn)行信息傳送的結(jié)構(gòu)。突觸如圖10-4所示。它由突觸前成分，突觸間隙和突觸后成分組成。突觸前成分是一個(gè)神經(jīng)元的軸突末梢。突觸間隙是突觸前成分與后成分之間的距離空間，間隙一般為200—300?。突觸后成分可以是細(xì)胞體、樹突或軸突。突觸的存在說(shuō)明兩個(gè)神經(jīng)元的細(xì)胞質(zhì)并不直接連通，兩者彼此聯(lián)系是通過突觸這種結(jié)構(gòu)接口的。突觸的4種生物行為有：①能進(jìn)行信息綜合；②能產(chǎn)生漸次變化的傳送；③有電接觸和化學(xué)接觸等多種連接方式；④會(huì)產(chǎn)生延時(shí)激發(fā)。2110.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)1)突觸是一個(gè)神經(jīng)元與另一個(gè)3.神經(jīng)元的數(shù)學(xué)模型與神經(jīng)生理學(xué)類比，連接機(jī)制結(jié)構(gòu)的基本處理單元就稱為神經(jīng)元。每個(gè)構(gòu)造起網(wǎng)絡(luò)的神經(jīng)元模型模擬一個(gè)生物神經(jīng)元，如圖10-5所示。該神經(jīng)元單元由多個(gè)輸入(i=1,2,...,n)和一個(gè)輸出y組成。中間狀態(tài)由輸入信號(hào)的權(quán)和表示，而輸出為:神經(jīng)元的數(shù)學(xué)模型如圖

10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)2)

223.神經(jīng)元的數(shù)學(xué)模型與神經(jīng)生理學(xué)類比，連接機(jī)制結(jié)構(gòu)的基本處3.神經(jīng)元的數(shù)學(xué)模型(續(xù))式中,θ為神經(jīng)元單元的偏置（閾值），wi為連接權(quán)系數(shù)（對(duì)于激發(fā)狀態(tài)，wi取正值，對(duì)于抑制狀態(tài)，wi取負(fù)值），n為輸入信號(hào)數(shù)目，Y為神經(jīng)元輸出，f為輸出變換函數(shù)，有時(shí)叫做激發(fā)或激勵(lì)函數(shù)，往往采用0和1二值函數(shù)或Ｓ形函數(shù)，這些函數(shù)都是連續(xù)和非線性的。一種二值函數(shù)可由下式表示：一種常規(guī)的Ｓ形函數(shù)可由下式表示：

常用雙曲正切函數(shù)來(lái)取代常規(guī)Ｓ形函數(shù)，因?yàn)椋有魏瘮?shù)的輸出均為正值，而雙曲正切函數(shù)的輸出值可為正或負(fù)。雙曲正切函數(shù)如下式所示：10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)3)

233.神經(jīng)元的數(shù)學(xué)模型(續(xù))式中,θ為神經(jīng)元單元的偏置（閾值神經(jīng)網(wǎng)絡(luò)的工作過程

10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)4)

24神經(jīng)網(wǎng)絡(luò)的工作過程10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)4)244.人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)和優(yōu)越性

1)可以充分逼近任意復(fù)雜的非線性關(guān)系；2)所有定量或定性的信息都分布貯存于網(wǎng)絡(luò)內(nèi)的各神經(jīng)元及其連線上，故有很強(qiáng)的魯棒性和容錯(cuò)性；3)采用并行分布處理方法，使得快速進(jìn)行大量運(yùn)算成為可能；4)可學(xué)習(xí)和自適應(yīng)不知道或不確定的系統(tǒng)；5)能夠同時(shí)處理定量、定性知識(shí)；6)具有自學(xué)習(xí)功能；7)具有聯(lián)想存儲(chǔ)功能；8)具有高速尋找優(yōu)化解的能力。

10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)5)

254.人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)和優(yōu)越性1)可以充分逼近任意復(fù)雜分布式計(jì)算(DistributedComputing)是一種把需要進(jìn)行大量計(jì)算的工程數(shù)據(jù)分割成小塊，由多臺(tái)計(jì)算機(jī)分別計(jì)算，在上傳運(yùn)算結(jié)果后再統(tǒng)一合并得出數(shù)據(jù)結(jié)論的科學(xué)。當(dāng)今從事的科學(xué)研究課題學(xué)科繁多，涉及面廣，分類又細(xì)，而每個(gè)學(xué)科似乎都需要進(jìn)行大量的計(jì)算。天文學(xué)研究組織需要計(jì)算機(jī)來(lái)分析太空脈沖（pulse），星位移動(dòng)；生物學(xué)家需要計(jì)算機(jī)來(lái)模擬蛋白質(zhì)的折疊（proteinfolding）過程；藥物學(xué)家想要研制克服愛滋?。ˋIDS）或非典（SARS）的藥物；數(shù)學(xué)家想計(jì)算最大的質(zhì)數(shù)和圓周率的更精確值；經(jīng)濟(jì)學(xué)家要用計(jì)算機(jī)分析計(jì)算在幾萬(wàn)中因素考慮下某個(gè)企業(yè)/城市/國(guó)家的發(fā)展方向從而宏觀調(diào)控。由此可見，人類未來(lái)的科學(xué)，時(shí)時(shí)刻刻離不開計(jì)算。而分布式計(jì)算，以其獨(dú)特的優(yōu)點(diǎn)——便宜、高效而越來(lái)越受到社會(huì)的關(guān)注。10.2.4分布式計(jì)算26分布式計(jì)算(DistributedComputing)是一分布式計(jì)算產(chǎn)生的原因主要有：1)計(jì)算資源的共享。用整個(gè)網(wǎng)絡(luò)中的所有計(jì)算機(jī)來(lái)處理總比單臺(tái)機(jī)器要快一些，另外，一些運(yùn)算速度比較慢的客戶機(jī)也可以用運(yùn)算速度比較快的服務(wù)器來(lái)協(xié)作完成某項(xiàng)工作。2)減輕網(wǎng)絡(luò)的負(fù)荷。雖然網(wǎng)絡(luò)技術(shù)飛速發(fā)展，網(wǎng)絡(luò)的帶寬不斷的增加，但總是有限的。在分布式數(shù)據(jù)處理中，在網(wǎng)絡(luò)中傳遞的數(shù)據(jù)量是非常大的。SQL語(yǔ)句會(huì)把一整張表放在網(wǎng)絡(luò)上。因此，如果在網(wǎng)絡(luò)中所傳輸?shù)膬H僅是一些數(shù)據(jù)處理后的結(jié)果，而不是大量的中間數(shù)據(jù)，整個(gè)網(wǎng)絡(luò)的負(fù)荷就會(huì)降低了。3)安全性。我們可以把一些關(guān)鍵的計(jì)算過程和數(shù)據(jù)放在服務(wù)器上，并給予特殊的安全保護(hù)。4)合理的軟件結(jié)構(gòu)。在某一些環(huán)境下，擁有分布式計(jì)算的軟件結(jié)構(gòu)更加容易解決實(shí)際問題。

10.2.4分布式計(jì)算(續(xù)1)27分布式計(jì)算產(chǎn)生的原因主要有：10.2.4分布式計(jì)算(續(xù)1)分布式計(jì)算的格局就目前來(lái)看，全球的各種分布式計(jì)算已有約百種，這些計(jì)算大多互無(wú)聯(lián)系、獨(dú)立管理、獨(dú)立使用自己的一套軟件。目前的這種分布式計(jì)算互相割據(jù)的格局很不利于發(fā)展的需要。為了改變這種雜亂無(wú)章的割據(jù)，美國(guó)加州大學(xué)伯克利分校（UCBerkeley）首先提出了建立BOINC的想法。BOINC的中文全稱是伯克利開放式網(wǎng)絡(luò)計(jì)算平臺(tái)（BerkeleyOpenInfrastructureforNetworkComputing），它能夠把許多不同的分布式計(jì)算項(xiàng)目聯(lián)系起來(lái)統(tǒng)一管理，并對(duì)計(jì)算機(jī)資源進(jìn)行統(tǒng)一分配（比方對(duì)研究愛滋病藥物和探索地外文明同時(shí)感興趣，就可以同時(shí)選擇兩個(gè)運(yùn)行，并設(shè)置優(yōu)先級(jí)）。同時(shí)，還對(duì)統(tǒng)計(jì)評(píng)分系統(tǒng)進(jìn)行統(tǒng)一管理（無(wú)論你在為哪個(gè)項(xiàng)目工作，只要你奉獻(xiàn)CPU時(shí)間長(zhǎng)，就積分高）。

10.2.4分布式計(jì)算(續(xù)2)28分布式計(jì)算的格局10.2.4分布式計(jì)算(續(xù)2)28分布式存儲(chǔ)和計(jì)算如果說(shuō)某項(xiàng)工作是分布式的，那么，參與這項(xiàng)工作的一定不只是一臺(tái)計(jì)算機(jī)，而是一個(gè)計(jì)算機(jī)網(wǎng)絡(luò)?？梢园延?jì)算機(jī)網(wǎng)絡(luò)所做的工作分兩種：分布式數(shù)據(jù)存貯，分布式計(jì)算。在分布式數(shù)據(jù)存貯中，網(wǎng)絡(luò)使數(shù)據(jù)存貯分布化，我們把數(shù)據(jù)放到網(wǎng)絡(luò)上的不同的機(jī)器中，而不是僅存儲(chǔ)在一臺(tái)計(jì)算機(jī)。數(shù)據(jù)是共享的，網(wǎng)絡(luò)的任何計(jì)算機(jī)可以透明地存取到不同來(lái)源的數(shù)據(jù)。比如，在Delphi或PowerBuilder中，程序所處理的數(shù)據(jù)往往來(lái)自于不同的數(shù)據(jù)庫(kù)服務(wù)器，而不僅僅是本地機(jī)器。我們把它稱為分布式數(shù)據(jù)。在分布式計(jì)算中，網(wǎng)絡(luò)側(cè)重于它的計(jì)算功能。在分布式數(shù)據(jù)中，完成一件工作時(shí)，數(shù)據(jù)可能來(lái)自于網(wǎng)絡(luò)中不同的機(jī)器，但對(duì)于這些數(shù)據(jù)的處理卻是在本機(jī)中完成的。而在分布式計(jì)算環(huán)境中，數(shù)據(jù)的處理不只是在一臺(tái)機(jī)器完成，而是多臺(tái)機(jī)器協(xié)作完成的。比如，為了處理一項(xiàng)工作P，它由兩部分工作組成，PA和PB。如果我們把PA放在機(jī)器A中完成，PB處理放在機(jī)器B中完成，那么它們就形成了一個(gè)分布式的計(jì)算。計(jì)算機(jī)的計(jì)算總是離不開數(shù)據(jù)，所以，在大部分情況下，分布式計(jì)算總是伴隨著分布式數(shù)據(jù)。10.2.4分布式計(jì)算(續(xù)3)29分布式存儲(chǔ)和計(jì)算10.2.4分布式計(jì)算(續(xù)3)29網(wǎng)格計(jì)算網(wǎng)格(GridComputing)是構(gòu)筑在因特網(wǎng)上的一組新興技術(shù)，它將高速互聯(lián)網(wǎng)、高性能計(jì)算機(jī)、大型數(shù)據(jù)庫(kù)、傳感器、遠(yuǎn)程設(shè)備等融為一體，為科技人員和普通老百姓提供更多的資源、功能和交互性。比如，有一項(xiàng)業(yè)務(wù)使用1GHzCPU需要3分鐘的處理時(shí)間。如果網(wǎng)絡(luò)中有3臺(tái)安裝了同樣CPU的計(jì)算機(jī)，我們把這項(xiàng)業(yè)務(wù)分成3等分，然后分別交給每臺(tái)計(jì)算機(jī)進(jìn)行處理，那么簡(jiǎn)單地計(jì)算一下就會(huì)知道其處理時(shí)間將縮短到1分鐘。這就是網(wǎng)格計(jì)算的基本思路。網(wǎng)格計(jì)算是伴隨著互聯(lián)網(wǎng)而迅速發(fā)展起來(lái)的，專門針對(duì)復(fù)雜科學(xué)計(jì)算的新型計(jì)算模式。這種計(jì)算模式是利用互聯(lián)網(wǎng)把分散在不同地理位置的電腦組織成一個(gè)“虛擬的超級(jí)計(jì)算機(jī)”，其中每一臺(tái)參與計(jì)算的計(jì)算機(jī)就是一個(gè)“節(jié)點(diǎn)”，而整個(gè)計(jì)算是由成千上萬(wàn)個(gè)“節(jié)點(diǎn)”組成的“一張網(wǎng)格”，所以這種計(jì)算方式叫網(wǎng)格計(jì)算。這樣組織起來(lái)的“虛擬的超級(jí)計(jì)算機(jī)”有兩個(gè)優(yōu)勢(shì)，一個(gè)是數(shù)據(jù)處理能力超強(qiáng)；另一個(gè)是能充分利用網(wǎng)上的閑置處理能力。10.2.4分布式計(jì)算(續(xù)4)30網(wǎng)格計(jì)算10.2.4分布式計(jì)算(續(xù)4)30采用并行計(jì)算，解決海量數(shù)據(jù)處理問題，有三種途徑：1)采用并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)。2)使用有并行運(yùn)算功能的操作系統(tǒng)。3)使用能夠進(jìn)行并行運(yùn)算的計(jì)算機(jī)軟件。

10.2.5并行計(jì)算

31采用并行計(jì)算，解決海量數(shù)據(jù)處理問題，有三種途徑：10.2.51.并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)，一是指單臺(tái)計(jì)算機(jī)并行處理結(jié)構(gòu)，二是指多臺(tái)計(jì)算機(jī)構(gòu)成的多微理處理分布式系統(tǒng)結(jié)構(gòu)。對(duì)于傳統(tǒng)的處理器，性能上的競(jìng)爭(zhēng)一直集中在增大緩存容量和提高頻率兩個(gè)方面，但是傳統(tǒng)處理器由于是單個(gè)物理運(yùn)算，單元運(yùn)算不能充分發(fā)揮處理器的性能。英特爾發(fā)明了超線程技術(shù)，它是一種特殊的多線程技術(shù)，可以充分挖掘單個(gè)物理處理器的潛力，讓單個(gè)處理器都能使用線程級(jí)并行運(yùn)算，從而兼容多線程操作系統(tǒng)和軟件，提高處理器性能，操作系統(tǒng)或者應(yīng)用軟件的多線程可以同時(shí)在一個(gè)處理器上運(yùn)行。其設(shè)計(jì)思想是：在一個(gè)CPU中增加電路，讓它以兩個(gè)邏輯CPU的形式出現(xiàn)。其結(jié)果是：物理上的一個(gè)CPU，在操作系統(tǒng)和多線程應(yīng)用中以兩個(gè)邏輯CPU的形式

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔