超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第1頁(yè)
超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第2頁(yè)
超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第3頁(yè)
超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第4頁(yè)
超分子芯片的計(jì)算機(jī)-集美大學(xué)計(jì)算機(jī)工程學(xué)院課件_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)導(dǎo)論主編:丁躍潮計(jì)算機(jī)導(dǎo)論主編:丁躍潮第10章計(jì)算機(jī)前沿研究及發(fā)展趨勢(shì)10.1新型計(jì)算機(jī)系統(tǒng)

10.2計(jì)算理論發(fā)展

計(jì)算機(jī)科學(xué)與技術(shù)是科技領(lǐng)域最活躍、發(fā)展最快的科學(xué),也是現(xiàn)代生產(chǎn)力中最活躍的部分。從電子產(chǎn)品的換代到軟件和相關(guān)書刊的更新,從計(jì)算機(jī)的在日常事務(wù)中的作用到計(jì)算機(jī)在尖端科技的上的應(yīng)用,無(wú)不體現(xiàn)出日新月異的景象。這些給世界帶來(lái)了燦爛的文明—信息時(shí)代和網(wǎng)絡(luò)經(jīng)濟(jì),而計(jì)算機(jī)在經(jīng)濟(jì)和社會(huì)各領(lǐng)域的應(yīng)用促進(jìn)了計(jì)算機(jī)科學(xué)的發(fā)展,計(jì)算機(jī)的研究永無(wú)止境。2第10章計(jì)算機(jī)前沿研究及發(fā)展趨勢(shì)10.1新型計(jì)算機(jī)系統(tǒng)10.1新型計(jì)算機(jī)系統(tǒng)

現(xiàn)代計(jì)算機(jī)理論的奠基人是圖靈,他提出了通用機(jī)的概念,描述了計(jì)算步驟的數(shù)學(xué)模型。美國(guó)數(shù)學(xué)家馮·諾伊曼提出計(jì)算機(jī)可以使用二進(jìn)制,計(jì)算機(jī)的指令和數(shù)據(jù)都可以存儲(chǔ)在機(jī)內(nèi),這奠定了計(jì)算機(jī)軟件的理論基礎(chǔ)。在馮·諾伊曼的主持下,1949年誕生了第一臺(tái)存儲(chǔ)程序的計(jì)算機(jī),又稱第一代機(jī),這臺(tái)計(jì)算機(jī)為后來(lái)的計(jì)算機(jī)發(fā)展奠定了基礎(chǔ)。半個(gè)多世紀(jì)以來(lái),雖然計(jì)算機(jī)的系統(tǒng)結(jié)構(gòu)發(fā)生了翻天覆地的變化,電子學(xué)及其相關(guān)科學(xué)的發(fā)展,使計(jì)算機(jī)的總線、CPU、存儲(chǔ)器、外部設(shè)備都改進(jìn)到了接近巔峰的狀態(tài),但仍然是在原來(lái)的系統(tǒng)結(jié)構(gòu)框架之下,現(xiàn)有芯片制造方法將在未來(lái)10多年內(nèi)即2020年左右達(dá)到極限。如果人們想要極大地?cái)U(kuò)展電子元件的能力,使之克服摩爾定律的限制,那么很可能需要在目前的計(jì)算設(shè)計(jì)上做根本改變,采用全新計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)。為此,世界各國(guó)研究人員正在加緊開發(fā)新型計(jì)算機(jī)。隨著生物學(xué)、物理學(xué)和化學(xué)的發(fā)展,多種新型計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)已見雛形。哪種結(jié)構(gòu)類型將主導(dǎo)第六代計(jì)算機(jī),尚待今后的研究成果確定。310.1新型計(jì)算機(jī)系統(tǒng)現(xiàn)代計(jì)算機(jī)理論的奠基人是圖靈,他提10.1.1生物計(jì)算機(jī)以生物界處理問題的方式為模型的計(jì)算機(jī)都屬于生物計(jì)算機(jī),而狹義的生物計(jì)算機(jī)主要是指利用生物化學(xué)反應(yīng)算法或具有生物分子、超分子芯片的計(jì)算機(jī)。廣義的生物計(jì)算機(jī)還包括自動(dòng)機(jī)模型、仿生算法等類型。生物計(jì)算機(jī)目前主要有以下幾類:(1)生物分子或超分子芯片生物分子或超分子芯片立足于傳統(tǒng)計(jì)算機(jī)模式,從尋找高效、體微的電子信息載體及信息傳遞體入手,目前已對(duì)生物體內(nèi)的小分子、大分子、超分子生物芯片的結(jié)構(gòu)與功能做了大量的研究與開發(fā)。生物分子計(jì)算機(jī)中的生物分子,在電流的作用下同樣可以產(chǎn)生“開”和“關(guān)”的兩種狀態(tài),并能貯存、輸出“0”和“1”這樣的二進(jìn)制信息。因此,可以像電子計(jì)算機(jī)一樣進(jìn)行運(yùn)算和信息處理。組成生物計(jì)算機(jī)的蛋白質(zhì)分子,直徑只有頭發(fā)絲的五千分之一,體積僅手指頭粗細(xì)的一只生物計(jì)算機(jī),其貯存信息的容量可以比現(xiàn)在的普通電子計(jì)算機(jī)大1千萬(wàn)倍。而且由于生物分子非常微小、彼此之間的距離又非常近,所以傳遞信息和計(jì)算速度非???。

410.1.1生物計(jì)算機(jī)以生物界處理問題的方式為模型10.1.1生物計(jì)算機(jī)(續(xù)1)(2)自動(dòng)機(jī)模型和仿生算法以自動(dòng)理論為基礎(chǔ),致力與尋找新的計(jì)算機(jī)模式,特別是特殊用途的非數(shù)值計(jì)算機(jī)模式。目前研究的熱點(diǎn)集中在基本生物現(xiàn)象的類比,如神經(jīng)網(wǎng)絡(luò)、免疫網(wǎng)絡(luò)、細(xì)胞自動(dòng)機(jī)等。不同自動(dòng)機(jī)的區(qū)別主要是網(wǎng)絡(luò)內(nèi)部連接的差異,其基本特征是集體計(jì)算,又稱集體主義,在非數(shù)值計(jì)算、模擬、識(shí)別方面有極大的潛力。以生物智能為基礎(chǔ),用仿生的觀念致力于尋找新的算法模式,雖然類似于自動(dòng)機(jī)思想,但立足點(diǎn)在算法上,不追求硬件上的變化。人工智能的“結(jié)構(gòu)模擬”學(xué)派(或稱為“聯(lián)結(jié)主義”學(xué)派)對(duì)計(jì)算神經(jīng)網(wǎng)絡(luò)的研究取得了突出的成果,主張從結(jié)構(gòu)方面模擬、延伸、擴(kuò)展人的智能,用“電腦”模擬“人腦”神經(jīng)系統(tǒng)的聯(lián)結(jié)機(jī)制。神經(jīng)網(wǎng)絡(luò)就是由許多神經(jīng)元互連在一起所組成的神經(jīng)結(jié)構(gòu)。把神經(jīng)元之間相互作用的關(guān)系進(jìn)行數(shù)學(xué)模型化就可以得到神經(jīng)網(wǎng)絡(luò)模型。目前應(yīng)用較多的代表性模型有:M-P神經(jīng)細(xì)胞模型、BP神經(jīng)網(wǎng)絡(luò)模型、Hopfield神經(jīng)網(wǎng)絡(luò)模型。

510.1.1生物計(jì)算機(jī)(續(xù)1)(2)自動(dòng)機(jī)模型和仿生算法10.1.1生物計(jì)算機(jī)(續(xù)2)

(3)生物化學(xué)反應(yīng)算法立足于可控的生物化學(xué)反應(yīng)或反應(yīng)系統(tǒng),利用小容積內(nèi)同類分子高拷貝數(shù)的優(yōu)勢(shì),追求運(yùn)算的高度并行化,從而提供運(yùn)算的效率。DNA計(jì)算機(jī)屬于此類,將在下文介紹分子計(jì)算機(jī)時(shí)予以介紹。上海交通大學(xué)2004年在試管中完成了DNA計(jì)算機(jī)的雛形研制工作。由于生物具有自我修復(fù)功能,生物芯片一旦出現(xiàn)故障,不需要人工修理也可以進(jìn)行自我修復(fù)。所以,生物計(jì)算機(jī)具有“半永久性”和很高的可靠性。再者,生物計(jì)算機(jī)的元件是由有機(jī)分子組成的生物化學(xué)元件,它們是利用化學(xué)反應(yīng)工作的,所以,只需要很少的能量就可以工作了。因此,不會(huì)像電子計(jì)算機(jī)那樣,工作一段時(shí)間后,機(jī)體會(huì)發(fā)熱,而且它的電路間也沒有信號(hào)干擾。除了DNA計(jì)算外,生物計(jì)算還有另一個(gè)發(fā)展方向,即在半導(dǎo)體芯片上加入生物分子芯片,將硅基與碳基結(jié)合起來(lái)的混合技術(shù)。例如,硅片上長(zhǎng)出排列特殊的神經(jīng)元的“生物芯片”已被生產(chǎn)出來(lái)。盡管這些生物計(jì)算實(shí)驗(yàn)離實(shí)用還很遙遠(yuǎn)。610.1.1生物計(jì)算機(jī)(續(xù)2)(3)生物化學(xué)反應(yīng)算法610.1.2光計(jì)算機(jī)

光計(jì)算機(jī)是用光束代替電子進(jìn)行運(yùn)算和存儲(chǔ),它以不同波長(zhǎng)的光代表不同的數(shù)據(jù),以大量的透鏡、棱鏡和反射鏡將數(shù)據(jù)從一個(gè)芯片傳送到另一個(gè)芯片。這種傳送方式稱為自由空間光學(xué)技術(shù)。自由空間光學(xué)技術(shù)的原理非常簡(jiǎn)單。首先,將硅片內(nèi)的電子脈沖轉(zhuǎn)換為極細(xì)的閃爍光束,“接通”表示“1”,“斷開”表示“0”。然后,將數(shù)據(jù)流通過反射鏡和棱鏡網(wǎng)絡(luò)投射到需要數(shù)據(jù)的地方。在接收端,透鏡將每根光束聚焦到微型光電池上,由光電池將閃光重新轉(zhuǎn)換成一系列電子脈沖。光計(jì)算機(jī)有三大優(yōu)勢(shì)。一是光子的傳播速度無(wú)與倫比,電子在導(dǎo)線中的運(yùn)行速度與其相比就像蝸牛爬行那樣,而采用硅-光混合技術(shù)后,其傳送速度就可達(dá)到每秒萬(wàn)億字節(jié)。二是光子不像帶電的電子那樣相互作用,因此經(jīng)過同樣窄小的空間通道可以傳送更多數(shù)據(jù)。三是光無(wú)須物理連接。如能將普通的透鏡和激光器做得很小,足以裝在微芯片的背面,那么明天的計(jì)算機(jī)就可以通過稀薄的空氣傳送信號(hào)了。710.1.2光計(jì)算機(jī)光計(jì)算機(jī)是用光束代替電子進(jìn)行運(yùn)算和存10.1.3量子計(jì)算機(jī)

量子計(jì)算機(jī)是利用原子所具有的量子特性進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理的一種物理裝置。量子計(jì)算機(jī)是一種全新概念的計(jì)算機(jī),基于量子的相干性,因而它具有高度的并行計(jì)算能力。與經(jīng)典計(jì)算機(jī)相比,量子計(jì)算機(jī)在存儲(chǔ)容量、運(yùn)算速度上都會(huì)有指數(shù)數(shù)量級(jí)的提高。因此,量子計(jì)算機(jī)的研究在國(guó)際上引起高度關(guān)注。如對(duì)一個(gè)129位數(shù)的因子分解,用1600臺(tái)超級(jí)計(jì)算機(jī)與互連網(wǎng)進(jìn)行運(yùn)算要花8個(gè)多月才能破譯,而用一臺(tái)量子計(jì)算機(jī)幾秒鐘就輕易解決了。據(jù)介紹,具有5000個(gè)量子位的量子計(jì)算機(jī),可以在30秒內(nèi)解決傳統(tǒng)超級(jí)計(jì)算機(jī)要100億年才能解決的大數(shù)因子分解問題。量子計(jì)算機(jī)的輸入用一個(gè)具有有限能級(jí)的量子系統(tǒng)來(lái)描述,最小的信息單元是一個(gè)量子比特(quantumbit)。量子比特不只是開、關(guān)兩種狀態(tài),而是以多種狀態(tài)同時(shí)出現(xiàn)。處于量子狀態(tài)的粒子能夠進(jìn)入“超態(tài)”,即同時(shí)沿上、下兩個(gè)方向自旋。這一狀態(tài)可代表1、0以及中間的所有可能數(shù)值。810.1.3量子計(jì)算機(jī)量子計(jì)算機(jī)是利用原子所具有的量子10.1.4分子計(jì)算機(jī)

分子計(jì)算機(jī)用單個(gè)分子或單個(gè)電子代替硅晶體管,起到類似邏輯門和電子開關(guān)的作用,從而進(jìn)行運(yùn)算。近年來(lái),分子級(jí)電子元件領(lǐng)域中取得了進(jìn)展,該領(lǐng)域的出現(xiàn)有一個(gè)前提,即有可能制造出單個(gè)的分子,其功能與三極管、二極管及今天的微電路的其他重要部件完全相同或相似?;瘜W(xué)家、物理學(xué)家和工程師已經(jīng)在一系列出色的示范試驗(yàn)中顯示:?jiǎn)蝹€(gè)的分子能傳導(dǎo)和轉(zhuǎn)換電流,并存儲(chǔ)信息。DNA計(jì)算機(jī)將是分子計(jì)算機(jī)發(fā)展的方向之一。20世紀(jì)70年代,人們發(fā)現(xiàn)脫氧核糖核酸(DNA)分子是一條雙螺“長(zhǎng)鏈”,鏈上布滿了“珍珠”即核苷酸,DNA分子計(jì)算機(jī)就是用這些“珍珠”的排列來(lái)表示各種信息。DNA處于不同狀態(tài)時(shí)可以代表信息的有或無(wú)。DNA分子中的遺傳密碼相當(dāng)于存儲(chǔ)的數(shù)據(jù),DNA分子間通過生化反應(yīng),從一種基因代碼轉(zhuǎn)變?yōu)榱硪环N基因代碼。反應(yīng)前的基因代碼相當(dāng)于輸入數(shù)據(jù),反應(yīng)后的基因代碼相當(dāng)于輸出數(shù)據(jù)。如果能控制這一反應(yīng)過程,那么就可以制作成功DNA計(jì)算機(jī)。當(dāng)計(jì)算機(jī)計(jì)算時(shí),幾種生物酶則充當(dāng)加、減、乘、除。DNA計(jì)算機(jī)通過生物化學(xué)反應(yīng)得出計(jì)算的結(jié)果。910.1.4分子計(jì)算機(jī)分子計(jì)算機(jī)用單個(gè)分子或單個(gè)電子代10.2計(jì)算理論的發(fā)展

10.2.1人工智能智能是個(gè)體有目的的行為,合理的思維,以及有效的、適應(yīng)環(huán)境的綜合能力。智能是個(gè)體認(rèn)識(shí)客觀事物和運(yùn)用知識(shí)解決問題的能力。人工智能(ArtificialIntelligence)簡(jiǎn)稱AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能(HumanIntelligence)的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是由多學(xué)科滲透產(chǎn)生的綜合性邊緣學(xué)科。人工智能的研究目標(biāo)就是探討智能的基本機(jī)理,研究如何利用各種自動(dòng)機(jī)來(lái)模擬人的某些思維過程和智能行為,用機(jī)器來(lái)代替人的部分腦力勞動(dòng),包括用計(jì)算機(jī)進(jìn)行復(fù)雜推理、自動(dòng)求解某些復(fù)雜問題。

1010.2計(jì)算理論的發(fā)展10.2.1人工智能1010.2.1人工智能(續(xù))人工智能在以下方面取得了成就,并且研究正在深入:1)專家咨詢系統(tǒng):主要由知識(shí)庫(kù)、數(shù)據(jù)庫(kù)和推理機(jī)制組成。如:數(shù)學(xué)專家系統(tǒng),化學(xué)專家系統(tǒng)、中醫(yī)專家系統(tǒng)等。2)模式識(shí)別:用特征識(shí)別和關(guān)系識(shí)別,先對(duì)文字、聲音、圖形、圖象、物體等信息加以分析,然后與模式對(duì)比識(shí)別。有效的應(yīng)用已有文字識(shí)別、語(yǔ)言識(shí)別和理解、人的面孔和指紋識(shí)別、醫(yī)療診斷等。3)機(jī)器人:模擬人的部分功能的自動(dòng)機(jī)器。分工業(yè)機(jī)器人和智能機(jī)器人,人工智能主要研究智能機(jī)器人。智能機(jī)器人具有各種傳感器(感覺器)和學(xué)習(xí)能力。4)數(shù)學(xué)定理的證明:大大減輕人的腦力勞動(dòng)。四色問題又稱四色猜想,即:如果相鄰兩國(guó)用不同顏色涂上,地圖只需要四種顏色就夠了。5)博奕:由計(jì)算機(jī)與人下棋、打牌等。IBM的“深藍(lán)”系統(tǒng)戰(zhàn)勝了國(guó)際象棋大師卡斯帕諾夫,就是計(jì)算機(jī)的機(jī)器智能水平的一次榮譽(yù)記錄,也是聰明的人工智能軟件的一個(gè)成功范例。6)人工智能計(jì)算機(jī):對(duì)正在研制中的新型電子計(jì)算機(jī),有人稱為第五代計(jì)算機(jī),是一種更接近人的人工智能計(jì)算機(jī)。1110.2.1人工智能(續(xù))人工智能在以下方面取得了10.2.2數(shù)據(jù)挖掘

數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程,這些模型和關(guān)系可以用來(lái)作出預(yù)測(cè)。數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)大部分情況下,數(shù)據(jù)挖掘都要先把數(shù)據(jù)從數(shù)據(jù)倉(cāng)庫(kù)中拿到數(shù)據(jù)挖掘庫(kù)或數(shù)據(jù)集市中(見圖10-1)。從數(shù)據(jù)倉(cāng)庫(kù)中直接得到進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多,如果數(shù)據(jù)在導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)時(shí)已經(jīng)清理過,那很可能在做數(shù)據(jù)挖掘時(shí)就沒必要再清理一次了,而且所有的數(shù)據(jù)不一致的問題都已經(jīng)被解決了。1210.2.2數(shù)據(jù)挖掘數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量10.2.2數(shù)據(jù)挖掘(續(xù)1)

數(shù)據(jù)挖掘庫(kù)可能是數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)邏輯上的子集,而不一定非得是物理上單獨(dú)的數(shù)據(jù)庫(kù)。但如果數(shù)據(jù)倉(cāng)庫(kù)的計(jì)算資源已經(jīng)很緊張,那最好還是建立一個(gè)單獨(dú)的數(shù)據(jù)挖掘庫(kù)。數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)(續(xù))1310.2.2數(shù)據(jù)挖掘(續(xù)1)數(shù)據(jù)挖掘庫(kù)可能是數(shù)據(jù)倉(cāng)庫(kù)的一10.2.2數(shù)據(jù)挖掘(續(xù)2)

數(shù)據(jù)挖掘和在線分析處理(OLAP)

OLAP是決策支持領(lǐng)域的一部分。傳統(tǒng)的查詢和報(bào)表工具是告訴你數(shù)據(jù)庫(kù)中都有什么(Whathappened),OLAP則更進(jìn)一步告訴你下一步會(huì)怎么樣(Whatnext)、如果我采取這樣的措施又會(huì)怎么樣(Whatif)。用戶首先建立一個(gè)假設(shè),然后用OLAP檢索數(shù)據(jù)庫(kù)來(lái)驗(yàn)證這個(gè)假設(shè)是否正確。數(shù)據(jù)挖掘與OLAP不同的地方是,數(shù)據(jù)挖掘不是用于驗(yàn)證某個(gè)假定的模式(模型)的正確性,而是在數(shù)據(jù)庫(kù)中自己尋找模型,在本質(zhì)上是一個(gè)歸納的過程。數(shù)據(jù)挖掘和OLAP具有一定的互補(bǔ)性。在利用數(shù)據(jù)挖掘出來(lái)的結(jié)論采取行動(dòng)之前,你也許要驗(yàn)證一下如果采取這樣的行動(dòng)會(huì)給公司帶來(lái)什么樣的影響,那么OLAP工具能回答你的這些問題。

1410.2.2數(shù)據(jù)挖掘(續(xù)2)數(shù)據(jù)挖掘和在線分析處理(OL10.2.2數(shù)據(jù)挖掘(續(xù)3)

數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)數(shù)據(jù)挖掘利用了人工智能(AI)和統(tǒng)計(jì)分析的進(jìn)步所帶來(lái)的好處。這兩門學(xué)科都致力于模式發(fā)現(xiàn)和預(yù)測(cè)。數(shù)據(jù)挖掘不是為了替代傳統(tǒng)的統(tǒng)計(jì)分析技術(shù)。相反,它是統(tǒng)計(jì)分析方法學(xué)的延伸和擴(kuò)展。大多數(shù)的統(tǒng)計(jì)分析技術(shù)都基于完善的數(shù)學(xué)理論和高超的技巧,預(yù)測(cè)的準(zhǔn)確度還是令人滿意的,但對(duì)使用者的要求很高。而隨著計(jì)算機(jī)計(jì)算能力的不斷增強(qiáng),我們有可能利用計(jì)算機(jī)強(qiáng)大的計(jì)算能力只通過相對(duì)簡(jiǎn)單和固定的方法完成同樣的功能。一些新興的技術(shù)同樣在知識(shí)發(fā)現(xiàn)領(lǐng)域取得了很好的效果,如神經(jīng)元網(wǎng)絡(luò)和決策樹,在足夠多的數(shù)據(jù)和計(jì)算能力下,它們幾乎不用人的關(guān)照自動(dòng)就能完成許多有價(jià)值的功能。數(shù)據(jù)挖掘就是利用了統(tǒng)計(jì)和人工智能技術(shù)的應(yīng)用程序,它把這些高深復(fù)雜的技術(shù)封裝起來(lái),使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題。

1510.2.2數(shù)據(jù)挖掘(續(xù)3)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)1510.2.2數(shù)據(jù)挖掘(續(xù)4)

數(shù)據(jù)挖掘應(yīng)用由于數(shù)據(jù)挖掘帶來(lái)的顯著的經(jīng)濟(jì)效益,使數(shù)據(jù)挖掘越來(lái)越普及。數(shù)據(jù)挖掘不僅能用于控制成本,也能給企業(yè)帶來(lái)效益。很多企業(yè)都在利用數(shù)據(jù)挖掘技術(shù)幫助管理客戶生命周期的各個(gè)階段,包括爭(zhēng)取新的客戶、在已有客戶的身上賺更多的錢、和保持住好的客戶。如果能夠確定好的客戶的特點(diǎn),那么就能提供為客戶提供針對(duì)性的服務(wù)。比如,已經(jīng)發(fā)現(xiàn)了購(gòu)買某一商品的客戶的特征,那么就可以向那些具有這些特征但還沒有購(gòu)買此商品的客戶推銷這個(gè)商品;找到流失的客戶的特征,就可以在那些具有相似特征的客戶還未流失之前進(jìn)行針對(duì)性的彌補(bǔ),因?yàn)楸A粢粋€(gè)客戶要比爭(zhēng)取一個(gè)客戶便宜得多。

1610.2.2數(shù)據(jù)挖掘(續(xù)4)數(shù)據(jù)挖掘應(yīng)用1610.2.2數(shù)據(jù)挖掘(續(xù)5)

數(shù)據(jù)挖掘的步驟(1)定義商業(yè)問題。在開始知識(shí)發(fā)現(xiàn)之前,最先的、最重要的要求就是了解數(shù)據(jù)和業(yè)務(wù)問題,搞清楚到底想干什么。(2)建立數(shù)據(jù)挖掘庫(kù)。應(yīng)該把要挖掘的數(shù)據(jù)都收集到一個(gè)數(shù)據(jù)庫(kù)中。(3)分析數(shù)據(jù)。瀏覽分析這些數(shù)據(jù),產(chǎn)生初步的認(rèn)識(shí)和處理方向。(4)準(zhǔn)備數(shù)據(jù)。這是建立模型之前的最后一步數(shù)據(jù)準(zhǔn)備工作,包括選擇變量、選擇記錄、創(chuàng)建新變量和轉(zhuǎn)換變量。(5)建立模型。建立模型是最重要的工作,也是一個(gè)反復(fù)的過程。建立模型是為了預(yù)測(cè)或分類。(6)評(píng)價(jià)模型。模型建立好之后,必須評(píng)價(jià)其結(jié)果、解釋其價(jià)值。(7)實(shí)施和改進(jìn)。模型建立好后,可以投入實(shí)用,記載使用情況。1710.2.2數(shù)據(jù)挖掘(續(xù)5)數(shù)據(jù)挖掘的步驟1710.2.3人工神經(jīng)網(wǎng)絡(luò)

所謂人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,簡(jiǎn)寫為ANN或ANNs)是指為了模擬生物大腦的結(jié)構(gòu)和功能而構(gòu)成的一種信息處理系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)并行、分布處理結(jié)構(gòu),是由處理單元(人工神經(jīng)元)及稱為聯(lián)接的無(wú)向訊號(hào)通道互連組成的網(wǎng)絡(luò)。它是從微觀結(jié)構(gòu)和功能上對(duì)人腦的抽象、簡(jiǎn)化,是模擬人類智能的一條重要途徑,反映了人腦功能的若干基本特征,如并行信息處理、學(xué)習(xí)、聯(lián)想、模式分類、記憶等。簡(jiǎn)單地講,它是一個(gè)數(shù)學(xué)模型,可以用電子線路來(lái)實(shí)現(xiàn),也可以用計(jì)算機(jī)程序來(lái)模擬,是人工智能研究的一種方法。傳統(tǒng)的人工智能技術(shù)是基于物理符號(hào)系統(tǒng)的,而人工神經(jīng)網(wǎng)絡(luò)技術(shù)是基于聯(lián)接主義觀點(diǎn)的。人工神經(jīng)網(wǎng)絡(luò)是對(duì)人腦或自然神經(jīng)網(wǎng)絡(luò)(NaturalNeuralNetwork)若干基本特性的抽象和模擬。人工神經(jīng)網(wǎng)絡(luò)的模型現(xiàn)在有數(shù)十種之多,應(yīng)用較多的典型的神經(jīng)網(wǎng)絡(luò)模型有BP網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)、ART網(wǎng)絡(luò)和Kohonen網(wǎng)絡(luò)。1.什么是神經(jīng)網(wǎng)絡(luò)1810.2.3人工神經(jīng)網(wǎng)絡(luò)所謂人工神經(jīng)網(wǎng)絡(luò)(Artific2.神經(jīng)元及其行為機(jī)理神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)在于神經(jīng)元。神經(jīng)元是腦組織的基本單元,人腦是由大約10億個(gè)神經(jīng)元組成的巨系統(tǒng)。在人體內(nèi),神經(jīng)元的結(jié)構(gòu)形式并非是完全相同的;但是,無(wú)論結(jié)構(gòu)形式如何,神經(jīng)元都是由一些基本的成份組成的。從圖中可以看出:神經(jīng)元是由細(xì)胞體、樹突和軸突三部分組成。192.神經(jīng)元及其行為機(jī)理神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)在于神經(jīng)元。神經(jīng)元是腦10.2.3人工神經(jīng)網(wǎng)絡(luò)

細(xì)胞體:由細(xì)胞核、細(xì)胞質(zhì)和細(xì)胞膜組成,是神經(jīng)元活動(dòng)的能量供應(yīng)地,在這里進(jìn)行新陳代謝等各種生化過程。軸突:由細(xì)胞體外伸出的最長(zhǎng)的分支組成,是把神經(jīng)元興奮的信息傳出到其它神經(jīng)元的出口。有興奮型與抑制型兩種。樹突:由細(xì)胞體外伸出的較短的分支組成,是接受從其它神經(jīng)元傳入的信息的入口。根據(jù)神經(jīng)生理學(xué)的研究,已經(jīng)發(fā)現(xiàn)神經(jīng)元有4種生物行為:①能處于抑制或興奮狀態(tài);②能產(chǎn)生爆發(fā)和平臺(tái)兩種情況;③能產(chǎn)生抑制后的反沖;④具有適應(yīng)性。2010.2.3人工神經(jīng)網(wǎng)絡(luò)細(xì)胞體:由細(xì)胞核、細(xì)胞質(zhì)和細(xì)胞膜10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)1)

突觸是一個(gè)神經(jīng)元與另一個(gè)神經(jīng)元之間相聯(lián)系并進(jìn)行信息傳送的結(jié)構(gòu)。突觸如圖10-4所示。它由突觸前成分,突觸間隙和突觸后成分組成。突觸前成分是一個(gè)神經(jīng)元的軸突末梢。突觸間隙是突觸前成分與后成分之間的距離空間,間隙一般為200—300?。突觸后成分可以是細(xì)胞體、樹突或軸突。突觸的存在說(shuō)明兩個(gè)神經(jīng)元的細(xì)胞質(zhì)并不直接連通,兩者彼此聯(lián)系是通過突觸這種結(jié)構(gòu)接口的。突觸的4種生物行為有:①能進(jìn)行信息綜合;②能產(chǎn)生漸次變化的傳送;③有電接觸和化學(xué)接觸等多種連接方式;④會(huì)產(chǎn)生延時(shí)激發(fā)。2110.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)1)突觸是一個(gè)神經(jīng)元與另一個(gè)3.神經(jīng)元的數(shù)學(xué)模型與神經(jīng)生理學(xué)類比,連接機(jī)制結(jié)構(gòu)的基本處理單元就稱為神經(jīng)元。每個(gè)構(gòu)造起網(wǎng)絡(luò)的神經(jīng)元模型模擬一個(gè)生物神經(jīng)元,如圖10-5所示。該神經(jīng)元單元由多個(gè)輸入(i=1,2,...,n)和一個(gè)輸出y組成。中間狀態(tài)由輸入信號(hào)的權(quán)和表示,而輸出為:神經(jīng)元的數(shù)學(xué)模型如圖

10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)2)

223.神經(jīng)元的數(shù)學(xué)模型與神經(jīng)生理學(xué)類比,連接機(jī)制結(jié)構(gòu)的基本處3.神經(jīng)元的數(shù)學(xué)模型(續(xù))式中,θ為神經(jīng)元單元的偏置(閾值),wi為連接權(quán)系數(shù)(對(duì)于激發(fā)狀態(tài),wi取正值,對(duì)于抑制狀態(tài),wi取負(fù)值),n為輸入信號(hào)數(shù)目,Y為神經(jīng)元輸出,f為輸出變換函數(shù),有時(shí)叫做激發(fā)或激勵(lì)函數(shù),往往采用0和1二值函數(shù)或S形函數(shù),這些函數(shù)都是連續(xù)和非線性的。一種二值函數(shù)可由下式表示:一種常規(guī)的S形函數(shù)可由下式表示:

常用雙曲正切函數(shù)來(lái)取代常規(guī)S形函數(shù),因?yàn)椋有魏瘮?shù)的輸出均為正值,而雙曲正切函數(shù)的輸出值可為正或負(fù)。雙曲正切函數(shù)如下式所示:10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)3)

233.神經(jīng)元的數(shù)學(xué)模型(續(xù))式中,θ為神經(jīng)元單元的偏置(閾值神經(jīng)網(wǎng)絡(luò)的工作過程

10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)4)

24神經(jīng)網(wǎng)絡(luò)的工作過程10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)4)244.人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)和優(yōu)越性

1)可以充分逼近任意復(fù)雜的非線性關(guān)系;2)所有定量或定性的信息都分布貯存于網(wǎng)絡(luò)內(nèi)的各神經(jīng)元及其連線上,故有很強(qiáng)的魯棒性和容錯(cuò)性;3)采用并行分布處理方法,使得快速進(jìn)行大量運(yùn)算成為可能;4)可學(xué)習(xí)和自適應(yīng)不知道或不確定的系統(tǒng);5)能夠同時(shí)處理定量、定性知識(shí);6)具有自學(xué)習(xí)功能;7)具有聯(lián)想存儲(chǔ)功能;8)具有高速尋找優(yōu)化解的能力。

10.2.3人工神經(jīng)網(wǎng)絡(luò)(續(xù)5)

254.人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)和優(yōu)越性1)可以充分逼近任意復(fù)雜分布式計(jì)算(DistributedComputing)是一種把需要進(jìn)行大量計(jì)算的工程數(shù)據(jù)分割成小塊,由多臺(tái)計(jì)算機(jī)分別計(jì)算,在上傳運(yùn)算結(jié)果后再統(tǒng)一合并得出數(shù)據(jù)結(jié)論的科學(xué)。當(dāng)今從事的科學(xué)研究課題學(xué)科繁多,涉及面廣,分類又細(xì),而每個(gè)學(xué)科似乎都需要進(jìn)行大量的計(jì)算。天文學(xué)研究組織需要計(jì)算機(jī)來(lái)分析太空脈沖(pulse),星位移動(dòng);生物學(xué)家需要計(jì)算機(jī)來(lái)模擬蛋白質(zhì)的折疊(proteinfolding)過程;藥物學(xué)家想要研制克服愛滋?。ˋIDS)或非典(SARS)的藥物;數(shù)學(xué)家想計(jì)算最大的質(zhì)數(shù)和圓周率的更精確值;經(jīng)濟(jì)學(xué)家要用計(jì)算機(jī)分析計(jì)算在幾萬(wàn)中因素考慮下某個(gè)企業(yè)/城市/國(guó)家的發(fā)展方向從而宏觀調(diào)控。由此可見,人類未來(lái)的科學(xué),時(shí)時(shí)刻刻離不開計(jì)算。而分布式計(jì)算,以其獨(dú)特的優(yōu)點(diǎn)——便宜、高效而越來(lái)越受到社會(huì)的關(guān)注。10.2.4分布式計(jì)算26分布式計(jì)算(DistributedComputing)是一分布式計(jì)算產(chǎn)生的原因主要有:1)計(jì)算資源的共享。用整個(gè)網(wǎng)絡(luò)中的所有計(jì)算機(jī)來(lái)處理總比單臺(tái)機(jī)器要快一些,另外,一些運(yùn)算速度比較慢的客戶機(jī)也可以用運(yùn)算速度比較快的服務(wù)器來(lái)協(xié)作完成某項(xiàng)工作。2)減輕網(wǎng)絡(luò)的負(fù)荷。雖然網(wǎng)絡(luò)技術(shù)飛速發(fā)展,網(wǎng)絡(luò)的帶寬不斷的增加,但總是有限的。在分布式數(shù)據(jù)處理中,在網(wǎng)絡(luò)中傳遞的數(shù)據(jù)量是非常大的。SQL語(yǔ)句會(huì)把一整張表放在網(wǎng)絡(luò)上。因此,如果在網(wǎng)絡(luò)中所傳輸?shù)膬H僅是一些數(shù)據(jù)處理后的結(jié)果,而不是大量的中間數(shù)據(jù),整個(gè)網(wǎng)絡(luò)的負(fù)荷就會(huì)降低了。3)安全性。我們可以把一些關(guān)鍵的計(jì)算過程和數(shù)據(jù)放在服務(wù)器上,并給予特殊的安全保護(hù)。4)合理的軟件結(jié)構(gòu)。在某一些環(huán)境下,擁有分布式計(jì)算的軟件結(jié)構(gòu)更加容易解決實(shí)際問題。

10.2.4分布式計(jì)算(續(xù)1)27分布式計(jì)算產(chǎn)生的原因主要有:10.2.4分布式計(jì)算(續(xù)1)分布式計(jì)算的格局就目前來(lái)看,全球的各種分布式計(jì)算已有約百種,這些計(jì)算大多互無(wú)聯(lián)系、獨(dú)立管理、獨(dú)立使用自己的一套軟件。目前的這種分布式計(jì)算互相割據(jù)的格局很不利于發(fā)展的需要。為了改變這種雜亂無(wú)章的割據(jù),美國(guó)加州大學(xué)伯克利分校(UCBerkeley)首先提出了建立BOINC的想法。BOINC的中文全稱是伯克利開放式網(wǎng)絡(luò)計(jì)算平臺(tái)(BerkeleyOpenInfrastructureforNetworkComputing),它能夠把許多不同的分布式計(jì)算項(xiàng)目聯(lián)系起來(lái)統(tǒng)一管理,并對(duì)計(jì)算機(jī)資源進(jìn)行統(tǒng)一分配(比方對(duì)研究愛滋病藥物和探索地外文明同時(shí)感興趣,就可以同時(shí)選擇兩個(gè)運(yùn)行,并設(shè)置優(yōu)先級(jí))。同時(shí),還對(duì)統(tǒng)計(jì)評(píng)分系統(tǒng)進(jìn)行統(tǒng)一管理(無(wú)論你在為哪個(gè)項(xiàng)目工作,只要你奉獻(xiàn)CPU時(shí)間長(zhǎng),就積分高)。

10.2.4分布式計(jì)算(續(xù)2)28分布式計(jì)算的格局10.2.4分布式計(jì)算(續(xù)2)28分布式存儲(chǔ)和計(jì)算如果說(shuō)某項(xiàng)工作是分布式的,那么,參與這項(xiàng)工作的一定不只是一臺(tái)計(jì)算機(jī),而是一個(gè)計(jì)算機(jī)網(wǎng)絡(luò)??梢园延?jì)算機(jī)網(wǎng)絡(luò)所做的工作分兩種:分布式數(shù)據(jù)存貯,分布式計(jì)算。在分布式數(shù)據(jù)存貯中,網(wǎng)絡(luò)使數(shù)據(jù)存貯分布化,我們把數(shù)據(jù)放到網(wǎng)絡(luò)上的不同的機(jī)器中,而不是僅存儲(chǔ)在一臺(tái)計(jì)算機(jī)。數(shù)據(jù)是共享的,網(wǎng)絡(luò)的任何計(jì)算機(jī)可以透明地存取到不同來(lái)源的數(shù)據(jù)。比如,在Delphi或PowerBuilder中,程序所處理的數(shù)據(jù)往往來(lái)自于不同的數(shù)據(jù)庫(kù)服務(wù)器,而不僅僅是本地機(jī)器。我們把它稱為分布式數(shù)據(jù)。在分布式計(jì)算中,網(wǎng)絡(luò)側(cè)重于它的計(jì)算功能。在分布式數(shù)據(jù)中,完成一件工作時(shí),數(shù)據(jù)可能來(lái)自于網(wǎng)絡(luò)中不同的機(jī)器,但對(duì)于這些數(shù)據(jù)的處理卻是在本機(jī)中完成的。而在分布式計(jì)算環(huán)境中,數(shù)據(jù)的處理不只是在一臺(tái)機(jī)器完成,而是多臺(tái)機(jī)器協(xié)作完成的。比如,為了處理一項(xiàng)工作P,它由兩部分工作組成,PA和PB。如果我們把PA放在機(jī)器A中完成,PB處理放在機(jī)器B中完成,那么它們就形成了一個(gè)分布式的計(jì)算。計(jì)算機(jī)的計(jì)算總是離不開數(shù)據(jù),所以,在大部分情況下,分布式計(jì)算總是伴隨著分布式數(shù)據(jù)。10.2.4分布式計(jì)算(續(xù)3)29分布式存儲(chǔ)和計(jì)算10.2.4分布式計(jì)算(續(xù)3)29網(wǎng)格計(jì)算網(wǎng)格(GridComputing)是構(gòu)筑在因特網(wǎng)上的一組新興技術(shù),它將高速互聯(lián)網(wǎng)、高性能計(jì)算機(jī)、大型數(shù)據(jù)庫(kù)、傳感器、遠(yuǎn)程設(shè)備等融為一體,為科技人員和普通老百姓提供更多的資源、功能和交互性。比如,有一項(xiàng)業(yè)務(wù)使用1GHzCPU需要3分鐘的處理時(shí)間。如果網(wǎng)絡(luò)中有3臺(tái)安裝了同樣CPU的計(jì)算機(jī),我們把這項(xiàng)業(yè)務(wù)分成3等分,然后分別交給每臺(tái)計(jì)算機(jī)進(jìn)行處理,那么簡(jiǎn)單地計(jì)算一下就會(huì)知道其處理時(shí)間將縮短到1分鐘。這就是網(wǎng)格計(jì)算的基本思路。網(wǎng)格計(jì)算是伴隨著互聯(lián)網(wǎng)而迅速發(fā)展起來(lái)的,專門針對(duì)復(fù)雜科學(xué)計(jì)算的新型計(jì)算模式。這種計(jì)算模式是利用互聯(lián)網(wǎng)把分散在不同地理位置的電腦組織成一個(gè)“虛擬的超級(jí)計(jì)算機(jī)”,其中每一臺(tái)參與計(jì)算的計(jì)算機(jī)就是一個(gè)“節(jié)點(diǎn)”,而整個(gè)計(jì)算是由成千上萬(wàn)個(gè)“節(jié)點(diǎn)”組成的“一張網(wǎng)格”,所以這種計(jì)算方式叫網(wǎng)格計(jì)算。這樣組織起來(lái)的“虛擬的超級(jí)計(jì)算機(jī)”有兩個(gè)優(yōu)勢(shì),一個(gè)是數(shù)據(jù)處理能力超強(qiáng);另一個(gè)是能充分利用網(wǎng)上的閑置處理能力。10.2.4分布式計(jì)算(續(xù)4)30網(wǎng)格計(jì)算10.2.4分布式計(jì)算(續(xù)4)30采用并行計(jì)算,解決海量數(shù)據(jù)處理問題,有三種途徑:1)采用并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)。2)使用有并行運(yùn)算功能的操作系統(tǒng)。3)使用能夠進(jìn)行并行運(yùn)算的計(jì)算機(jī)軟件。

10.2.5并行計(jì)算

31采用并行計(jì)算,解決海量數(shù)據(jù)處理問題,有三種途徑:10.2.51.并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),一是指單臺(tái)計(jì)算機(jī)并行處理結(jié)構(gòu),二是指多臺(tái)計(jì)算機(jī)構(gòu)成的多微理處理分布式系統(tǒng)結(jié)構(gòu)。對(duì)于傳統(tǒng)的處理器,性能上的競(jìng)爭(zhēng)一直集中在增大緩存容量和提高頻率兩個(gè)方面,但是傳統(tǒng)處理器由于是單個(gè)物理運(yùn)算,單元運(yùn)算不能充分發(fā)揮處理器的性能。英特爾發(fā)明了超線程技術(shù),它是一種特殊的多線程技術(shù),可以充分挖掘單個(gè)物理處理器的潛力,讓單個(gè)處理器都能使用線程級(jí)并行運(yùn)算,從而兼容多線程操作系統(tǒng)和軟件,提高處理器性能,操作系統(tǒng)或者應(yīng)用軟件的多線程可以同時(shí)在一個(gè)處理器上運(yùn)行。其設(shè)計(jì)思想是:在一個(gè)CPU中增加電路,讓它以兩個(gè)邏輯CPU的形式出現(xiàn)。其結(jié)果是:物理上的一個(gè)CPU,在操作系統(tǒng)和多線程應(yīng)用中以兩個(gè)邏輯CPU的形式

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論