版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生物信息學(xué)數(shù)據(jù)挖掘第1頁/共18頁2023/4/182主要內(nèi)容生物信息學(xué)的范疇數(shù)據(jù)挖掘的相關(guān)概念數(shù)據(jù)挖掘的經(jīng)典案例生物信息學(xué)數(shù)據(jù)挖掘領(lǐng)域的現(xiàn)狀、方向課題的前景第2頁/共18頁2023/4/183生物信息學(xué)(Bioinformatics)在生命科學(xué)的研究中,以計(jì)算機(jī)為工具對生物信息進(jìn)行存儲、檢索和分析的一門交叉學(xué)科。研究內(nèi)容:基因組生物信息學(xué)蛋白質(zhì)組生物信息學(xué)代謝調(diào)控生物信息學(xué)目的:
通過對生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、存儲、檢索與分析,進(jìn)而揭示數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義。前景:生物信息學(xué)已然深入到了生命科學(xué)的方方面面。人類基因組計(jì)劃為生物信息學(xué)提供了興盛的契機(jī),創(chuàng)造了施展身手的巨大空間。第3頁/共18頁2023/4/184生物信息學(xué)相關(guān)數(shù)據(jù)庫資源1.核酸序列及其相關(guān)數(shù)據(jù)庫2.蛋白質(zhì)序列及其相關(guān)數(shù)據(jù)庫(蛋白質(zhì)三維結(jié)構(gòu)、蛋白質(zhì)組二維凝膠電泳數(shù)據(jù)庫、信號傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫、DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫)3.基因組數(shù)據(jù)庫4.序列分析數(shù)據(jù)庫5.人類基因突變及疾病相關(guān)數(shù)據(jù)庫6.進(jìn)化相關(guān)數(shù)據(jù)庫第4頁/共18頁2023/4/185專門數(shù)據(jù)庫目錄網(wǎng)站《核酸研究》2000年開始創(chuàng)建了生物信息學(xué)數(shù)據(jù)庫目錄。DBCat:法國生物信息中心于1997年建立的數(shù)據(jù)庫目錄。到目前為止收錄500多個數(shù)據(jù)庫。目前,絕大部分核酸和蛋白質(zhì)數(shù)據(jù)庫由美國、歐洲和日本的3家數(shù)據(jù)庫系統(tǒng)產(chǎn)生。它們共同組成國際核酸序列數(shù)據(jù)庫,每天交換數(shù)據(jù),同步更新大部分?jǐn)?shù)據(jù)庫是可以免費(fèi)下載的公用數(shù)據(jù)庫。第5頁/共18頁2023/4/186
生物信息學(xué)中心1.NCBI:美國國立生物技術(shù)信息中心(TheNationalCenterBiotechnologyInformation),設(shè)立了公共數(shù)據(jù)庫,開發(fā)軟件工具分析核酸序列、基因組序列、基因表達(dá)序列、蛋白序列等提供了大量與基因、蛋白序列有關(guān)的信息與文獻(xiàn)資料。2.EBI:歐洲生物信息研究(TheEuropeanBioinformationIntitute),提供與生物學(xué)有關(guān)的各種信息、數(shù)據(jù)庫、軟件工具等3.ExPASy:(ExpertProteinAnalysisSystem)日內(nèi)瓦大學(xué)分子生物學(xué)服務(wù)站,提供與蛋白有關(guān)的各種在線工具。提供數(shù)據(jù)庫中的鏈接,同時提供許多用于該方面查詢的文件,并與本站點(diǎn)相鏈接。4.BioSino:上海生命科學(xué)院生物信息中心,提供了有關(guān)生物信息學(xué)方面的新聞、論文、相關(guān)數(shù)據(jù)庫、軟件等。5.CBI:北京大學(xué)生物信息中心,介紹了豐富的生物信息學(xué)基本知識,國內(nèi)外生物信息學(xué)網(wǎng)站,常用的生物信息學(xué)數(shù)據(jù)庫的介紹和相關(guān)的軟件等。第6頁/共18頁2023/4/187數(shù)據(jù)挖掘(datamining)數(shù)據(jù)挖掘
是以數(shù)據(jù)倉庫和多維數(shù)據(jù)庫中的大量數(shù)據(jù)為基礎(chǔ),自動發(fā)現(xiàn)數(shù)據(jù)中的潛在模式,并以這些模式為基礎(chǔ)自動的作出預(yù)測.收集在大型數(shù)據(jù)庫中的數(shù)據(jù)變成了”數(shù)據(jù)墳?zāi)埂蔽覀償?shù)據(jù)豐富但信息貧乏第7頁/共18頁2023/4/188數(shù)據(jù)中知識發(fā)現(xiàn)(KDD)在你的數(shù)據(jù)中搜索知識(有趣的模式)第8頁/共18頁2023/4/189數(shù)據(jù)挖掘的經(jīng)典案例啤酒和尿布的案例英國超級市場中的啤酒和尿布的擺放位置其他數(shù)據(jù)挖掘的案例
顧客信譽(yù)卡:使用信譽(yù)卡將顧客的購買序列記錄下來,顧客在不同時期購買的商品可以分組為序列,序列模式的挖掘可以分析顧客的消費(fèi)或忠誠的變化,據(jù)此對價(jià)格和商品花樣進(jìn)行調(diào)整以便留住老顧客,吸引新顧客。
卡夫(Kraft)食品公司建立了一個擁有3000萬客戶資料的數(shù)據(jù)庫,數(shù)據(jù)庫是通過收集對公司發(fā)出的優(yōu)惠券等其他促銷手段作出積極反應(yīng)的客戶和銷售記錄而建立起來的,卡夫公司通過數(shù)據(jù)挖掘了解特定客戶的興趣和口味,并以此為基礎(chǔ)向他們發(fā)送特定產(chǎn)品的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產(chǎn)品食譜。
第9頁/共18頁2023/4/1810在電信行業(yè)
加拿大BC省電話公司要求加拿大SimonFraser大學(xué)KDD研究組根據(jù)其擁有的十多年的客戶數(shù)據(jù),總結(jié)、分析并提出新的電話收費(fèi)和管理辦法,制定既有利于公司又有利于客戶的優(yōu)惠政策。競技運(yùn)動中的數(shù)據(jù)挖掘
美國著名的國家籃球隊(duì)NBA的教練,利用IBM公司提供的數(shù)據(jù)挖掘工具臨場決定替換隊(duì)員。電子商務(wù)的關(guān)聯(lián)銷售、客戶類別銷售分析數(shù)據(jù)挖掘的經(jīng)典案例第10頁/共18頁111.數(shù)據(jù)清理(消除噪音或不一致的數(shù)據(jù))2.數(shù)據(jù)集成(多種數(shù)據(jù)源組合到一起)3.數(shù)據(jù)選擇(從數(shù)據(jù)庫中提取與分析任務(wù)相關(guān)的數(shù)據(jù))4.數(shù)據(jù)變換(變換或統(tǒng)一成合適挖掘的形式)5.數(shù)據(jù)挖掘(使用智能方法提取數(shù)據(jù)模式)6.模式評估(根據(jù)某種興趣程度度量識別提供知識的真正有趣的模式)7.知識表示(向用戶提供挖掘的知識)數(shù)據(jù)挖掘的過程第11頁/共18頁2023/4/1812典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)第12頁/共18頁進(jìn)行數(shù)據(jù)挖掘常用技術(shù)算法人工神經(jīng)網(wǎng)絡(luò)
為解決大復(fù)雜度問題提供了一種相對來說比較有效的簡單方法。神經(jīng)網(wǎng)絡(luò)可以很容易的解決具有上百個參數(shù)的問題。決策樹
決策樹提供了一種展示類似在什么條件下會得到什么值這類規(guī)則的方法支持向量機(jī)方法。遺傳算法
基于進(jìn)化理論,并采用遺傳結(jié)合、遺傳變異、以及自然選擇等設(shè)計(jì)方法的優(yōu)化技術(shù)。近鄰算法
將數(shù)據(jù)集合中每一個記錄進(jìn)行分類的方法。規(guī)則推導(dǎo)
從統(tǒng)計(jì)意義上對數(shù)據(jù)中的“如果-那么”規(guī)則進(jìn)行尋找和推導(dǎo)方法
第13頁/共18頁2023/4/1814生物信息學(xué)與數(shù)據(jù)挖掘生物信息學(xué):融合生物科學(xué)與計(jì)算機(jī)科技的新學(xué)科快速的數(shù)據(jù)獲取率和客觀分析的要求---已經(jīng)不能僅依賴于人的感知來處理了.因而,生物信息學(xué)與機(jī)器學(xué)習(xí)相結(jié)合也就成了必然。生物信息量的大規(guī)模,常規(guī)的計(jì)算機(jī)算法可以應(yīng)用于生物數(shù)據(jù)分析中,但越來越不適用于序列分析問,需要新的思想的加入.究竟原因,是由于生物系統(tǒng)本質(zhì)上的模型復(fù)雜性及缺乏在分子層上建立的完備的生命組織理論.生物信息學(xué)給數(shù)據(jù)挖掘提出了新課題和挑戰(zhàn)
第14頁/共18頁2023/4/1815生物信息學(xué)數(shù)據(jù)挖掘的現(xiàn)狀2000網(wǎng)易杯全國大學(xué)生數(shù)學(xué)建模競賽題目
DNA序列分類近10年國家在863、973計(jì)劃、國家自然科學(xué)基金重大項(xiàng)目開始參與國際生物信息學(xué)合作對于生物信息或基因的數(shù)據(jù)挖掘和通常的數(shù)據(jù)挖掘相比,無論在數(shù)據(jù)的復(fù)雜程度、數(shù)據(jù)量還有分析和建立模型的算法而言,都要復(fù)雜得多。從分析算法上講,更需要一些新的和好的算法?,F(xiàn)在很多廠商正在致力于這方面的研究。但就技術(shù)和軟件而言,還遠(yuǎn)沒有達(dá)到成熟的地步。第15頁/共18頁2023/4/1816學(xué)科目前研究方向(國內(nèi))機(jī)構(gòu):
哈爾濱工業(yè)大學(xué)、北京大學(xué)、復(fù)旦大學(xué)、哈工大生物信息學(xué)相關(guān)研究方向:
(1)
復(fù)雜重大疾病的分子分型與功能基因的識別
(2)
基因與蛋白質(zhì)的表達(dá)與功能研究
(3)
生物信息融合分析技術(shù)
(4)
基因與蛋白質(zhì)功能研究的生物芯片信息學(xué)技術(shù)
(5)
藥物靶識別和功能研究生物信息學(xué)方法
(6)
大規(guī)模微陣列(DNA芯片)基因表達(dá)信息分析
(7)
分子生物學(xué)數(shù)據(jù)庫中的數(shù)據(jù)挖掘
(8)
數(shù)據(jù)庫中的知識發(fā)現(xiàn)
(9)
統(tǒng)計(jì)遺傳學(xué)的研究
(10)
離子通道數(shù)據(jù)分析平臺及數(shù)據(jù)庫建設(shè)的研究
第16頁/共18頁2023/4/1817生物信息學(xué)數(shù)據(jù)挖掘課題的展望計(jì)算機(jī)科學(xué)技術(shù)是生物信息學(xué)的基本工
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學(xué)《數(shù)字系統(tǒng)集成二》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《社會查與統(tǒng)計(jì)》2021-2022學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《科學(xué)社會主義概論》2023-2024學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《管理技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《地理信息系統(tǒng)導(dǎo)論實(shí)驗(yàn)》2021-2022學(xué)年第一學(xué)期期末試卷
- 山東省濟(jì)寧市曲阜市2024-2025學(xué)年九年級數(shù)學(xué)上學(xué)期期中試卷
- 用鋼尺和游標(biāo)卡試題
- 2024屆云南省石屏縣一中第二學(xué)期高三期中考試數(shù)學(xué)試題
- 初中微作文知識課件
- 2024年萊蕪小型客運(yùn)從業(yè)資格證考試題答案
- 2024年養(yǎng)老院免責(zé)協(xié)議書(特殊條款版)
- 職業(yè)技能鑒定課件
- 日常巡店流程課件
- 《上海市中學(xué)物理課程標(biāo)準(zhǔn)》試行稿
- 奶牛牧場經(jīng)營管理課件
- 涉密人員培訓(xùn)和教育
- 存儲設(shè)備擴(kuò)容與數(shù)據(jù)遷移服務(wù)
- smt部門年工作計(jì)劃
- 關(guān)于數(shù)學(xué)的知識講座
- 護(hù)士與醫(yī)生的合作與溝通
- 陰莖損傷的護(hù)理課件
評論
0/150
提交評論