版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人類(lèi)疾病網(wǎng)絡(luò)第1頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日背景在刻畫(huà)人類(lèi)疾病位點(diǎn)的研究中,很多疾病基因的位置克隆和全基因組的關(guān)聯(lián)研究,產(chǎn)生了疾病與基因的關(guān)聯(lián)對(duì)列表。另外,蛋白質(zhì)相互作用,人類(lèi)代謝圖譜和調(diào)控網(wǎng)絡(luò)等都為不同疾病基因間的相互作用提供了一些細(xì)節(jié)描述。2*第2頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日給出一個(gè)不同的方法,在細(xì)胞和有機(jī)體的組織的高水平上,探索人類(lèi)遺傳疾病和對(duì)應(yīng)的疾病基因是否可以彼此相關(guān)聯(lián)。通過(guò)提供有多個(gè)基因引起的疾?。ɑ蜃愘|(zhì)性)的例子來(lái)支持這個(gè)方法的有效性。比方說(shuō),腦肝腎綜合癥是由至少11個(gè)基因的變異引起的,所有的都與過(guò)氧化酶體的生物發(fā)生
2、有關(guān)。還有由一個(gè)基因的不同變異(等位基因異質(zhì)性)的疾病。比方說(shuō),TP53的變異被關(guān)聯(lián)到11個(gè)臨床上不同的癌癥相關(guān)疾病。通過(guò)發(fā)展一個(gè)全部遺傳疾病(疾病表型組)和全部疾病基因(疾病基因組)的關(guān)聯(lián)框架,得到對(duì)疾病組學(xué)的全局認(rèn)識(shí)。3*第3頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日結(jié)果和討論疾病組的構(gòu)建:構(gòu)建兩個(gè)不相交頂點(diǎn)集的二部圖。一個(gè)集合對(duì)應(yīng)所有的已知遺傳疾病,另一個(gè)集合對(duì)應(yīng)人類(lèi)基因組的所有已知的疾病基因。如果一個(gè)基因的變異暗示了某種疾病的發(fā)生,則疾病和基因相關(guān)聯(lián)。疾病、疾病基因和他們之間的關(guān)系的列表都是從OMIM獲得。到2005年12月,包含了1284種疾病和1777個(gè)疾病基因。我
3、們基于被疾病所影響的生理系統(tǒng),將疾病分成22類(lèi)疾病。4*第4頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日由疾病組的二部圖可以產(chǎn)生兩個(gè)相關(guān)的生物網(wǎng)絡(luò)投影。一個(gè)是人類(lèi)疾病網(wǎng)絡(luò)(HDN),頂點(diǎn)是疾病,當(dāng)兩個(gè)疾病共享至少一個(gè)疾病基因時(shí),二者關(guān)聯(lián)。另一個(gè)是疾病基因網(wǎng)絡(luò)(DGN),頂點(diǎn)是疾病基因,當(dāng)兩個(gè)基因關(guān)聯(lián)到同一疾病時(shí),二者相連。然后,我們討論了這些網(wǎng)絡(luò)對(duì)于幫助我們理解和代表所有已知疾病和表型關(guān)聯(lián)的框架的潛力。5*第5頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日6*第6頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日HDN的性質(zhì):如果一個(gè)人類(lèi)疾病有不同并且唯一的遺
4、傳原因,那么HDN對(duì)應(yīng)的是不連通的孤立點(diǎn)。但,獲得的HDN包含了單個(gè)疾病間和疾病類(lèi)間的很多關(guān)聯(lián)。1284個(gè)疾病中,867個(gè)至少一個(gè)邊關(guān)聯(lián)到其他疾病,516個(gè)疾病形成一個(gè)巨大的類(lèi),暗示很多疾病同其他疾病是同享遺傳原因。一個(gè)疾病關(guān)聯(lián)的基因數(shù)目s有很寬的分布,暗示大多數(shù)疾病關(guān)聯(lián)到少數(shù)基因,很少的疾病關(guān)聯(lián)到很多基因。白血病s=37,結(jié)腸癌s=34等。HDN的度分布也是冪律的,結(jié)腸癌k=507*第7頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日灰色表示linear binning;紅色表示以2為底的對(duì)數(shù)數(shù)據(jù)8*第8頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日HDN有明顯的聚類(lèi)現(xiàn)
5、象,但在不同疾病類(lèi)之間有明顯的不同。癌癥類(lèi)因?yàn)楣蚕砗芏喟┗颍跃o密相連,并且還有很多疾病同癌癥有強(qiáng)相關(guān);代謝疾病沒(méi)有明顯的形成一個(gè)不同的類(lèi)。如圖三為了量化這種差異,我們衡量了每個(gè)疾病類(lèi)的基因座異質(zhì)性和連通性(HDN中彼此連接的一部分疾?。H鐖D四,紅色代表較高的顯著性,藍(lán)色代表較低的顯著性。發(fā)現(xiàn)癌癥有著較高的異質(zhì)性和連通性,而代謝類(lèi)有較低的異質(zhì)性和連通性。基因座異質(zhì)性:指多于一個(gè)基因的變異。用屬于這個(gè)類(lèi)的疾病中基因的平均數(shù)目(也就是節(jié)點(diǎn)的平均大?。﹣?lái)衡量。一個(gè)類(lèi)的連通性:用在HDN中彼此互相關(guān)聯(lián)的一部分疾病來(lái)衡量9*第9頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日10*第10
6、頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日11*第11頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日DGN的性質(zhì)基因間的關(guān)聯(lián),代表了相關(guān)表型關(guān)聯(lián),他們代表了表型相關(guān)性的衡量,這個(gè)可以用在未來(lái)的研究中,同蛋白質(zhì)相互作用、轉(zhuǎn)錄因子啟動(dòng)子相互作用、代謝相互作用關(guān)聯(lián),發(fā)現(xiàn)新的遺傳相互作用。在DGN中,1377個(gè)疾病基因連接到其他基因,903個(gè)基因?qū)儆谝粋€(gè)巨大的類(lèi)。如圖五涉及多種疾病的基因數(shù)目急劇減少。如圖六12*第12頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日13*第13頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日14*第14頁(yè),共72頁(yè),20
7、22年,5月20日,20點(diǎn)30分,星期日HDN和DGN的功能類(lèi)在保持疾病和基因的度不變的情況下,在二部圖基礎(chǔ)上隨機(jī)化重連邊,得到的疾病網(wǎng)絡(luò)的最大類(lèi)的平均大小是64316,遠(yuǎn)大于實(shí)際HDN中的516。相似,基因網(wǎng)絡(luò)的最大類(lèi)的平均大小為108720,也遠(yuǎn)大于實(shí)際DGN中的903(P10(-4))。這些不同顯示了疾病和基因的重要的病理生理學(xué)類(lèi)。在實(shí)際的網(wǎng)絡(luò)中,疾?。ɑ颍└鼉A向于相同疾病類(lèi)中疾?。ɑ颍┑南噙B。15*第15頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日疾病關(guān)聯(lián)基因識(shí)別不同功能模塊大多數(shù)的疾病和疾病類(lèi)對(duì)應(yīng)細(xì)胞內(nèi)網(wǎng)絡(luò)中怎樣的不同的功能模塊仍然不清楚。假設(shè)1:如果編碼蛋白質(zhì)的疾
8、病關(guān)聯(lián)基因在功能不同的模塊中相互作用,則在這些疾病模塊中的蛋白質(zhì)比其他蛋白質(zhì)更可能相互作用。為了檢驗(yàn)這種假設(shè),建立了蛋白質(zhì)相互作用網(wǎng)絡(luò),發(fā)現(xiàn)290個(gè)重疊的相互作用,是隨機(jī)情況下的10倍。*16第16頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日同一個(gè)疾病關(guān)聯(lián)的基因共享一般的細(xì)胞和功能特性,在Gene Ontology(GO)中注釋。假設(shè)2:如果HDN顯示模塊化組織,則與相同疾病關(guān)聯(lián)的一組基因應(yīng)該分享相似的細(xì)胞和功能特性,正如在GO中注釋的一樣。為了證實(shí)這個(gè)假設(shè)的有效性,對(duì)于GO的每個(gè)分支(生物過(guò)程、分子功能和細(xì)胞組分),我們測(cè)量了每個(gè)疾病的GO同質(zhì)性。發(fā)現(xiàn)有很高的顯著性。GO同質(zhì)性
9、: , 是疾病i關(guān)聯(lián)的有GO術(shù)語(yǔ)j的基因數(shù)目; 是與疾病i關(guān)聯(lián)的有GO注釋的所有基因數(shù)目。*17第17頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*18第18頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日假設(shè)3:在一般功能模塊中相互作用的編碼蛋白質(zhì)的疾病基因應(yīng)該趨向于在相同的組織中表達(dá)。為了衡量,我們引入疾病的組織同質(zhì)系數(shù)。定義為: 其中 表示對(duì)于疾病i的關(guān)聯(lián)基因至少在一個(gè)組織中表達(dá)的基因數(shù)目, 表示在組織j中 表達(dá)的基因的數(shù)目。如右圖,有68%的疾病有 完全組織同質(zhì)性,隨機(jī)情 況下為51%。(P0.6。*20第20頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,
10、星期日總結(jié):關(guān)聯(lián)同一疾病的基因1)他們對(duì)應(yīng)的產(chǎn)物通過(guò)蛋白質(zhì)相互作用傾向于彼此連接;2)傾向于在特異性組織中共同表達(dá);3)顯示較高的共表達(dá)水平;4)作為一個(gè)組顯示同步表達(dá);5)傾向于共享GO術(shù)語(yǔ)。這些支持了對(duì)于疾病基因和他們產(chǎn)物的全局功能相關(guān)性,提供了一個(gè)疾病組的基于網(wǎng)絡(luò)的模型*21第21頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日中心性和外圍性一個(gè)細(xì)胞網(wǎng)絡(luò)的結(jié)構(gòu)和它功能特性的關(guān)聯(lián)的最早的解釋是在釀酒酵母中高連通蛋白或hubs更傾向于被關(guān)鍵基因編碼。這促使研究者對(duì)人類(lèi)疾病基因傾向于編碼hubs的假設(shè)進(jìn)行研究,但有研究者發(fā)現(xiàn),二者僅有很弱的相關(guān)性。我們最初的研究是支持這一假設(shè)的。但是
11、,疾病基因和hubs的關(guān)系在不同疾病基因間是不相同的。*22第22頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日在探索疾病基因是否編碼hubs時(shí),忽略了在早期發(fā)育中的關(guān)鍵基因,它們的改變導(dǎo)致高比例的自發(fā)流產(chǎn)。通過(guò)對(duì)老鼠基因的人類(lèi)同源基因分析,發(fā)現(xiàn)1276個(gè)人類(lèi)基因的老鼠重要同源基因,其中398個(gè)與人類(lèi)疾病有關(guān),占人類(lèi)疾病基因的22%。這樣就把人類(lèi)基因分為:1276個(gè)關(guān)鍵基因和1379個(gè)非關(guān)鍵疾病基因。發(fā)現(xiàn)關(guān)鍵蛋白顯示了同hubs關(guān)聯(lián)的趨勢(shì),而其余非關(guān)鍵疾病蛋白沒(méi)有這種趨勢(shì)。*23第23頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*24第24頁(yè),共72頁(yè),2022年,5
12、月20日,20點(diǎn)30分,星期日期望:關(guān)鍵基因和疾病基因的表達(dá)模式同相當(dāng)數(shù)量的其他基因同步。定義關(guān)鍵基因(或非關(guān)鍵疾病基因)i和細(xì)胞中所有其他基因之間的平均基因共表達(dá)系數(shù) , 是從人類(lèi)正常組織中計(jì)算得到的。發(fā)現(xiàn):對(duì)于關(guān)鍵基因,有高的的基因比小的或負(fù)的的基因更關(guān)鍵;而對(duì)于非關(guān)鍵疾病基因正好相反。*25第25頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日最后,我們問(wèn):看家基因是否有一個(gè)編碼疾病基因的趨勢(shì)?我們發(fā)現(xiàn)一個(gè)基因在越多的組織中表達(dá),則這個(gè)基因是關(guān)鍵基因的可能性越高。而非關(guān)鍵疾病基因有在很少的組織中表達(dá)的趨勢(shì)。發(fā)現(xiàn)9.9%的看家基因?qū)?yīng)到疾病基因,13.5%的非看家基因;*26第2
13、6頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日大部分疾病基因的次要性可以用進(jìn)化的觀點(diǎn)進(jìn)行解釋。導(dǎo)致嚴(yán)重表型的體細(xì)胞突變更可能影響中心功能。我們分別研究了體細(xì)胞癌基因的特性,發(fā)現(xiàn)它們更可能編碼hubs、顯示了與其他基因更高的共表達(dá)性、更可能代表看家基因。體細(xì)胞癌基因的這種功能和拓?fù)渲行男耘c當(dāng)前的理解相吻合很多癌基因在細(xì)胞的發(fā)育和生長(zhǎng)中發(fā)揮很重要的作用。*27第27頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日在人類(lèi)的復(fù)雜表型中探索遺傳重疊某些疾病會(huì)在病人中高頻率(低頻)的同時(shí)發(fā)生。因此研究疾病間的遺傳重疊至關(guān)重要。我們用對(duì)多種疾病的觀察的大量的表型數(shù)據(jù)集和適當(dāng)?shù)慕y(tǒng)計(jì)模型
14、,推理表型間的遺傳重疊。比方說(shuō),孤獨(dú)癥、雙相型障礙和精神分裂癥存在重要的遺傳重疊。因此,這種疾病網(wǎng)絡(luò)假說(shuō)可以很快被用在遺傳圖譜的方法設(shè)計(jì)上,它涉及看似孤立的多種表型間的聯(lián)合關(guān)聯(lián)*28第28頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日數(shù)據(jù)來(lái)源:哥倫比亞大學(xué)醫(yī)學(xué)中心的臨床資料庫(kù)。包括161種疾病的150萬(wàn)病人記錄。這些數(shù)據(jù)包含了疾病的比較寬的范圍,從一般到稀有,影響不同的生理系統(tǒng)。*29第29頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日方法:考慮一對(duì)疾病D1和D2,模擬一個(gè)人在特定年齡或之前的表型。一個(gè)人天生帶有(沒(méi)有)疾病易感變化集合,用k1、k2和k12的隨機(jī)變量表
15、示,這些變量確定了某個(gè)人在某個(gè)時(shí)間被診斷為某種病的概率。如果沒(méi)有時(shí)間的調(diào)節(jié),早發(fā)疾病和晚發(fā)疾病可能被錯(cuò)誤的判斷為負(fù)關(guān)聯(lián)。*30第30頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*31第31頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日假設(shè)1)如果有兩種(多種)不同疾病是在相同環(huán)境下發(fā)生的,那么它們通常是通過(guò)分子機(jī)制引發(fā)的。2)對(duì)于每個(gè)表型對(duì)D1和D2,整個(gè)人類(lèi)基因組被分為四個(gè)不相交的核苷酸位點(diǎn)集合。3)涉及連接疾病表型的四個(gè)集合中遺傳變異的假設(shè)機(jī)制。在位點(diǎn)的疾病易感集合中,遺傳變異的數(shù)目越大,疾病表型越可能顯現(xiàn)出來(lái)。*32第32頁(yè),共72頁(yè),2022年,5月20日,2
16、0點(diǎn)30分,星期日這兒考慮兩類(lèi)遺傳外顯率函數(shù):sharp-threshold和soft-threshold。Sharp-threshold是指當(dāng)多態(tài)性的數(shù)目超過(guò)閾值 時(shí),表現(xiàn)出表型i的特征來(lái)。 是指表現(xiàn)疾病表型i所需要的,在疾病特異性核苷酸位點(diǎn)的有害多態(tài)性的最少數(shù)目。Soft-threshold是指,閾值是一個(gè)隨機(jī)變量,滿足均值為 ,方差為 的二項(xiàng)分布。( )*33第33頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日對(duì)每一個(gè)疾病對(duì),我們選擇三種模型中的一種進(jìn)行分析:二者不相關(guān)(也就是沒(méi)有遺傳重疊);二者負(fù)相關(guān)(競(jìng)爭(zhēng)遺傳重疊);二者正相關(guān)(合作遺傳重疊)。合作模型比標(biāo)準(zhǔn)的遺傳多效模型
17、更一般。因?yàn)楹献髂P统朔窒淼亩鄳B(tài)性,還允許關(guān)聯(lián)影響各自的遺傳多態(tài)性。獨(dú)立模型是兩個(gè)重疊模型的特殊情況,我們通過(guò)將兩個(gè)重疊模型同獨(dú)立模型比較,用兩個(gè)對(duì)數(shù)似然比統(tǒng)計(jì) 代表我們分析的結(jié)果。進(jìn)一步,我們的參數(shù)模型提供了對(duì)假定遺傳重疊的大小的評(píng)估。*34第34頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日相關(guān)性和重疊對(duì)于遺傳重疊的分析顯示了疾病間的大量的相關(guān)性,很多都被很好的確定,但有些相關(guān)性先前沒(méi)有描述過(guò)。與孤獨(dú)癥的遺傳重疊的疾病分為四類(lèi);雙相型障礙和精神分裂癥也類(lèi)似分析。這三種疾病同其余158中疾病的關(guān)聯(lián),紅線代表正相關(guān),藍(lán)線代表負(fù)相關(guān)。*35第35頁(yè),共72頁(yè),2022年,5月20日
18、,20點(diǎn)30分,星期日*36第36頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日非孟德?tīng)柤膊〉谋硇徒?jīng)常定義一個(gè)模糊度,尤其是神經(jīng)學(xué)上的。很多情況下,觀察到的疾病是有相似癥狀但可能不同遺傳原因的多種病態(tài)的混合。我們對(duì)一對(duì)疾病間遺傳疾病的解釋不排除一個(gè)疾病是另一個(gè)疾病的原因的可能*37第37頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日具體方法:對(duì)于病人i的兩個(gè)疾病D1和D2,第i個(gè)病人用下式表示 N是數(shù)據(jù)庫(kù)中病人的總數(shù); 是病人的年齡;是病人的性別; 是病人的種族; 和 分別指病人被診斷為疾病D1,D2的年齡。當(dāng)病人沒(méi)有被診斷為疾病Dk時(shí), 為。*38第38頁(yè),共72頁(yè),
19、2022年,5月20日,20點(diǎn)30分,星期日對(duì)于疾病D1和D2,將整個(gè)基因組分為四個(gè)不相交的集合。盡管我們是集中在點(diǎn)突變的研究,但是我們的方法可以擴(kuò)展到遺傳多態(tài)性的其他類(lèi)型,比方說(shuō)插入、刪除、倒置和替換。對(duì)于D1和D2,我們定義四種表型 基因型: 的概率。對(duì)病人i,我們用隨機(jī)變量三元組 表示所有有害多態(tài)性,這些多態(tài)性被分成 。這三個(gè)隨機(jī)變量完全描述了病人涉及到疾病D1,D2的基因型 。假設(shè) 獨(dú)立的服從poisson分布,參數(shù)分別為 。如果一個(gè)疾病相關(guān)的核苷酸位點(diǎn)集合 很小,可以假設(shè)用二項(xiàng)分布代替poisson分布。*39第39頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日給定 ,
20、的概率(外顯函數(shù))我們用 表示一個(gè)病人在他生命結(jié)束時(shí)涉及到疾病D1和D2。定義兩個(gè)外顯函數(shù):一個(gè)是在 和 中的有害變異的數(shù)目 大于等于一個(gè)閾值 ;另一個(gè)定義是指,閾值本身是一個(gè)隨機(jī)變量,所以疾病發(fā)生的概率隨有害多態(tài)性數(shù)目的增加而逐漸增加。給定 , 的概率用 表示一個(gè)人在時(shí)間t之前的表型。令 和 表示第一次診斷到D1和D2的時(shí)間, 等價(jià)于 。因此對(duì)于 和 ,兩個(gè)疾病表型狀態(tài)的可能可以用聯(lián)合失效時(shí)間模型來(lái)研究,基于類(lèi)似于年齡和性別的遺傳因子和協(xié)方差*40第40頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日然后,我們定義下面的條件概率其中k=1,2.我們可以直接從數(shù)據(jù)估計(jì) , 的估計(jì)如圖
21、一。 最后我們定義,在給定 , 的概率以 的形式給出。*41第41頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日病人i被診斷為疾病Di的概率為 *42第42頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日兩類(lèi)遺傳重疊模型:合作和競(jìng)爭(zhēng)在合作模型中,重疊基因可以同時(shí)對(duì)兩種疾病貢獻(xiàn);在競(jìng)爭(zhēng)模型中,重疊基因僅對(duì)于其中一種病有貢獻(xiàn),具體對(duì)那種病有影響是隨機(jī)的。似然比檢驗(yàn)為了計(jì)算第i個(gè)病人的似然值,我們需要對(duì)給定的 在 所有可能的取值( )和 上的概率求和。如果我們假設(shè)對(duì)于所有的e和g,參數(shù)向量 都是一樣的,則似然函數(shù)是所觀察表型的概率的乘積(所有病人);或者,我們根據(jù)種族和性別將數(shù)
22、據(jù)細(xì)分,對(duì)每個(gè)數(shù)據(jù)子集估計(jì)參數(shù)的集合。*43第43頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日核心:我們的分析是模型選擇的問(wèn)題。1)當(dāng)兩種疾病有任意大的遺傳重疊時(shí), 我們對(duì)同一模型有兩種看法。(合作或競(jìng)爭(zhēng))2)當(dāng)兩個(gè)疾病在遺傳上是獨(dú)立的時(shí),我們有一個(gè)更簡(jiǎn)單的模型嵌套在前兩個(gè)模型里,即 為空,因此,我們可以用一個(gè)標(biāo)準(zhǔn)似然比統(tǒng)計(jì)量 來(lái)計(jì)算。隨著樣本數(shù)的增加, 漸近的服從 分布。通過(guò)計(jì)算 和 區(qū)分三個(gè)模型(獨(dú)立、合作和競(jìng)爭(zhēng))。*44第44頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日研究人類(lèi)表型的動(dòng)態(tài)網(wǎng)絡(luò)方法通過(guò)證明以下事實(shí),我們提供了關(guān)于表型疾病網(wǎng)絡(luò)的結(jié)構(gòu)同疾病發(fā)展的理解
23、相關(guān)的根據(jù):1)一個(gè)人患的某種病在網(wǎng)絡(luò)中與曾經(jīng)患過(guò)的病接近;2)對(duì)于不同性別和種族的病人,疾病在網(wǎng)絡(luò)中沿著網(wǎng)絡(luò)邊的發(fā)展是不同的;3)在表型疾病網(wǎng)絡(luò)中,有高連通的疾病的病人要比低連通疾病更易于死亡;4)在網(wǎng)絡(luò)中,后發(fā)生的疾病比先發(fā)生的有較多的連通,并且與較高的死亡率相關(guān)聯(lián)。*45第45頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日我們的結(jié)果顯示,疾病的發(fā)展可以用網(wǎng)絡(luò)的方法進(jìn)行研究,并且提供了加強(qiáng)對(duì)人類(lèi)疾病的起源和進(jìn)化的理解的可能性。*46第46頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日方法數(shù)據(jù)醫(yī)療機(jī)構(gòu)提供關(guān)于疾病診斷的有效的,系統(tǒng)的和完整的數(shù)據(jù)。每條記錄包括:拜訪的日
24、期、最初的診斷和到第九級(jí)的診斷,所有的都被一個(gè)5位的ICD9碼指定。前三位指定了主要的疾病類(lèi),后兩位提供關(guān)于疾病的其他信息。ICD-9-CM分類(lèi)在3位水平上分為657類(lèi),而在5位水平上分為16459類(lèi)。我們基于1990-1993年的住院治療的MedPAR記錄編寫(xiě)了原始的醫(yī)療保險(xiǎn)聲明(medicare claims)。大部分是65歲以上的老人。*47第47頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*48MFM+FW4910362 (37.66%)6835054 (52.42%)11745416 (90.08%)B386663 (2.97%)596432 (4.57%)983095
25、 (7.54%)B+W5297025 (40.62%)7431486 (56.99%)12728511 (97.62%)B+W+Other5440490 (41.72%)7598529 (58.28%)Other (Hispanic+Asian+Native American+Other)310507 (2.38%)Total13039018 (100%)第48頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日數(shù)據(jù)限制:有時(shí)候,一個(gè)疾病對(duì)應(yīng)多于一個(gè)的編碼,或者編碼對(duì)于研究目的沒(méi)有足夠的特定性。例如,在5位數(shù)水平上,有33種診斷關(guān)聯(lián)到高血壓。有時(shí)候,對(duì)于脫水這個(gè)癥狀,編碼沒(méi)有指定到任何一
26、個(gè)診斷。但是,大部分的疾病被映射到ICD9碼。對(duì)于那些在老年中不常見(jiàn)的疾病(與懷孕有關(guān)的),數(shù)據(jù)信息不足;并且不包含那些沒(méi)有住院治療的病人的信息。*49第49頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日合并癥關(guān)系的定量測(cè)量引入兩個(gè)疾病間“距離”的概念。這種方法的困難之處是:不同的統(tǒng)計(jì)距離測(cè)量有偏差。這種偏差給出了一個(gè)疾病被診斷的次數(shù)與它的流行程度服從重尾分布。意味著大部分疾病被很少的診斷到,少數(shù)疾病在種群的很大一部分被診斷到。因此,定量分析合并癥需要比較影響一小部分病人的疾病和影響大部分病人的疾病。用兩種合并癥測(cè)量來(lái)定量分析兩個(gè)疾病間的距離:相對(duì)風(fēng)險(xiǎn)比率(RR)和-相關(guān)()。*5
27、0第50頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日相對(duì)風(fēng)險(xiǎn)率RR: 其中 是指被兩種病影響的病人數(shù)目,N指種群中病人的總數(shù), 和 是指疾病i和j的流行程度。RR值的分布如圖:*51第51頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日-相關(guān)是對(duì)于二值變量的Pearson相關(guān): 對(duì)于 , 值的分布如圖: *52第52頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日這兩個(gè)合并癥的測(cè)量不是完全獨(dú)立的,因?yàn)樗麄兌茧S著兩個(gè)疾病所影響的病人數(shù)目的增加而增加,并且這兩個(gè)測(cè)量都有固有的誤差。 給定兩個(gè)測(cè)量的 互補(bǔ)誤差,分別 構(gòu)建每個(gè)測(cè)量的 PDN,討論它們 對(duì)于特定疾病組
28、的各自的相關(guān)性*53第53頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日重要的問(wèn)題是:基于關(guān)系的合并癥的預(yù)測(cè)能力怎么與遺傳和已知遺傳標(biāo)記的預(yù)測(cè)能力進(jìn)行比較?給定一個(gè)疾病,計(jì)算與另一種疾病的RR的范圍是0.25-16;而兄弟姐妹間的研究表明,他們患同一種病的RR值范圍也在這個(gè)范圍內(nèi)。在遺傳易感研究上的比較。更進(jìn)一步,可用合并癥數(shù)據(jù)探索疾病風(fēng)險(xiǎn)。*54第54頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日結(jié)果表型疾病網(wǎng)絡(luò)(PDN)節(jié)點(diǎn)是唯一被ICD9碼識(shí)別的疾病表型,連接表型的邊是根據(jù)測(cè)量得到的顯著性的合并癥關(guān)系。分別用RR測(cè)量和-相關(guān)構(gòu)造了PDN。這兩個(gè)網(wǎng)絡(luò)有很多相似之處。
29、但用RR構(gòu)造的網(wǎng)絡(luò)對(duì)于那些相對(duì)不常見(jiàn)的疾病較流行,并且有可辨別的模塊,這種模塊與ICD9分類(lèi)有點(diǎn)接近;用構(gòu)造的網(wǎng)絡(luò)對(duì)于高度流行的疾病很流行。盡管它們之間有這些不同,它們都在不同的流行程度水平上揭示了顯著性關(guān)聯(lián),兩者互相補(bǔ)充。*55第55頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日疾病網(wǎng)絡(luò)動(dòng)力學(xué)從一個(gè)網(wǎng)絡(luò)動(dòng)力學(xué)的觀點(diǎn)揭示PDN對(duì)于研究疾病發(fā)展的應(yīng)用。PDN允許我們研究病人從一個(gè)疾病到另一個(gè)疾病沿PDN中的邊發(fā)展的動(dòng)態(tài)過(guò)程。限制:即使根據(jù)診斷時(shí)間排好序的疾病,也不能揭示哪個(gè)疾病是結(jié)果。因此,我們?cè)陟o態(tài)網(wǎng)絡(luò)上研究疾病發(fā)展的可能的結(jié)果上用了一個(gè)保守的方法。*56第56頁(yè),共72頁(yè),202
30、2年,5月20日,20點(diǎn)30分,星期日通過(guò)三個(gè)問(wèn)題探索疾病網(wǎng)絡(luò)動(dòng)力學(xué):1)沿PDN的邊疾病是不是顯著發(fā)展的?2)對(duì)于不同種族和性別的病人,疾病的發(fā)展是不是不同?3)在PDN中,疾病的高連通性是不是同高致命性相關(guān)?*57第57頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日對(duì)于第一個(gè)問(wèn)題,我們測(cè)量了所有四次訪問(wèn)的病人的第一、二次診斷的疾病和第三、四次診斷的疾病間的平均相關(guān)性(N=946580)。 構(gòu)造隨機(jī)疾病集合作為對(duì)照組:保持疾病的流行程度相同,隨機(jī)選取前兩次診斷的疾病。發(fā)現(xiàn)真實(shí)數(shù)據(jù)中的相關(guān)性更高。*58第58頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日 比較真實(shí)和隨機(jī)
31、情況下的相關(guān)性,用 ,其中 表示真實(shí)數(shù)據(jù)的平均相關(guān), 表示對(duì)照組的平均相關(guān)。 *59第59頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日對(duì)于第二個(gè)問(wèn)題,我們用比值比OR(odds ratio)來(lái)計(jì)算種群和中疾病i和j關(guān)系的不同 其中 是疾病i和j在種群中的一個(gè)病人中觀察到的概率。 并且用關(guān)聯(lián)到高血壓或局部缺血性心臟病的所有疾病來(lái)顯示白種人男性和黑人男性對(duì)關(guān)系的影響。另一個(gè)圖顯示了性別不同對(duì)關(guān)系的影響*60第60頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*61第61頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*62第62頁(yè),共72頁(yè),2022年,5月20
32、日,20點(diǎn)30分,星期日對(duì)于第三個(gè)問(wèn)題:首先,我們定義一個(gè)疾病的連通性 和 。高的 和 表示疾病i在PDN中高連通。其次,為了測(cè)量一個(gè)疾病的致命性,我們計(jì)算在第一次診斷后8年病人減少的百分比。從下圖發(fā)現(xiàn)連通性和致命性在兩種PDN中相關(guān)(A和B);發(fā)現(xiàn)致命性和流行程度只有弱相關(guān)(C);對(duì)于某些疾病組,疾病的連通性和致命性關(guān)系很強(qiáng),比方說(shuō),對(duì)于腫瘤,這種關(guān)系很強(qiáng),而對(duì)于精神類(lèi)疾病,這種關(guān)系比較弱甚至為負(fù)的。*63第63頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日*64第64頁(yè),共72頁(yè),2022年,5月20日,20點(diǎn)30分,星期日這種關(guān)系可能解釋是:病的重的病人更容易檢測(cè)到。通過(guò)觀察給定拜訪次數(shù)、診斷次數(shù)、最后一次診斷
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學(xué)生讀書(shū)心得筆記
- 租房合同范本集錦15篇
- 數(shù)學(xué)教學(xué)心得體會(huì)
- 新媒體營(yíng)銷(xiāo)(第三版) 課件 項(xiàng)目二 新媒體營(yíng)銷(xiāo)定位與策劃
- 新目錄監(jiān)理規(guī)劃2025
- 貨車(chē)租賃合同模板
- 肉牛養(yǎng)殖場(chǎng)租賃合同樣書(shū)
- 學(xué)校房屋租賃合同范文
- 戶外廣告廣告位租賃合同書(shū)范文
- 2024年設(shè)計(jì)師合作伙伴權(quán)益合同版B版
- 有機(jī)肥料及微生物肥料生產(chǎn)技術(shù)的創(chuàng)新與發(fā)展
- 銀行市場(chǎng)份額提升方案
- 鎮(zhèn)海煉化線上測(cè)評(píng)試題
- 2024寧夏高級(jí)電工證考試題庫(kù)電工理論考試試題(全國(guó)通用)
- 浙江省溫州市2022-2023學(xué)年八年級(jí)上學(xué)期數(shù)學(xué)期末試題(含答案)
- 2023年客訴工程師年度總結(jié)及下一年計(jì)劃
- 廣東省佛山市2022-2023學(xué)年三年級(jí)上學(xué)期語(yǔ)文期末試卷(含答案)
- 網(wǎng)絡(luò)運(yùn)維從入門(mén)到精通29個(gè)實(shí)踐項(xiàng)目詳解
- 2024屆黃岡市啟黃中學(xué)中考試題猜想數(shù)學(xué)試卷含解析
- 揚(yáng)州育才小學(xué)2023-2024一年級(jí)上冊(cè)數(shù)學(xué)期末復(fù)習(xí)卷(一)及答案
- 04某污水處理廠630kW柔性支架光伏發(fā)電項(xiàng)目建議書(shū)
評(píng)論
0/150
提交評(píng)論