版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
/醫(yī)療大數(shù)據(jù)解決方案
醫(yī)療大數(shù)據(jù)解決方案與信息系統(tǒng)的耦合度為零的數(shù)據(jù)才是合格的大數(shù)據(jù)全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu)的信息系統(tǒng)根本上都是用關(guān)系數(shù)據(jù)庫(kù)而建立的,然而要對(duì)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)展挖掘非常困難。大數(shù)據(jù)并不是小數(shù)據(jù)之和,關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)不適合處理大數(shù)據(jù)。創(chuàng)造專(zhuān)利技術(shù)(創(chuàng)造申請(qǐng)?zhí)?02322495041.8)《醫(yī)學(xué)信息的構(gòu)造化存貯方法》非常適合處理醫(yī)療大數(shù)據(jù)。
目錄醫(yī)療大數(shù)據(jù)解決方案1第1章概要41.1名詞定義5第2章醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)72.1醫(yī)療大數(shù)據(jù)與醫(yī)院信息系統(tǒng)之間的具有本質(zhì)的差異72.1.1小問(wèn)題放大萬(wàn)倍就會(huì)大的嚇人92.2醫(yī)療大數(shù)據(jù)面臨八大難題102.3國(guó)家大數(shù)據(jù)標(biāo)準(zhǔn)工程堪比“兩彈一星”142.4醫(yī)療行業(yè)的信息系統(tǒng)頂層設(shè)計(jì)為何難產(chǎn)152.5大數(shù)據(jù)挖掘中的問(wèn)題:大數(shù)據(jù)的關(guān)鍵不在于大而在于如何挖掘162.5.1我國(guó)醫(yī)療行業(yè)每年產(chǎn)生多少數(shù)據(jù)162.5.2挖掘關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)所產(chǎn)生的醫(yī)療數(shù)據(jù)非常困難172.5.3僅患者與數(shù)據(jù)的對(duì)應(yīng)關(guān)系就是一個(gè)大問(wèn)題182.6關(guān)系數(shù)據(jù)庫(kù)理論的致命傷192.6.1關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)在大數(shù)據(jù)環(huán)境中為何變成無(wú)意義的數(shù)據(jù)192.6.2關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)是一種完全封閉的系統(tǒng):外來(lái)數(shù)據(jù)無(wú)法入住222.6.3關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與數(shù)據(jù)系統(tǒng)密不可分222.6.4關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與數(shù)據(jù)構(gòu)造密不可分232.6.5關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與應(yīng)用程序密不可分232.6.6關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)一旦脫離相應(yīng)的系統(tǒng)就成了無(wú)意義的數(shù)據(jù)242.6.7關(guān)系數(shù)據(jù)庫(kù)無(wú)法實(shí)現(xiàn)病歷信息的構(gòu)造化存貯242.6.8關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)都是“方言”,大數(shù)據(jù)需要的是“普通話”242.7關(guān)系數(shù)據(jù)庫(kù)如何處理國(guó)家醫(yī)療大數(shù)據(jù)中數(shù)萬(wàn)個(gè)數(shù)據(jù)庫(kù)、數(shù)千萬(wàn)張表252.8大數(shù)據(jù)之夢(mèng)十年后成真262.8.1信息化社會(huì)由概念到比較成熟用了30多年時(shí)間272.8.2千年蟲(chóng)問(wèn)題的啟示272.8.3大數(shù)據(jù)工程遠(yuǎn)比千年蟲(chóng)問(wèn)題復(fù)雜282.8.4五年之內(nèi)(2023年前)醫(yī)療大數(shù)據(jù)只是紙上談兵292.9必須開(kāi)發(fā)新型的軟件工具才能對(duì)醫(yī)療大數(shù)據(jù)進(jìn)展高效挖掘29第3章創(chuàng)造專(zhuān)利:醫(yī)學(xué)信息的構(gòu)造化存貯方法303.1在了解醫(yī)學(xué)信息的構(gòu)造化存貯方法時(shí)的本卷須知313.2醫(yī)學(xué)信息的構(gòu)造化存貯方法323.3數(shù)據(jù)的完整性是大數(shù)據(jù)的根本383.3.1大數(shù)據(jù)的策略:以適當(dāng)?shù)臄?shù)據(jù)冗余而使數(shù)據(jù)易識(shí)別383.3.2一個(gè)事物的數(shù)據(jù)403.3.3事物分類(lèi)403.3.4關(guān)系數(shù)據(jù)庫(kù)的缺陷:關(guān)系423.3.5數(shù)據(jù)的可識(shí)別性463.3.6數(shù)據(jù)的多樣性483.3.7元數(shù)據(jù)及國(guó)際元數(shù)據(jù)標(biāo)準(zhǔn)非常重要483.3.8大數(shù)據(jù)的關(guān)鍵:讓數(shù)據(jù)自己說(shuō)話493.3.9大數(shù)據(jù)的策略:用數(shù)據(jù)代替程序513.4與信息系統(tǒng)的耦合度為零的數(shù)據(jù)才是合格的大數(shù)據(jù)523.5醫(yī)學(xué)信息的構(gòu)造化存貯方法與關(guān)系數(shù)據(jù)庫(kù)的比照553.6應(yīng)用醫(yī)學(xué)信息的構(gòu)造化存貯方法的本卷須知553.7超大表化問(wèn)題:分為多張表563.8關(guān)系數(shù)據(jù)庫(kù)中的二維表是數(shù)據(jù)不具獨(dú)立性的一個(gè)根本原因563.9“萬(wàn)能數(shù)據(jù)構(gòu)造表”存放病歷信息的例子563.10醫(yī)學(xué)信息的構(gòu)造化存貯方法實(shí)現(xiàn)互聯(lián)互通非常簡(jiǎn)單583.11構(gòu)造化錄入病歷信息的例子:病癥的構(gòu)造化58第4章獨(dú)立數(shù)據(jù)庫(kù)在醫(yī)療大數(shù)據(jù)方面的優(yōu)勢(shì)614.1大數(shù)據(jù)中最重要的就是查詢(xún)614.2超大表問(wèn)題614.2.1自動(dòng)調(diào)整表的長(zhǎng)度624.2.2自動(dòng)查詢(xún)多張表624.3用獨(dú)立數(shù)據(jù)庫(kù)實(shí)現(xiàn)國(guó)家醫(yī)療大數(shù)據(jù)的存貯處理634.3.1獨(dú)立數(shù)據(jù)庫(kù)如何處理國(guó)家醫(yī)療大數(shù)據(jù)中數(shù)十萬(wàn)個(gè)數(shù)據(jù)庫(kù)、數(shù)千萬(wàn)張表634.3.2疾病、病癥的相關(guān)數(shù)據(jù)65第1章概要關(guān)系數(shù)據(jù)庫(kù)理論存在很多很?chē)?yán)重的問(wèn)題,例如,用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)所設(shè)計(jì)出的信息系統(tǒng)都是孤島型系統(tǒng),難以實(shí)現(xiàn)系統(tǒng)之間的互聯(lián)互通;在大數(shù)據(jù)時(shí)代,人們發(fā)現(xiàn),對(duì)全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu)所產(chǎn)生的醫(yī)療數(shù)據(jù)進(jìn)展挖掘非常困難,當(dāng)前的大多數(shù)醫(yī)療信息系統(tǒng)都是用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)而設(shè)計(jì)的。
用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)所設(shè)計(jì)出的信息系統(tǒng)之所以難以互聯(lián)互通,孤島問(wèn)題嚴(yán)重,根本原因在于“異構(gòu)數(shù)據(jù)”?!夺t(yī)學(xué)信息的構(gòu)造化存貯方法》中的“萬(wàn)能數(shù)據(jù)構(gòu)造表”可以存貯各種各樣的數(shù)據(jù),也可說(shuō)用《醫(yī)學(xué)信息的構(gòu)造化存貯方法》所設(shè)計(jì)出的信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)都是“同構(gòu)”的,不存在“異構(gòu)數(shù)據(jù)”的問(wèn)題。關(guān)系數(shù)據(jù)庫(kù)理論先天缺乏,不可能解決“異構(gòu)數(shù)據(jù)”問(wèn)題。
醫(yī)院信息系統(tǒng)所處理的數(shù)據(jù)只是某家醫(yī)院所產(chǎn)生的某些特定的數(shù)據(jù)(可稱(chēng)作小數(shù)據(jù))。醫(yī)療大數(shù)據(jù)所要處理的數(shù)據(jù)是全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu)所擁有的數(shù)十萬(wàn)個(gè)醫(yī)療信息系統(tǒng)所產(chǎn)生的數(shù)據(jù),這些數(shù)據(jù)存貯在數(shù)千萬(wàn)張表中,這些系統(tǒng)由不同的開(kāi)發(fā)商所開(kāi)發(fā),各系統(tǒng)的數(shù)據(jù)構(gòu)造各不相同。每家醫(yī)院的信息化工作都涉及幾十個(gè)廠家,每個(gè)廠家的數(shù)據(jù)、標(biāo)準(zhǔn)、采集、存儲(chǔ)都不一樣。因此,即便是在一家醫(yī)院,都會(huì)出現(xiàn)很多孤島,整個(gè)醫(yī)療行業(yè)的信息孤島問(wèn)題更嚴(yán)重。各家醫(yī)院信息系統(tǒng)的標(biāo)準(zhǔn)、接口都不同,這成為利用率低、共享難的原因之一。不僅如此,數(shù)據(jù)種類(lèi)的多樣化也為數(shù)據(jù)標(biāo)準(zhǔn)的制定和應(yīng)用帶來(lái)了挑戰(zhàn)。
小數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)的類(lèi)型和數(shù)據(jù)都是有限的,在處理數(shù)據(jù)前能事先確定數(shù)據(jù)的類(lèi)型。而大數(shù)據(jù)的數(shù)據(jù)特點(diǎn)是“多樣性(Variety)”,在處理數(shù)據(jù)時(shí)很難先事先確定數(shù)據(jù)的類(lèi)型,甚至不能確定數(shù)據(jù)的類(lèi)型。目前關(guān)系數(shù)據(jù)庫(kù)在數(shù)據(jù)處理中占據(jù)統(tǒng)治地位,而關(guān)系數(shù)據(jù)庫(kù)在處理數(shù)據(jù)時(shí)事先要確定數(shù)據(jù)的類(lèi)型,因此,在處理數(shù)據(jù)類(lèi)型不能事先確定的大數(shù)據(jù)時(shí),關(guān)系數(shù)據(jù)庫(kù)就遇到了難以逾越的障礙。
醫(yī)療大數(shù)據(jù)與醫(yī)院信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)具有本質(zhì)的差異?,F(xiàn)有的各種信息系統(tǒng)所處理的數(shù)據(jù)都是小數(shù)據(jù)。目前人們只是認(rèn)識(shí)到大數(shù)據(jù)重要性,大數(shù)據(jù)還只是處于概念階段。大數(shù)據(jù)夢(mèng)想將在10年后夢(mèng)想成真,5年之內(nèi),難有突破性進(jìn)展。
國(guó)家醫(yī)療大數(shù)據(jù)所面臨的最大難題:當(dāng)前的醫(yī)療信息系統(tǒng)不能適應(yīng)醫(yī)療大數(shù)據(jù)的實(shí)際需求,需要對(duì)現(xiàn)有的信息系統(tǒng)進(jìn)展徹底的改造才能適應(yīng)大數(shù)據(jù)時(shí)代的潮流。然而,要徹底改造全國(guó)現(xiàn)的醫(yī)療信息系統(tǒng),所花費(fèi)的代價(jià)是非常高昂的!關(guān)鍵詞:數(shù)據(jù)與系統(tǒng)的耦合度、萬(wàn)能數(shù)據(jù)構(gòu)造表、獨(dú)立數(shù)據(jù)庫(kù)、醫(yī)療大數(shù)據(jù)、數(shù)據(jù)的獨(dú)立性、數(shù)據(jù)的完整性、數(shù)據(jù)的可識(shí)別性、事物分類(lèi)。
聯(lián)系人:樊夢(mèng)Q:269779216269779216@1.1名詞定義l數(shù)據(jù)與系統(tǒng)的耦合度:數(shù)據(jù)與系統(tǒng)的耦合度越高,數(shù)據(jù)對(duì)系統(tǒng)的依賴(lài)程度就越高。當(dāng)數(shù)據(jù)對(duì)系統(tǒng)的依賴(lài)程度比較高時(shí),數(shù)據(jù)一旦脫離了原有的系統(tǒng)就變成了無(wú)意義的數(shù)據(jù)。大數(shù)據(jù)的數(shù)據(jù)來(lái)源于成千上萬(wàn)家單位的系統(tǒng),因此,大數(shù)居中的數(shù)據(jù)應(yīng)該是與系統(tǒng)的耦合度為零的數(shù)據(jù),否那么就需要很多的應(yīng)用程度來(lái)解讀數(shù)據(jù),這會(huì)增加數(shù)據(jù)處理的難度、本錢(qián)。
l萬(wàn)能數(shù)據(jù)構(gòu)造表:由創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”在模仿大腦記憶、聯(lián)想的根底上而所提出的一種新型數(shù)據(jù)構(gòu)造,可以在同一張表中存貯各種各樣的數(shù)據(jù)。
l獨(dú)立數(shù)據(jù)庫(kù):由創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”而建立的數(shù)據(jù)庫(kù)即可稱(chēng)為獨(dú)立數(shù)據(jù)庫(kù)。獨(dú)立數(shù)據(jù)庫(kù)與關(guān)系數(shù)據(jù)庫(kù)有本質(zhì)的差異。
l數(shù)據(jù)的獨(dú)立性:數(shù)據(jù)的獨(dú)立性是由創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”所提出的概念,是指數(shù)據(jù)不信依靠數(shù)據(jù)庫(kù)系統(tǒng)、不依靠數(shù)據(jù)構(gòu)造、不依靠注釋、不依靠應(yīng)用程序而獨(dú)立地表達(dá)出某種含義。關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)不具有獨(dú)立性,需要借助于注釋、數(shù)據(jù)構(gòu)造、應(yīng)用程序才能解讀數(shù)據(jù)的含義。
l數(shù)據(jù)的完整性:數(shù)據(jù)的完整生是由創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”所提出的概念,是指數(shù)據(jù)不信依靠數(shù)據(jù)庫(kù)系統(tǒng)、不依靠數(shù)據(jù)構(gòu)造、不依靠注釋、不依靠應(yīng)用程序而完整地表達(dá)出某種含義。關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)不具有完整性,需要借助于注釋、數(shù)據(jù)構(gòu)造、應(yīng)用程序才能解讀數(shù)據(jù)的含義。
l數(shù)據(jù)的可識(shí)別性:在班、組這樣的小環(huán)境中可以用每個(gè)人的姓名而區(qū)分出每一個(gè)人,然而在全國(guó)范圍內(nèi),由于人數(shù)太多,很多姓名都有重名現(xiàn)象,因此僅靠姓名就不能準(zhǔn)確無(wú)誤地識(shí)別出每一個(gè)人。大數(shù)據(jù)時(shí)代以前的關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)只是應(yīng)用于某個(gè)機(jī)構(gòu)內(nèi)部,因此各個(gè)數(shù)據(jù)就容易識(shí)別,然而如果把關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)放到大數(shù)據(jù)環(huán)境中,那么這些數(shù)據(jù)就成了不可識(shí)別的數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,需要通過(guò)數(shù)據(jù)的獨(dú)立性、數(shù)據(jù)的完整性而確保每一個(gè)數(shù)據(jù)都是可識(shí)別的。
l在醫(yī)療大數(shù)據(jù)中,各個(gè)醫(yī)療數(shù)據(jù)分別由各家醫(yī)療機(jī)構(gòu)所產(chǎn)生、擁有。
l事物分類(lèi):事物分類(lèi)是由創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”所提出的概念。大數(shù)據(jù)時(shí)代以前的信息系統(tǒng)的最終用戶(hù)是通過(guò)應(yīng)用程序而看到各種數(shù)據(jù),最終用戶(hù)并不直接與數(shù)據(jù)庫(kù)中的數(shù)據(jù)打交道,數(shù)據(jù)庫(kù)中的數(shù)據(jù)需要通過(guò)應(yīng)用程序解讀后最終用戶(hù)才能讀懂。在大數(shù)據(jù)時(shí)代,大數(shù)據(jù)中包含成千上萬(wàn)家機(jī)構(gòu)的數(shù)據(jù),因此,大數(shù)據(jù)中的每一個(gè)數(shù)據(jù)庫(kù)是由哪家機(jī)構(gòu)所產(chǎn)生,數(shù)據(jù)庫(kù)中各表中所存貯的數(shù)據(jù)是什么等等都是非常重要的信息,只有搞清楚這些信息,才能正常解讀各數(shù)據(jù)的真實(shí)含義。在“萬(wàn)能數(shù)據(jù)構(gòu)造表”中,“信息系統(tǒng)的名稱(chēng)、數(shù)據(jù)庫(kù)的名稱(chēng)、表名”是以“事物分類(lèi)”的形式存貯在表中,其目的是讓數(shù)據(jù)具體獨(dú)立性、完整性,以此確保各數(shù)據(jù)在大數(shù)據(jù)中具有可識(shí)別性。
第2章醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)本章內(nèi)容提要:大數(shù)據(jù)并不是小數(shù)據(jù)之和,大數(shù)據(jù)與小數(shù)據(jù)有本質(zhì)的差異。關(guān)系數(shù)據(jù)庫(kù)只適合于處理小數(shù)據(jù)而不適合處理大數(shù)據(jù)。用關(guān)系數(shù)據(jù)庫(kù)來(lái)處理大數(shù)據(jù)時(shí)會(huì)遇到很多難以抑制的困難。五年之內(nèi)(2023年前)大數(shù)據(jù)難以取得根本性突破,大數(shù)據(jù)之夢(mèng)十年之后才能夢(mèng)想成真。維基百科關(guān)于大數(shù)據(jù)的定義也明確指出當(dāng)前的主流軟件工具不能高效地處理大數(shù)據(jù),要高效處理大數(shù)據(jù)必須開(kāi)發(fā)新的軟件工具。目前的大多數(shù)信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)都存貯在關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中。關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)的一大特點(diǎn)(或者說(shuō)一大問(wèn)題)就是“數(shù)據(jù)嚴(yán)重依賴(lài)于數(shù)據(jù)庫(kù)系統(tǒng)及應(yīng)用程序”,當(dāng)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)脫離了相應(yīng)的數(shù)據(jù)庫(kù)系統(tǒng)及應(yīng)用程序后,這些數(shù)據(jù)根本上就成了難以閱讀的無(wú)用數(shù)據(jù)。
2.1醫(yī)療大數(shù)據(jù)與醫(yī)院信息系統(tǒng)之間的具有本質(zhì)的差異如果把全國(guó)各家醫(yī)院所產(chǎn)生的數(shù)據(jù)全部集中上傳到國(guó)家醫(yī)療大數(shù)據(jù)中心,這些數(shù)據(jù)的數(shù)據(jù)量一定會(huì)非常龐大,這些數(shù)據(jù)能不能稱(chēng)為國(guó)家醫(yī)療大數(shù)據(jù)?按維基百科對(duì)大數(shù)據(jù)的定義:“大數(shù)據(jù)是指所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)到達(dá)獲取、處理的數(shù)據(jù)。”這些數(shù)據(jù)可以稱(chēng)為國(guó)家醫(yī)療大數(shù)據(jù)。
維基百科的定義也明確地說(shuō)明了把全國(guó)各家醫(yī)院全部集中起來(lái)的“數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)到達(dá)獲取、處理”。為什么不能處理呢?例如,患者就醫(yī)時(shí),醫(yī)生非常關(guān)心患者的病史。醫(yī)生能否從國(guó)家醫(yī)療大數(shù)據(jù)中心獲得患者在全國(guó)任意一家醫(yī)院就醫(yī)時(shí)的所有病歷呢?假設(shè)全國(guó)各家醫(yī)院的所有信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)都已全部集中在國(guó)家醫(yī)療大數(shù)據(jù)中心,而且醫(yī)生具有獲得這些數(shù)據(jù)的權(quán)限。
截至2023年3月底,全國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)達(dá)97.8萬(wàn)個(gè),其中:醫(yī)院2.5萬(wàn)個(gè),基層醫(yī)療衛(wèi)生機(jī)構(gòu)91.8萬(wàn)個(gè),專(zhuān)業(yè)公共衛(wèi)生機(jī)構(gòu)3.2萬(wàn)個(gè),其他機(jī)構(gòu)0.3萬(wàn)個(gè)。
全國(guó)按2.5萬(wàn)家醫(yī)院計(jì)算,一家醫(yī)院按4個(gè)信息系統(tǒng)計(jì)算,全國(guó)共有10萬(wàn)個(gè)醫(yī)院信息系統(tǒng),這些信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)存貯在數(shù)千萬(wàn)張表中。
醫(yī)療大數(shù)據(jù)應(yīng)該說(shuō)是永久有用的,可用來(lái)研究人類(lèi)疾病的歷史變化情況。因此,國(guó)家醫(yī)療大數(shù)據(jù)應(yīng)是整個(gè)國(guó)家數(shù)年內(nèi)、數(shù)十年內(nèi)所產(chǎn)生的全部數(shù)據(jù)的總和,甚至需要存貯數(shù)百年、數(shù)千年。國(guó)家醫(yī)療大數(shù)據(jù)所涉及的信息量是一般的醫(yī)院信息系統(tǒng)的數(shù)據(jù)量的數(shù)萬(wàn)倍、數(shù)十萬(wàn)倍以上。
醫(yī)生要想獲得患者以往的病史數(shù)據(jù),就必須從數(shù)據(jù)千萬(wàn)張表中查詢(xún)患者的病史數(shù)據(jù)。了解關(guān)系數(shù)據(jù)庫(kù)理論者都知道,如果說(shuō)僅有表中的數(shù)據(jù),沒(méi)有相應(yīng)的軟件工具,那么,從數(shù)千萬(wàn)張表中查詢(xún)數(shù)據(jù),即使最優(yōu)秀的程序員,在目前的技術(shù)條件下,一周的時(shí)間內(nèi)肯定查不出來(lái)患者的所有病史數(shù)據(jù)。因?yàn)槌绦騿T在查詢(xún)數(shù)據(jù)前,首先要搞清楚如下問(wèn)題:1、這些數(shù)據(jù)分別是哪家醫(yī)院所產(chǎn)生的?2、這些數(shù)據(jù)分別是什么樣的數(shù)據(jù)庫(kù)系統(tǒng)產(chǎn)生的?3、這些數(shù)據(jù)分別存貯在哪些表中?4、各張表的構(gòu)造是什么?5、表中會(huì)含有大量的代碼,各個(gè)代碼的含義是什么?6、同一數(shù)據(jù)庫(kù)中會(huì)有多張表,這些表之間的關(guān)系是什么?7、各張表中所存貯的是什么數(shù)據(jù)?數(shù)據(jù)的類(lèi)型是什么?國(guó)家醫(yī)療大數(shù)據(jù)文件中含有數(shù)千萬(wàn)張表,一張表詳細(xì)情況說(shuō)明根本上要用一頁(yè)復(fù)印的信息量來(lái)描述,共需數(shù)千萬(wàn)頁(yè)復(fù)印紙才能描述清楚全部表的根本情況。
面對(duì)全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu),2萬(wàn)多家有一定規(guī)模的醫(yī)院,數(shù)萬(wàn)個(gè)醫(yī)院信息系統(tǒng),數(shù)千萬(wàn)張表,程序員在一周的時(shí)間內(nèi)肯定搞不清楚上述問(wèn)題。
從理論上而言,只要有數(shù)據(jù),程序員可以查詢(xún)到任何需要信息,然而由于國(guó)家醫(yī)療大數(shù)據(jù)的數(shù)據(jù)量太大,數(shù)據(jù)關(guān)系太復(fù)雜,數(shù)據(jù)構(gòu)造太多、數(shù)據(jù)類(lèi)型太多、不標(biāo)準(zhǔn)的數(shù)據(jù)太多,結(jié)果是太難太難。
處理小數(shù)據(jù)時(shí)并未感到關(guān)系數(shù)據(jù)庫(kù)有什么缺乏之處,在大數(shù)據(jù)時(shí)代人們已認(rèn)識(shí)到關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)不適合處理大數(shù)據(jù)。
2.1.1小問(wèn)題放大萬(wàn)倍就會(huì)大的嚇人國(guó)家醫(yī)療大數(shù)據(jù)并不是把全國(guó)各家醫(yī)院所產(chǎn)生的數(shù)據(jù)全部集中在一起就可以稱(chēng)作是合格的醫(yī)療大數(shù)據(jù)。如果僅是把全國(guó)各家醫(yī)院所產(chǎn)生的數(shù)據(jù)全部集中在一起,而沒(méi)有處理這些數(shù)據(jù)的應(yīng)用程序,那么,這些數(shù)據(jù)也沒(méi)什么用處。
目前不是沒(méi)有大數(shù)據(jù),而是有很多大數(shù)據(jù),然而人們不能高效地對(duì)這些數(shù)據(jù)進(jìn)展處理。
到目前為止,還沒(méi)有成功處理上萬(wàn)家醫(yī)療機(jī)構(gòu)所產(chǎn)生的醫(yī)療大數(shù)據(jù)的成功案例。
大數(shù)據(jù)比小數(shù)據(jù)大多少倍?目前沒(méi)有明確的定義,應(yīng)該說(shuō)真正的大數(shù)據(jù)要比小數(shù)據(jù)大一萬(wàn)倍以上,最少也應(yīng)大一百倍以上。
大數(shù)據(jù)的大表現(xiàn)在:一是數(shù)據(jù)量大(是小數(shù)據(jù)”萬(wàn)倍以上”),二是數(shù)據(jù)類(lèi)型多(是小數(shù)據(jù)“萬(wàn)倍以上”),三是所涉及到的單位多(是小數(shù)據(jù)“萬(wàn)倍以上”),四是所涉及到的用戶(hù)多種多樣(是小數(shù)據(jù)“萬(wàn)倍以上”),五是對(duì)數(shù)據(jù)的需求多種多樣而且不確定(是小數(shù)據(jù)“萬(wàn)倍以上”)。
在處理大數(shù)據(jù)時(shí),會(huì)有很多的“萬(wàn)倍以上”的問(wèn)題。
3歲小朋友都可以數(shù)清楚自已家里有幾口人,然而全國(guó)有多少人?由于人數(shù)十分龐大,全國(guó)人口普查就成了一項(xiàng)十分艱巨的大工程。自有人類(lèi)以來(lái),還無(wú)人能夠數(shù)百之百準(zhǔn)確地?cái)?shù)清楚全球在某段時(shí)間內(nèi)的人數(shù)。大家都認(rèn)為當(dāng)今的計(jì)算機(jī)技術(shù)已非常先進(jìn),然而時(shí)至今日,全球、全國(guó)的人口普查都做不到百分之百準(zhǔn)確。我國(guó)歷次人口普查都要花費(fèi)大量的人力、物力。
宇宙之中有多少個(gè)星球體?誰(shuí)也數(shù)不清,因?yàn)檎麄€(gè)宇宙實(shí)在是太大了,宇宙中的星球數(shù)量實(shí)在是太多了,誰(shuí)也數(shù)不清,永遠(yuǎn)也數(shù)不清。
事物的數(shù)量大到一定程度后一項(xiàng)非常簡(jiǎn)單的工作就會(huì)變成一項(xiàng)非常艱巨的大工程。
小數(shù)據(jù)所處理的數(shù)據(jù)猶如小朋友數(shù)家里的人數(shù),大數(shù)據(jù)所處理的數(shù)據(jù)猶如全國(guó)人口普查。
大數(shù)據(jù)的特點(diǎn):小數(shù)據(jù)中的小問(wèn)題一旦放大萬(wàn)倍就會(huì)大的嚇人!在大數(shù)據(jù)處理中,會(huì)遇到數(shù)量眾多的小問(wèn)題。
當(dāng)前的絕大多數(shù)信息系統(tǒng)都是用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)而建立的。在設(shè)計(jì)數(shù)據(jù)庫(kù)系統(tǒng)時(shí),設(shè)計(jì)人員習(xí)慣于用代碼來(lái)表示各種數(shù)據(jù),例如一些設(shè)計(jì)人員人用數(shù)字“0”來(lái)代表女性、用“1”代表男性),有的用“M”來(lái)代表男性、“F”來(lái)代表女性。全國(guó)各行各業(yè)擁有數(shù)千萬(wàn)個(gè)信息系統(tǒng),其中的數(shù)千萬(wàn)張表中擁有人的性別這種字段。在當(dāng)前的情況下,人們是用數(shù)據(jù)抽取的方法來(lái)而使性別這種字段中的數(shù)據(jù)全部轉(zhuǎn)換為統(tǒng)一的、標(biāo)準(zhǔn)的數(shù)據(jù),例如統(tǒng)一為“男”、“女”。要把全國(guó)數(shù)千萬(wàn)張表中的性別數(shù)據(jù)全部轉(zhuǎn)換為統(tǒng)一的數(shù)據(jù),就是一項(xiàng)非常艱巨的系統(tǒng)工程。
要真正建立起國(guó)家醫(yī)療大數(shù)據(jù),要解決很多個(gè)數(shù)量十分龐大的小問(wèn)題。
大數(shù)據(jù)一般比小數(shù)據(jù)大數(shù)萬(wàn)倍、數(shù)十萬(wàn)倍,小數(shù)據(jù)中的小問(wèn)題一旦放大數(shù)萬(wàn)倍、數(shù)十萬(wàn)倍就會(huì)大的嚇人!在小數(shù)據(jù)時(shí)代,人們所設(shè)計(jì)的信息系統(tǒng)只是用來(lái)處理某個(gè)機(jī)構(gòu)、某個(gè)部門(mén)內(nèi)部的某個(gè)局部問(wèn)題進(jìn)展統(tǒng)計(jì)、分析,一個(gè)信息系統(tǒng)中只有幾張表、幾十張表。
在大數(shù)據(jù)時(shí)代,人們更關(guān)注全國(guó),甚至全球范圍內(nèi)的對(duì)所有事物進(jìn)展統(tǒng)計(jì)、分析,涉及到數(shù)百萬(wàn)、數(shù)千萬(wàn)個(gè)信息系統(tǒng)、數(shù)億張表。
小數(shù)據(jù)是為機(jī)構(gòu)內(nèi)部的人員所使用,是從機(jī)構(gòu)的角度看問(wèn)題,而大數(shù)據(jù)而是從全國(guó),甚至全球來(lái)考慮問(wèn)題。
對(duì)醫(yī)療行業(yè)而言,全國(guó)擁有近97.8萬(wàn)家醫(yī)療機(jī)構(gòu),數(shù)百萬(wàn)從業(yè)人員,為全國(guó)13億人效勞。
目前商業(yè)智能所處理的還只是一家企業(yè)內(nèi)部的數(shù)據(jù),人們已感到對(duì)企業(yè)內(nèi)部的數(shù)十個(gè)信息系統(tǒng)中的數(shù)據(jù)進(jìn)展處理已非常困難,而大數(shù)據(jù)所要處理的是整個(gè)行業(yè)的數(shù)據(jù),比商業(yè)智能復(fù)雜數(shù)萬(wàn)倍。
l大數(shù)據(jù)=價(jià)值大=困難大=問(wèn)題大=代價(jià)大2.2醫(yī)療大數(shù)據(jù)面臨八大難題當(dāng)前國(guó)內(nèi)的各家醫(yī)院的各種信息系統(tǒng)都是為了滿足自己的需求而開(kāi)發(fā)的,可以比較好地滿足各家醫(yī)院自己的各種需求,并發(fā)揮出了重要的作用。然而,當(dāng)人們從國(guó)家醫(yī)療大數(shù)據(jù)的角度來(lái)考慮問(wèn)題時(shí),就會(huì)發(fā)現(xiàn)要從全國(guó)的所有醫(yī)療機(jī)構(gòu)的所有信息系統(tǒng)中挖掘出有價(jià)值的信息實(shí)在是大難了!主要有下述八大難題。
1、各自為政:各家醫(yī)療機(jī)構(gòu)各自為政,都想要?jiǎng)e人的的數(shù)據(jù),都不希望自己的數(shù)據(jù)共享給他人。到目前為止,醫(yī)療數(shù)據(jù)都存貯在各家醫(yī)療機(jī)構(gòu)內(nèi)部,從各家醫(yī)療機(jī)構(gòu)獲得數(shù)據(jù)非常難。
2、數(shù)據(jù)不標(biāo)準(zhǔn):醫(yī)療行業(yè)還未建立全國(guó)統(tǒng)一的、標(biāo)準(zhǔn)化、標(biāo)準(zhǔn)的數(shù)據(jù),各家醫(yī)院的醫(yī)療數(shù)據(jù)各不相同。數(shù)據(jù)不標(biāo)準(zhǔn)問(wèn)題是影響大數(shù)據(jù)處理的一個(gè)重大問(wèn)題,在大數(shù)據(jù)時(shí)代,各行各業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)化工作是大數(shù)據(jù)的一項(xiàng)非常重要的根底工作,這項(xiàng)根底工作搞不好,大數(shù)據(jù)挖掘工作不可能搞好。醫(yī)療行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)化工作也是一項(xiàng)工程量巨大的系統(tǒng)工程,需要大量的醫(yī)務(wù)人員共同參與才能完成。國(guó)內(nèi)還未做好這項(xiàng)根底工作。數(shù)據(jù)不標(biāo)準(zhǔn)、不標(biāo)準(zhǔn),會(huì)嚴(yán)重影響數(shù)據(jù)挖掘的結(jié)果?!緮?shù)據(jù)不一致可以有多種情況,如數(shù)據(jù)類(lèi)型不一致,隨意縮寫(xiě)造成的不一致,計(jì)量單位不一致等。當(dāng)從多個(gè)不同的數(shù)據(jù)源整合數(shù)據(jù)時(shí),由于定義的不同,更容易產(chǎn)生數(shù)據(jù)不一致問(wèn)題。在不同的數(shù)據(jù)源中,相同類(lèi)型的信息可能表現(xiàn)為不同的格式。例如,電話號(hào)碼通常定義為字符型數(shù)據(jù),但在有些數(shù)據(jù)源中可能將定義數(shù)值型數(shù)據(jù),因此應(yīng)將其標(biāo)準(zhǔn)化。典型的例子是字段“性別”,一些人用數(shù)字“0”、“1”、“2”來(lái)表示“不清”、“男”、“女”。而在其它數(shù)據(jù)庫(kù)中,可能直接用“不清”、“男”、“女”來(lái)描述。另一種情況是字段值在不同的數(shù)據(jù)源中不一致,如“出生地”可能分別使用“上海”、“滬”、“上海市”、“滬市”、“SHANGHAI”、“SH”等表示上海市出生的人。解決這一問(wèn)題首先應(yīng)該進(jìn)展標(biāo)準(zhǔn)化,然后根據(jù)標(biāo)準(zhǔn)逐步消除數(shù)據(jù)不一致的問(wèn)題。】3、業(yè)務(wù)及業(yè)務(wù)流程不標(biāo)準(zhǔn):要對(duì)全國(guó)的某個(gè)行業(yè)的大數(shù)據(jù)進(jìn)展分析統(tǒng)一,行業(yè)內(nèi)的業(yè)務(wù)及業(yè)務(wù)流程的標(biāo)準(zhǔn)化工作也是一項(xiàng)非常重要的工作,否那么,各個(gè)機(jī)構(gòu)的數(shù)據(jù)也就會(huì)百花齊放、各不相同,不利于分析統(tǒng)計(jì)。
4、數(shù)據(jù)多樣性(Variety)【數(shù)據(jù)構(gòu)造不標(biāo)準(zhǔn)、不統(tǒng)一】:全國(guó)有97.8萬(wàn)家醫(yī)療機(jī)構(gòu),這些機(jī)構(gòu)的全部信息系統(tǒng)有數(shù)十萬(wàn)個(gè),這些系統(tǒng)由不同的開(kāi)發(fā)商所開(kāi)發(fā),各系統(tǒng)的數(shù)據(jù)構(gòu)造不盡相同。【每家醫(yī)院的信息化工作都涉及幾十個(gè)廠家,每個(gè)廠家的數(shù)據(jù)、標(biāo)準(zhǔn)、采集、存儲(chǔ)都不一樣。因此,即便是在一家醫(yī)院,都會(huì)出現(xiàn)很多孤島,更別說(shuō)整個(gè)醫(yī)療行業(yè)了。各家醫(yī)院信息系統(tǒng)的標(biāo)準(zhǔn)、接口都不同,這成為利用率低、共享難的原因之一?!?、數(shù)據(jù)與數(shù)據(jù)庫(kù)系統(tǒng)、應(yīng)用系統(tǒng)密切不可分:關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中的每一個(gè)數(shù)據(jù)都要先定義數(shù)據(jù)構(gòu)造才能入住數(shù)據(jù)庫(kù)。信息系統(tǒng)的最終用戶(hù)所看到的數(shù)據(jù)都需要應(yīng)用程序的解讀,最終用戶(hù)看不懂關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)。
6、不能實(shí)現(xiàn)醫(yī)學(xué)信息的構(gòu)造化存貯:醫(yī)學(xué)信息非常復(fù)雜,醫(yī)務(wù)人員習(xí)慣于用自然語(yǔ)言編寫(xiě)各種醫(yī)學(xué)檔案,例如醫(yī)生都是用自然語(yǔ)言編寫(xiě)病歷。然而,計(jì)算機(jī)很笨,不能理解自然語(yǔ)言,因此只有把醫(yī)學(xué)信息構(gòu)造化之后進(jìn)展存貯,才能用計(jì)算機(jī)進(jìn)展處理。而當(dāng)前的眾多醫(yī)學(xué)信息都未能很好地進(jìn)展構(gòu)造化存貯。
7、信息孤島:各家醫(yī)院的各個(gè)信息系統(tǒng)不能實(shí)現(xiàn)全國(guó)互聯(lián)互通。
8、老系統(tǒng)升級(jí)改造難題:當(dāng)前的信息系統(tǒng)都是小數(shù)據(jù)系統(tǒng),不適應(yīng)大數(shù)據(jù)時(shí)代的需求,然而要對(duì)現(xiàn)有的信息系統(tǒng)進(jìn)展全面改造也是非常困難的,其代價(jià)也是非常高昂的?!緸槭裁匆?jí)改造?因?yàn)楫?dāng)前的各家醫(yī)院的信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)各不相同,數(shù)據(jù)不標(biāo)準(zhǔn)、不標(biāo)準(zhǔn)。要對(duì)大數(shù)據(jù)進(jìn)展處理,必須確保全國(guó)各家醫(yī)療機(jī)構(gòu)的信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)是統(tǒng)一的、標(biāo)準(zhǔn)的、標(biāo)準(zhǔn)的醫(yī)學(xué)標(biāo)準(zhǔn)數(shù)據(jù)。只有這樣,才能高效處理大數(shù)據(jù)?!繌睦碚撋隙裕t(yī)療大數(shù)據(jù)挖掘很簡(jiǎn)單,只要懂關(guān)系數(shù)據(jù)庫(kù),根本上就能對(duì)醫(yī)療大數(shù)據(jù)進(jìn)展挖掘。然而,要想對(duì)全國(guó)近百萬(wàn)個(gè)醫(yī)療機(jī)構(gòu)、數(shù)十萬(wàn)個(gè)信息系統(tǒng)的全部數(shù)據(jù)進(jìn)展高效地挖掘,所面臨的挑戰(zhàn)是非常嚴(yán)重的。
如何解決八大難題?1、各自為政:這個(gè)問(wèn)題必須國(guó)家衛(wèi)生和方案生育委員會(huì)以行政命令的方式來(lái)解決,強(qiáng)制要求各醫(yī)療單位實(shí)時(shí)地把各種醫(yī)療信息上傳到國(guó)家醫(yī)療大數(shù)據(jù)中心。假設(shè)沒(méi)有強(qiáng)制的行政命令,不可能建立起合格的國(guó)家醫(yī)療大數(shù)據(jù)。
2、數(shù)據(jù)不標(biāo)準(zhǔn)難題:此難題涉及到的數(shù)據(jù)量太大、工程量太大。國(guó)家衛(wèi)計(jì)委及很多人士雖說(shuō)早就注意到此問(wèn)題的存在,然而直到目前還未從根本上解決醫(yī)療行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)化問(wèn)題。此問(wèn)題不從根本上解決,那么醫(yī)療大數(shù)據(jù)的挖掘就等于說(shuō)大話。醫(yī)療行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)化工作是大數(shù)據(jù)挖掘的根底工作。此問(wèn)題應(yīng)該由國(guó)家衛(wèi)計(jì)委組織業(yè)內(nèi)外力量來(lái)解決,解決此問(wèn)題需要3至5年的時(shí)間。有了國(guó)家醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)之后,還需要用標(biāo)準(zhǔn)的醫(yī)療數(shù)據(jù)去代替現(xiàn)有的不標(biāo)準(zhǔn)的醫(yī)療數(shù)據(jù),而此項(xiàng)工作的工作量也是非常巨大的。標(biāo)準(zhǔn)化工作是不賺錢(qián)的根底性工作,商業(yè)機(jī)構(gòu)沒(méi)有從事這項(xiàng)工作的動(dòng)力,應(yīng)該由國(guó)家衛(wèi)計(jì)委來(lái)解決。
3、業(yè)務(wù)、業(yè)務(wù)流程不標(biāo)準(zhǔn):目前全國(guó)各醫(yī)療機(jī)構(gòu)的業(yè)務(wù)及業(yè)務(wù)流程并不標(biāo)準(zhǔn),因此,各醫(yī)療機(jī)構(gòu)所產(chǎn)生的數(shù)據(jù)也各不一樣。要建立國(guó)家醫(yī)療大數(shù)據(jù),就必須道先對(duì)全國(guó)醫(yī)療機(jī)構(gòu)的業(yè)務(wù)流程進(jìn)展標(biāo)準(zhǔn)化處理,這也是一項(xiàng)工程量巨大的根底性系統(tǒng)工程。這項(xiàng)工作也應(yīng)該由國(guó)家衛(wèi)計(jì)委來(lái)解決。此項(xiàng)工作最快需要三至五年的時(shí)間才能完成。
l只有解決了上述三項(xiàng)根底性問(wèn)題,才能夠建立起國(guó)家醫(yī)療大數(shù)據(jù)這個(gè)大廈的堅(jiān)實(shí)地基,否那么醫(yī)療大數(shù)據(jù)只能是空中樓閣。由于上述三個(gè)因素牽涉到全國(guó)各個(gè)醫(yī)療機(jī)構(gòu)的方方面面,非常復(fù)雜,十年之內(nèi)很難看到真正的國(guó)家醫(yī)療大數(shù)據(jù)的曙光。
下述4個(gè)問(wèn)題屬于技術(shù)問(wèn)題,關(guān)系數(shù)據(jù)庫(kù)理論解決不了這4個(gè)問(wèn)題,可由創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”從技術(shù)上加以徹底解決:4、數(shù)據(jù)多樣性(Variety)【數(shù)據(jù)構(gòu)造不標(biāo)準(zhǔn)、不統(tǒng)一】:目前關(guān)系數(shù)據(jù)庫(kù)占據(jù)統(tǒng)治地位,絕大多數(shù)信息系統(tǒng)都是用關(guān)系數(shù)據(jù)庫(kù)而建立的。醫(yī)院的各種信息系統(tǒng)中,多數(shù)也是用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)而建立。例如,目前國(guó)內(nèi)醫(yī)療行業(yè)的HIS系統(tǒng)是由多個(gè)開(kāi)發(fā)商所開(kāi)發(fā),各家開(kāi)發(fā)商所用的數(shù)據(jù)庫(kù)系統(tǒng)不一樣,所用的數(shù)據(jù)構(gòu)造構(gòu)造及數(shù)據(jù)類(lèi)型也不一樣。因此,如果要對(duì)全國(guó)各家醫(yī)療機(jī)構(gòu)的HIS系統(tǒng)中的數(shù)據(jù)進(jìn)展分析,那么首先就要把各種數(shù)據(jù)全部轉(zhuǎn)換為同一的數(shù)據(jù)構(gòu)造,然后才能對(duì)數(shù)據(jù)進(jìn)展分析統(tǒng)計(jì)。然而要對(duì)全國(guó)近百萬(wàn)個(gè)醫(yī)療機(jī)構(gòu)的數(shù)十萬(wàn)個(gè)、數(shù)百萬(wàn)個(gè)信息系統(tǒng)中的數(shù)據(jù)進(jìn)展轉(zhuǎn)換,也是一項(xiàng)工程量巨大的系統(tǒng)工程。另一外很重要的問(wèn)題是,所有這些信息系統(tǒng)中的數(shù)據(jù)要轉(zhuǎn)換為哪一種統(tǒng)一的、標(biāo)準(zhǔn)的數(shù)據(jù)構(gòu)造,也是需要國(guó)家衛(wèi)計(jì)委制定相應(yīng)的標(biāo)準(zhǔn)、標(biāo)準(zhǔn)。
5、數(shù)據(jù)與數(shù)據(jù)庫(kù)系統(tǒng)、應(yīng)用系統(tǒng)密不可分。
6、不能實(shí)現(xiàn)醫(yī)學(xué)信息的構(gòu)造化存貯:醫(yī)學(xué)信息非常復(fù)雜,用關(guān)系數(shù)據(jù)庫(kù)不能實(shí)現(xiàn)病歷信息的構(gòu)造化存貯。有人用XML實(shí)現(xiàn)病歷信息的構(gòu)造化存貯,然而XML只適合處于少量數(shù)據(jù),不適合對(duì)全國(guó)的病歷信息的處理。
7、信息孤島。
8、信息系統(tǒng)改造:現(xiàn)有的醫(yī)療信息系統(tǒng)就猶如廣州的城中村,廣州的城中村雖有一定的作用,然而城中村與廣州這樣的國(guó)際化大都市非常不協(xié)調(diào)。改造廣州城中村的最正確方案就是推倒重建,局部的修補(bǔ)是沒(méi)用的。然而要全部推倒重建,所花費(fèi)的資金是非常巨大的。
2.3國(guó)家大數(shù)據(jù)標(biāo)準(zhǔn)工程堪比“兩彈一星”大數(shù)據(jù)工程,標(biāo)準(zhǔn)先行。
國(guó)家大數(shù)據(jù)標(biāo)準(zhǔn)的工程的工程量要比“兩彈一星”的工程量大。
國(guó)家大數(shù)據(jù)標(biāo)準(zhǔn)涉及到每一個(gè)行業(yè),也涉及到各種各樣的業(yè)務(wù)。大數(shù)據(jù)標(biāo)準(zhǔn)涉及數(shù)據(jù)的標(biāo)準(zhǔn)化、數(shù)據(jù)構(gòu)造的標(biāo)準(zhǔn)化、業(yè)務(wù)的標(biāo)準(zhǔn)化、業(yè)務(wù)流程的標(biāo)準(zhǔn)化。
大數(shù)據(jù)標(biāo)準(zhǔn)化工作完成之后還要對(duì)現(xiàn)有的信息系統(tǒng)進(jìn)展改造,這種改造的工程量及代價(jià)也是非常高昂的。目前的信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)不適應(yīng)大數(shù)據(jù)的需求。
歷史對(duì)秦始皇統(tǒng)一文字、統(tǒng)一度量衡、統(tǒng)一貨幣的評(píng)價(jià)非常高:功惠千秋。大數(shù)據(jù)所面臨的問(wèn)題也猶如秦始皇時(shí)代所面臨的“文字不統(tǒng)一、度量衡不統(tǒng)一、貨幣不統(tǒng)一”問(wèn)題。因此,要解決大數(shù)據(jù)所面臨的問(wèn)題,也需要由秦國(guó)、秦始皇那樣強(qiáng)大的機(jī)構(gòu)、領(lǐng)袖人物以行政命令的形式強(qiáng)制推行,才能從根本上解決問(wèn)題。
大數(shù)據(jù)八大難題中的五大難題(各自為政、數(shù)據(jù)不標(biāo)準(zhǔn)、業(yè)務(wù)流程不標(biāo)準(zhǔn)、數(shù)據(jù)多樣性(Variety)【數(shù)據(jù)構(gòu)造不標(biāo)準(zhǔn)、不統(tǒng)一】、信息孤島)與秦始皇曾經(jīng)遇到的問(wèn)題有些類(lèi)似。
為解決千年蟲(chóng)問(wèn)題,全球花費(fèi)了超千億美元的資金。徹底砸爛小數(shù)據(jù)而建立大數(shù)據(jù)新環(huán)境的代價(jià)遠(yuǎn)遠(yuǎn)超過(guò)千年蟲(chóng)問(wèn)題。千年蟲(chóng)只是解決一個(gè)時(shí)間數(shù)據(jù)的問(wèn)題,而徹底砸爛小數(shù)據(jù)建立大數(shù)據(jù)新環(huán)境那么涉及到幾乎所有信息系統(tǒng)的所有數(shù)據(jù)!小數(shù)據(jù):只要能滿足自己需求,能解決自己的問(wèn)題即可。
大數(shù)據(jù):不只是滿足自己的需求、解決自己的問(wèn)題,還要考慮他人的需求。重點(diǎn)是如何讓他人能夠找到所需要的數(shù)據(jù)。
要讓他人、大家找到所需要的數(shù)據(jù),最重要的是大家都要遵循相同的標(biāo)準(zhǔn),大家都講普通話,而不是方言,這猶如泰始皇統(tǒng)一六國(guó)后的“書(shū)同文”的標(biāo)準(zhǔn)化改革。
當(dāng)前在處理大數(shù)據(jù)時(shí)的首要工作就是數(shù)據(jù)抽取(ETL:“Extract”、“Transform”、“Load”,“抽取”、“轉(zhuǎn)換”、“裝載”),其實(shí)數(shù)據(jù)抽取工作也類(lèi)似“秦始皇的書(shū)同文”,只是數(shù)據(jù)抽取并未能真正象秦始那樣從根本上解決書(shū)同文問(wèn)題。要使大數(shù)據(jù)真正做到“書(shū)同文”,需要象秦始皇那樣從根本上解決問(wèn)題。而真正實(shí)現(xiàn)大數(shù)據(jù)“書(shū)同文”時(shí),就不再需要數(shù)據(jù)抽取。
與當(dāng)前人們所提到的大數(shù)據(jù)相比,關(guān)系數(shù)據(jù)庫(kù)所處理的數(shù)據(jù)那么是小數(shù)據(jù)。大數(shù)據(jù)中的數(shù)據(jù)是數(shù)萬(wàn)家、數(shù)十萬(wàn)家以上的各中機(jī)構(gòu)中各種數(shù)據(jù)的總和。而關(guān)系數(shù)據(jù)庫(kù)所處理的小數(shù)據(jù)那么是一家機(jī)構(gòu)或幾家機(jī)構(gòu)中的局部數(shù)據(jù)。
當(dāng)我們面對(duì)數(shù)十萬(wàn)個(gè)、數(shù)百萬(wàn)個(gè)以上的信息系統(tǒng)中的數(shù)據(jù)(大數(shù)據(jù))時(shí),就會(huì)發(fā)現(xiàn),我們面臨很多挑戰(zhàn):“(維基百科對(duì)大數(shù)據(jù)的定義)無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)展捕捉、管理和處理”。也就說(shuō)明用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)已“無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)展捕捉、管理和處理”大數(shù)據(jù)。
在小數(shù)據(jù)時(shí)代,信息系統(tǒng)的用戶(hù)是通過(guò)應(yīng)用程序而查到自己所需要的數(shù)據(jù),而信息系統(tǒng)對(duì)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)展處理后而以用戶(hù)能夠理解的形式展現(xiàn)給用戶(hù)。然而,在大數(shù)據(jù)時(shí)代,這種方法行不通了。因?yàn)樵谛?shù)據(jù)時(shí)代,我們所要處理的數(shù)據(jù)是有限的、可確定的,而在大數(shù)據(jù)時(shí)代,我們所要處理的數(shù)據(jù)是無(wú)限的,不確定的數(shù)據(jù)。
秦始皇之所以能使“書(shū)同文”成為現(xiàn)實(shí),是因?yàn)樗麚碛兄粮邿o(wú)上的權(quán)威;“兩彈一星”之所以能成功,關(guān)鍵在于“兩彈一星”關(guān)系到國(guó)家的生死存亡,國(guó)家大力支持。大數(shù)據(jù)的成敗與國(guó)家的支持是分不開(kāi)的。
2.4醫(yī)療行業(yè)的信息系統(tǒng)頂層設(shè)計(jì)為何難產(chǎn)國(guó)家衛(wèi)生和方案生育委員會(huì)幾年前就注意到了醫(yī)療行業(yè)信息系統(tǒng)頂層設(shè)計(jì)的重要性,并希望從根本上解決此問(wèn)題,但至今未能從根本上實(shí)現(xiàn)醫(yī)療行業(yè)信息系統(tǒng)的頂層設(shè)計(jì)。
為什么要進(jìn)展頂層設(shè)計(jì)?因?yàn)楫?dāng)前的各種醫(yī)院信息系統(tǒng)存在嚴(yán)重的問(wèn)題,信息孤島問(wèn)題嚴(yán)重,不能互聯(lián)互通。
頂層設(shè)計(jì)建立在醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)化、醫(yī)療業(yè)務(wù)流程標(biāo)準(zhǔn)化的根底之上。而如今醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)化、醫(yī)療業(yè)務(wù)流程標(biāo)準(zhǔn)化這兩個(gè)根底工作還未做好,因此頂層設(shè)計(jì)就不可能有結(jié)果。
技術(shù)上的原因:關(guān)系數(shù)據(jù)庫(kù)理論的先天缺乏。
客觀原因:?jiǎn)栴}非常復(fù)雜、牽涉面太廣、所需資金非常巨大。
頂層設(shè)計(jì)非常難,比頂層設(shè)計(jì)更難的是有了頂層設(shè)計(jì)之后再對(duì)全國(guó)的醫(yī)療信息系統(tǒng)進(jìn)展全面更新?lián)Q代。
2.5大數(shù)據(jù)挖掘中的問(wèn)題:大數(shù)據(jù)的關(guān)鍵不在于大而在于如何挖掘如果把全國(guó)97.8萬(wàn)個(gè)醫(yī)療衛(wèi)生機(jī)構(gòu)所產(chǎn)生的數(shù)據(jù)全部存貯到國(guó)家醫(yī)療大數(shù)據(jù)中心,這些數(shù)據(jù)可以稱(chēng)作是“國(guó)家醫(yī)療大數(shù)據(jù)”,然而這樣的數(shù)據(jù)并不能稱(chēng)作是真正合格的“國(guó)家醫(yī)療大數(shù)據(jù)”,因?yàn)椋瑢?duì)這樣的數(shù)據(jù)的挖掘非常困難,從這些數(shù)據(jù)中挖掘出有用數(shù)據(jù)的代價(jià)非常高,猶如沙里淘金,大海撈針。
大數(shù)據(jù)不是小數(shù)據(jù)之和。大數(shù)據(jù)的關(guān)鍵不在于大,而在于挖掘。只有可以讓大家高效挖掘、任意挖掘的大數(shù)據(jù)才是真正合格的大數(shù)據(jù)。
2.5.1我國(guó)醫(yī)療行業(yè)每年產(chǎn)生多少數(shù)據(jù)國(guó)家醫(yī)療大數(shù)據(jù)的概況:截至2023年3月底,全國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)達(dá)97.8萬(wàn)個(gè),其中:醫(yī)院2.5萬(wàn)個(gè),基層醫(yī)療衛(wèi)生機(jī)構(gòu)91.8萬(wàn)個(gè),專(zhuān)業(yè)公共衛(wèi)生機(jī)構(gòu)3.2萬(wàn)個(gè),其他機(jī)構(gòu)0.3萬(wàn)個(gè)。
僅按全國(guó)擁有2.5萬(wàn)家醫(yī)院、每家醫(yī)院4個(gè)信息系統(tǒng)計(jì)算,全國(guó)約有10萬(wàn)個(gè)以上的醫(yī)院信息系統(tǒng),每個(gè)信息系統(tǒng)按20張表估算,全國(guó)共擁有200百萬(wàn)張表。
除了存貯在關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)外,還有其它類(lèi)型的數(shù)據(jù):XML、音像、文本等。
國(guó)家醫(yī)療大數(shù)據(jù)的數(shù)據(jù)量估算:南京軍區(qū)南京總醫(yī)院目前擁有5臺(tái)存儲(chǔ)設(shè)備,2臺(tái)專(zhuān)用于PACS,其中HIS、LIS、EMR等數(shù)據(jù)3T,病案縮微數(shù)據(jù)12T,PACS數(shù)據(jù)120T左右,每個(gè)月的數(shù)據(jù)增長(zhǎng)為2T左右,每年產(chǎn)生的數(shù)據(jù)量:24T/年。國(guó)家醫(yī)療大數(shù)據(jù)的數(shù)據(jù)量估算=2.5萬(wàn)家(未計(jì)小醫(yī)療機(jī)構(gòu)的數(shù)據(jù))*24T/年=60萬(wàn)T/年。
國(guó)家醫(yī)療大數(shù)據(jù)的數(shù)據(jù)量估算:6萬(wàn)T/年至100萬(wàn)T/年。
2.5.2挖掘關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)所產(chǎn)生的醫(yī)療數(shù)據(jù)非常困難如果全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu)以鏡像的方式把所有數(shù)據(jù)都上傳到國(guó)家醫(yī)療大數(shù)據(jù)中心,那么該如何對(duì)這些數(shù)據(jù)進(jìn)展挖掘?全國(guó)共有97.8萬(wàn)家醫(yī)療機(jī)構(gòu),這些醫(yī)療機(jī)構(gòu)所擁有的信息系統(tǒng)有10萬(wàn)個(gè)以上,這些醫(yī)療機(jī)構(gòu)所擁有的數(shù)據(jù)庫(kù)有10萬(wàn)個(gè)以上,這些數(shù)據(jù)庫(kù)中的表有200萬(wàn)張以上。這些醫(yī)療機(jī)構(gòu)的數(shù)據(jù)存貯在數(shù)十萬(wàn)個(gè)以上的文件夾中(存貯XML、音像、文本等數(shù)據(jù))?;颊卟∈房赡苁腔颊咦猿錾詠?lái)的所有情況,病史數(shù)據(jù)可能存貯在幾十年的數(shù)據(jù)中,并不僅是一年的數(shù)據(jù)中。
當(dāng)前的大多數(shù)醫(yī)療數(shù)據(jù)都是存貯在關(guān)系數(shù)據(jù)庫(kù)中,關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與數(shù)據(jù)庫(kù)系統(tǒng)密切相關(guān)、與數(shù)據(jù)構(gòu)造密切相關(guān)、與應(yīng)用程序密切相關(guān)、數(shù)據(jù)不標(biāo)準(zhǔn)。如果只是以鏡像的方式把全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu)的數(shù)據(jù)全部上傳到國(guó)家醫(yī)療大數(shù)據(jù)中心,要從這些數(shù)據(jù)中挖掘數(shù)據(jù),也是非常困難的。要從國(guó)家醫(yī)療大數(shù)據(jù)中查詢(xún)患者病歷數(shù)據(jù),必要首先搞清楚如下情況:l10萬(wàn)個(gè)以上的數(shù)據(jù)庫(kù)各用什么數(shù)據(jù)庫(kù)系統(tǒng)?l10萬(wàn)個(gè)以上的數(shù)據(jù)庫(kù)的數(shù)據(jù)存貯在哪里?IP?如何訪問(wèn)數(shù)據(jù)庫(kù)(帳號(hào))?l100萬(wàn)張以上的表中的每張表的數(shù)據(jù)構(gòu)造l100萬(wàn)張以上的表中各表之間的關(guān)系l100萬(wàn)張以上的表中的各個(gè)數(shù)據(jù)代碼的含義l10萬(wàn)個(gè)以上的文件夾中存貯什么樣的數(shù)據(jù)根底醫(yī)療數(shù)據(jù)大多存在于HIS、LIS、PACS、EMR、手術(shù)麻醉、體檢、心電等多個(gè)子系統(tǒng)中。各系統(tǒng)來(lái)源于不同的生產(chǎn)廠商,數(shù)據(jù)存放在不同的數(shù)據(jù)庫(kù),數(shù)據(jù)多而散,數(shù)據(jù)庫(kù)的設(shè)計(jì)缺乏標(biāo)準(zhǔn)化,不同數(shù)據(jù)庫(kù)中的數(shù)據(jù)靠患者主索引等進(jìn)展關(guān)聯(lián),關(guān)聯(lián)關(guān)系相當(dāng)復(fù)雜。各自廠家研發(fā)人員除了對(duì)自家系統(tǒng)的數(shù)據(jù)構(gòu)造非常了解之外,缺乏對(duì)其他系統(tǒng)數(shù)據(jù)構(gòu)造的了解,整體數(shù)據(jù)分析能力較差。
專(zhuān)業(yè)做數(shù)據(jù)分析及整合的公司,缺乏對(duì)醫(yī)院實(shí)際操作流程的深入了解,導(dǎo)致對(duì)數(shù)據(jù)流向及關(guān)聯(lián)關(guān)系的分析不夠準(zhǔn)確,且很難準(zhǔn)確的拿到各子系統(tǒng)的根底數(shù)據(jù),最終未必能做到數(shù)據(jù)全面、準(zhǔn)確。
2.5.3僅患者與數(shù)據(jù)的對(duì)應(yīng)關(guān)系就是一個(gè)大問(wèn)題如果說(shuō)要從國(guó)家醫(yī)療大數(shù)據(jù)中查詢(xún)患者影像數(shù)據(jù),那么,該如何實(shí)現(xiàn)?在當(dāng)前的醫(yī)療信息系統(tǒng)中,關(guān)于患者的編碼并不是唯一的,也不是全國(guó)統(tǒng)一的。
要查詢(xún)某個(gè)患者的醫(yī)療數(shù)據(jù),最理想的查詢(xún)方式就是以患者的身份證號(hào)作為查詢(xún)條件而查詢(xún)相關(guān)數(shù)據(jù)。由于目前國(guó)內(nèi)的各種醫(yī)療信息系統(tǒng)中的各個(gè)表中并不一定擁有患者身份證這一字段,從而使查詢(xún)變得非常繁瑣。
例如:下面的表中的數(shù)據(jù)是一個(gè)PACS系統(tǒng)中的數(shù)據(jù)。此表中并沒(méi)有包含可以直接識(shí)別患者身份的數(shù)據(jù)。因?yàn)橛上卤碇械摹靶彰奔啊伴T(mén)診及住院號(hào)”并不能準(zhǔn)確地識(shí)別出是哪一個(gè)患者。國(guó)內(nèi)同名的人非常多,僅由姓名查義患者的數(shù)據(jù)是不行的?!伴T(mén)診及住院號(hào)”只是各家醫(yī)院自己的編號(hào),也不能把“門(mén)診及住院號(hào)”作為查詢(xún)條件。
在上面的PACS系統(tǒng)表中未包含患者身份證數(shù)據(jù)。因此,需要從HIS系統(tǒng)中根據(jù)患者身份證號(hào)而查出患者的“門(mén)診或住院號(hào)”,再根據(jù)“門(mén)診或住院號(hào)”而從PACS系統(tǒng)表中查出PACS影像數(shù)據(jù)。
“患者與數(shù)據(jù)的對(duì)應(yīng)關(guān)系”這樣的問(wèn)題其實(shí)是大數(shù)據(jù)中的一個(gè)非常突出的問(wèn)題。為了查詢(xún)的方便,一定要把數(shù)據(jù)的最主要的特征在數(shù)據(jù)中表現(xiàn)出來(lái)。但關(guān)系數(shù)據(jù)庫(kù)理論未考慮此問(wèn)題。在大數(shù)據(jù)挖掘中,僅是確定患者的身份就是一項(xiàng)艱巨的工程。對(duì)小數(shù)據(jù)而言,程序員知道相關(guān)的數(shù)據(jù)存貯在哪個(gè)表中,但在大數(shù)據(jù)環(huán)境中,程序員不知道想要查詢(xún)的數(shù)據(jù)存貯在哪里。
2.6關(guān)系數(shù)據(jù)庫(kù)理論的致命傷關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)只適合于處理小數(shù)據(jù),而不適合處理大數(shù)據(jù),其根本原因在于關(guān)系數(shù)據(jù)庫(kù)理論的先天缺乏。
2.6.1關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)在大數(shù)據(jù)環(huán)境中為何變成無(wú)意義的數(shù)據(jù)如果在國(guó)家醫(yī)療大數(shù)據(jù)中心查詢(xún)到下表的數(shù)據(jù),誰(shuí)能看懂?該表中的數(shù)據(jù)是某家醫(yī)院的信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù),普通人看不懂,醫(yī)生也只能靠猜測(cè)才能猜出局部?jī)?nèi)容。
下面的兩張表中的數(shù)據(jù)也是關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù),這兩張表中的數(shù)據(jù)也是普通人難以看懂的:IDXMXBNLTZSG1張三男5672180IDXMXBZYFXYFQTFY2146張三男5672180上面兩表中的數(shù)據(jù)的實(shí)際含義如下:ID姓名性別所齡體重身高1張三男5672180ID姓名性別中藥費(fèi)西藥費(fèi)其它費(fèi)用2146張三男5672180下表是用創(chuàng)造專(zhuān)利技術(shù)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”而設(shè)計(jì)的表,該表中的數(shù)據(jù)無(wú)論是誰(shuí),只要懂漢語(yǔ),就可以看懂表中內(nèi)容:ID事物代號(hào)事物特征事物特征值超長(zhǎng)特征值單位附件時(shí)間100280事物分類(lèi)體育管理系統(tǒng)2023.3.2101280事物分類(lèi)教練信息2023.3.2102280事物分類(lèi)教練根本情況2023.3.2103280身份證號(hào)XXXXXXXXXX
2023.3.2105280姓名張三2023.3.2106280性別男2023.3.2107280年齡562023.3.2108280體重72
KG
2023.3.2109280身高180CM2023.3.211001280事物分類(lèi)病歷2023.5.311011280事物分類(lèi)住院病歷2023.5.311021280事物分類(lèi)醫(yī)療費(fèi)用2023.5.311031280身份證號(hào)XXXXXXXXXX
2023.5.311041280住院號(hào)XXXXXXXXXX
2023.5.311051280姓名張三2023.5.311061280性別男2023.5.311071280中藥費(fèi)56元2023.5.311081280西藥費(fèi)72
元
2023.5.311091280其它費(fèi)用180元2023.5.3相對(duì)大數(shù)據(jù)而言,關(guān)系數(shù)據(jù)庫(kù)理論是小數(shù)據(jù)時(shí)代的產(chǎn)物,只適合處理小數(shù)據(jù),而不適合處理大數(shù)據(jù)。
關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)根本上都是不合格的失真數(shù)據(jù),因?yàn)殛P(guān)系數(shù)據(jù)庫(kù)系統(tǒng)所面對(duì)的用戶(hù)只是熟悉關(guān)系數(shù)據(jù)庫(kù)理論的設(shè)計(jì)人員,而不是最終的用戶(hù)。關(guān)系數(shù)據(jù)庫(kù)的最終用戶(hù)所看到的數(shù)據(jù)是設(shè)計(jì)人員利用應(yīng)用程序?qū)﹃P(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)展解讀之后的數(shù)據(jù),最終用戶(hù)并不是直接閱讀關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)。最終用戶(hù)也看不懂關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)。
關(guān)系數(shù)據(jù)庫(kù)理論非常注重?cái)?shù)據(jù)的冗余,用關(guān)系數(shù)據(jù)庫(kù)所建立的信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)所占用的存貯空間比較小,但關(guān)系數(shù)據(jù)庫(kù)在減少數(shù)據(jù)冗余的同時(shí)也導(dǎo)致關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)只有通過(guò)應(yīng)用程序的解讀才能讓最終用戶(hù)讀懂?dāng)?shù)據(jù)的含義。
關(guān)系數(shù)據(jù)理論的一個(gè)致命傷就是由設(shè)計(jì)人員隨意定義數(shù)據(jù)構(gòu)造(表構(gòu)造),關(guān)系數(shù)據(jù)庫(kù)理論中沒(méi)有定義數(shù)據(jù)構(gòu)造的國(guó)際標(biāo)準(zhǔn)。由此而帶來(lái)的嚴(yán)重問(wèn)題就是不同的設(shè)計(jì)者所設(shè)計(jì)出的數(shù)據(jù)構(gòu)造各不相同,每一個(gè)信息系統(tǒng)只認(rèn)識(shí)自己所定義的數(shù)據(jù),而不認(rèn)識(shí)其它信息系統(tǒng)所定義的數(shù)據(jù)。系統(tǒng)與系統(tǒng)之間不能互聯(lián)互通,用關(guān)系數(shù)據(jù)庫(kù)理論所設(shè)計(jì)出的信息系統(tǒng)都是孤島型信息系統(tǒng)。
在小數(shù)據(jù)環(huán)境中,可由應(yīng)用程序來(lái)解讀數(shù)據(jù)的真實(shí)含義。然而在大數(shù)據(jù)環(huán)境中,面對(duì)數(shù)百萬(wàn)張以上的表,就是災(zāi)難。
數(shù)據(jù)猶如語(yǔ)言,數(shù)據(jù)互聯(lián)互通、信息共享的根底就是大家都講“普通話”。而用關(guān)系數(shù)據(jù)庫(kù)理論所設(shè)計(jì)的每一個(gè)信息系統(tǒng)都有自己獨(dú)特的“方言”,任何兩個(gè)信息系統(tǒng)之間誰(shuí)也聽(tīng)不懂對(duì)方的“方言”。關(guān)系數(shù)據(jù)庫(kù)理論中根本就沒(méi)有“普通話”的概念。
在小數(shù)據(jù)時(shí)代,一個(gè)信息系統(tǒng)只應(yīng)用于一個(gè)單位,甚至只應(yīng)用于某個(gè)部門(mén),例如醫(yī)院的HIS系統(tǒng)、PACS系統(tǒng)、LIS系統(tǒng)。
在互聯(lián)網(wǎng)時(shí)代、大數(shù)據(jù)時(shí)代,人們逐步發(fā)現(xiàn)信息系統(tǒng)之間的互聯(lián)互通、信息共享,以及處理數(shù)百萬(wàn)家單位的全部數(shù)據(jù)具有更大的價(jià)值。此時(shí)人們才發(fā)現(xiàn)原來(lái)用關(guān)系數(shù)據(jù)庫(kù)理論所設(shè)計(jì)的信息系統(tǒng)不能互聯(lián)互通,用關(guān)系數(shù)據(jù)庫(kù)理論不能處理數(shù)百萬(wàn)家單位所產(chǎn)生的大數(shù)據(jù)。
關(guān)系數(shù)據(jù)庫(kù)理論是單機(jī)時(shí)代時(shí)代的產(chǎn)物。在創(chuàng)立關(guān)系數(shù)據(jù)理論之初根本就沒(méi)有考慮系統(tǒng)之間的互聯(lián)互通、信息共享、大數(shù)據(jù)問(wèn)題。關(guān)系數(shù)據(jù)庫(kù)理論只適用于一個(gè)單位內(nèi)部,不適合于處理單位之間數(shù)據(jù)互聯(lián)互通。
關(guān)系數(shù)據(jù)庫(kù)理論于1970年的6月由IBM公司的研究員埃德加.考特(EdgarFrankCodd)創(chuàng)立【論文名稱(chēng)為《大型共享數(shù)據(jù)庫(kù)數(shù)據(jù)的關(guān)系模型》(ARelationalModelofDataforLargeSharedDataBanks)】。ORACLE誕生于1979年。
關(guān)系數(shù)據(jù)庫(kù)是信息化社會(huì)的功臣,也是當(dāng)今嚴(yán)重的信息孤島的罪魁禍?zhǔn)祝£P(guān)系數(shù)據(jù)庫(kù)理論是單機(jī)時(shí)代、局域網(wǎng)時(shí)代的產(chǎn)物,是一種以自我為“中心”的孤島型理論,沒(méi)有與外界進(jìn)展數(shù)據(jù)交換及數(shù)據(jù)共享的概念,也沒(méi)有數(shù)據(jù)接口及互聯(lián)互通的概念。而當(dāng)今的互聯(lián)網(wǎng)是一種沒(méi)有中心的網(wǎng)絡(luò),系統(tǒng)之間的互聯(lián)互通是重中之重。用關(guān)系數(shù)據(jù)庫(kù)理論所建立的信息系統(tǒng)都是孤島型的,不能互聯(lián)互通。
關(guān)系數(shù)據(jù)庫(kù)的特點(diǎn)是:雞犬之聲相聞,老死不相往來(lái)。我只處理我的系統(tǒng)中的數(shù)據(jù),我不處理你的系統(tǒng)中的數(shù)據(jù),你也不能處理我的系統(tǒng)中的數(shù)據(jù)。我不管你的數(shù)據(jù),你也別想管我的數(shù)據(jù)。我的就是我的,你的就是你的,你我之間沒(méi)關(guān)系。你的數(shù)據(jù)來(lái)到我的系統(tǒng)中是無(wú)意義的數(shù)據(jù),我的數(shù)據(jù)到了你的系統(tǒng)中也是意義的數(shù)據(jù)。我的數(shù)據(jù)只能在我的系統(tǒng)中生存,你的數(shù)據(jù)只能在你的系統(tǒng)中生存。正因如此,用關(guān)系數(shù)據(jù)庫(kù)理論所設(shè)計(jì)出的信息系統(tǒng)全都是孤島型信息系統(tǒng)。
2.6.2關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)是一種完全封閉的系統(tǒng):外來(lái)數(shù)據(jù)無(wú)法入住關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)猶如私人住宅,只有家庭成員才能入住,外人莫入。
大數(shù)據(jù)所需要的是旅館。旅館向所有人開(kāi)放,誰(shuí)來(lái)了都可以入住,只要有房間。
關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中并沒(méi)有現(xiàn)成的位置供數(shù)據(jù)入住到數(shù)據(jù)庫(kù)中,數(shù)據(jù)要入住關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中,首先必須先為其定義數(shù)據(jù)構(gòu)造,或者說(shuō)只有已定義數(shù)據(jù)構(gòu)造的數(shù)據(jù)入能入住到數(shù)據(jù)庫(kù)中,而絕大多數(shù)外來(lái)數(shù)據(jù)都未經(jīng)過(guò)定義,因此,外來(lái)數(shù)據(jù)都不能入住到數(shù)據(jù)庫(kù)系統(tǒng)中。
2.6.3關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與數(shù)據(jù)系統(tǒng)密不可分關(guān)系數(shù)據(jù)庫(kù)有多種(ORACLE、SQLSERVER、DB2、ACCESS等等),每一種數(shù)據(jù)庫(kù)都有自己的特點(diǎn),各種數(shù)據(jù)庫(kù)系統(tǒng)只能處理自己的數(shù)據(jù),不能處理其它系統(tǒng)的數(shù)據(jù),例如由ORACLE所產(chǎn)生的數(shù)據(jù)只能由ORACLE系統(tǒng)處理,SQLSERVER處理不了ORACLE所產(chǎn)生的數(shù)據(jù)。
關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)在相應(yīng)的數(shù)據(jù)庫(kù)系統(tǒng)中才是有意義的,一旦脫離了相應(yīng)的數(shù)據(jù)庫(kù)系統(tǒng)就成了無(wú)意義的數(shù)據(jù)。
2.6.4關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與數(shù)據(jù)構(gòu)造密不可分關(guān)系數(shù)據(jù)庫(kù)中的每一個(gè)數(shù)據(jù)都是有數(shù)據(jù)構(gòu)造的,一旦失去相應(yīng)的數(shù)據(jù)構(gòu)造,就成了無(wú)意義的數(shù)據(jù)。
對(duì)小數(shù)據(jù)而言,一個(gè)信息系統(tǒng)只有幾張表、幾十張表,多的也只有幾百?gòu)埍怼6鴮?duì)大數(shù)據(jù)而言,例如國(guó)家醫(yī)療大數(shù)據(jù),就會(huì)涉及到數(shù)十萬(wàn)個(gè)信息系統(tǒng)中的數(shù)百萬(wàn)張表。而現(xiàn)有的信息系統(tǒng)都只是小數(shù)據(jù)信息系統(tǒng),只能認(rèn)識(shí)自己的系統(tǒng)中的數(shù)據(jù),都不認(rèn)識(shí)其它系統(tǒng)的數(shù)據(jù),都不能處理其它系統(tǒng)的數(shù)據(jù)。
對(duì)關(guān)系數(shù)據(jù)庫(kù)而言,它只能處理特定的數(shù)據(jù),所謂特定的數(shù)據(jù)就是只有事先在關(guān)系數(shù)據(jù)庫(kù)定義了構(gòu)造的數(shù)據(jù)關(guān)系數(shù)據(jù)庫(kù)才能處理,不能處理事先未定義構(gòu)造的數(shù)據(jù)。而大數(shù)據(jù)所面臨的數(shù)據(jù)以不確定,或不好確定為特點(diǎn),面對(duì)不確定的數(shù)據(jù)、不確定的數(shù)據(jù)構(gòu)造,關(guān)系數(shù)據(jù)庫(kù)無(wú)能為力。大數(shù)據(jù)的特點(diǎn):大數(shù)據(jù)所面臨的是無(wú)窮的數(shù)據(jù)、無(wú)窮的數(shù)據(jù)構(gòu)造,這是關(guān)系數(shù)據(jù)庫(kù)所不能解決的。因此,要處理大數(shù)據(jù),必須從根本上解決大數(shù)據(jù)所涉及到的“無(wú)窮的數(shù)據(jù)、無(wú)窮的數(shù)據(jù)構(gòu)造”問(wèn)題。例如,真正合格的大數(shù)據(jù)處理軟件工具,不但能夠處理國(guó)家醫(yī)療大數(shù)據(jù),也應(yīng)該能夠其它各行各業(yè)的數(shù)據(jù)。
2.6.5關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)與應(yīng)用程序密不可分目前的信息系統(tǒng)都是通過(guò)應(yīng)用程序來(lái)解讀關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù),而每個(gè)應(yīng)用程序只能解讀自己的系統(tǒng)中的數(shù)據(jù)而無(wú)法解讀其它系統(tǒng)中的數(shù)據(jù)。
關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)不具獨(dú)立性、完整性,數(shù)據(jù)一旦脫離相應(yīng)的數(shù)據(jù)庫(kù)系統(tǒng)及相應(yīng)的應(yīng)用程序就變成了無(wú)意義的數(shù)據(jù)。例如,程序員在設(shè)計(jì)信息系統(tǒng)時(shí)習(xí)慣用代碼來(lái)表達(dá)數(shù)據(jù),例如有的用“1”代表男性,用“0”代表女生,而另一些人那么用“M”代表男性,用“W”代表女性。在醫(yī)院信息系統(tǒng)中,各個(gè)信息系統(tǒng)可由應(yīng)用程序來(lái)解讀各個(gè)代碼,然而,在醫(yī)療大數(shù)據(jù)挖掘中,這種不標(biāo)準(zhǔn)、不標(biāo)準(zhǔn)、不統(tǒng)一的代碼帶給數(shù)據(jù)挖掘人員的將是災(zāi)難!因?yàn)獒t(yī)療大數(shù)據(jù)挖掘人員所面臨的是全國(guó)數(shù)萬(wàn)家醫(yī)院的數(shù)十萬(wàn)個(gè)信息系統(tǒng)。假設(shè)要對(duì)數(shù)十萬(wàn)個(gè)信息系統(tǒng)的數(shù)據(jù)中的代碼進(jìn)展分析、轉(zhuǎn)換,將是一項(xiàng)工程量非常巨在的工程。因此,對(duì)大數(shù)據(jù)而言,盡量不要在數(shù)據(jù)庫(kù)中采用代碼。
例如下表中的“性別碼”、“婚否碼”:2.6.6關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)一旦脫離相應(yīng)的系統(tǒng)就成了無(wú)意義的數(shù)據(jù)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)只有在某個(gè)特定的系統(tǒng)中才有意義,一旦脫離了這個(gè)系統(tǒng)就成了無(wú)意義的數(shù)據(jù)。正因如此。也可以認(rèn)為關(guān)系數(shù)據(jù)庫(kù)中所存貯的根本就不是最終用戶(hù)所能讀懂的數(shù)據(jù),而是只是專(zhuān)業(yè)的設(shè)計(jì)人員自己才能懂的“代碼”。
2.6.7關(guān)系數(shù)據(jù)庫(kù)無(wú)法實(shí)現(xiàn)病歷信息的構(gòu)造化存貯構(gòu)造化電子病歷系統(tǒng)是醫(yī)院信息系統(tǒng)的核心,這是國(guó)際上公認(rèn)的。
關(guān)系數(shù)據(jù)庫(kù)可以應(yīng)用于各行各業(yè),然而在醫(yī)療行業(yè)關(guān)系數(shù)據(jù)庫(kù)遇到了巨大挑戰(zhàn),準(zhǔn)確地說(shuō)是束手無(wú)策,醫(yī)學(xué)信息非常復(fù)雜,用關(guān)系數(shù)據(jù)庫(kù)不能實(shí)現(xiàn)病歷信息的構(gòu)造化存貯。
XML雖說(shuō)可以實(shí)現(xiàn)病歷信息的構(gòu)造化,然而要從全國(guó)每年所產(chǎn)生的幾十億份電子病歷中查詢(xún)信息是非常困難的,查詢(xún)速度非常低。
用醫(yī)學(xué)信息的構(gòu)造化存貯方法可以在關(guān)系數(shù)據(jù)庫(kù)中實(shí)現(xiàn)電子病歷信息及醫(yī)學(xué)知識(shí)庫(kù)信息的構(gòu)造化存貯,查詢(xún)速度遠(yuǎn)遠(yuǎn)超過(guò)從XML電子病歷中查詢(xún)信息的速度。醫(yī)學(xué)信息的構(gòu)造化存貯方法可用于各行各業(yè),最突出的應(yīng)用那么是在醫(yī)療行業(yè)。
2.6.8關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)都是“方言”,大數(shù)據(jù)需要的是“普通話”用關(guān)系數(shù)據(jù)庫(kù)所設(shè)計(jì)出的每一個(gè)信息系統(tǒng)都有自己特定的“方言”。關(guān)系數(shù)據(jù)庫(kù)理論中沒(méi)有“普通話”的概念,每設(shè)計(jì)一種信息系統(tǒng),就產(chǎn)生一種方言。系統(tǒng)之間誰(shuí)也聽(tīng)不懂對(duì)方所講的話,必須翻譯才行。
醫(yī)療行業(yè)的現(xiàn)狀:相當(dāng)于每個(gè)醫(yī)療信息系統(tǒng)講一種方言,各醫(yī)院之間不能互聯(lián)互通,甚至同一家醫(yī)院內(nèi)部的信息系統(tǒng)之間也不能互聯(lián)互通。
在小數(shù)據(jù)時(shí)代,數(shù)據(jù)只是在一個(gè)單位內(nèi)部使用,甚至只是在一個(gè)單位的某個(gè)部門(mén)使用。
在大數(shù)據(jù)時(shí)代,最需要的是各個(gè)機(jī)構(gòu)之間、各個(gè)系統(tǒng)之間的數(shù)據(jù)的互聯(lián)互通,數(shù)據(jù)不只是在單位內(nèi)部使用,也要供單位外的人使用。
小數(shù)據(jù)系統(tǒng)只處理自己的數(shù)據(jù),大數(shù)據(jù)系統(tǒng)要可以處理來(lái)自各種各樣的小數(shù)據(jù)系統(tǒng)中的所有數(shù)據(jù)。
大數(shù)據(jù)最需要的就是普通話,一種可以讓各個(gè)信息系統(tǒng)都能聽(tīng)懂的語(yǔ)言。
2.7關(guān)系數(shù)據(jù)庫(kù)如何處理國(guó)家醫(yī)療大數(shù)據(jù)中數(shù)萬(wàn)個(gè)數(shù)據(jù)庫(kù)、數(shù)千萬(wàn)張表例子:如果說(shuō)全國(guó)的各家醫(yī)療機(jī)構(gòu)的數(shù)據(jù)以鏡像的方式全部上傳到國(guó)家醫(yī)療大數(shù)據(jù)中心,那么,國(guó)家醫(yī)療大數(shù)據(jù)中就擁有10萬(wàn)個(gè)以上的醫(yī)療信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)中共含有數(shù)千萬(wàn)張表,該如何編寫(xiě)一個(gè)通用的查詢(xún)患者病史的通用應(yīng)用軟件?患者病史數(shù)據(jù)有可能包含在10萬(wàn)個(gè)以上的數(shù)據(jù)庫(kù)中的數(shù)千萬(wàn)張以上的表中,所有數(shù)據(jù)庫(kù)、所有表中的數(shù)據(jù)都有可能涉及到。要在國(guó)家醫(yī)療大數(shù)據(jù)中查詢(xún)患者的病史數(shù)據(jù),需要查詢(xún)?nèi)珖?guó)數(shù)十年內(nèi)所產(chǎn)生的國(guó)家醫(yī)療大數(shù)據(jù)。
首先需要搞清楚國(guó)家醫(yī)療大數(shù)據(jù)中的10萬(wàn)個(gè)以上的信息系統(tǒng)所產(chǎn)生的數(shù)據(jù)存貯在哪些數(shù)據(jù)庫(kù)中,這些數(shù)據(jù)庫(kù)的地址、是什么數(shù)據(jù)庫(kù)系統(tǒng)所產(chǎn)生的數(shù)據(jù),各數(shù)據(jù)庫(kù)中含有哪些表,這些表(數(shù)千萬(wàn)張表)的數(shù)據(jù)構(gòu)造是什么、這些表之間的關(guān)系。
其次是數(shù)據(jù)抽取(ETL),然而要對(duì)數(shù)十萬(wàn)個(gè)數(shù)據(jù)庫(kù)中的數(shù)千萬(wàn)張表中的數(shù)據(jù)進(jìn)展抽取確實(shí)是一項(xiàng)工程量浩大的工程。
l為了說(shuō)明問(wèn)題的簡(jiǎn)單化,下面以查詢(xún)PACS中的數(shù)據(jù)為例來(lái)說(shuō)明問(wèn)題。
查詢(xún)患者的病史應(yīng)該以患者的身份證號(hào)作為查詢(xún)條件,而不能以患者的姓名作為查詢(xún)條件,因?yàn)閲?guó)內(nèi)有很多同名同姓者。
如果某些醫(yī)療信息系統(tǒng)中未能使用患者的身份證號(hào),那么,在大數(shù)據(jù)環(huán)境中,患者的病史數(shù)據(jù)根本上是查不到的,或者說(shuō)查起來(lái)非常困難。
查詢(xún)過(guò)程如下:1、以身份證號(hào)為查詢(xún)條件而查詢(xún)患者曾經(jīng)在哪家醫(yī)院就醫(yī)。一般是從HIS系統(tǒng)查詢(xún)患者身份證號(hào)。面對(duì)數(shù)萬(wàn)個(gè)HIS系統(tǒng),各由不同的開(kāi)發(fā)商所開(kāi)發(fā),數(shù)據(jù)構(gòu)造各不相同。要搞清楚對(duì)應(yīng)的數(shù)據(jù)庫(kù)及對(duì)應(yīng)的表,也是一項(xiàng)大工程。
2、從數(shù)萬(wàn)個(gè)HIS系統(tǒng)中的數(shù)十萬(wàn)個(gè)表中查詢(xún)是否有對(duì)應(yīng)的身份證號(hào)3、再以身份證號(hào)從數(shù)萬(wàn)個(gè)HIS系統(tǒng)中查詢(xún)出相應(yīng)的住院號(hào)、門(mén)診號(hào)4、以住院號(hào)、門(mén)診號(hào)而從數(shù)萬(wàn)個(gè)PACS系統(tǒng)中查詢(xún)相應(yīng)PACS數(shù)據(jù)。
如果說(shuō)哪家醫(yī)院的信息系統(tǒng)的數(shù)據(jù)構(gòu)造有變化,那么相關(guān)的程序都要進(jìn)展修改。這就是關(guān)系數(shù)據(jù)庫(kù)的先天缺乏。而醫(yī)院的信息系統(tǒng)的升級(jí)改造是非常普遍的。這種升級(jí)改造對(duì)國(guó)家醫(yī)療大數(shù)據(jù)的通用查詢(xún)軟件工具也是一項(xiàng)大考驗(yàn)。
上述例子說(shuō)明,查詢(xún)?nèi)魏我粋€(gè)病史數(shù)據(jù)都要編寫(xiě)大量的程序。如果對(duì)全國(guó)每年的某種疾病進(jìn)展統(tǒng)計(jì),那么會(huì)因?yàn)楦骷裔t(yī)療機(jī)構(gòu)的信息系統(tǒng)所用的疾病名不標(biāo)準(zhǔn)、不標(biāo)準(zhǔn)、不統(tǒng)一而帶來(lái)很大的麻煩。
病歷數(shù)據(jù)存貯在XML文件中。全年每年產(chǎn)生76億份病歷,從76億份病因中快速地查詢(xún)數(shù)據(jù)也是很困難的。
結(jié)論:處理數(shù)十萬(wàn)個(gè)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)所產(chǎn)生的大數(shù)據(jù)是非常困難的!2.8大數(shù)據(jù)之夢(mèng)十年后成真由于醫(yī)療大數(shù)據(jù)面臨八大難題以及對(duì)全國(guó)各家醫(yī)療醫(yī)療機(jī)構(gòu)現(xiàn)有的信息系統(tǒng)進(jìn)展全面改造非常困難,國(guó)家醫(yī)療大數(shù)據(jù)之夢(mèng)十年后才能成真。
大數(shù)據(jù)不僅僅是數(shù)據(jù)問(wèn)題,而是非常復(fù)雜的綜合問(wèn)題。國(guó)家醫(yī)療大數(shù)據(jù)并不是把各家醫(yī)療機(jī)構(gòu)的數(shù)據(jù)全部存貯到一個(gè)云平臺(tái)就能稱(chēng)作是合格的國(guó)家醫(yī)療大數(shù)據(jù)。要建立合格的國(guó)家醫(yī)療大數(shù)據(jù),需要對(duì)原有數(shù)據(jù)進(jìn)展抽取,更需要對(duì)全國(guó)各家醫(yī)療機(jī)構(gòu)現(xiàn)有的信息系統(tǒng)進(jìn)展全面整改。
2.8.1信息化社會(huì)由概念到比較成熟用了30多年時(shí)間“信息化”的概念是上世紀(jì)60年代初提出的。在80年代,關(guān)于“信息社會(huì)”的較為流行的說(shuō)法是“3C”社會(huì)(通訊化、計(jì)算機(jī)化和自動(dòng)控制化),“3A”社會(huì)(工廠自動(dòng)化、辦公室自動(dòng)化、家庭自動(dòng)化)和“4A”社會(huì)(“3A”加農(nóng)業(yè)自動(dòng)化)。到了90年代,關(guān)于信息社會(huì)的說(shuō)法又加上多媒體技術(shù)和信息高速公路?!靶畔⒒鐣?huì)”的概念從提出到比效成熟用了30多年,而時(shí)至今日,“信化社會(huì)”之夢(mèng)還沒(méi)有全部成真。
大數(shù)據(jù)的概念是2023年提出的,根據(jù)以往的經(jīng)歷,要?jiǎng)?chuàng)造一個(gè)時(shí)代,最起碼以也十年以上的時(shí)間。
2.8.2千年蟲(chóng)問(wèn)題的啟示計(jì)算機(jī)2000年問(wèn)題,又叫做“千年蟲(chóng)”、“電腦千禧年千年蟲(chóng)問(wèn)題”或“千年危機(jī)”??s寫(xiě)為“Y2K”。是指在某些使用了計(jì)算機(jī)程序的智能系統(tǒng)(包括計(jì)算機(jī)系統(tǒng)、自動(dòng)控制芯片等)中,由于其中的年份只使用兩位十進(jìn)制數(shù)來(lái)表示,因此當(dāng)系統(tǒng)進(jìn)展(或涉及到)跨世紀(jì)的日期處理運(yùn)算時(shí)(如多個(gè)日期之間的計(jì)算或比較等),就會(huì)出現(xiàn)錯(cuò)誤的結(jié)果,進(jìn)而引發(fā)各種各樣的系統(tǒng)功能紊亂甚至崩潰。因此從根本上說(shuō)千年蟲(chóng)是一種程序處理日期上的BUG,而非病毒。
“千年蟲(chóng)”問(wèn)題的根源始于60年代。當(dāng)時(shí)計(jì)算機(jī)存儲(chǔ)器的本錢(qián)很高,如果用四位數(shù)字表示年份,就要多占用存儲(chǔ)器空間,就會(huì)使本錢(qián)增加,因此為了節(jié)省存儲(chǔ)空間,計(jì)算機(jī)系統(tǒng)的編程人員采用兩位數(shù)字表示年份。隨著計(jì)算機(jī)技術(shù)的迅猛開(kāi)展,雖然后來(lái)存儲(chǔ)器的價(jià)格降低了,但在計(jì)算機(jī)系統(tǒng)中使用兩位數(shù)字來(lái)表示年份的做法卻由于思維上的慣性勢(shì)力而被沿襲下來(lái),年復(fù)一年,直到新世紀(jì)即將降臨之際,大家才突然意識(shí)到用兩位數(shù)字表示年份將無(wú)法正確辨識(shí)公元2000年及其以后的年份。1997年,信息界開(kāi)場(chǎng)拉起了“千年蟲(chóng)”警鐘,并很快引起了全球關(guān)注。
“千年蟲(chóng)”是人類(lèi)不經(jīng)意造成的失誤,為了抓住這只“蟲(chóng)”,全球至少已花費(fèi)2000億美元(有的媒體報(bào)道為3000億美元,有的為6000億美元)。
新年伊始,聯(lián)合國(guó)“國(guó)際2000年問(wèn)題協(xié)調(diào)中心”、美國(guó)的“國(guó)際‘千年蟲(chóng)’監(jiān)控中心”等機(jī)構(gòu)先后宣布,133個(gè)國(guó)家的能源、通訊等十幾個(gè)對(duì)“千年蟲(chóng)”敏感行業(yè)都順利過(guò)渡,僅十多個(gè)國(guó)家出現(xiàn)一些輕微案例,但均及時(shí)糾正,未造成嚴(yán)重后果。
全球唯一受“千年蟲(chóng)”嚴(yán)重影響的國(guó)家只有非洲的贊比亞,其政府、金融、電力、航空、效勞一片混亂。政府宣布放假3日,防止社會(huì)功能癱瘓殃及其他系統(tǒng)。
有人稱(chēng)“千年蟲(chóng)”工程是人類(lèi)最大的信息工程、人類(lèi)最龐大的搶救工程。
2.8.3大數(shù)據(jù)工程遠(yuǎn)比千年蟲(chóng)問(wèn)題復(fù)雜假設(shè)用當(dāng)前的技術(shù)如何處理國(guó)家醫(yī)療大數(shù)據(jù)?首先是制訂數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)構(gòu)造標(biāo)準(zhǔn),以及業(yè)務(wù)和業(yè)務(wù)流程的標(biāo)準(zhǔn):這些工作的工程量非常大,需要五年左右的時(shí)間才能完成。目前雖說(shuō)大家已認(rèn)識(shí)到了標(biāo)準(zhǔn)化工作的重要性,但在實(shí)際行動(dòng)上的力度還不夠。
其次是數(shù)據(jù)抽?。簩?duì)原有的數(shù)據(jù)進(jìn)展抽取。假設(shè)要對(duì)全國(guó)97.8萬(wàn)家醫(yī)療機(jī)構(gòu)所產(chǎn)生的所有數(shù)據(jù)進(jìn)展抽取,其工程量也是非常巨大的。這個(gè)抽取工作需要以國(guó)家醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)為根底。
第三是對(duì)現(xiàn)有信息系統(tǒng)的改造:只有對(duì)現(xiàn)有的信息系統(tǒng)進(jìn)展徹底改造才能產(chǎn)生標(biāo)準(zhǔn)化的數(shù)據(jù),這樣才能適應(yīng)大數(shù)據(jù)的需要。然而對(duì)全國(guó)各家醫(yī)院的信息系統(tǒng)進(jìn)展全面改造,所花費(fèi)的代價(jià)是非常高的。到目前為止,各行各業(yè)的信息系統(tǒng)根本上都不標(biāo)準(zhǔn),都不適應(yīng)大數(shù)據(jù)的需求,對(duì)現(xiàn)有信息系統(tǒng)的改造的代價(jià)遠(yuǎn)遠(yuǎn)超對(duì)千年蟲(chóng)問(wèn)題的處理。
第四是數(shù)據(jù)同步:對(duì)現(xiàn)有信息系統(tǒng)進(jìn)展改造之后,數(shù)據(jù)要實(shí)時(shí)地同步到國(guó)家醫(yī)療大數(shù)據(jù)中心。
2.8.4五年之內(nèi)(2023年前)醫(yī)療大數(shù)據(jù)只是紙上談兵五年之內(nèi),醫(yī)療大數(shù)據(jù)還只是處于探索階段、開(kāi)展階段。五年之后醫(yī)療大數(shù)據(jù)才能逐步變成現(xiàn)實(shí)。從某種方面而言,五年之內(nèi)(2023年前)中國(guó)沒(méi)有真正合格的國(guó)家醫(yī)療大數(shù)據(jù)。真正的合格的國(guó)家醫(yī)療大數(shù)據(jù)是可以進(jìn)展高效挖掘的數(shù)據(jù),并不是把所有的數(shù)據(jù)堆集在一起就能稱(chēng)為醫(yī)療大數(shù)據(jù)。不能進(jìn)展高效處理、挖掘的數(shù)據(jù)只能稱(chēng)為“數(shù)據(jù)垃圾”,五年之后才能將“數(shù)據(jù)垃圾”變成寶。
2.9必須開(kāi)發(fā)新型的軟件工具才能對(duì)醫(yī)療大數(shù)據(jù)進(jìn)展高效挖掘維基百科對(duì)大數(shù)據(jù)的定義:“大數(shù)據(jù)是指所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)到達(dá)獲取、處理的數(shù)據(jù)?!本S基百科對(duì)大數(shù)據(jù)的定義也意味著當(dāng)前的主流軟件工具已不能滿足時(shí)代開(kāi)展的要求,需要開(kāi)發(fā)新軟件工具來(lái)處理大數(shù)據(jù),也意味著當(dāng)前的醫(yī)療信息系統(tǒng)不能適應(yīng)醫(yī)療大數(shù)據(jù)的實(shí)際需求,需要對(duì)現(xiàn)有的信息系統(tǒng)進(jìn)展徹底的改造才能適應(yīng)大數(shù)據(jù)時(shí)代的潮流。
第3章創(chuàng)造專(zhuān)利:醫(yī)學(xué)信息的構(gòu)造化存貯方法維基百科關(guān)于大數(shù)據(jù)的定義已明確指出,目前的主流軟件工具已不適合處理大數(shù)據(jù),其言外之意就是要高效處理大數(shù)據(jù),必須創(chuàng)造創(chuàng)造新的軟件工具。
人的大腦才是最好的數(shù)據(jù)處理工具。最好的大數(shù)據(jù)的處理工具應(yīng)該在模仿大腦的記憶、思維方式的根底上而開(kāi)發(fā)出來(lái)的軟件工具。
在大數(shù)據(jù)的4V特性中,最關(guān)鍵的問(wèn)題就是數(shù)據(jù)類(lèi)型的“多樣性(Variety)”。人的大腦是如何處理數(shù)據(jù)的多樣性的?對(duì)人的大腦而言,沒(méi)有數(shù)據(jù)類(lèi)型的概念。人的大腦通過(guò)視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、嗅覺(jué)、味覺(jué)、痛覺(jué)等感覺(jué)器官而接收信號(hào)。對(duì)于同一感覺(jué)器官所接收的信號(hào)而言,它們的類(lèi)型都是一樣的。如果說(shuō)大腦中的數(shù)據(jù)有數(shù)據(jù)類(lèi)型,也只有六種類(lèi)型(視覺(jué)型、聽(tīng)覺(jué)型、觸覺(jué)型、嗅覺(jué)型、味覺(jué)型、痛覺(jué)型)。從某種方面而言,大腦中的數(shù)據(jù)只有一種類(lèi)型,即模擬型數(shù)據(jù)。
大腦通過(guò)聯(lián)想而實(shí)現(xiàn)對(duì)信號(hào)的處理。聯(lián)想共有三種:同時(shí)聯(lián)想、相似聯(lián)想、接近聯(lián)想。
同時(shí)聯(lián)想:在同一時(shí)間內(nèi)由不同的感覺(jué)器官所接收的信號(hào)同時(shí)輸入大腦時(shí),這些信號(hào)之間就可以形成聯(lián)想關(guān)系。
相似聯(lián)想:同一感覺(jué)器官所接收到的信號(hào)相似時(shí)就可以形成聯(lián)想關(guān)系。
接近聯(lián)想:在空間和時(shí)間上相互接近的事物的信號(hào)輸入到大腦之中時(shí),這些事物之間可以開(kāi)成聯(lián)想關(guān)系。
大腦是以“穿糖葫蘆”的形式存貯信號(hào):當(dāng)人的大腦接收第一個(gè)視覺(jué)信號(hào)時(shí),大腦是從最接近視覺(jué)的存貯區(qū)域開(kāi)場(chǎng)存貯信號(hào),并以“穿糖葫蘆”的形式逐一存貯所接收到的視覺(jué)信號(hào)。
大腦是以六列的二維表的形式來(lái)存貯信號(hào)。
對(duì)于同一存貯區(qū)域的信號(hào),例如視覺(jué)存貯區(qū)域的信號(hào),大腦是以相似聯(lián)想、接近聯(lián)想的形式而處理信號(hào)。
對(duì)于不同存貯區(qū)載的信號(hào),例如視覺(jué)存貯區(qū)域的信號(hào)與聽(tīng)覺(jué)存貯區(qū)域的信號(hào),大腦是以同時(shí)聯(lián)想的形式處理信號(hào)。
大腦以同時(shí)聯(lián)想、相似聯(lián)想、接近聯(lián)想的方式就可以聯(lián)想(猶如計(jì)算機(jī)中的查詢(xún)、檢索)到大腦中的所有信號(hào)。
人的大腦只用“一張表“就可以存貯所有的信號(hào),只用識(shí)別和聯(lián)想即可處理所有的信號(hào)。
醫(yī)學(xué)信息的構(gòu)造化存貯方法就是在模仿大腦的上述記憶、聯(lián)想形式的根底上而創(chuàng)造出的一種新型的數(shù)據(jù)構(gòu)造,這種數(shù)據(jù)構(gòu)造類(lèi)似大腦記憶信息的構(gòu)造,所以具有非常強(qiáng)大的功能。
3.1在了解醫(yī)學(xué)信息的構(gòu)造化存貯方法時(shí)的本卷須知醫(yī)學(xué)信息的構(gòu)造化存貯方法的數(shù)據(jù)構(gòu)造是一種與關(guān)系數(shù)據(jù)庫(kù)中的二維數(shù)據(jù)構(gòu)造完全不同的一種新型數(shù)據(jù)構(gòu)造。正因如此,它擁有很多優(yōu)異的功能、特性,而這些功能、特性是關(guān)系數(shù)據(jù)庫(kù)及XML不可能實(shí)現(xiàn)的。醫(yī)學(xué)信息的構(gòu)造化存貯方法的一個(gè)最突出的特性就是非常適合處理病歷信息,可以使電子病歷完全構(gòu)造化,也可以很容易地解決信息孤島問(wèn)題,也非常適合大數(shù)據(jù)存貯、挖掘。然而醫(yī)學(xué)信息的構(gòu)造化存貯方法是關(guān)系數(shù)據(jù)庫(kù)理論的異類(lèi),與關(guān)系數(shù)據(jù)庫(kù)理論格格不入,醫(yī)學(xué)信息的構(gòu)造化存貯方法在存貯和處理數(shù)據(jù)時(shí)也與關(guān)系數(shù)據(jù)庫(kù)理論完全不同。
用關(guān)系數(shù)據(jù)庫(kù)理論的方法在進(jìn)展大數(shù)據(jù)挖掘時(shí)會(huì)遇到很多困難,用醫(yī)學(xué)信息的構(gòu)造化存貯方法進(jìn)展大數(shù)據(jù)挖掘時(shí)會(huì)使原來(lái)非常困難的問(wèn)題變得非常簡(jiǎn)單。
對(duì)于了解關(guān)系數(shù)據(jù)庫(kù)理論者而言,在閱讀醫(yī)學(xué)信息的構(gòu)造化存貯方法的相關(guān)內(nèi)容之前,需要先忘掉關(guān)系數(shù)據(jù)庫(kù)理論,不要在一開(kāi)場(chǎng)就拿關(guān)系數(shù)據(jù)庫(kù)與醫(yī)學(xué)信息的構(gòu)造化存貯方法相比較。要想真正理解醫(yī)學(xué)信息的構(gòu)造化存貯方法,需要先了解它真正優(yōu)于關(guān)系數(shù)據(jù)庫(kù)的地方,即醫(yī)學(xué)信息的構(gòu)造化存貯方法非常適合處理病歷信息,可以使病歷信息構(gòu)造化,也可以很容易地解決信息孤島實(shí)現(xiàn)互聯(lián)互通,而關(guān)系數(shù)據(jù)庫(kù)那么無(wú)法使病歷信息構(gòu)造化,也不能有效地解決信息孤島問(wèn)題。
學(xué)習(xí)關(guān)系數(shù)據(jù)理論根本上需要一個(gè)月的時(shí)間,“醫(yī)學(xué)信息的構(gòu)造化存貯方法”也是一種新型的數(shù)據(jù)庫(kù)理論,因此,需要花一定的時(shí)間才能真正理解其內(nèi)容,剛開(kāi)場(chǎng)時(shí)肯定會(huì)遇到一些問(wèn)題,這很正常。
金庸的小說(shuō)描寫(xiě)到:游坦之之所以能練成易筋經(jīng)是因?yàn)樗瓉?lái)什么武功都不會(huì)。武功非常高強(qiáng)的鳩摩智為什么練不成易筋經(jīng)?在少林寺藏經(jīng)閣中的掃地僧說(shuō)“鳩摩智練了少林派的七十二絕技之后,又去強(qiáng)練甚么《易筋經(jīng)》”,又說(shuō)他“次序顛倒,大難已在旦夕之間”。說(shuō)道修煉少林諸門(mén)絕技,倘假設(shè)心中不存慈悲之念,戾氣所鐘,奇禍難測(cè)。這般修煉上乘武功而走火入魔,最是厲害不過(guò)。
學(xué)習(xí)“醫(yī)學(xué)信息的構(gòu)造化存貯方法”猶如修煉易筋經(jīng),不懂關(guān)系數(shù)據(jù)庫(kù)理論的人反而更容易承受,而關(guān)系數(shù)據(jù)庫(kù)高手、專(zhuān)家反而比較難承受。
金庸的小說(shuō)雖說(shuō)是虛假的,但也有一定的哲理。小孩子之所以容易承受新理論、新觀念,就是因?yàn)樗麄兊拇竽X中沒(méi)有舊觀念的束縛,就像一張白紙,你想在上面畫(huà)什么都可以。成年人那么因?yàn)樵陂L(zhǎng)期的生活中已形成自己的世界觀,所以對(duì)新的理論、觀念就會(huì)產(chǎn)生抗拒之心,成年人承受新理論、新觀念就慢,甚至完全不能承受。例如年輕人容易受西方的那種今天花明天的錢(qián)的超前消費(fèi)觀念,但上年紀(jì)的人卻無(wú)論如何也承受不了超前消費(fèi)的觀念,無(wú)論錢(qián)多錢(qián)少,總要先存一些錢(qián)。
3.2醫(yī)學(xué)信息的構(gòu)造化存貯方法醫(yī)學(xué)信息的構(gòu)造化存貯方法中所用的表的構(gòu)造是一種新型的數(shù)據(jù)構(gòu)造,這種數(shù)據(jù)構(gòu)造與XML中的數(shù)據(jù)有點(diǎn)相似。醫(yī)學(xué)信息的構(gòu)造化存貯方法中所用的表簡(jiǎn)稱(chēng)為“萬(wàn)能數(shù)據(jù)構(gòu)造表”?!叭f(wàn)能數(shù)據(jù)構(gòu)造表”的數(shù)據(jù)構(gòu)造與關(guān)系數(shù)據(jù)庫(kù)中的表的數(shù)據(jù)構(gòu)造有本質(zhì)的區(qū)別。要用醫(yī)學(xué)信息的構(gòu)造化存貯方法而開(kāi)發(fā)出一種概念全新的數(shù)據(jù)庫(kù)系統(tǒng)是非常困難的,所需的投資非常大,因此,目前可采用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)ORACAL、DB2、SQLSERVER、Access等來(lái)實(shí)現(xiàn)醫(yī)學(xué)信息的構(gòu)造化存貯。
關(guān)系數(shù)據(jù)庫(kù)以“橫向”的N個(gè)字段存貯一個(gè)事物的信息:ID姓名性別年齡職業(yè)298張三男56醫(yī)生“醫(yī)學(xué)信息的構(gòu)造化存貯方法”以“縱向”的N(或N+X)條記錄存貯一個(gè)事物的信息:ID事物代號(hào)事物特征事物特征值超長(zhǎng)特征值單位附件時(shí)間1201280事物分類(lèi)人事管理系統(tǒng)1202280事物分類(lèi)員工信息1203280姓名張三1204280性別男1205280年齡561206280職業(yè)醫(yī)生“萬(wàn)能數(shù)據(jù)構(gòu)造表”在SQLSERVER中的構(gòu)造形式:列名數(shù)據(jù)類(lèi)型Idbigint事物代號(hào)bigint事物特征nvarchar事物特征值nvarchar超長(zhǎng)特征值ntext單位nvarchar附件image時(shí)間datatime“萬(wàn)能數(shù)據(jù)構(gòu)造表”存貯數(shù)據(jù)的例子:ID事物代號(hào)事物特征事物特征值超長(zhǎng)特征值單位附件時(shí)間28事物分類(lèi)住院病歷28事物分類(lèi)患者根本情況28病案號(hào)19910819-2-21528身份證號(hào)XXXXXXXXXXXXX28姓名徐XX28工作單位石化總廠28職務(wù)機(jī)械工28地址上海市南京路28年齡4328入院日期1991-8-1928婚否已婚28病史采取日期1991-8-1928籍貫浙江省寧波市28病史記錄日期1991-8-1928民族漢28病情陳述者患者本人29事物分類(lèi)住院病歷29事物分類(lèi)現(xiàn)病歷29事物分類(lèi)病癥29病案號(hào)19910819-2-21529身份證號(hào)XXXXXXXXXXXXX29病癥寒戰(zhàn)29病癥腹瀉29誘因洗澡時(shí)著涼29病癥開(kāi)場(chǎng)時(shí)間1991-8-1632病案號(hào)19910819-2-21532身份證號(hào)XXXXXXXXXXXXX32事物分類(lèi)住院病歷32事物分類(lèi)現(xiàn)病歷32事物分類(lèi)病癥詳情32病癥腹瀉32開(kāi)場(chǎng)時(shí)間1991-8-16晚間32次數(shù)3次32糞便情況水樣便502病案號(hào)19910626-2-218502身份證號(hào)XXXXXXXXXXXX502事物分類(lèi)住院病歷502事物分類(lèi)出院記錄502事物分類(lèi)病癥詳情502病癥乳房腫塊502腫塊部位左乳502腫塊大小5X4X4CM502腫塊硬度質(zhì)硬502腫塊特點(diǎn)不光滑502腫塊特點(diǎn)界限不清502腫塊特點(diǎn)活動(dòng)欠佳502腫塊特點(diǎn)無(wú)觸痛502腫塊特點(diǎn)與皮膚粘連502腫塊特點(diǎn)外表皮膚呈輕度“桔皮樣”改變醫(yī)學(xué)信息的構(gòu)造化存貯方法的規(guī)定:1、數(shù)據(jù)構(gòu)造必須統(tǒng)一,不能作任何改變。這是確保信息系統(tǒng)互聯(lián)互通的根底。
2、同一事物擁有一個(gè)唯一的事物代號(hào)。不同的事物不能擁有相同的事物代號(hào)。不同的事物代號(hào)代表不同的事物。
3、數(shù)據(jù)的獨(dú)立性、數(shù)據(jù)的完整性、數(shù)據(jù)的可識(shí)別性:醫(yī)學(xué)信息的構(gòu)造化存貯方法要求數(shù)據(jù)與數(shù)據(jù)庫(kù)系統(tǒng)及相應(yīng)的應(yīng)用程序的耦合度為零。要實(shí)現(xiàn)數(shù)據(jù)與數(shù)據(jù)庫(kù)系統(tǒng)及相應(yīng)的應(yīng)用程序的耦合度為零,就必須完全讓數(shù)據(jù)自己表達(dá)出應(yīng)有的含義。這是實(shí)現(xiàn)互聯(lián)互通的最重要的根底。
在關(guān)系數(shù)據(jù)庫(kù)中實(shí)現(xiàn)醫(yī)學(xué)信息的構(gòu)造化存貯方法時(shí),只要用“id、事物代號(hào)、事物特征、事物特征值、超長(zhǎng)特征值、單位、附件、時(shí)間”8個(gè)字段的表就可以存貯各種各樣的數(shù)據(jù),對(duì)“事物代號(hào)、事物特征、事物特征值”字段建立索引以便查詢(xún);當(dāng)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)轉(zhuǎn)換到“萬(wàn)能數(shù)據(jù)構(gòu)造表”中時(shí),醫(yī)學(xué)信息的構(gòu)造化存貯方法把關(guān)系數(shù)據(jù)庫(kù)表中的一條記錄當(dāng)作一個(gè)事物,并為該事物分配一個(gè)唯一的事物代號(hào),關(guān)系數(shù)據(jù)庫(kù)表的字段名轉(zhuǎn)換為醫(yī)學(xué)信息的構(gòu)造化存貯方法所用的表中的“事物特征”,相應(yīng)字段中的數(shù)據(jù)那么轉(zhuǎn)換為“事物特征值”,超過(guò)“事物特征值”字段長(zhǎng)度的數(shù)據(jù)那么存放在“超長(zhǎng)特征值”字段中,圖片、附件等信息量比較大的信息、不適合轉(zhuǎn)換為字符型數(shù)據(jù)的數(shù)據(jù)那么存放在“附件”字段中。
“萬(wàn)能數(shù)據(jù)構(gòu)造表”中各字段的含義:1.“id”為每個(gè)記錄的ID。
2.“事物代號(hào)”為各事物的代號(hào),每個(gè)事物擁有唯一的“事物代號(hào)”。關(guān)系數(shù)據(jù)庫(kù)中的一個(gè)完整的數(shù)據(jù)是記錄,“醫(yī)學(xué)信息的構(gòu)造化存貯方法”中一個(gè)完整的數(shù)據(jù)是“事物”,一個(gè)“事物”的信息由假設(shè)干條擁有相同“事物代號(hào)”的記錄組成。
3.“事物特征”的含義為事物的特征。
4.“事物特征值”的含義為事物的特征值。
5.“超長(zhǎng)特征值”的含義也是事物特征值,用來(lái)存放超過(guò)“事物特征值”字段的長(zhǎng)度的字符型數(shù)據(jù)。
6.“單位”字段代表事物特征值的單位(次、米、噸等)。
7.“附件”字段:用來(lái)存放圖象、附件等信息量比較大的、不適合轉(zhuǎn)換為字符型數(shù)據(jù)的數(shù)據(jù)。
8.“時(shí)間”字段:該字段為每一個(gè)事物的特征寫(xiě)入數(shù)據(jù)庫(kù)時(shí)的時(shí)間,一般可由系統(tǒng)自動(dòng)可
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 給朋友的慰問(wèn)信模板合集6篇
- 工程建筑實(shí)習(xí)報(bào)告模板集合7篇
- 2024年03月山東浦發(fā)銀行青島分行招考(0310)筆試歷年參考題庫(kù)附帶答案詳解
- 2025年中、大功率激光器項(xiàng)目申請(qǐng)報(bào)告模稿
- 2025年固態(tài)地振動(dòng)強(qiáng)度記錄儀項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告
- 2025年植物穩(wěn)態(tài)營(yíng)養(yǎng)肥料項(xiàng)目提案報(bào)告模板
- 2024-2025學(xué)年亞?wèn)|縣三上數(shù)學(xué)期末經(jīng)典試題含解析
- 學(xué)校國(guó)慶節(jié)活動(dòng)總結(jié)5篇2021
- 小學(xué)生書(shū)法教學(xué)工作計(jì)劃
- 辭職報(bào)告的模板(15篇)
- 公墓項(xiàng)目建議書(shū)
- 化工廠防火防爆設(shè)計(jì)
- 高壓氧艙技術(shù)要求
- 老鼠兔飼養(yǎng)方法 老鼠兔吃什么
- 施工現(xiàn)場(chǎng)消防安全操作規(guī)程
- A4標(biāo)簽打印模板
- (完整版)工程項(xiàng)目管理組織機(jī)構(gòu)
- 工程質(zhì)量檢測(cè)內(nèi)容包括哪些?
- 科創(chuàng)板知識(shí)測(cè)評(píng)20個(gè)題目的答案
- 資格審查表范本
- 加工工藝規(guī)范
評(píng)論
0/150
提交評(píng)論