11種重要的數(shù)據(jù)庫設(shè)計規(guī)則_第1頁
11種重要的數(shù)據(jù)庫設(shè)計規(guī)則_第2頁
11種重要的數(shù)據(jù)庫設(shè)計規(guī)則_第3頁
11種重要的數(shù)據(jù)庫設(shè)計規(guī)則_第4頁
11種重要的數(shù)據(jù)庫設(shè)計規(guī)則_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、十一種重要的數(shù)據(jù)庫設(shè)計規(guī)則2012年4月4日 作者:Shivprasad 2010年4月15日 譯者:lixh 譯者話:我在網(wǎng)上無意中看到這篇文章,是中文版的,出自CSDN,當(dāng)時我想收藏,但版主聲明了轉(zhuǎn)發(fā)需要他本人同意,所以我決定重新翻譯此英文原文。這篇文章寫的真不錯,可以好好的揣摩一下作者的深意,唯一讓我感覺到不舒服的地方是作者太過方言化了,以至于部分句子我家的專業(yè)翻譯也沒弄明白。由于本人能力有限,此文章只做參考,建立您閱讀原文。英文原文地址: HYPERLINK /UploadFile/shivprasadk/11-important-database-designing-rules/%2

2、3Introduction /UploadFile/shivprasadk/11-important-database-designing-rules/#Introduction-這篇文章將描述11種重要的數(shù)據(jù)庫設(shè)計規(guī)則。簡介在讀這篇文章之前,讓我確認(rèn)一下,我不是數(shù)據(jù)設(shè)計方面的大師,如下所示的十一點是我經(jīng)過學(xué)習(xí)項目所獲得到的經(jīng)驗。我個人認(rèn)為,在數(shù)據(jù)庫設(shè)計過程中對我來說幫助很大。歡迎任何批評。我寫這個完整的文章原因是,當(dāng)開發(fā)者座下來設(shè)計一個數(shù)據(jù)庫時,他們趨向于三種常規(guī)模式(“l(fā)ike a silver bullet.”沒翻譯成功,不知道是什么意思,應(yīng)該是根深蒂固的意思吧)。他們常常認(rèn)為常規(guī)化設(shè)計

3、是唯一的途徑。由于這種心態(tài),修改問題(原文“hit road blocks”)作為項目推進的方法。如果你是一個新的常規(guī)化設(shè)計,則點擊觀看“3種常規(guī)模式”,這里詳細(xì)介紹了所有三種常規(guī)模式。我們所說、所做的標(biāo)準(zhǔn)化規(guī)則,是非常重要的準(zhǔn)則,(“but taking them as a mark on stone is calling for troubles.”沒翻譯好)但是在使用它們存在著頑固的調(diào)用麻煩。接下來是我自己理解的11條規(guī)則,記得在前面提到,這11條規(guī)則用于數(shù)據(jù)庫設(shè)計。規(guī)則1:應(yīng)用的本質(zhì)(OLTP或OLAP)?當(dāng)你開始你的數(shù)據(jù)庫設(shè)計時,第一件事是分析你設(shè)計的應(yīng)用本質(zhì)是什么,是事務(wù)型還是分析

4、型,你會發(fā)現(xiàn)許多開發(fā)者默認(rèn)使用常規(guī)化的規(guī)則,而不考慮應(yīng)用的本質(zhì),最后考慮性能與定制問題。說到這里,是基于事務(wù)性和基于分析性兩種方法,讓我們來理解這兩種方法:Transactional(事務(wù)型):在這類應(yīng)用中,用戶最感興趣的是CRUD(Create、Retrieve、Update、Delete),即創(chuàng)建、查詢、更新和刪除記錄。這類數(shù)據(jù)庫的正式命名為OLTP(On-Line Transaction Processing在線事務(wù)處理)。Analytical(分析型):在這類應(yīng)用中,用戶最感興趣的是分析、報告、預(yù)測等。這類數(shù)據(jù)庫很少用到插入與更新操作。這里主要的目的是盡可能快速的獲取和分析數(shù)據(jù)。這類數(shù)

5、據(jù)庫正式命名為OLAP(On-Line Analytical Processing在線分析處理)。換句話說,如果你認(rèn)為插入、更新或刪除更重要,則使用常規(guī)化的表單設(shè)計或者建立一個簡單的非常規(guī)化的數(shù)據(jù)結(jié)構(gòu)。下面是一個簡單的圖表,左邊的表顯示了名稱(Name)和地址(Address),是應(yīng)用非規(guī)范化結(jié)構(gòu)創(chuàng)建出來的一個簡單地常規(guī)化表單。規(guī)則2:數(shù)據(jù)進行邏輯分塊,使你的生活更簡單這個規(guī)則實際上是從第一范式演變過來的第一種規(guī)則。違反這種規(guī)則的第一種模式是,如果你查詢使用了太多字符串解析功能,像子串、字符索引等,可能需要應(yīng)用此規(guī)則。例如,如下表所示,其中有學(xué)生的名字(Student Name),如果你想查詢

6、學(xué)生的名字包含“Koirala”而沒有“Harisingh”,你可以想像使用什么方法可以實現(xiàn)。所以更好的方法是打破這一字段,進行更多的邏輯分塊,所以我們能寫出最簡潔、高效的查詢方法。規(guī)則3:不要過多的使用規(guī)則2開發(fā)者們思維很單一,如果你告訴他這個方法,他們會一直這樣做下去,過度使用它,會導(dǎo)致不必要的后果。這也適用于剛剛談到的規(guī)則2。當(dāng)你考慮分解時,你會停頓一下,問自己是否需要這樣做,分解必須具有一定邏輯性。例如,你可以看到電話號碼字段(Phone Number),你將操作ISD(international subscriber dialing 國際電話加入者撥號通話)代碼,將電話號碼段分離(直

7、到滿足你的需求),因此,這將是明智的選擇,當(dāng)然,分離它可能會導(dǎo)致更多的并發(fā)癥。規(guī)則4:重復(fù)、無規(guī)則的數(shù)據(jù)將是你最大的敵人聚焦、重構(gòu)重復(fù)的數(shù)據(jù)。我個人擔(dān)心的不是關(guān)于重復(fù)數(shù)據(jù)它占用空間,而是它造成混亂。例如,在接下來的圖表中,你能看到“5th Standard”和“Fifth standard”含義相同?,F(xiàn)在,你可以說因為錄入了壞數(shù)據(jù)或者數(shù)據(jù)驗證錯誤是系統(tǒng)原因。現(xiàn)在如果你想獲得一份報表,它們可能顯示為不同的實體,從最終用戶角度來看,是非常困難的。其中一個解決辦法是移動數(shù)據(jù)到另外的主表中,使用外鍵關(guān)聯(lián)。你可以看到下圖中,我們是如何建立一個新的主表叫做“Standards”作為一個簡單的關(guān)聯(lián)外鍵。規(guī)則

8、5:注意分離器的數(shù)據(jù)分離第二條規(guī)則即第一范式所提到的重復(fù)分組。重復(fù)分組的例子之一如下圖表解釋。如你看到的“syllabus”字段,在這一字段中,有太多的數(shù)據(jù)冗余。這種字段被稱為“重復(fù)組”。如果我們要去處理這些數(shù)據(jù),查詢起來會很復(fù)雜,而且我也懷疑查詢的性能。這些列存在數(shù)據(jù)冗余,帶有分離的數(shù)據(jù)需要特別注意,一個更好的辦法是將一個字段移動不同的表單中,連接這些主鍵,從而更好的去管理?,F(xiàn)在讓我們應(yīng)用第一范式的第二條規(guī)則“避免重復(fù)分組”。如上圖所示,我創(chuàng)建的分離“syllabus”表與“subject”具有多對多的關(guān)系。這種方法在主表中“syllabus”字段避免了過多的重復(fù)和數(shù)據(jù)分離。規(guī)則6:注意數(shù)據(jù)

9、依賴注意主鍵字段的部分依賴。例如,在上表所示,我們注意創(chuàng)建的“roll number”和“standard”的主鍵?,F(xiàn)在觀察“syllabus”字段已刪除?!癝yllabus”字段是關(guān)聯(lián)到“standard”,而沒有直接與“student”產(chǎn)生關(guān)聯(lián)(即“roll number”)?!癝yllabus”是由“standard”關(guān)聯(lián)在一起,學(xué)生與學(xué)習(xí)的科目沒有直接的聯(lián)系。如果明天我們要更新“syllabus”字段,我們必須更新所有“student”字段,這是一件痛苦的事,而且也不符合邏輯。將這些字段移出,并與“standard”表建立關(guān)聯(lián)將更有意義。你應(yīng)該能觀察出如何移出“syllabus”字段,

10、并與“standard”表建立關(guān)聯(lián)。這些規(guī)則是什么,但第二范式提及到“所有鍵都須完全依賴主鍵,而不是部分”。規(guī)則7:重視派生列的選擇如果你使用OLTP應(yīng)用在你的工作中,正確的作法是獲得派生列的列標(biāo)識,直到獲得性能的提升。OLAP是做了很多的優(yōu)化,計算這些字段所必須的內(nèi)容,從而進一步提升性能。上圖所示,你可以看出,“average”字段是如何依賴“marks”字段與“subject”字段的,這也是冗余形式之一。這類字段由其它字段衍變而來,這樣做確實有必要。這個規(guī)則也稱為第三范式(屬性不依賴于其它非主屬性)。我個人而言,不會盲目地使用這個規(guī)則,而要看它的處境。它不是多余數(shù)據(jù),但也不是好的數(shù)據(jù)。如果

11、多余數(shù)據(jù)經(jīng)過計算,看情況去決定實施第三范式。規(guī)則8:如果注重性能,不要避開冗余數(shù)據(jù)不要一味的使用規(guī)則,你將永遠(yuǎn)去避免冗余。如果迫切的考慮到性能規(guī)范問題,正常你需要多表關(guān)聯(lián)和減少非規(guī)范化,從而提高性能。規(guī)則9:多維數(shù)據(jù)區(qū)分于復(fù)雜數(shù)據(jù)OLAP項目更多的是處理多維數(shù)據(jù),例如,如下圖所示,你想獲得每個國家、客戶和日期的銷量,簡單的說,你可以看一下銷售圖表,三條相交的維度數(shù)據(jù)。對于這種情況一維表有更好的設(shè)計方法,簡單地說,你可以創(chuàng)建一個簡單的中間銷售表,其中有銷售金額字段,它與所有的維度表通過外鍵關(guān)聯(lián)。規(guī)則10:名稱-值表的設(shè)計很多次,我所遇到的名稱-值表,名稱和值表存在一些鍵,這些鍵值與一些關(guān)鍵數(shù)據(jù)相連。例如在接下來的圖表中,你能看到我們的貨幣表(Currency Table)與國家表(Country Table),你觀察數(shù)據(jù)很相近的數(shù)據(jù),實際上只有鍵(Key)和值(Value)。這類表需要創(chuàng)建一個中間表,使用一個類型字段(Type)來區(qū)分?jǐn)?shù)據(jù),這樣才更有意義。規(guī)則11:無限制的自我參數(shù)等級數(shù)據(jù)PK和FK。很多時候,我遇到過無限制父子層次結(jié)構(gòu)的數(shù)據(jù)。例如,考慮一個多層次的營銷方案,一個銷售人員下面有多個銷售人員,在這種方案中,可以使用自定義主鍵和外鍵來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論