生物數(shù)學第三章_第1頁
生物數(shù)學第三章_第2頁
生物數(shù)學第三章_第3頁
生物數(shù)學第三章_第4頁
生物數(shù)學第三章_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章生物分類的數(shù)學模型本章開始將討論生物分類,按照生物分類學家的理解就是指表征分類和分支分類,advance\l6我們僅研究兩種分類概念下的數(shù)學理論與方法。這里的分類也是多元統(tǒng)計關于聚類分析的延續(xù),但是已遠遠超出統(tǒng)計數(shù)學的范圍。表征分類除經典的系統(tǒng)分類以外還包括圖論分類、信息分類、模糊分類;分支分類是以抽象代數(shù)為基礎,研究生物演化規(guī)律的分支學科。因此生物數(shù)學中的分類數(shù)學模型不能再視作多元統(tǒng)計中的聚類分析,而應稱為分類分析。本章專門討論分類分析中的表征分類數(shù)學模型。第一節(jié)分類的基本概念和原始數(shù)據(jù)的獲得何謂分類?有句俗話“物以類聚”,這句話的意思是說,許多事物依據(jù)其類別的特征,相似者歸為同一種類。從這個意思去理解,分類有兩個要素。第一個要素是被分類的對象,分類對象是由許多被分類的實體所組成,3個以上的實體構成一個基本分類對象。被分類的實體,就是被分類的基本單位,在數(shù)量分類學中稱為運算分類單位(operationaltaxonomicunit)簡寫作分類單位(OTU)。全部被分類的分類單位構成的集合稱為被分類群。分類的第二個要素是分類的依據(jù),分類依據(jù)取決于被類群中分類單位的性狀,所謂性狀(character)是一個分類單位區(qū)分于其他分類單位的性質、特征或屬性。一個分類單位對某個性狀所呈現(xiàn)的狀態(tài),稱為該性狀的性狀狀態(tài)(characterstate),簡稱狀態(tài)(state)。分類就是將被分類群中所有的分類單位,依據(jù)它們的性狀狀態(tài),遵從一定的原則作出劃分或聚合,得到一組新的分類單位集合。通過分類獲得的這個分類單位集合稱為分類群(taxon)。世界上一切事物都存在分類的問題。專門研究生物物種的分類,也就是生物分類學中的分類,有表征與分支兩個對立的概念。依據(jù)生物表現(xiàn)性狀相似性全面比較而建立的系統(tǒng)分類稱為表征分類(pheneticclassification);遵從生物演化的譜系關系而建立的系統(tǒng)分類稱為分支分類(cladisticclassification)。這兩個概念在生物分類學和數(shù)量分類學中都很重要,相應的也有兩種不同的數(shù)學方法,本章將要研究表征分類。分類單位隸屬于一個分類群產生分類單位與分類單位之間的聯(lián)系。如果A是被考慮的一個分類群,又有分類單位x∈A,且分類單位y∈A,則認為x與y之間建立起同屬于一個分類群的聯(lián)系,稱作分類單x與y共分類群,記作xφy分類學家在分析比較鑒定被分類對象時,經常要問哪些分類單位屬于同一分類群,advance\l6生物分類工作時時刻刻都在考慮共分類群問題。顯然共分類群這個聯(lián)系成為分類學理論上最基本的概念之一。分類單位共分類群關系φ具有以下性質:性質1自反性(reflexivity),即xφx;性質2對稱性(symmetry),若xφy,則yφx;性質3傳遞性(transitivity),若xφy且yφz,則xφz。共分類群,就分類單位的隸屬性關系來說,以上3條性質是十分必要的,3條性質正是數(shù)學中的所謂等價關系(equivalencerelation)。具有等價關系的集合,可以依據(jù)等價關系將集合分類,得等價集合類。這是集合論中的一個重要結論。數(shù)量分類學中的定量分類方法正是依靠數(shù)學中的這個結論去解決分類問題。等價關系下的等價集合類成為表征分類方法的理論根據(jù)。下面我們將開始討論在表征分類觀點下的數(shù)量分類方法。當被分類群一經確定,合適的性狀也被挑選出來,生物學工作者就要對調查、觀察、測量、實驗得到的數(shù)據(jù)進行整理,獲得有關分類單位和性狀的原始記錄。這些記錄收集了來自各方面的信息,是從事分類工作的第一手資料。原始記錄的形式尚不能直接進行數(shù)學運算。為了能夠利用數(shù)學工具來從事分類學的研究,必須將所有這些記錄改變成適合于數(shù)學運算的形式。在數(shù)量分類學中這項工作叫做性狀編碼。性狀編碼的一般方法隨性狀的各種類型分別處理,現(xiàn)敘述如下:1.數(shù)值性狀以整數(shù)或實數(shù)所表示的性狀稱為數(shù)值性狀(numericalcharacter)。例如生物形態(tài)的各種度量、長度、面積、體積、角度和重量等;生物組織器官各部分構成的數(shù)量;各種實驗數(shù)據(jù);各種儀器測量的數(shù)據(jù)以及基于上述性狀而獲得的導出性狀。這些都是數(shù)值性狀。數(shù)值性狀本身已經是數(shù)值,它是天然的最適合于進行數(shù)量分類的性狀,一般分類方法無須編碼處理,就可以轉入下一步進行數(shù)學運算。需要注意的是有些性狀雖然以數(shù)值表示,但實質上不屬于數(shù)值性狀。2.二元性狀表現(xiàn)為對立面二種狀態(tài)的性狀稱為二元性狀(binarycharacter)。例如動物是脊椎動物還是無脊椎動物,脊椎動物中是胎生還是卵生,冷血還是溫血;有花植物的花冠是合瓣還是離瓣,子房是分離心皮還是合生心皮,果實開裂與否;在微生物學中二元性狀尤其多,各種生理、生化、營養(yǎng)性狀幾乎都出現(xiàn)二元性狀;生物地理學的調查資料中,生物種類在指定區(qū)域內的有或無也是二元性狀。二元性狀的編碼很簡單,將兩個狀態(tài)分別以“0”和“1”表示,通??隙ǖ臓顟B(tài)為1,否定的性狀為0。3.有序多態(tài)性狀表現(xiàn)為三個狀態(tài)以上,能排列成一定次序,次序具有分類意義的性狀稱為有序多態(tài)性狀(orderedmultistatecharacter)。例如對器官某部分長度的描述是短、略長、長、極長;植物體表無毛、微具毛、具毛、多毛、密毛;植物地理學中某植物在某地區(qū)的分布調查是無、有、較多、極多。有序多態(tài)性狀的狀態(tài)個數(shù)一般都是有限的,由于是有序的,可以將其排列為一定的等級。編碼時可以取連續(xù)排列的非負整數(shù)0,1,2,3,…,n,它們分別表示n+1個有序多態(tài)性狀狀態(tài)。例如被毛的性狀可編碼如下:性狀狀態(tài): 無毛 微具毛 具毛 多毛 密毛編碼: 0 1 2 3 4性狀狀態(tài)在不同方向上各自排列為有序的多態(tài)性狀,不能按上面的編碼方法處理。例如關于被毛的性狀,如果毛有短毛、長毛,硬毛、柔毛,單一毛、二歧分支毛和多歧星狀毛。這種情形屬于無序多態(tài)性狀,可采取分解的方法編碼。4.無序多態(tài)性狀表現(xiàn)在三個狀態(tài)以上,不能排列成具有分類意義的一條序列的性狀稱為無序多態(tài)性狀(disorderedmultistatecharacter)。例如種子植物的花序有總狀、頭狀、傘形、傘房、穗狀……;花冠的類型有唇形、蝶形、鐘形、舌形……;昆蟲的口器有咀嚼式、針吸式、虹吸式、舐吸式……;生物分布的地理區(qū)域也是無序多態(tài)性狀。在微觀世界蛋白質的氨基酸組成和核酸中的核苷酸構成都是無序多態(tài)性狀。無序多態(tài)性狀的編碼比較復雜,有以下三種方法,敘述如下:4.1分解法分解法就是將原性狀分成多個新性狀,再進行編碼。有時候無序多態(tài)性狀包含了多種互相獨立的意義,實際上這種性狀不符合單位性狀的要求,分解成多個相應的單位性狀是應該的。例如植物被毛的種類,有短毛、長毛、硬毛、軟毛、單一毛、二歧分支毛、多歧星狀毛和腺毛等。這一無序多態(tài)性狀具有多方面的意義,即毛的長短、毛的硬軟、毛的分枝狀況和毛端是否形成腺狀小點。據(jù)此,該性狀可以分解為4個性狀,分別編碼如下:毛的長短性,二元性狀。短,0;長,1。毛的質地,二元性狀。軟,0;硬,1。毛的分枝程度,有序多態(tài)性狀。單一毛,0;二歧分枝毛,1;星狀毛,2。毛端是否具腺狀點,二元性狀。非腺毛,0;腺毛,1。4.2綜合評分法這種方法正好像競技比賽的記分一樣,容易為一般讀者所理解。為了盡可能避免主觀性,必須在編碼之前先確定評分的標準,規(guī)定合適的綜合計算方法,并且要求評分者深明性狀的分類學意義。具體方法隨性狀的要求而異,現(xiàn)舉例說明。例1豬品種的分類研究中,豬耳的形態(tài)學性狀在育種學和生態(tài)學方面具有重要意義。采取綜合評分法編碼,將該性狀納入豬品種的定量分類研究中。根據(jù)豬耳的形態(tài)學特征及其生物學意義,先確定耳的大小和下垂程度是評分的兩個主要依據(jù),再規(guī)定評分標準:耳大小:耳小,0;一般,1;耳大,2;特大,3;特大遮眼,4。耳下垂:耳直立,0;耳平伸,1;耳下垂,2。從這兩個方面評出分數(shù),再將兩分數(shù)相加得綜合評分編碼。譬如焦溪豬,耳特大遮眼、下垂,評分編碼值6=4+2。例2小麥抗銹性是小麥育種學重要特征,根據(jù)已有的記錄將抗銹性分為五個評分等級。發(fā)病特別嚴重、孢子堆大而普遍,0;有較大孢子堆、發(fā)病較普遍,1;有較小孢子堆、發(fā)病較輕,2;有抗性斑點,3;從未見發(fā)病,4。小麥的抗銹性又有抗條銹、抗桿銹和抗葉銹三種不同的區(qū)別。小麥的育種工作抗條銹品種容易獲得,抗稈銹品種較少不易獲得,抗葉銹品種很難得到。因此,對三種不同的抗銹性分別給予不同的權重系數(shù),0.091(抗條銹)、0.435(抗稈銹)、0.474(抗葉銹)。譬如小麥“農大16”品種,對條、稈、葉的抗銹性等級評分分別是4、1、2。該小麥總的綜合評分編碼為(0.091×4+0.435+0.474×2)=1.7474.3演化分析法生物分類的某些無序多態(tài)性狀,性狀自身呈現(xiàn)出樹狀的演化過程,可畫出其演化關系——樹(tree)。樹是圖的一種,這里涉及圖論的一些基本概念。考慮到演化的特點,有向樹圖中連接兩頂點之間的弧是有方向的,于是圖中存在一個頂點,可以它為起點連通到所有其他狀態(tài)頂點,稱為演化起源,而且這樣頂點只有一個。除代表演化起源的頂點外,一個頂點,沒有一條弧以它為起點,稱為演化終點。每一個演化終點代表一個演化方向,把這個演化方向定為新的性狀。新性狀的編碼規(guī)定如下,演化起源的頂點編碼為0。連接起源頂點到該性狀的演化終點的通路稱為主通路。從起源頂點開始沿主通路,每經過一條邊增加一個單位編碼值,于是主通路上所有頂點的狀態(tài)都賦給編碼值,演化終點狀態(tài)達到該性狀編碼的最大值。非主通路上頂點狀態(tài)的編碼值這樣規(guī)定:取出從起源頂點到該頂點的通路,該通路經過主通路的邊數(shù)是其狀態(tài)編碼值。這樣一來,所有的狀態(tài)都賦給了新性狀的編碼值。對每一個演化終點照前述方法對所有狀態(tài)賦給一個新性狀編碼值,編碼工作完成。舉一個例子。如果在某植物分類研究中,采用花序性狀,出現(xiàn)的性狀狀態(tài)有復穗狀花序、穗狀花序、總狀花序、圓錐花序和傘房花序,無疑這個性狀屬于無序多態(tài)。花序的演化實際過程比較復雜,這里假如按圖3-1的方式展開,圖中單生葉腋花序是假設狀態(tài),也是樹圖的演化起源。該樹圖有3個演化終點狀態(tài),分別是復穗狀花序、傘房花序和圓錐花序。3個演化終點狀態(tài)確定3個新的性狀,分別記作性狀I、II和III,新性狀的編碼列于圖3-1的表中。性狀狀態(tài)新性狀編碼IIIIII總狀花序011穗狀花序100復穗狀花序200圓錐花序012傘房花序021圖3-1部分花序的演化分析編碼起源狀態(tài)是單生葉腋花序,所有性狀的編碼均為0。性狀I的主通路單生葉腋花序→穗狀花序→復穗狀花序;性狀II的主通路單生葉腋花序→總狀花序→傘房花序;性狀III的主通路單生葉腋花序→總狀花序→圓錐花序。按照前述編碼規(guī)定,性狀I中穗狀花序和復穗狀花序的編碼分別為1和2;總狀花序、圓錐花序和傘房花序,因為從起源狀態(tài)到它們的路徑不經過主通路,故編碼值均為0。性狀II中總狀花序和傘房花序的編碼分別為1和2;從起源狀態(tài)到圓錐花序的通路有一條邊通過主通路,故圓錐花序在性狀II的編碼值為1;從起源狀態(tài)到穗狀花序和復穗狀花序的通路不經過主通路,故穗狀花序和復穗狀花序在性狀II的編碼為0。同理可作性狀III的編碼,不再贅述。其實,演化分析的編碼方法也是性狀分解法,它的分解是依據(jù)性狀的演化關系。因此,演化分析方法能更好地反映生物演化譜系,對生物分類系統(tǒng)學的研究具有重要價值,在分支分類部分還要詳細討論。無序多態(tài)性狀的編碼方法介紹到此。經過編碼以后的原始數(shù)據(jù),如果有t個分類單位,n個性狀,數(shù)據(jù)可列成表格記錄如下:性狀12…n分類單位1…(3.1)2………t…其中分類單位和性狀都以整數(shù)編號表示。第i個分類單位,第j個性狀狀態(tài)的數(shù)據(jù)是yij(i=1,2,…,t;j=1,2,…,n)。第二節(jié)數(shù)據(jù)變換和數(shù)據(jù)標準化前一節(jié)討論了性狀的編碼,經過編碼所獲得的原始數(shù)據(jù)如果都是二元數(shù)據(jù),沒有特殊需要可以直接進行相似性系數(shù)運算;如果數(shù)據(jù)是一般的實數(shù),就必須先進行數(shù)據(jù)的變換和標準化,然后才能進行相似系數(shù)運算。生物世界種類萬千,變化多端,對生命現(xiàn)象的描述和記錄十分復雜,數(shù)據(jù)的來源不同,量綱不同,某些來自專門技術和特殊實驗的數(shù)據(jù)度量標準更復雜。數(shù)據(jù)的復雜性最后反映在數(shù)值的大小和變化的幅度因不同的性狀而各不相同。性狀之間的這種差異僅僅是由于性狀各自的特點和度量標準不同而產生的。這種差異影響分類的結果,有時候甚至大到把具有分類意義的變化完全掩蓋下去,使得分類運算看不到有意義的結果。因此在進行大規(guī)模運算之前,需要先進行變換或標準化處理,以便減少和消除這種差異帶來的影響。對原始性狀數(shù)據(jù)進行變換的方法就是將需要變換的數(shù)據(jù)代入一個事先擬好的函數(shù)中,進行計算,得出一組新的數(shù)值代替原來的性狀數(shù)據(jù)。如果某一性狀有t個分類單位,數(shù)據(jù)x1,x2,…,xt進行變換的一般形式是:……這里(i=1,2,…,t)表示變換后的數(shù)據(jù),fi(x1,x2,…,xt)(i=1,2,…,t)是原始性狀數(shù)據(jù)的函數(shù),稱為該變換的變換函數(shù)。最簡單的變換是數(shù)據(jù)自身減去某一常數(shù): (3.2)這個變換的效果是把度量的基準點做一次平移,有時把常數(shù)c改換成該性狀數(shù)據(jù)的平均值,這樣的變換稱為中心化(centralization)。另一個簡單的變換是數(shù)據(jù)自身乘以非零常數(shù)c, (3.3)這個變換可以使性狀數(shù)據(jù)均勻地放大(c>1)或者縮小(c<1)。還有一個基本的變換是m次冪乘方,變換函數(shù)是 (3.4)其中m是非零整數(shù)。如果不是整數(shù)也可以表示開方運算。前面提到的三種變換是性狀數(shù)據(jù)自身最基本的代數(shù)變換,部分復雜的變換都可以通過有限次這種變換的組合來實現(xiàn)。除基本的代數(shù)變換以外,還有一些特殊函數(shù)的變換。數(shù)學中任何一個函數(shù)都可以當作變換函數(shù),常見的變換函數(shù)有三角函數(shù)與反三角函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等,例如:前面所討論的變換都是個別性狀對其自身的變換。為了消除性狀之間數(shù)值的大小和變化幅度的差異,常常對所有的性狀采取統(tǒng)一的變換,這種變換稱為標準化變換(standardizedtransformation)。對原始數(shù)據(jù)進行這種變換的運算過程稱為原始數(shù)據(jù)的標準化(standardizationoforiginaldata)。在主成分分析和許多相似性系數(shù)的運算中,原始數(shù)據(jù)的標準化已成為必不可少的步驟,我們在這一節(jié)里詳細討論。經過性狀編碼以后獲得的原始數(shù)據(jù)可以看作一個t行n列的矩陣,稱為原始數(shù)值矩陣(originaldatamatrix): (3.5)矩陣中的行向量[yi1yi2…yin](i=1,2,…,t)稱為第i個分類單位向量(vectorofoperationaltaxonomicunit);列向量[y1jy2j…ytj](j=1,2,…,n)稱為第j個性狀向量(vectorofcharater).最簡單的標準化變換稱為極差標準化變換。如果經標準化變換以后的數(shù)據(jù)記作xij,極差標準化變換的數(shù)學公式如下: (3.6)其中表示第j個性狀數(shù)據(jù)y1j,y2j,…,ytj的最大值;為相應的最小值。公式中的分母代表第j性狀極大狀態(tài)值和極小狀態(tài)值之間的差異。極差標準化的名稱由此而得。不難看出,經極差標準化變換之后的數(shù)據(jù)xij介于0到1之間(0≤xij≤1),性狀之間數(shù)據(jù)大小和變化幅度不具有分類意義的差異已經消除。極差標準化變換雖然計算簡單,但這種變換設計十分粗糙,特別當個別數(shù)據(jù)遠離其他數(shù)據(jù)時,較大的極差使變換后的數(shù)據(jù)取值不甚合理。下面介紹一種基于統(tǒng)計運算的標準化變換,這種變換比較合理,已成為數(shù)量分類運算常規(guī)的運算過程。以至以后再述及標準化時,除非特別說明,一般都指這種基于統(tǒng)計學的標準化方法。其變換公式表示如下: (3.7)其中 (3.8) (3.9)和sj分別是第j性狀數(shù)據(jù)的平均值(mean)和標準差(standarddeviation)。怎樣理解上述標準化變換的意義呢?如果我們把每個性狀的數(shù)據(jù)都看作是平均值為,標準差為sj的正態(tài)分布隨機變量。所謂標準正態(tài)分布就是平均值為0,標準差為1的正態(tài)分布。不難驗證變換以后每一個性狀的數(shù)據(jù)組x1j,x2j,…,xtj其平均值為0,標準差為1。變換之前,每一個性狀各有自己的平均值和標準差;變換之后,所有的性狀都服從標準正態(tài)分布,因而性狀之間因數(shù)值大小和變化幅度不同而產生的不具有分類意義的差異就不復存在了。也可以從另一個角度理解標準化的意義。變換以后的第j個性狀向量以大寫字母Xj表示,有趣的是,變換后性狀向量的模都相同,并且有等式 (3.10)其中Xj=[x1j,x2j,…,xtj]向量的??梢岳斫鉃橄蛄康拈L度。經過標準化變換,性狀向量長度都一致,說明因性狀之間大小和變化幅度的不同而產生的不具有分類意義的差異已經消除。原始數(shù)值矩陣(3.5)經過標準化變換之后獲得已標準化原始數(shù)值矩陣 (3.11)該矩陣仍然與原始數(shù)值矩陣一樣,t行代表分類單位,n列代表性狀。矩陣在標準化過程中排除了不具有分類意義的數(shù)量關系,因而能正確地反映分類單位之間的相親性。以后的分類運算分析將在這個矩陣上進行。本書為了說明數(shù)量分類每一步的具體運算方法,選取植物桔???Campanulaceae)中的部分種(6個種,8個形態(tài)學性狀)和五加科人參屬(Panax)部分種(7個種,13個性狀)作為具體例子。此兩例經過性狀編碼獲得的原始數(shù)據(jù)將在以后各章中多次采用。取用時,對數(shù)據(jù)的來源每次不再作具體介紹。為了使舉例簡單易算,盡量把數(shù)據(jù)的規(guī)??s小,當然,在實際工作中,分類單位和性狀的個數(shù)都遠比此例多,不會如此簡單。舉例的桔???個種,學名和種的形態(tài)描述如下:黨參[Codonopsispilosula(French.)Nannf.]多年生草本。莖纏繞附它物而蔓生,莖長約3~10米。葉對生,有長柄,卵圓形,葉全緣或具波狀邊緣?;▎紊敾蛏~腋;萼片5,寬披針形;花冠鐘狀,淺綠色,5淺裂;雄蕊5;柱頭3~5裂;子房下位,3~5室。蒴果圓錐形,成熟時頂部萼片間室背開裂。種子長橢圓形、褐色、無翼。桔梗[Platycodongrandiflorus(Jacq.)A.DC.]多年生直立草本,株高60厘米。葉互生,有時對生或輪生;葉無柄或短柄;葉緣有銳鋸齒?;▎紊驍?shù)朵生枝頂;萼5裂;花冠闊鐘狀,藍紫色,5裂,花徑4~5厘米;雄蕊5;子房下位,5室,柱頭5裂。蒴果倒卵形,成熟時頂部瓣裂;種子扁平、無翼。輪葉沙參[Adenophorapereskiifolia(Fisch.exRoem.etSchult.)G.Don.]多年生直立草本,株高50厘米。莖生葉3~4葉輪生;葉卵圓狀披針形;葉緣有銳粗鋸齒。圓錐花序或總狀花序;萼片5、披針形;花冠鐘形、藍紫色,花盤短筒狀;花柱長,伸出花冠外,柱頭膨大、3瓣裂;子房下位、3室,果沿側壁開裂;種子卵圓形、無翼。薺苨[Adenophoraremotiflora(Sieb.etZucc.)Miq.]多年生直立草本,株高70厘米。上部莖生葉互生、有柄、卵形、長橢圓狀卵形至廣披針形;葉緣有銳重鋸齒。總狀花序或疏圓錐花序;花冠寬鐘形、白色或淡青色;花柱伸出花冠外;柱頭3淺裂;子房下位,3室;花盤短筒狀。蒴果側壁開裂;種子卵形、無翼。羊乳[Codonopsislanceolata(Sieb.etZucc.)Trautv.]多年生草本,莖纏繞,長2~3米。葉有短柄、對生,葉狹卵形,葉全緣,或微具波狀疏齒?;▎紊换ü阽姞?、5淺裂,淡綠色,內面具有紫褐色斑;雄蕊5,柱頭3~5;子房3~5。果短圓錐形,頂部萼片間室背開裂;種子淡褐色、卵圓形、扁而具翼。石沙參(AdenophorapolyanthaNakai)多年生直立草本,高65厘米左右。葉互生、近無柄,葉橢圓狀披針形,葉緣具粗鋸齒。圓錐花序或總狀花序;萼片線狀披針形;花冠鐘形,邊緣裂片外翻卷,花藍紫色;花柱略伸出花冠外;子房3室。蒴果側壁開裂;種子無翼。選取8個性狀,性狀的編碼方法如下:(1)莖是否纏繞,二元性狀。莖纏繞,1;直立,0。(2)株高,數(shù)值性狀。取株高或莖的長度(米)(3)葉的著生方式,有序多態(tài)性狀。葉互生,0;對生,1;輪生,2。(4)葉緣,有序多態(tài)性狀。葉全緣或波狀疏齒,0;鋸齒,1;重鋸齒,2。(5)花序,有序多態(tài)性狀。單生花序,或整個生枝頂,0;總狀花序或疏圓錐花序,1;圓錐花序或總狀花序,2。(6)子房室數(shù),數(shù)值性狀。取子房室數(shù)。(7)果開裂方式,有序多態(tài)性狀。果側壁開裂,0;果頂部5瓣裂,1;果頂部萼片間室背開裂,2。(8)種子是否具翼,二元性狀。果不具翼,0;具翼,1。對6個種的8個性狀,按照上述原則進行編碼,編碼結果列于表3-1中。標準化數(shù)據(jù)在表3-2中。表3-1桔梗科試驗數(shù)據(jù)性狀分類單位莖纏繞否1株高2葉序3葉緣4花序5子房室數(shù)6果裂方式7種具翼否81黨參15.51004202桔梗00.6010510續(xù)表3-1性狀分類單位莖纏繞否1株高2葉序3葉緣4花序5子房室數(shù)6果裂方式7種具翼否83輪葉沙參00.52123004薺苨00.70213005羊乳12.51004216石沙參00.65012300表3-2桔??圃囼灁?shù)據(jù)的標準化性狀分類單位莖纏繞否株高葉序葉緣花序子房室數(shù)果裂方式種具翼否黨參1.29101.88760.4082-1.1070-0.84760.40821.1866-0.4082桔梗-0.6455-0.5734-0.81650.2214-0.84761.63300.1695-0.4082輪葉沙參-0.6455-0.62361.63300.22141.1866-0.8165-0.8476-0.4082薺苨-0.6455-0.5232-0.81651.54980.1695-0.8165-0.8476-0.4082羊乳1.29100.38090.4082-1.1070-0.84760.40821.18662.0412石沙參-0.6455-0.5483-0.81650.22141.1866-0.8165-0.8476-0.4082平均值0.33331.74170.66670.83330.83333.66670.83330.1667標準差0.51641.99110.81650.75280.98320.81650.98320.4082人參屬選取部分種和變種(7個OTU13個性狀)的數(shù)據(jù),也作為本書演算的實例。分類單位的描述如下:人參(PanaxginsengC.A.Meyer)多年生草本,株高50~60厘米。主根圓柱形或紡錘形,肉質;根狀莖較短,節(jié)距4毫米左右。掌狀復葉,小葉3~5;中央小葉長10厘米左右,橢圓形至長橢圓形,長8~12厘米,寬3~5厘米;葉緣鋸齒,10齒寬18毫米左右。傘形花序頂生;花??;萼5齒;花瓣5;雄蕊5;花柱2,分離。果成熟時紅色;種子扁圓形,寬4~5毫米。根部化學成分人參醇含量高。分布海拔1000米左右。西洋參(PanaxquinquefoliusLinn.)多年生草本,株高30厘米左右。主根圓柱形或紡錘形,肉質;根狀莖短,節(jié)距3~4毫米。掌狀復葉,小葉3~5;中央小葉長7~10厘米,寬5厘米左右,長倒卵形;葉緣鋸齒10齒寬20毫米左右。傘形花序頂生;花萼5齒;花瓣5;花柱2,分離。果成熟時紅色。種子扁球形,寬5毫米左右。植物化學成分人參醇含量高。分布海拔1000米左右。三七(Panaxnotoginseng(Burk.)F.H.Chen)多年生草本,株高30~40厘米,主根圓錐形、肉質。根狀莖短,節(jié)距9毫米左右。掌狀復葉,小葉5~7;中央小葉長6~10厘米,寬3厘米左右,倒卵狀橢圓形;葉緣鋸齒較寬,10齒寬23毫米左右。傘形花序頂生,花80~100朵;花柱2,合生。果成熟紅色?;瘜W成分人參醇含量高。分布海拔2000米左右。竹節(jié)參(PanaxjaponicusC.A.Meyervar.japonicus)多年生草本,株高50厘米左右;肉質主根較小;根狀莖竹節(jié)狀,節(jié)距5~8毫米,差異較??;掌狀復葉,小葉常5枚,中央小葉闊橢圓形,長8~9厘米,寬3~5厘米;葉緣細鋸齒,10齒寬20毫米左右;傘形花序;花柱2或3,離生;果成熟時紅色具黑色斑點;種子卵球形,寬3毫米左右;植物化學成分人參醇含量低;分布海拔1000~1500米。羽葉三七[PanaxjaponicusC.A.Meyervar.bipinnatifidus(Seem).C.Y.Wu

etK.M.Feng]多年生草本,株高35~55厘米。主根不呈明顯肉質;根狀莖較長,節(jié)距3~5厘米;差異較大。掌狀復葉,小葉5~7;中央小葉長5~9厘米,寬2~4厘米,二回羽狀深裂,長橢圓形;葉緣鋸齒細,10齒寬10~20毫米。傘形花序頂生;花小;子房二室;花柱2,離生。果成熟紅色具黑色點;種子較小,寬3毫米左右?;瘜W成分中人參醇含量較少。分布海拔較高,2000~3000米。狹葉竹節(jié)參[PanaxjaponicusC.A.Meyervar.angustifolius(Burk.)ChengetChu]多年生草本,株高60~100厘米。肉質主根不明顯;根狀莖竹節(jié)狀,節(jié)距0.5~1.0厘米。掌狀復葉,小葉5~7;小葉狹長,長可達10~15厘米,寬1~3厘米,披針形或線狀披針形;葉緣鋸齒細密,10齒寬10~20毫米。傘形花序;花柱2~5,離生。果成熟時紅色具黑色點。種子較小,卵球形,寬2.5毫米左右。植物化學成分人參醇含量低。分布海拔1500~2000米左右。珠子參[PanaxjaponicusC.A.Meyervar.marjor(Burk.)C.Y.WuetK.M.Feng]多年生草本,株高50~60厘米。肉質主根不明顯;根狀莖串球狀,或前端有短竹鞭狀部分,節(jié)距長10~30毫米,差異較大。掌狀復葉,小葉5,小葉較小,中央小葉長5~8厘米,寬2~3厘米,倒披針形,倒卵狀橢圓形;葉緣鋸齒細密,10齒寬10~15毫米;傘形花序長;花柱2,離生;果成熟時紅色具黑色斑點;種子卵球形,小,寬2~3毫米;植物化學成分人參醇含量低;分布于海拔較高的林下,2500~3000米。選取13個性狀,性狀編碼如下:(1)根狀莖節(jié)距,數(shù)值性狀。取根狀莖兩相鄰節(jié)間的長度(毫米)。(2)根狀莖節(jié)距標準差,數(shù)值性狀。根狀莖節(jié)距多次度量數(shù)據(jù),取數(shù)據(jù)的標準差。(3)具有圓錐狀肉質根,有序多態(tài)性狀。肉質根很小或不明顯,0;肉質根明顯紡錘形或圓柱形,1;肉質根明顯,圓錐形,2。(4)株高,數(shù)值性狀。地上部分主莖長度(厘米)。(5)中央小葉長,數(shù)值性狀。中央小葉長(厘米)。(6)中央小葉長:寬,數(shù)值性狀。中央小葉長與寬的比值。(7)葉緣10齒寬,數(shù)值性狀。中央小葉葉中部10個鋸齒的寬(毫米)。(8)柱頭數(shù),數(shù)值性狀。花柱數(shù)量多個觀測數(shù)的平均值。(9)花柱合生,二元性狀。離生,0;合生,1。(10)成熟果具黑點,二元性狀。不具黑點,0;具黑色斑點,1。(11)種子寬,數(shù)值性狀。種子沿果實對稱軸垂直方向的寬度(毫米)。(12)分布海拔、數(shù)值性狀。分布地區(qū)海拔高度記錄的平均值(米)。(13)人參醇含量,有序多態(tài)性狀。植物化學成分水解后人參二醇與人參三醇數(shù)量的多少,無,0;+,1;++,2;+++,3;++++,4。上述7個分類單位,13個性狀,將觀察記錄的數(shù)據(jù)整理后列于表3-3。表3-3人參屬植物分類數(shù)據(jù)性狀分類單位根狀莖節(jié)距節(jié)距標準差圓錐肉質根株高中央小葉長小葉長比寬葉緣10齒寬柱頭數(shù)花柱合生熟果具黑點種子寬分布海拔人參醇含量1人參3.971.861571.30102.801.9917.692.00004.56100042西洋參3.231.441301.8086.831.6120.432.00004.79110043三七8.883.352314.5077.632.5523.122.00105.80120044竹節(jié)參6.772.580497.1786.762.3020.002.29013.10133925羽葉三七39.7130.830442.8051.002.6613.931.88012.87263626狹葉竹節(jié)參7.352.900695.00109.634.1714.783.63012.63182827珠子參23.7917.890543.9475.882.6813.502.06012.6727062上述人參屬的數(shù)據(jù)不大,作為演算的實際例子比較合適。它與桔???個種的實際例子所不同之處,在于人參屬類群較小,選擇的7個種已經把人參屬絕大多數(shù)種類包括在內,取用的13個性狀,把反映該屬主要形態(tài)學的依據(jù)也納入。因此對該數(shù)據(jù)的演算具有較大的真實性。第三節(jié)相似性概念的數(shù)量化親緣關系(geneticrelationship)是生物學中一個十分重要的概念,生物數(shù)學中的生物分類須要引進比親緣關系更廣泛的概念,即相似性的概念。在闡述分類的基本概念時,已經指出分類工作的目標是在被分類群集合上建立起一種分類關系,即滿足等價性三個條件的一種關系。生物分類希望建立的分類關系能反映分類單位之間的親緣關系。以分析事物為目的的分類,要求所建立的分類關系能體現(xiàn)事物之間的本質聯(lián)系。在表征生物分類觀點下,兩者的要求可以統(tǒng)一于相似性的概念之中。如果從生物親緣關系考慮,關系接近的生物個體,它們的性狀表現(xiàn)傾向于比較相同,反之,性狀表現(xiàn)較大的差異。在分析事物時,一個呈現(xiàn)多種特性的事物,如果事物之間表現(xiàn)的差異較小,說明兩個事物間的聯(lián)系密切,否則聯(lián)系疏遠。因而我們可以建立一般的相似性概念,即表現(xiàn)性狀差異所決定的,分類單位之間的相似性關系,稱為相似性(similarity)。兩個分類單位,性狀表現(xiàn)比較一致,相似性就大;反之相似性就小。相似性的概念比親緣關系具有更廣泛更抽象的意義,可以用于比較二個生物個體,也能用于比較不同的生物類群,在生物學中有相似性的概念,非生物學中也能應用這個概念。相似性程度用數(shù)值來表示,該數(shù)值稱為相似性系數(shù)(similaritycoefficient)。相似性系數(shù)的出現(xiàn)是生物分類朝定量方向發(fā)展的重要標志。對它的計算,至今一直是分類運算過程中一個十分重要的步驟,相似性系數(shù)有以下幾個主要類型,即距離系數(shù)、相關系數(shù)、聯(lián)合系數(shù)、信息系數(shù)和模糊系數(shù),前三個系數(shù)將在本章中論述,其他系數(shù)將連同其相應的分類方法,另辟專門章節(jié)進行討論。按照數(shù)值的大小與其反映的相似性程度是否一致,可以將相似性系數(shù)分為兩大類,即相異系數(shù)和相親系數(shù):相異系數(shù)(dissimilaritycoefficient)系數(shù)值愈小,表示的相似性程度愈高;反之,值愈大,愈不相似。距離系數(shù)是最常見的相異系數(shù)。相親系數(shù)(similaritycoefficient)系數(shù)值愈大,表示相似性程度愈高;反之,值愈小,愈不相似。這里,相親系數(shù)與相似性系數(shù)英文原詞相同,出現(xiàn)兩個概念名稱上的混亂。為了使中譯名不再混淆,采用了“相親系數(shù)”這個名詞,以此與相似性系數(shù)區(qū)別。相關系數(shù)是最常用的相親系數(shù)。3.1距離系數(shù)在數(shù)量分類學中,距離系數(shù)有較早的歷史,早在1934年Anderson就已經用距離系數(shù)做樺木科的定量分類研究?,F(xiàn)在的許多研究說明,距離系數(shù)對于分類運算有較好的穩(wěn)定性,在距離系數(shù)基礎之上建立起來的分類運算,方法很多,比較完整,另外距離系數(shù)也比較直觀,所以直到今天還被定量分析普遍采用,是相似性系數(shù)中比較重要的一種。讓我們從最簡單的情形開始討論,如果在三個性狀之下討論二個分類單位之間的關系,性狀狀態(tài)數(shù)據(jù)表示如下:性狀123分類單位Ax1x2x3分類單位By1y2y3其中x1,x2,x3,y1,y2和y3分別是兩個分類單位性狀狀態(tài)的數(shù)值。圖3-2距離系數(shù)的空間表示如果以三個性狀當作坐標軸,狀態(tài)數(shù)值分別為相應的坐標,可以將兩個分類單位分別以三維歐氏空間中的兩個點A,B來表示(見圖3-2)。怎樣用數(shù)值來描繪它們之間的相似性關系呢?一個最簡單,也是最直觀的方法就是連A與B二點間的直線,量出它們之間的距離dAB,以值dAB表示OTUA與OTUB之間的相似性,值dAB小,A和B兩點相近,說明兩個分類單位有較大的相似性。相反,若dAB值大,A和B兩點相距較遠,說明兩個OTU的相似性疏遠。用幾何學的距離當作相似性系數(shù),來描述相似性關系是很合適的。距離dAB的值可以通過三個性狀分量差的平方和進行計算:將前面的結果推廣到n個性狀,得到n維坐標下的距離系數(shù)(distancecoefficient)。 (3.12)這個系數(shù)也被稱為歐氏距離系數(shù)(Euclideandistancecoefficient)。如此確立的距離系數(shù)具有以下三個性質,這三個性質具有普遍意義,也稱為距離系數(shù)的基本性質:(1)dAB≥0,當且僅當A=B時,等式成立。(2)dAB=dBA。(3)dAB≤dAC+dCB,這里C是A和B之外的另一個任意的分類單位。這三條基本性質都不難理解。最后一條性質是幾何學中的三角形不等式,有時候被改換成其他的形式,如:()dAB≤max{dAC,dCB}這條性質比原來的三角不等式要求更強,因為max{dAC,dBC}≤dAC+dBC距離系數(shù)很多,不管如何定義,通常都應當滿足這三條基本性質。它的前兩條性質保證了共分類群等價條件的自反性和對稱性成立。但是三角不等式不能保證傳遞性的成立。而性質()卻能做到這一點。這是因為如果把距離系數(shù)作為共分類群關系的判別系數(shù),亦即對于任意do>0如果有dAB≤doOTUAφOTUB由此我們可以從性質()導出等價性的傳遞條件成立。但是絕大多數(shù)的距離系數(shù)不能滿足如此苛刻的要求。這是距離系數(shù)作為相似性系數(shù)的重大缺陷。如果我們需要比較分類單位i和j而建立距離系數(shù),從已標準化原始數(shù)值矩陣(3.11)取出分類單位向量常見的距離系數(shù)計算公式摘引如下:平均歐氏距離系數(shù)(meanEuclideandistancecoefficient): (3.13)平均絕對距離系數(shù)(meanabsolutedistancecoefficient): (3.14)Minkowski距離系數(shù): (3.15)其中常數(shù)r>0。這個系數(shù)常常被化學分類學使用,借以比較兩個薄層層析的差異。因為當r充分小時Minkowski系數(shù)對較小的差異十分敏感,故適用于差異十分微小的OTU之間建立相似性比較。前面兩個距離系數(shù)(3.13)和(3.14)可以歸于Minkowski距離系數(shù)的特殊情況。當r=1時即平均絕對距離系數(shù)(3.14),當r=2時,即平均歐氏距離系數(shù)(3.13),當r→∞時,可以引出Chebyshev距離系數(shù): (3.16)歐氏距離系數(shù)的又一種擴展形式是:Mahalanobis距離系數(shù) (3.17)其中mkl(k,l=1,2,…,n)是參數(shù)。這個表達式寫成向量與矩陣的乘積形式比較方便,若向量該向量的轉置(Xi-Xj)T=[xi1-xj1xi2-xj2…xin-xjn]公式(3.17)可改寫成 (3.18)其中常數(shù)矩陣M=[mkl]n×n。當矩陣M是單位矩陣時,即M=E在此E表示單位矩陣,這時,Mahalanobis距離系數(shù)又回到歐氏距離系數(shù)(3.12)的平方。雖然Mahalanobis系數(shù)比歐氏距離系數(shù)更完全,但是該公式要確定n2個參數(shù),使用很不方便,下面再介紹幾個其他形式的距離系數(shù)。Canberra距離系數(shù): (3.19)在此要求xij≥0(對一切可能取到的值)。不然的話,應將公式稍加改變: (3.20)與Canberra系數(shù)相類似的另一個系數(shù)如下:分離系數(shù) (3.21)最后,如果分類單位取樣不止一個,相似性距離系數(shù)可按下面系數(shù)(coefficientofraciallikeness)計算。距離系數(shù): (3.22)其中和分別表示性狀k對于第i個分類單位和第j個分類單位取樣的平均值;sik和sjk是其相應的標準差;mi和mj分別表示分類單位i和分類單位j的取樣個數(shù)。最后要說明兩點,其一是公式(3.12)~(3.18)要求數(shù)據(jù)已進行標準化處理;公式(3.19)~(3.21)可直接就原始數(shù)據(jù)進行計算。其二是公式(3.12)、(3.18)、(3.19)和(3.20)的系數(shù)與性狀的多少有關。為了排除這個影響也可以取相應的平均系數(shù),這時只需緊接在求和符號之前添加一個分數(shù)“”。3.2相關系數(shù)與角余弦系數(shù)前一節(jié)的距離系數(shù)屬于相異系數(shù)。在本節(jié)介紹兩種相親系數(shù),即相關系數(shù)和角余弦系數(shù)。這兩種系數(shù)都來自統(tǒng)計數(shù)學,學過數(shù)理統(tǒng)計的讀者不會感到陌生。特別是相關系數(shù),在統(tǒng)計數(shù)學中這是一個重要的統(tǒng)計量,被普遍使用于表示兩組數(shù)據(jù)的相關性。Sokal和Michener(1958)將相關系數(shù)引進到數(shù)量分類學,在數(shù)量分類學中,該系數(shù)繼續(xù)扮演一個頗為重要的角色。至于角余弦系數(shù)往往被相關系數(shù)代替,末能普遍采用。它計算簡單,其實也值得推薦使用。如果數(shù)據(jù)來自已標準化的原始數(shù)據(jù)(3.11),兩個分類單位i與j之間的相關系數(shù)(correlationcoefficient)定義如下: (3.23)其中。角余弦系數(shù)(coefficientofcosineofincludedangle)定義于下: (3.24)因為兩個系數(shù)都屬于相親系數(shù),與距離系數(shù)的相異性有著相反的意義。系數(shù)值越大,相似性程度越大;反之,值越小,相似性程度越小。兩個系數(shù)都具有以下兩條基本性質,表述這兩條性質時讓相關系數(shù)rij也代表角余弦系數(shù)aij。(1)-1≤rij≤1,當且僅當xik=ckjk(c為非零常數(shù),k=1,2,…,n)時,rij=1(c>0)或rij=-1(c<0)。(2)。這兩條性質保證了共分類群等價性的自反性和對稱性要求,但是傳遞性也與距離系數(shù)一樣未能被滿足要求。相關系數(shù)當rij=1時,達到完全正相關,這時兩個分類單位數(shù)據(jù)成比例,僅差一個正比例常數(shù)因子;當rij=0時,兩分類單位數(shù)據(jù)不相關;當rij=-1時,完全負相關,兩分類單位數(shù)據(jù)成比例,僅差一個負比例常數(shù)因子。角余弦系數(shù)具有明顯的幾何意義,把兩個分類單位向量Xi和Xj之間的夾角記作θa,根據(jù)向量乘積與向量夾角的關系有 (3.25)桔梗科試驗數(shù)據(jù)的平均歐氏距離系數(shù)、相關系數(shù)、角余弦系數(shù)和絕對距離系數(shù)分別置于下面表(3-4)、(3-5)、(3-6)和(3-7)中,供讀者參考。表3-4平均歐氏距離系數(shù)(桔梗科試驗數(shù)據(jù))分類單位平均歐氏距離系數(shù)1234561黨參0.00001.39671.69911.76041.01671.68542桔梗1.39670.00001.46521.10881.43441.18183輪葉沙參1.69911.46520.00001.04941.72480.86644薺苨1.76041.10881.04940.00001.79580.59165羊乳1.01671.43441.72481.79580.00001.71956石沙參1.68541.18180.86640.59161.71950.0000表3-5相關系數(shù)(桔梗科試驗數(shù)據(jù))分類單位相關系數(shù)1234561黨參1.0000-0.0471-0.5061-0.71080.4896-0.69222桔梗-0.04711.0000-0.5135-0.0206-0.0455-0.31423輪葉沙參-0.5061-0.51351.00000.2583-0.51580.49054薺苨-0.7108-0.02060.25831.0000-0.70890.66515羊乳0.4896-0.0455-0.5158-0.70891.0000-0.67386石沙參-0.6922-0.31420.49050.6651-0.67381.0000表3-6角余弦系數(shù)(桔??圃囼灁?shù)據(jù))分類單位角余弦系數(shù)1234561黨參1.0000-0.1095-0.4910-0.74470.5591-0.73222桔梗-0.10951.0000-0.49440.0525-0.1257-0.18473輪葉沙參-0.4910-0.49441.00000.2559-0.48360.45624薺苨-0.74470.05250.25591.0000-0.75140.71575羊乳0.5591-0.1257-0.4836-0.75141.0000-0.73656石沙參-0.7322-0.18470.45620.7157-0.73651.0000表3-7絕對距離系數(shù)(桔??圃囼灁?shù)據(jù))分類單位絕對距離系數(shù)1234561黨參0.00001.14911.53671.56310.49451.52732桔梗1.14910.00001.00010.73281.26690.69073輪葉沙參1.53671.00010.00000.61191.65460.31564薺苨1.56310.73280.61190.00001.68100.29635羊乳0.49451.26691.65461.68100.00001.64526石沙參1.52730.69070.31560.29631.64520.00003.3聯(lián)合系數(shù)聯(lián)合系數(shù)在生物學的研究中已經起到很重要的作用,特別在生物分類學、生態(tài)學、advance\l6生物地理學和微生物學中。在生物學的定量分析研究中,聯(lián)合系數(shù)常常用來表示分類群實體的相親性和相似性。英國微生物學家Sneath(1957)首次把聯(lián)合系數(shù)引進數(shù)量分類學,advance\l6他曾提出,在對比兩種細菌時,把負匹配從聯(lián)合系數(shù)中排除出去。Sokal與他合著的《數(shù)量分類學原理》(1963)一書,對聯(lián)合系數(shù)曾進行過總結。此外,Clifford和Stephenson(1975)也曾做過總結性的討論,這本著作偏重于生態(tài)學和生物地理學的應用。有關聯(lián)合系數(shù)的論述很多,隨著定量分析的發(fā)展,生物學家與數(shù)學家設計了多種多樣適用于不同需要的聯(lián)合系數(shù),有關聯(lián)合系數(shù)的理論和應用正在發(fā)展中。在各種相似性度量中聯(lián)合系數(shù)難于確切定義。在此我們摘引Sokal和Sneath給出的定義:聯(lián)合系數(shù)(associationcoefficient)是在整個二元性狀或多態(tài)性狀數(shù)據(jù)上,一對OTU之間一致性度量的配對函數(shù)。在大多數(shù)情形,聯(lián)合系數(shù)以二元數(shù)據(jù)出現(xiàn),因此,本書把重點放在二元性狀的聯(lián)合系數(shù)。當原始數(shù)據(jù)是二元數(shù)據(jù)時,由于數(shù)據(jù)結構的特殊性,它不必經過標準化處理,直接就原始數(shù)據(jù)進行相似性系數(shù)的計算。假設兩個分類單位OTUi和OTUj,待比較其相似性,從原始數(shù)據(jù)矩陣中提取相應的第i個和第j個分類單位向量,OTUi:Yi[yi1yi2yi3…yin]OTUj:Yj[yj1yj2yj3…yjn]其中的分量yik和yjk(k=1,2,…,n)取值0或1。當對比OTUi和OTUj的相似性時,兩組數(shù)據(jù)的匹配有四種情形。即OTUi和OTUj分別為1-1,1-0,0-1,0-0。計數(shù)這四種情形,將計數(shù)結果匯總于一個規(guī)定的2×2列聯(lián)表如下:OTUj10OTUi1abn=a+b+c+d0cd其中a,b,c和d稱為OTUi和OTUj的匹配數(shù)值。a是兩個OTU都取1的性狀個數(shù)計數(shù)值;d是兩個OTU都取0的性狀個數(shù)計數(shù)值;b和c分別是其中一個OTU取1,另一個OTU取0的性狀個數(shù)計數(shù)值。列聯(lián)表中的4種情形把性狀可能取到的各種匹配情形都已包括在內,因此4種情形的計數(shù)值之和應該等于性狀的總個數(shù)n,即n=a+b+c+d。舉一個簡單的例子說明,如果兩個被比較的分類單位,32個性狀狀態(tài)記錄如下:1111001110110100010010011101101111001011011110000111010100111010OTUj10OTUi1118076OTUj10OTUi1118076n=11+8+7+6=32兩個OTU狀態(tài)都取0的性狀有6個,d=6;兩個OTU分別取1和0的性狀有8個,b=8;兩個OTU分別取0和1的性狀有7個,c=7。有了匹配數(shù)值,將該值代入聯(lián)合系數(shù)公式,得到反映OTUi和OTUj之間相似性的系數(shù)值。一個最簡單的考慮就是計算匹配一致的性狀個數(shù)(a+d)占總性狀個數(shù)n的百分比值。因而有簡單聯(lián)合系數(shù)當然對問題的考慮,并不都如此簡單,不同的生物學問題需要設計各種不同的聯(lián)合系數(shù)。聯(lián)合系數(shù)的種類很多,常見的聯(lián)合系數(shù)匯集于表3-8中。此外,還有兩種系數(shù)分別是如下兩個方程的解: (Preston,1962) (Mountford,1962)它們是超越方程,不具一般的解。由于在具體實踐中計算和使用不便,這些系數(shù)未被收列于表3-8中。可是,Mountford系數(shù)具有近似表達式2a/(ab+ac+bc),它已被包括在表3-8中。為了便于討論,將表3-8中最左邊的編號當作相應聯(lián)合系數(shù)的編號。例如S(3)是Jaccard系數(shù)SJ,S(6)是簡單匹配系數(shù)。我們已盡可能把訖今為止的各種二元數(shù)據(jù)的聯(lián)合系數(shù)收集在表3-8中。其中許多是已為人們熟知的系數(shù)。除簡單匹配系數(shù)S(6)以外,還有Russell和Rao系數(shù)S(1),Jaccard系數(shù)S(3),Czekanowski系數(shù)S(4)和普通的相關系數(shù)S(15)。表3-8常見的聯(lián)合系數(shù)編號公式作者或系數(shù)名稱范圍參數(shù)類型h1h2h3l1l2l31RussellandRao,1940[0,1]10110012SokalandSneath,1963[0,1].50010013Jaccard,1908[0,1]10010014Czekanowski,1913[0,1]20010015RogersandTanimoto,1960[0,1].5.5.510016SimpleMatching[0,1]11110017SokalandSneath,1963[0,1]2221001續(xù)表3-8編號公式作者或系數(shù)名稱范圍參數(shù)類型h1h2h3l1l2l38Unnamedcoefficient[0,1]01111119Unnamedcoefficient[0,1]200101110Kulczynski,1927[0,1]100201111SokalandSneath,1963[0,1]5.50201112Ochiai,1957[0,1]100100113SokalandSneath,1963[0,1]100110114Unnamedcoefficient[0,1].50–.5110115Correlationcoefficient,Guifford,1942[–1,1].50–.5110316McConnaughy,1964[–1,1]100201317Hamann,1961[–1,1]111100318YuleandKendall,1950[–1,1]011111319SokalandSneath,1963[0,∞)111100220Kulczynski,1927[0,∞)100100221SneathandSokal,1973[0,∞)200101222Watsonetal.,1966[0,1]200100423EuclideanDistance[0,1]111100424FagerandMcGowan,1963(-∞,1]*。在實際工作中,如何從眾多的聯(lián)合系數(shù)中挑選合適的公式呢?讓我們對表3-8中的聯(lián)合系數(shù)進行比較分析。分析方法采取分類分析,利用桔???個種的二元數(shù)據(jù),對每一個聯(lián)合系數(shù)公式,計算全部種之間的系數(shù)值(共有個數(shù)值),把23個聯(lián)合系數(shù)當作OTU,種間的15個系數(shù)值當作性狀,作分類運算,得樹譜圖(圖3-3)。圖3-3聯(lián)合系數(shù)的分類樹譜圖對樹譜圖粗略地一瞥,就看到兩個系數(shù)S(22)和S(23)結合為一,并與其他系數(shù)明顯不同。呈特殊表現(xiàn)的原因是因為它們屬于相異系數(shù),而其他聯(lián)合系數(shù)都是相親系數(shù)。這兩個系數(shù)值愈大,OTU之間的相似性愈小,它與大多數(shù)聯(lián)合系數(shù)的相親性截然相反。advance\l6再看樹譜圖,除S(22)和S(23)之外,其他系數(shù)按取值范圍又分為三個組。三個取值范圍分別是[0,1],[0,∞)和[-1,1],聯(lián)合系數(shù)的這三個組分別被稱為相親有限聯(lián)合系數(shù),相親無限聯(lián)合系數(shù)和相親相關聯(lián)合系數(shù)。進一步研究發(fā)現(xiàn)對稱性是聯(lián)合系數(shù)的另一個重要方面。所謂對稱性,在此是指當交換表達式中的兩個字母,例如a和d,系數(shù)表達式的值不變,于是稱該系數(shù)關于a和d對稱;否則稱關于a和d不對稱。表3-8中除最后一個S(24)外所有的聯(lián)合系數(shù)都關于b和c對稱。不難理解,在生物學相似性意義下,這個對稱性是必需的。因為相似性的關系,要滿足共分類群等價關系的對稱性條件。然而,聯(lián)合系數(shù)關于匹配數(shù)和的對稱性卻完全不同。審視表3-8中的聯(lián)合系數(shù),S(1)~S(4),S(9),S(10),S(12),S(16),S(20)~S(22)和S(24)所有這些系數(shù)是非對稱的,advance\l6其他都是對稱的。在樹譜圖(圖3-8)中,盡管非對稱系數(shù)分散在不同類型中,在相親有限聯(lián)合系數(shù)中,大多數(shù)非對稱系數(shù)仍聚集在一起。它表明,聯(lián)合系數(shù)關于a和d的非對稱性具有內在的、數(shù)量上的聯(lián)系。匹配值a表示雙方OTU都取肯定(值1)的性狀個數(shù),稱之為正匹配數(shù);類似地d稱為負匹配數(shù)。在生物學問題中,正匹配數(shù)可能與負匹配數(shù)具有不同的意義,因而在聯(lián)合系數(shù)的表達式中應占有不同的地位。非對稱系數(shù)的出現(xiàn)正適合了這種情形的需要。這種情形在生物學領域屢見不鮮,特別在生態(tài)學、生物地理學、advance\l6分類學和微生物學中。在生物地理學和生態(tài)學中,調查記錄的原始數(shù)據(jù)矩陣常常表現(xiàn)為這種形式,OTU是地點,性狀是種。當兩個地點進行比較時,某些所謂指示種和特征種起重要的作用。假若兩個地點具有相同的指示種或特征種,則可以論斷,它們屬于相同的類型或類別。如果都不具有這樣的種,是否屬于相同類型尚不能做出論斷。例如龍腦香料(Dipterocarpaceae)的一些種被一些生物地理學家在植被調查研究中當作熱帶雨林的特征種,只要某些調查地區(qū)一旦具有這個種,就可以認定它們是相同的植被類型——熱帶雨林。相反,如果不具有該種,尚不能獲得如此結論。這種情形,正匹配比負匹配更重要,因而對稱聯(lián)合系數(shù)不合適,應該取適當?shù)年P于和不對稱的系數(shù),才能正確地表達正、負匹配不一致的情形。這正是生物地理學的定量分析中,為什么聯(lián)合系數(shù)常常采取某種非對稱形式的緣故。與此相類似的情形,也可能在生物分類學、生物系統(tǒng)學的研究中出現(xiàn),當數(shù)量分類使用二元數(shù)據(jù)時,某些性狀的兩個對立狀態(tài)是相互不等價的,在分類意義上一個可能比另一個更重要,也許某一個具有較大的鑒別意義。例如常常被生物分類學家強調的鑒別性狀,化學分類學中的特征化學成分,微生物學中基于鑒別培養(yǎng)基的某些性狀等?,F(xiàn)在就二元數(shù)據(jù)的某些計算機技術進行討論??紤]到計算機資源的節(jié)省和工作效率的提高,二元數(shù)據(jù)可以分組,每組由三個連續(xù)的二元數(shù)字組成,如此一組二進位數(shù)轉換成從0到7的普通十進位數(shù),表示如下:二元數(shù)據(jù)000001010011100101110111十進位數(shù)01234567將轉換后的十進位數(shù)(0~7)代替二元數(shù)據(jù),輸入操作將減少勞動力,存貯空間的節(jié)省更為可觀。例如,兩組32位的二元數(shù)據(jù)處理如下:二元數(shù)據(jù)依次分成3個數(shù)字一組:OTUi11110011101101000100100111011011OTUj11001011011110000111010100111010轉換成十進位數(shù)(0~7)OTUi7473,2111,666OTUj6267,4165,164(數(shù)據(jù)結尾如果不足一組時,以0補充直到湊足3個一組)轉換后的十進位數(shù),每連續(xù)四個組成一個整型數(shù),在計算機中僅占據(jù)整型變量6個單元。為了計算聯(lián)合系數(shù),需要計數(shù)a,b,c和d。按照匹配數(shù)的定義,似乎前面得到的十進數(shù)又要再轉換成原來的二元數(shù)據(jù)。這是不必要的,事實上,可以建立十進位數(shù)的配對,把所有十進位配對的a、b、c和d值事先準備好(表3-9),數(shù)a,b,c分別存于三個二維數(shù)組A(i,j),B(i,j)和C(i,j)中。然后將所有十進位配對的a,b和c值累計求和得整個數(shù)據(jù)的匹配數(shù)a,b和c,再從n減去a,b和c可得d。表3-9二元數(shù)據(jù)的基本匹配數(shù)00001001201030114100510161107111000000030012001200210012002100210030100101021002011110110111101101201020201001020111100210110111012010111020301102011101110120010210111011102010410001020111011101201002101110111020510102011101021011101101200111102010611002010210110111101101111020012010711103001200120021001200210021003000例如就前面已經轉換成十進位數(shù)的數(shù)據(jù),計算匹配數(shù)值如下:最后將a,b,c和d代入表3-8中的各種公式,可計算聯(lián)合系數(shù)。聯(lián)合系數(shù)具有6種類型。下面給出這6種類型之間的變換公式。表3-10相似性系數(shù)之間的轉換公式類型類型1類型2類型3類型4類型5類型6相親有限系數(shù)[0,M]類型1SM-S相親無限系數(shù)[0,∞)類型2S相親相關系數(shù)[-1,1]類型3S-S相異有限系數(shù)[0,M]類型4M-SS相異無限系數(shù)[0,∞)類型5S相異相關系數(shù)[-1,1]類型6-SS現(xiàn)在我們將利用表3-10所建立的相似性系數(shù)變換討論聯(lián)合系數(shù)的普遍公式。表3-8中所列舉的聯(lián)合系數(shù),按照取值范圍可歸屬于6種類型,取值為[0,1]的系數(shù)最為普遍,屬于相親有限類型。聯(lián)合系數(shù)屬于相親有限類型的定為基本類型?;诙獢?shù)據(jù)的聯(lián)合系數(shù),除去個別以外,絕大多數(shù)都可以借表3-10的相似性系數(shù)變換轉變成基本類型;反過來從基本類型也可以轉換成其他任何一種類型。因此要解決聯(lián)合系數(shù)的統(tǒng)一計算,只要基本類型的計算得到解決,其他任何類型的計算也就被解決。作者(1989)設計了聯(lián)合系數(shù)的兩個普遍公式,把表3-8中所有取值為[0,1]的相親有限類型聯(lián)合系數(shù)都歸于該公式。兩個普遍公式如下: (3.26) (3.27)(h1+h2=1且h3=0,除去當公式S(14)和S(15)時h3-0.5)其中這兩個普遍式中有六個參數(shù),參數(shù)h1,h2和h3≥0(除系數(shù)S(14)和S(15),h3=-0.5以外),l1,l2和l3為非負整數(shù),l3取值非0即1。每給一組適當?shù)膮?shù)就決定了一個聯(lián)合系數(shù)。表3-8中列出了所有系數(shù)(S(24)除外)的參數(shù)值。參數(shù)l1和l2通常取整數(shù)0或1,這時公式中的指數(shù)項可以被非指數(shù)項取代,例如可以被[al1+(1-l1)][dl2+(1-l2)]代替。公式(3.27)中參數(shù)h1和h2可視為權系數(shù),當l1≠l2且h1≠h2(h1+h2=1)時公式屬于非對稱(關于a與d)形式。公式(3.26)中參數(shù)l3除S(8),S(9),S(18)和S(21)取值1以外均取0值;參數(shù)h1,h2和h3也可當作權系數(shù),若h1=h2且h1=h3公式(3.26)對稱,否則(且l1≠l2)非對稱;當參數(shù)l1=l2時公式(3.26)也取對稱形式。表3-8中系數(shù)S(1)~S(14)取值范圍[0,1],已經被定為基本類型,稱之為基本聯(lián)合系數(shù)(fundamentalassociationcoefficients)。稱之為基本的含意之一在于這些系數(shù)可以由前述兩個普遍式(3.26)和(3.27)直接計算出來。S(1)-S(9)由第一個普遍式(3.26)給出;advance\l6S(10)-S(14)由第二個普遍式(3.27)給出。其他系數(shù)可以由這兩個普遍公式間接算得,把間接算得的聯(lián)合系數(shù)稱為擴展聯(lián)合系數(shù)(extendedassociationcoefficients)。對它的計算先代入普遍公式,得到相應的基本聯(lián)合系數(shù),然后再根據(jù)原數(shù)據(jù)所要求的類型,作表3-10中的變換,得到所需要的聯(lián)合系數(shù)。表3-8中S(15)~S(23)都屬于擴展聯(lián)合系數(shù),S(15)和S(16)由普遍式(3.27)計算,S(17)~S(23)歸普遍式(3.26)計算。它們所屬的類型在表3-8中已經給出。例如Jaccard系數(shù)S(3),從表中參數(shù)值知h1=1,h2=h3=0,l1=1并且l2=l3=0,代入普遍公式(3.26)得本系數(shù)值。Kulczynski系數(shù)S(10),參數(shù)值取h1=1,h2=h3=0,l1=2,l2=0,l3=1代入普遍公式(3.27)計算可得。以上都屬于基本聯(lián)合系數(shù)。再舉擴展聯(lián)合系數(shù)的例子,表3-8中的系數(shù)S(17),S(19)和S(23)屬于擴展聯(lián)合系數(shù)。這些系數(shù)的6個參數(shù)都與S(6)完全相同,對它們的計算先從計算S(6)開始。將參數(shù)h1=h2=h3=1,l1=1,l2=l3=0,代入公式(3.26)算得基本聯(lián)合系數(shù)S(6)。S(6)屬于相親有限,類型1。S(17),S(19)和S(23)分別為類型3、類型2和類型4,要獲得這些系數(shù)分別再做表3-10中的變換F13(S)=2S-1,和F14(S)=1-S(注意,這里M=1)。這三個系數(shù)中的S(23)就是聯(lián)合系數(shù)中的歐氏距離系數(shù)。再看一個重要的系數(shù),相關系數(shù)EQ\L(Sφ=S(15),)該系數(shù)是基本聯(lián)合系數(shù)S(14)的擴展類型。對它的計算是先將h1=0.5,h2=0,h3=-0.5,l1=l2=1,l3=0代入普遍公式(3.27),先得S(14);然后再做F13(S)=2S-1的轉換可得Sφ。聯(lián)合系數(shù)的普遍公式與相似性系數(shù)的轉換公式相結合,不僅把當前已經被使用過的聯(lián)合系數(shù)的計算包括在內,而且還可以開拓出更多的新系數(shù)。當前聯(lián)合系數(shù)的使用有片面性,對于非對稱系數(shù)僅考慮對匹配數(shù)a的加強,而忽視了對匹配數(shù)d的加強。聯(lián)合系數(shù)中相親類型多,相異類型少。新系數(shù)的開拓有助于克服使用上的片面性。如果把普遍公式的6個參數(shù)排成一組數(shù)[h1h2h3l1l2l3]按照參數(shù)的要求每給出一組參數(shù)都對應于一個基本聯(lián)合系數(shù),以及它的5個擴展聯(lián)合系數(shù)。例如我們信手給出一組值[220010],這一組參數(shù)值對于公式(3.26)相應的基本聯(lián)合系數(shù)是它的擴展類型只須將該系數(shù)代入表3-10中的轉換公式Fli(S)(i=2,3,…,6),便可得到。這些系數(shù)尚未見應用報道。它的基本類型是非對稱的,公式的數(shù)學結構分母中2d項出現(xiàn),削弱了匹配數(shù)d的作用,從而加強了a的作用。因此該公式對生物地理和具有特征性狀的分類研究可能有使用前景。6個參數(shù)[h1h2h3l1l2l3]得到的組合數(shù)量是驚人的,從中開發(fā)出具有使用價值的聯(lián)合系數(shù),數(shù)量之大是相當可觀的,表3-8中列出的基本聯(lián)合系數(shù)僅僅14個。足見聯(lián)合系數(shù)的應用研究中,未開墾的處女地還十分廣闊。相似性系數(shù)的轉換和普遍公式的相結合將為聯(lián)合系數(shù)的進一步開拓應用提供方便。相似性系數(shù)的轉換和聯(lián)合系數(shù)普遍公式為計算聯(lián)合系數(shù)編寫電腦程序帶來的益處,是十分明顯的,下面畫出這兩者相結合的聯(lián)合系數(shù)計算程序流程圖(圖3-4)。圖3-4聯(lián)合系數(shù)計算程序流程圖第四節(jié)表征分類的分類運算表征分類從原始資料的收集和整理開始,形成了原始數(shù)據(jù),又經過許多運算過程,advance\l6得出了我們所需要的相似性系數(shù)矩陣。做好這些準備以后,就要開始著手分類運算。分類運算是整個表征分類的核心內容,它決定了分類結果的好壞,因此,生物學家十分關心。分類運算是數(shù)量分類最困難的工作,各種數(shù)學工具應用于分類運算產生了許多分類方法,它也是數(shù)學家熱心致力于研究的課題之一。簡單的系統(tǒng)分類距離系數(shù)的系統(tǒng)分類,其運算過程大致如下。先將每一個分類單位看做是一個類群,運算最初,類群與類群之間的距離系數(shù),也就是分類單位之間的距離系數(shù);分類單位的距離系數(shù)矩陣,也就是類群的距離系數(shù)矩陣??紤]將相似性最接近的類群先結合,因而從類群的距離系數(shù)矩陣中找到距離最小的一對類群,將這兩個類群合并,獲得一個新的類群。然后根據(jù)一定的法則,計算新類群與其他所有類群之間的距離系數(shù),以這個新的類群代替被合并的一對類群,得到類群之間的新的距離系數(shù)矩陣,這樣就完成了一次循環(huán)運算。接著進行下一次循環(huán)運算,上次運算得到的矩陣中再找距離最近的兩個類群,將這一對類群合并,再計算系數(shù),得到新的系數(shù)矩陣……。一再重復執(zhí)行這樣的循環(huán)運算過程,運算過程與前面完全相同。每循環(huán)一次,有一個類群被歸并,獲得的系數(shù)矩陣其階數(shù)減少一階。直到所有的分類單位都歸屬于一個類群為止,整個分類運算結束。讓我們取Anderson等(1934)對樺木科(Betulaceae)植物的研究數(shù)據(jù)進行演算,以此當作一例來具體說明分類運算方法。分類單位是樺木科中的6個屬,下面是屬之間的距離系數(shù):表3-11樺木科6個屬的距離系數(shù)分類單位1234561苗榆屬(Ostrya)0.01.62.13.15.15.82鵝耳櫪屬(Carpinus)1.60.03.33.65.26.13虎榛子屬(Ostryopsis)2.13.30.02.45.26.04榛屬(Corylus)3.13.62.40.04.85.05樺木屬(Betula)5.15.25.24.80.03.56榿木屬(Alnus)5.86.16.05.03.50.0最初將每一個分類單位看作是一個類群,記作Gi={i}(i=1,2,…,6)。在此,括號中的數(shù)碼是分類單位的編碼,以此碼代表該分類單位。該數(shù)據(jù)分類運算步驟如下:1021.61021.60M(1)32.13.3043.13.62.4055.15.25.24.8065.86.16.05.03.50123456M(1)中尋找最小值,即d12=1.6。將類群G1與類群G2合并。得一新類群記作G7G7={1,2}計算新類群與其他類群的距離。距離的計算按最小距離方法。其他類群之間的系數(shù)不變,得新的距離系數(shù)矩陣M(2)。7032.10M(2)7032.10M(2)43.12.4055.15.24.8065.86.05.03.5073456值,即d37=2.1。將類群G3與類群G7合并,得新的類群,記作G8={7,3}={1,2,3}計算新類群與其他類群的距離系數(shù)。得新的系數(shù)矩陣M(3)。8042.40M(3)58042.40M(3)55.14.8065.85.03.508456 值,即d48=2.4,將類群G4和G8合并,得新類群記作G9G9={8,4}={1,2,3,4}計算新類群G9與其他類群的系數(shù)得新的系數(shù)矩陣M(4)。9054.8065.03.59054.8065.03.50956值,d56=3.5,將類群G5與G6合并,得新類群G10G10={5,6}計算類群G10與G9的系數(shù)得新的系數(shù)矩陣M(5)。90104.890104.80910二個類群G9和G10,將此二個類群合并得G11G11={9,1}={1,2,3,4,5,6}分類運算結束。每次循環(huán)若出現(xiàn)兩個以上最小值,取分類單位編碼大值的最小者;此時若分類編碼大值相同,取分類單位編碼小值的最小者。最后,將分類運算結果畫出樹譜圖(dendrogram),見圖3-5。樹譜圖顯示出樺木科內六個屬的分類系統(tǒng)關系。此例給出分類運算最簡單的一種方法,幫助我們了解聚類運算的基本過程。從這個最簡單的例子出發(fā),隨后還要對各種距離系數(shù)的分類方法進行深入討論。讓我們回過頭來再看看全部演算過程,所有這些運算步驟中最關鍵性的一步是合并的類群確立以后,如何計算新的距離系數(shù)。這些系數(shù)將決定整個分類運算的過程,類群之間,哪一個先被合并,怎樣合并,都要取決于這些系數(shù)值;分類最后的結果是好或者是壞,也取決于我們對新距離的定義是否合理。在距離系數(shù)基礎上的分類方法雖然名目繁多,但是運算的基本過程都相同。究其根本,區(qū)別全在新距離的定義不同,不同的距離定義,就得到不同的分類方法。許多從事數(shù)量分類研究的學者都對這個關鍵性的問題做了大量工作。運算過程中計算新類群距離的方法逐漸改進,分類的方法日趨完善。在此討論距離系數(shù)的各種分類方法,實際上都歸結到運算過程中如何確定新類群的距離系數(shù)?,F(xiàn)在讓我們開始討論。圖3-5樺木科樹譜圖(最短距離法,單鏈法)假如在某一分類運算的循環(huán)過程中,被合并的類群是Gp和Gq,歸并以后新的類群是Gr。Gi是任意一個已知的類群,Gr和Gi的距離系數(shù)可以定義如下: (3.28)這就是前述例子中所采用的距離計算方法。因為取距離的最小值,這個分類方法就被稱為最短距離法(theshortestdistancemethod)。與最短距離法相對應的是最長距離法(thelongestdistancemethod),它的距離定義是取最大值, (3.29)前面樺木科的運算數(shù)據(jù),用最長距離法進行運算得到的樹譜圖見圖3-6。運算過程與最短距離法完全相同,只是在計算距離時將最小值改換成最大值。由于距離取最大值,二個距離的最大系數(shù)符合聚合的條件時,最大值符合要求,兩類群之間所有分類單位的距離都小于這個最大值,當然也都符合相聚的條件,所以最長距離法也可稱為全鏈法(completelinkagemethod);最短距離法也稱為單鏈法(singlelinkagemethod)。圖3-6樺木科樹譜(最長距離法,全鏈法)圖3-7平均鏈的系統(tǒng)分類前面介紹了兩種分類運算方法。無論是最長距離法還是最短距離法,新距離的定義取了兩個極端,顯然是非常粗糙的、不太合理的。改進的第一個方法是中線法。圖3-7中,線段IP和IQ分別表示類群Gi與類群Gp和Gq之間的距離。類群Gp和Gq合并成Gr以后,類群Gi與Gr的距離按最短、最長距離法的定義就是從線段IP和IQ中選取最短者或最長者,如果采取三角形IPQ的中線IM來表示Gi與Gr之間的距離,自然要比IP和IQ要合理。因為取用的是三角形中線,分類方法的名稱由此而來?,F(xiàn)在將計算IM長度的表達式寫出來,幾何學中三角形中線的計算公式有 (3.30)前面的數(shù)據(jù)用中線法進行計算得到的樹譜圖見圖3-8。MM圖3-8樺木科樹譜圖(中線法)圖3-9中線法的距離,M點取在P與Q的中點,對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論