甲骨文字頻特征分析_第1頁
甲骨文字頻特征分析_第2頁
甲骨文字頻特征分析_第3頁
甲骨文字頻特征分析_第4頁
甲骨文字頻特征分析_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

甲骨文字頻特征分析

一抽樣材料的確定漢字頻率研究是了解字系統(tǒng)的重要方面。對于漢字來說,這仍然是一個年輕的研究方向,在20世紀(jì)70年代開始。但隨著中文信息技術(shù)的發(fā)展,近年來已呈現(xiàn)長足進(jìn)展態(tài)勢,材料對象已涉及歷史文獻(xiàn),研究的觸角也深入到了字頻與詞性、語義、字音及字形的關(guān)系,以及字頻與文獻(xiàn)內(nèi)容、時代的關(guān)系探究等層面。但總體而言,出土文獻(xiàn),特別是上古出土文獻(xiàn)字頻研究相對薄弱,而甲骨文的字頻研究更乏人問津。立足在漢字發(fā)展史的視角,字頻研究理應(yīng)聚焦斷代文字系統(tǒng)的特點(diǎn)。作為迄今所見最早的成系統(tǒng)的漢字文獻(xiàn)材料的甲骨文,無疑應(yīng)該成為這個特定視角研究序列的起點(diǎn)。但就現(xiàn)實(shí)情況來說,甲骨文字頻研究尚缺乏嚴(yán)格意義上的成果。島邦男的《殷墟卜辭綜類》和姚孝遂、肖丁的《殷墟甲骨刻辭類纂》,以單字為綱類聚辭條的體例,本來可以涉及字頻統(tǒng)計,但卻因壓縮篇幅的需要而將一些高頻卜辭語言單位作舉例節(jié)錄處理,如常見的卜辭套語“往來無災(zāi)”、“旬無”、“其雨”、“不雨”以及常見的虛詞“于”、“惟”、“在”、“其”、“勿”、“弗”、“不”、“弜”等等。這種處理方式正如姚孝遂所說:“對研究古代語言,尤其是研究古代語法的人來說,無疑是會感到遺憾……沒有其它好辦法,只能做出這樣痛苦的選擇。”4甲骨文字頻統(tǒng)計研究的缺位,意味著一個非常嚴(yán)重的情況的存在:對于任何一種歷史文獻(xiàn)的字頻研究而言,都將失去一種最為接近源頭的起點(diǎn)性狀況的參照,當(dāng)然,這將在一定程度上模糊人們歷史視線。毫無疑問,字頻研究是需要一定條件的。大致來說,這種條件可以概括為技術(shù)的和學(xué)術(shù)的兩個方面。就技術(shù)而言,需要數(shù)字化的文字處理手段,否則,以人工計數(shù)為基礎(chǔ)來完成字頻研究,僅僅存在理論上的可行性。就學(xué)術(shù)而言,則是被統(tǒng)計文本的用字正確和統(tǒng)一??陀^來說,對于甲骨卜辭而言,這兩個方面的條件目前都不自然具備。為此,我們根據(jù)統(tǒng)計學(xué)的抽樣原則,限定了材料范圍,確定以《漢英對照甲骨文今譯類檢》(下文簡稱《今譯》)、《小屯南地甲骨》(下文簡稱《小屯》)和《花園莊東地甲骨》(下文簡稱《花東》)卜辭為字頻統(tǒng)計的資料。抽樣當(dāng)然首先是為了限制材料的量,以便在目前條件下確保材料學(xué)術(shù)和技術(shù)加工的可行性。然而這種數(shù)量限制是被控制在實(shí)現(xiàn)字頻研究目標(biāo)可允許的范圍內(nèi)的。根據(jù)統(tǒng)計學(xué)原理,在一個總體為250的例子中,“只要樣本量不是太小——通常為10或20就夠了,統(tǒng)計學(xué)理論表明這個分布近似于正態(tài)分布?!?這也就是說,這三種材料的58544的總字量,可以滿足1410000以上字量文本的抽樣要求,而迄今所見已經(jīng)公布的卜辭材料,遠(yuǎn)遠(yuǎn)達(dá)不到這個字量(1)。此外,上述抽樣還有以下幾個原因:一是這三種卜辭材料的字頻數(shù)據(jù)已經(jīng)發(fā)表,具有驗(yàn)證的方便性(2)。二是照顧了甲骨卜辭出土地的分布。對于考古發(fā)掘材料來說,出土地的屬性是極為重要的,甲骨文當(dāng)然也不例外。我們所抽樣的三種卜辭材料,《今譯》選自《甲骨文合集》,代表了傳統(tǒng)殷墟卜辭出土地小屯村北的材料,而《小屯》和《花東》,則是非傳統(tǒng)出土地的主要卜辭材料。三是隨機(jī)抽樣和判斷抽樣的互補(bǔ)。《小屯》和《花東》對應(yīng)所有公布的出土地材料,用以為統(tǒng)計對象,屬于隨機(jī)抽樣,長處是所得數(shù)據(jù)相對客觀;而《今譯》則是在《甲骨文合集》的材料范圍內(nèi)進(jìn)行篩選,篩選原則“一是著眼內(nèi)容和字詞的覆蓋面,即在一定的篇幅內(nèi)包含盡可能多的內(nèi)容類型和字詞種類的甲骨刻辭;二是注重刻辭拓片的清晰度,即只選擇清晰或比較清晰的甲骨文刻辭進(jìn)行今譯”凡例,同時還考慮辭例的完整性和各期卜辭的合理分布,故屬于判斷抽樣(JudgementSampling),所得數(shù)據(jù)雖然可能在表面上偏離客觀性,但卻有可能反映本質(zhì)的真實(shí)。二甲基字頻兩端集中現(xiàn)象經(jīng)剔除刻辭殘泐字和兆序用字后的統(tǒng)計,《今譯》、《小屯》和《花東》的字量(3)和字?jǐn)?shù)(4)等數(shù)據(jù)如下:上表的數(shù)據(jù)(5)表明:使用單字的數(shù)量和其平均使用量都是與文獻(xiàn)的用字總量成正比增長的,《今譯》用字總量最少,故單字量和平均使用量也較少;《小屯》總字量最多,故其單字量和平均使用量也較多。匯合三種材料進(jìn)行統(tǒng)計,所得字頻分級數(shù)據(jù)(6)如下:上表數(shù)據(jù)所呈現(xiàn)的甲骨文字頻狀況林林總總,但其中最值得關(guān)注是兩端集中狀況,即少數(shù)高頻字占總字量的高比重(以下簡稱“高端集中”)和總字量中極低比重的低頻字占單字總數(shù)的極高比重(以下簡稱“低端集中”)。高端集中表現(xiàn)為,占單字量的22.87%的379個10次以上字的累計覆蓋率為94.60%,僅占單字量的1.87%的31個500次以上字的累積覆蓋率為52.46%。低端集中表現(xiàn)為,僅占總字量1.05%的616個一見字卻占單字量的37.18%。為了對甲骨文字頻兩端集中現(xiàn)象作一個合理的評估,我們首先引進(jìn)現(xiàn)代漢語的類似數(shù)據(jù)作為觀察的參照物。根據(jù)貝貴琴和張學(xué)濤的《漢字頻度統(tǒng)計——速成識讀優(yōu)選表》一書所提供的數(shù)據(jù),現(xiàn)代漢語中前42個高頻字累計覆蓋率在25.46%,而甲骨文9個1000頻次以上字就超過了這個覆蓋率,達(dá)到26.32%;現(xiàn)代漢語中出現(xiàn)1次的字占單字總數(shù)的8.76%,甲骨文中出現(xiàn)1次的字占單字總數(shù)的37.18%。再以古代傳世文獻(xiàn)為比較的參照。先看高頻:屬于先秦的《左傳》《論語》《詩經(jīng)》等文獻(xiàn),字頻最高前10字累加覆蓋率為19.276%70;而甲骨文字頻最高前10字累加覆蓋率為28.03%(1)。再看一見字:據(jù)研究,《爾雅》、《楚辭》、《山海經(jīng)》是先秦傳世文獻(xiàn)中一次字最多的三部作品。其中《爾雅》有619個,占總字?jǐn)?shù)3383的18.30%;《楚辭》有221個,占總字?jǐn)?shù)3137的7.04%;《山海經(jīng)》175個,占總字?jǐn)?shù)1999的8.75%115。與甲骨文一次字占總字?jǐn)?shù)37.18%相比,比重都要低得多。雖然字頻存在差異被認(rèn)為是作為人類思維的外在反映的文字受到大腦功能限制的必然結(jié)果,但對于一種文字系統(tǒng)而言,少數(shù)字被過度集中使用和較多字難得被使用終究是一種消極現(xiàn)象,而兩者又具有內(nèi)在的邏輯聯(lián)系:即文字系統(tǒng)的常用字集對整個字集的覆蓋面太小的另一面,必然是罕用字在字集中的大量存在。而兩端集中現(xiàn)象導(dǎo)致的直接后果,一方面意味著相對實(shí)際語言交際的豐富信息而言,文字記錄功能顯得低能;一方面又會極大挑戰(zhàn)這種文字使用者的識記能力。所以這種現(xiàn)象不應(yīng)該被人們長期接受,因而也不應(yīng)該是文字系統(tǒng)充分發(fā)展以后的常態(tài)。由此來看,少數(shù)高頻字占總字量的高比重和總字量中極低比重的低頻字占單字總數(shù)的極高比重的甲骨文,相對后世漢字而言,似乎確實(shí)體現(xiàn)著殷商時代這個對漢字來講屬于早期的文字系統(tǒng)的不成熟特性。三《花東》和《小屯》去程式因素前后的數(shù)據(jù)比較人們很容易想到,甲骨文兩端集中狀況與甲骨文的文獻(xiàn)特點(diǎn)有關(guān)。首先,甲骨卜辭是非常程式化的文字表達(dá),而覆蓋率極高的前辭、占辭等用字則是高度集中于少數(shù)字的。而如果去除這種因文獻(xiàn)特殊程式而導(dǎo)致的高頻因素,當(dāng)可更準(zhǔn)確反映甲骨文時代的一般文獻(xiàn)的字頻狀況。為此,我們分別將《花東》與《小屯》作不同程度的去程式因素處理,以評估卜辭中程式因素對字頻的影響程度。對字?jǐn)?shù)相對較少的《花東》僅作去除前辭用字的處理,依據(jù)去除后對兩端集中度產(chǎn)生影響的觀察角度,首先做總字量、單字?jǐn)?shù)和單字平均使用率的數(shù)據(jù)調(diào)查如下:上表去前辭版本的數(shù)據(jù)比較未去除前辭的《花東》相關(guān)數(shù)據(jù),可以發(fā)現(xiàn)三個變化:(1)總字量減少較多,達(dá)到3664個,這個數(shù)字要占未去前辭版本總字量的22.18%,占去前辭版本總字量的28.50%;(2)總字?jǐn)?shù)減少不多,僅7個:“夫京申”,這個數(shù)字僅占未去前辭版本總字?jǐn)?shù)的1.046%,占去前辭版本總字?jǐn)?shù)的1.05%。(3)單字平均使用量下降,具體下降了5.275,這個數(shù)字要占未去前辭版本單字平均字頻的27.16%,占去前辭版本單字平均字頻的21.38%?!缎⊥汀纷?jǐn)?shù)較多,因此在去除前辭的基礎(chǔ)上再作去占辭用字的處理,所得同類數(shù)據(jù)如下:上表的去前、占辭版本數(shù)據(jù)比較未去除前數(shù)據(jù)發(fā)生了與上述《花東》數(shù)據(jù)極為類同的變化:(1)總字量少了7711個,這個數(shù)字要占未去除前版本總字量的22.48%,占去除后版本總字量的28.99%;(2)總字?jǐn)?shù)只少了3個,即“卜”“”“”。這個數(shù)字僅占未去前占辭版本總字?jǐn)?shù)的0.292%,占去前占辭版本總字?jǐn)?shù)的0.293%。(3)單字平均使用量下降7.45%,這個數(shù)字要占未去前、占辭版本單字平均字頻的22.28%,占去前、占辭版本單字平均字頻的28.66%。細(xì)審《花東》和《小屯》去程式因素前后的數(shù)據(jù)比較,盡管也可以發(fā)現(xiàn)兩者間由各自文獻(xiàn)特點(diǎn)而導(dǎo)致的某種細(xì)微差異,如《花東》去程式因素后單字?jǐn)?shù)降低較多與《花東》前辭每每強(qiáng)調(diào)占卜地點(diǎn)有關(guān)(2),而《小屯》去程式因素后單字平均使用頻率下降較少則很可能與其總字量較大有關(guān),但就總體而言,兩者的數(shù)據(jù)指向卻有驚人的一致性:即卜辭程式對甲骨文總字量和字頻影響較大,而對字?jǐn)?shù)影響很小。為更加細(xì)致地描述卜辭去程式因素數(shù)據(jù)的意義,不妨再作字頻數(shù)據(jù)高低兩極的去程式前后的比較?!痘|》數(shù)據(jù)如下:從上表我們可以進(jìn)一步獲知值得注意的三點(diǎn):(1)由于剔出了前辭,頻率300次以上字從12個減少到9個,但是頻率為1的字卻沒有發(fā)生數(shù)量變化。(2)300次以上字的字均使用量和對總字量的覆蓋率也都有所下降:前者減少40.64(為單字平均字頻的2.09倍),后者下降4.34%。(3)由于總字量下降而一見字?jǐn)?shù)量不變,一見字對總字量的覆蓋率上升0.39%?!缎⊥汀返耐惤y(tǒng)計數(shù)據(jù)如下:從上表我們獲得了幾乎與上文《花東》同類數(shù)據(jù)相同的三點(diǎn)信息:(1)由于剔出了前占辭,頻率500次以上字從14個減少到10個,但是頻率為1的字卻只減少了1個。(2)500次以上字的字均使用量和對總字量的覆蓋率也都有所下降:前者減少75.63%(為單字平均字頻的2.3倍),后者下降5.89%。(3)由于總字量的下降量大而一見字減少量小,一見字對總字量的覆蓋率上升0.33%。綜合《花東》和《小屯》高低兩極字頻數(shù)據(jù)的去程式因素的前后比較,我們可以作這樣的歸納:首先,伴隨程式因素的去除,高頻一極的單字會發(fā)生較多的數(shù)量減少,而低頻一極的字卻只有微小的數(shù)量減少,甚至數(shù)量不變。可見,甲骨卜辭的程式,主要影響的是字頻高端集中度。其次,由于程式因素的消除,在降低了高頻字過度集中的密度的同時也提高了中低頻度的文字的出現(xiàn)比重。由于這兩個因素的共同作用,程式因素一旦去除,兩端集中現(xiàn)象的集中度有了某種程度的降低。這也就是說,卜辭的程式確實(shí)是導(dǎo)致甲骨文兩端集中現(xiàn)象的一個因素。其次,高頻字集中于少數(shù)字,與相關(guān)文獻(xiàn)的內(nèi)容熱點(diǎn)也是具有內(nèi)在聯(lián)系的。相對程式因素而言,內(nèi)容熱點(diǎn)的成因相對隱晦,但我們還是可以通過系統(tǒng)調(diào)查高頻一端用字的字用是否涉及甲骨卜辭的內(nèi)容熱點(diǎn)來摸清情況。前文言及,《小屯》未去前占辭版本中字頻在500以上者有14字,而這14字在該文獻(xiàn)中的實(shí)際使用次數(shù)占了該文獻(xiàn)的總字量近五分之二。那么,這些為數(shù)不多的高頻字的字用狀況是否具有相對集中的內(nèi)容熱點(diǎn)呢?答案無疑是肯定的:字頻數(shù)居前二位的“貞”“卜”,全然就是專用于占卜的動詞;“王”的高頻,無疑與《小屯》材料的王卜辭特點(diǎn)有關(guān);“吉”、“”,表達(dá)的是占卜的終極結(jié)果;“雨”,則是占卜中最多涉及的氣象概念;“旬”的多見,與殷人占卜有于旬末卜下旬之吉兇的習(xí)慣有關(guān);“癸”“乙”的多見,是因?yàn)檫@兩個天干字多表示占卜的時間,以及與占卜直接相關(guān)的先祖廟號;“又”的高頻,當(dāng)然與其用法較多有關(guān),而其中“祭名”和通“祐”的用法,也與殷商甲骨卜辭占卜事神的特點(diǎn)有關(guān)。這樣,在14個高頻字中,與占卜沒有直接關(guān)系的只有“其”“亡”“于”“叀”4個字。而這4個字的文字?jǐn)?shù)量只占14個字頻500以上字的28.57%,其字頻合計為4011,也占這14高頻字總字頻13347的30%。由此,我們可以得到如下認(rèn)識:對于甲骨文極高頻字的形成,占卜文獻(xiàn)的內(nèi)容熱點(diǎn)也起了相當(dāng)大的作用。四商法漢字的斷代屬性甲骨文字頻高端集中與卜辭程式和內(nèi)容熱點(diǎn)相聯(lián)系的事實(shí),很容易導(dǎo)致這樣一種認(rèn)識:甲骨文的字頻特征,只能反映甲骨文的文獻(xiàn)特性,而并不具備殷商漢字的斷代屬性。但事實(shí)上,前文的調(diào)查數(shù)據(jù)清晰地告訴我們:即使剔除程式因素,甲骨文的兩端集中度仍大大高于后世傳世文獻(xiàn)用字,可見甲骨文字頻兩端集中與殷商文字?jǐn)啻攸c(diǎn)是具有邏輯關(guān)系的,這種關(guān)系主要體現(xiàn)為如下兩個方面:(一)結(jié)論:材料中的字頻特征決定字頻差異的因素很多,除了前文言及的文字記錄語言的內(nèi)容熱點(diǎn)所在以外,另一個重要因素是文字記錄語言表達(dá)意義的方式,更確切地說是文字與其所要表達(dá)語言的意義要素對應(yīng)的精密化程度。如有的文字種類一個字可以記錄一個語段,有的文字則每個詞都要至少用一個字記錄。很顯然,這兩種不同的文字即使記錄同樣的語言內(nèi)容,字頻也一定會大不一樣。值得注意的是,由上述兩種因素導(dǎo)致的字頻差異有著根本不同的性質(zhì)。字頻差異可以歸結(jié)為結(jié)構(gòu)型和非結(jié)構(gòu)型兩種:不同頻度字在總字量中的比重存在差異,屬于結(jié)構(gòu)性差異;而不同頻度字在總字量中的比重大體不變,只是對應(yīng)頻度字群中所轄的具體文字不同,則屬于非結(jié)構(gòu)性差異。文本內(nèi)容的特點(diǎn)差異,既可以存在于不同斷代的文獻(xiàn),也可以存在于同一斷代的文獻(xiàn),如果屬于后者,由此導(dǎo)致的字頻差異一般不會是結(jié)構(gòu)上的差異,而只是不同頻級的字群所轄個體文字的差異。所以這種差異并不具備斷代的意義。一般來說,文字與其所要表達(dá)的意義要素對應(yīng)的精密化程度,是隨著文字系統(tǒng)的發(fā)展而進(jìn)化的,因此,作為導(dǎo)致字頻差異的原因,它顯然是更具有斷代意義的。那么,甲骨文的字頻特征,是否與殷商時代漢字記錄語言表達(dá)意義中字符與意義要素的對應(yīng)程度有關(guān)呢?顯然,這是判斷甲骨文字頻特征是否具有斷代屬性的重大問題。下面擬通過不同時代但內(nèi)容類同文獻(xiàn),以及相同時代內(nèi)容不同文獻(xiàn)的兩種比較來嘗試解答。甲骨文是占卜文獻(xiàn),如果其字頻特征僅僅形成于占卜的內(nèi)容熱點(diǎn),那么其他斷代的類似內(nèi)容類型的文獻(xiàn)的字頻特征應(yīng)該與之相去不遠(yuǎn)。基于這種認(rèn)識,我們以戰(zhàn)國楚簡中的卜筮祭禱文獻(xiàn)的字頻狀況來與甲骨文字頻作一個比較。與甲骨文以占卜和祭祀為主要內(nèi)容相類似,楚簡中《新蔡》簡也是記述占卜和祭祀的,我們剔除《新蔡》釋文中表示殘斷的2433個△和表示拓片不清的479個□,吸取迄今相關(guān)考釋研究的意見,對這部分楚簡的整理者釋文進(jìn)行了校訂,在此基礎(chǔ)上進(jìn)行了數(shù)字化處理,獲得如下數(shù)據(jù):總字量10053,總字?jǐn)?shù)1004。其中最高頻前11字共計出現(xiàn)2531次,占總字量的25.18%(1);而甲骨文的前7個最高頻字的出現(xiàn)頻次已占總字量的26.03%。這就是說,雖然卜筮類楚簡文獻(xiàn)的最高頻字?jǐn)?shù)量比甲骨文增加了57%以上,但其合計頻次占總字量的比重卻仍低于甲骨文。在最低頻一極,《新蔡》簡一次字397個:占總字?jǐn)?shù)的39.54%,占總字量3.95%;而前文統(tǒng)計三種材料合計的甲骨文一見字616個,雖然占單字?jǐn)?shù)比重略低于新蔡簡,為37.18%,但其在總字量中的比重卻大大低于新蔡簡,只占1.05%。這也從另一個角度說明了甲骨文的兩端集中度要大大高于新蔡簡。內(nèi)容相似而高頻字的集中度卻有著明顯差異,這至少可以證明甲骨文的字頻特征與其占卜、祭禱的文獻(xiàn)內(nèi)容并無必然聯(lián)系。其實(shí),對于甲骨卜辭與卜筮祭禱楚簡文字表達(dá)上的差異,人們只要讀過這兩種文獻(xiàn)都是可以直觀感悟的,字頻差異只是作了一個很清晰的宏觀描寫而已。甲骨文的字頻特征的斷代屬性由此可見一斑。殷商漢字除了用于記錄卜辭以外,至少還用于青銅器銘文,它們的字頻特征比較顯然具有另一層面的意義。不妨先從個案的比較入手。前文言及,字頻兩端集中現(xiàn)象的形成,與文字記錄語言中需要經(jīng)常使用的文字,即常用字集的數(shù)量相對偏少有著直接關(guān)系。然而,甲骨文字記錄卜辭為什么會只需要較少文字經(jīng)常使用呢?通過個案分析,我們或許能夠具體解釋這個問題。《甲骨文合集》133片:“貞:芻得?”《今譯》:“貞問:逃亡的牧人將會被抓獲嗎?”10比較以上卜辭原文和現(xiàn)代漢語翻譯,可以發(fā)現(xiàn)兩大差異:首先,今譯相對卜辭原文多使用了一些詞,記錄這些詞的是“的”“將”“會”“被”“嗎”等字。顯而易見,這些字詞在現(xiàn)代漢語的書面表達(dá)中是一些非常重要的成分,或表示限定修飾關(guān)系,如“的”;或表示行為的狀態(tài),如“將”“會”;或表示被動關(guān)系,如“被”;或表示疑問語氣,如“嗎”。毫無疑問,這些字詞所承載的語言成分,都起到了促使語言表達(dá)清晰準(zhǔn)確的作用,幾乎在現(xiàn)代漢語交際的每個句子中都是不可或缺的。然而在殷商卜辭中,它們卻根本不需要出現(xiàn),或者說它們表達(dá)的語言交際意義是不需要文字實(shí)體來承擔(dān)的。其次,卜辭原文的四個字都非專名,而是較為通用的名詞或動詞,而它們與今譯所對應(yīng)的表達(dá)在用字?jǐn)?shù)量上也有差異:“貞=貞問”,“=逃亡”,“芻=牧人”,“得=抓獲”。單音詞演變?yōu)殡p音詞,所用文字自然就會成倍增加。而在殷商青銅器銘文中,我們可以看到極為類似的情況。“作冊般甗”銘首句:“王宜人方,無敄?!苯褡g:“商王為出征人方到社祭祀,得到保佑,必能取勝?!?34對照今譯,我們同樣可以發(fā)現(xiàn)銘文原文表達(dá)的一些意義單位得不到文字的對應(yīng):王進(jìn)行社前的祭祀(宜祭)是為了征伐人方,這在現(xiàn)代漢語中用了一個介賓結(jié)構(gòu)的“為”字句來表達(dá),其中征伐的意義用了“出征”二字對應(yīng)。而這些在原文中卻并無文字對應(yīng),這些意義要素實(shí)際是靠“王”“宜”“人方”之間隱含的內(nèi)在關(guān)系,讓讀者意會的。個案分析表明,銘文的用字密度與卜辭似在伯仲之間。這也就決定了銘文的總體字頻狀況與卜辭類同。我們借助于《商周金文斷代字頻表》(2),只選取該表中確定時代為“殷”的記錄,來進(jìn)行殷商青銅器銘文的字頻統(tǒng)計,得出如下相關(guān)數(shù)據(jù):總字?jǐn)?shù):1579,總字量10799;銘文中最高頻的前6字的出現(xiàn)頻次為2919(3),占總字頻10799的27%。而總字量與之相對接近的《花東》卜辭的同口徑數(shù)據(jù)(4)則為27.25%。青銅器銘文當(dāng)然是與甲骨卜辭全然不同的文獻(xiàn)類型,具有與卜辭不同的體式,而其上述字頻特征卻與甲骨卜辭類同。這就意味著:甲骨文的字頻特點(diǎn)反映的是不是殷商文字的一種共性呢?這個結(jié)論可能還會遭到這樣的質(zhì)疑:無論是卜辭還是銘文,都是非常特殊另類的文獻(xiàn)種類,因此其字頻特點(diǎn)的時代代表性難以確認(rèn)。但種種情況表明:這種質(zhì)疑是不能成立的。首先,早期漢字,具體來說是戰(zhàn)國以前的漢字的具體用途與后世有很大不同。我們曾經(jīng)對《左傳》中關(guān)于文字使用的記錄做過窮盡性的調(diào)查(1),得到的相關(guān)結(jié)論是:(1)《左傳》時代的漢字決不介入中、下階層人群的社會生活,而僅僅為統(tǒng)治階級上層所用。(2)《左傳》記載中的文字應(yīng)用,又與人們的日常生活無涉,即便在統(tǒng)治階級上層也不例外。(3)《左傳》時代的文字,并不應(yīng)用于單純意義上的知識傳播。因而我們更不能期望在殷商時代就會存在如同后世主流文獻(xiàn)的種類。事實(shí)上,今天可以認(rèn)定確實(shí)存在的殷商出土文獻(xiàn)只是甲骨卜辭與銅器銘文而已,因此可以認(rèn)為甲骨卜辭之類就是可以反映當(dāng)時漢字基本特性的主流文獻(xiàn)。再換個角度來分析。殷商還有傳世文獻(xiàn),《尚書·多士》“惟殷先人,有典有冊,殷革夏命”的記載可以證明當(dāng)時史官已用漢字記史,顯然這種文獻(xiàn)更加符合傳統(tǒng)的主流概念,其字頻特點(diǎn)是否也與卜辭類同呢?毫無疑問,這個問題的答案能幫助我們進(jìn)一步確認(rèn)甲骨文字頻特征是否真的具有斷代屬性?!渡袝冯m有《商書》,但其4000余字的總字量很難滿足字頻研究的基本要求,更何況其時代的真實(shí)性也存在問題。因而相對后出的《春秋》更能反映先秦史官文字的真實(shí)字頻狀況。關(guān)于春秋時代史官文字的特點(diǎn),可以通過讀解《左傳·宣公二年》中關(guān)于晉國史官董狐如何記下“趙盾弒其君”的官史文字的記述獲知一二,從中不難發(fā)現(xiàn),先秦史官記史必須恪守“書法(記史之法)”,而所謂“書法”,其實(shí)都是一些簡約記事的手法。晉史如此,魯史也不會例外。歸結(jié)起來說,即使是類同于后世主流文獻(xiàn)的先秦史書,同樣呈現(xiàn)出文字對應(yīng)語言內(nèi)容的以簡馭繁特性。就這一點(diǎn)而言,《春秋》之類先秦史書與甲骨卜辭并無本質(zhì)差異。(2),占總字量24.93%,1頻次字占單字總數(shù)的35.89%。按照兩端集中的指標(biāo)將其字頻狀況與甲骨文作比較,則可得出如下數(shù)據(jù):上表數(shù)據(jù)表明:相對現(xiàn)代漢字來說,兩端集中無疑是甲骨文和《春秋》字頻的共同特征。而它們在集中度上的差異,顯然與其時代距離有關(guān)。而《春秋》的字頻的兩端集中度與《新蔡》更為接近的事實(shí),更說明了時代跨度是決定甲骨文與它們兩端集中度差異的根本原因。甲骨文字頻特征的殷商時代的斷代屬性,也由此得到了進(jìn)一步的證明。(二)期土樣形貌理論以上討論,主要涉及了高端集中的緣由闡釋,而對低端集中并未作多少分析說解,以下的討論,將試圖彌補(bǔ)這一缺陷。而要弄清楚這一問題,需要從具體材料的分析入手。不妨就《小屯》的一見字的用法類型作具體分析?!缎⊥汀芬灰娮址?95個,其中因辭殘而用法不明者117字(3),因?yàn)橛梅ú幻?實(shí)際意味著它們究竟屬于何字尚不明確,因而只能將其視為無效數(shù)據(jù)加以排除。另有25個合文,作為古文字中特殊的文字種類,合文并不能為本視角的探討分析提供有效的評估性信息,所以也作排除處理。這樣,真正可以認(rèn)定的《小屯》一見字只是253個,其中屬于專名類型的占了絕大多數(shù),達(dá)191個(4)。分別為:地名82個,祭名42個,人名38個,方國名11個,祭牲名5個,用牲法5個,神名7個,官名1個。而屬于普通詞匯之列的62個(1),其中動詞36個,名詞17個,副詞4個,形容詞4個,代詞1個。綜上,我們可以明確《小屯》一見字用法的基本狀況:大約四分之三為各類專名,四分之一所指則為一般詞匯。如何評估這種狀況呢?顯然也需要分層次進(jìn)行。作為目前可見最早的成系統(tǒng)的漢字材料,甲骨文當(dāng)然處于漢字發(fā)展的早期階段。而這樣一個早期階段實(shí)際在一定程度上具有由原始圖畫性或抽象刻畫符號類表意記事符號向成熟文字逐步過渡過程的性質(zhì),而在這個過程的兩端,同為視覺表意系統(tǒng)的重要差異就是表達(dá)符號的專用與通用性程度的不同:前者的特征就是圖形單位和意義單位的一一專門對應(yīng),而后者的特征則是以具有通用性的字形去對應(yīng)多個各不相同的語言單位。因此,在這個過程中,越是處于早期階段,出現(xiàn)次數(shù)不多的文字?jǐn)?shù)量也越多,而能夠獲得與之相對應(yīng)機(jī)會的,自然也是具有盡可能更早的時間屬性的專用性語言單位。《小屯》一見字的用法集中于地名、國族名、祭祀名等尤具歷史厚度的卜辭單位,正印證了上述邏輯聯(lián)系。因而低頻字群的多字?jǐn)?shù)集中度,同樣是衡量文字系統(tǒng)原始性的另一重要尺度。當(dāng)然,一見字的生成因由是多樣的,具體到《小屯》非專名類一見字,至少可以有這樣幾種理由來解釋它們的出現(xiàn):文字?jǐn)啻卣鞯淖饔?文獻(xiàn)用字?jǐn)?shù)量的限制和文獻(xiàn)內(nèi)容對文字單位的選擇性限制。值得注意的是,后兩者作用力的結(jié)果,都有可能影響字集中所有單位公平出現(xiàn)的機(jī)會。為用盡可能客觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論