廣西東莞的粵漢詞匯相似度研究_第1頁
廣西東莞的粵漢詞匯相似度研究_第2頁
廣西東莞的粵漢詞匯相似度研究_第3頁
廣西東莞的粵漢詞匯相似度研究_第4頁
廣西東莞的粵漢詞匯相似度研究_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

廣西東莞的粵漢詞匯相似度研究

一、廣西東部經(jīng)濟(jì)帶當(dāng)前,廣西梧州市的通俗語言是粵語。這個(gè)城市是廣東州的粵語發(fā)音,郊區(qū)是鄒及其語音輸家。廣府粵語以廣州話為代表,是粵語中最具影響、使用人數(shù)最多的一種方言,主要分布在廣東珠江三角洲一帶及廣西西江流域上游的部分地區(qū),共36個(gè)縣市,還有香港、澳門兩個(gè)地區(qū),使用人數(shù)約2834多萬。勾漏粵語主要分布于廣東西部的清遠(yuǎn)、肇慶兩市所轄的部分地區(qū)及廣西東部地帶,共41個(gè)縣市,使用人數(shù)約1030萬。其中廣東省11個(gè)區(qū)縣市,使用人口350余萬,廣西壯族自治區(qū)35個(gè)縣市,使用人口680余萬。在地理分布上,該種方言基本連成一個(gè)整片。眾所周知,廣府粵語和勾漏粵語在語音上差異較大,但兩者在詞匯方面的關(guān)系如何?這是筆者關(guān)注的問題。筆者出生在廣西蒼梧縣倒水鎮(zhèn),5歲時(shí)隨家人搬遷到梧州市區(qū),開始兼用梧州話(指梧州城區(qū)話,屬廣府粵語)和倒水話(屬勾漏粵語)。根據(jù)《蒼梧縣志》記載,蒼梧縣的粵方言大體劃分為:南五鄉(xiāng)片,包括龍圩、林水、廣平、大坡、新地,以龍圩為代表點(diǎn);東安片包括沙頭、石橋、木雙、梨埠、六堡,以沙頭為代表點(diǎn);撫河片包括倒水、旺埔、夏郢、嶺腳、人和、師寨、京南、長發(fā),以倒水為代表點(diǎn)。為了能夠細(xì)致、精確地研究梧州粵語和周邊勾漏粵語間詞匯的相似度,本文以梧州話和倒水話為例,對這兩種方言的1300多個(gè)日常所用詞項(xiàng)進(jìn)行詞匯相似度的計(jì)量分析。筆者使用Spss19.0統(tǒng)計(jì)軟件計(jì)算梧州話和倒水話的相似度,并以粵方言的標(biāo)準(zhǔn)方言廣州話與梧州話的相關(guān)系數(shù)作為參照,進(jìn)而說明梧州話和倒水話的相關(guān)性及其差異。二、測量分析的方法(一)相關(guān)系數(shù)統(tǒng)計(jì)法對方言間或不同語言間詞匯相似度的計(jì)量研究方法有:語言年代學(xué)(glottochronology)、相關(guān)系數(shù)統(tǒng)計(jì)法、算術(shù)統(tǒng)計(jì)法、概率法、矩陣分解(matrixdecomposition)和加權(quán)平均法等。本文選用的相關(guān)系數(shù)統(tǒng)計(jì)法,最早是由鄭錦全于1973年提出的,他用“皮爾遜相關(guān)”和“非加權(quán)平均系聯(lián)法”計(jì)算不同方言的字音和詞匯文字表現(xiàn)形式的親疏程度。用于比較的詞目有905條,在獲得它們的相關(guān)系數(shù)的基礎(chǔ)上,做聚類分析,用樹形圖對18種方言間的親疏程度作出直觀而細(xì)密的描寫。但此方法有兩個(gè)主要缺點(diǎn):一是沒有考慮詞頻對計(jì)量結(jié)果的影響;二是比較詞匯的異同時(shí),只考慮詞形異同,并不顧及詞內(nèi)部詞根或中心語素的異同。針對該方法的不合理性,王士元和沈鐘偉于1992年共同提出在漢語方言的分類上應(yīng)該以語素作為計(jì)算的基本單位,而不是詞。他們進(jìn)一步完善了相關(guān)系數(shù)統(tǒng)計(jì)法和聚類分析法(簡稱王沈計(jì)量法),給人們提供了一種切實(shí)可行的計(jì)量方言詞匯相關(guān)系數(shù)的途徑。(二)王沈月量法的總結(jié)1.以詞為單位的單位計(jì)算選擇語素作為計(jì)算的基本單位,同時(shí)把構(gòu)詞方法也納入計(jì)量的范圍。因?yàn)樵~與詞的關(guān)系是由語素和構(gòu)詞方法表達(dá)出來的,如果把這兩個(gè)要素排除在外,對詞和詞之間的部分相似關(guān)系棄之不顧的話,以詞為計(jì)算單位的計(jì)算必然會(huì)增大方言間的實(shí)際距離。2.雙無l指數(shù)法就一對方言(甲方言和乙方言)而言,它們之間某一個(gè)語素或構(gòu)詞方法出現(xiàn)的情況只有“雙有”、“有無”、“無有”、“雙無”四種,分別用a、b、c、d代表(1)。其中d“雙無”的情況對于分析兩方言間關(guān)系沒有實(shí)際意義。所以得出計(jì)算詞匯相關(guān)系數(shù)的公式:式中:k表示用于比較的某個(gè)詞項(xiàng);i、j表示k詞項(xiàng)在兩種方言中的反映形式(2);Skij表示i和j兩種反應(yīng)形式的相關(guān)系數(shù);a/(a+b+c)表示兩種方言詞匯語素和構(gòu)詞法的“雙有”關(guān)系和所有關(guān)系(3)的比值。3.n條詞項(xiàng)參與比較一對方言的總相關(guān)系數(shù)為單個(gè)詞項(xiàng)相關(guān)系數(shù)總和的平均值。如果甲、乙兩種方言共有n條詞項(xiàng)參與比較,可以得到n個(gè)Skij。其總體相關(guān)系數(shù)應(yīng)該是這n個(gè)相關(guān)系數(shù)的平均值:式中:Shk表示在兩個(gè)方言中某個(gè)詞項(xiàng)k的相關(guān)系數(shù),h表示它是n個(gè)相關(guān)系數(shù)中的任意一個(gè),n表示兩個(gè)方言中用于比較的詞項(xiàng)的總數(shù)。(三)方言詞匯的測量細(xì)節(jié)補(bǔ)充計(jì)算兩地方言詞匯的相關(guān)系數(shù)時(shí),本文需要補(bǔ)充幾點(diǎn)王沈計(jì)量法中沒有具體說明的細(xì)節(jié)。1.算法三:直接進(jìn)入較層次結(jié)構(gòu)的a或n其中,語素的比較方法是:首先分別找出用于比較的方言單個(gè)詞項(xiàng)的反映形式i和j的所有語素。然后分析,某語素若是屬于上文中提到的“雙有”情況a,便將其作為比較項(xiàng),標(biāo)記為“1”(“1”表示反映形式存在,“0”表示反映形式不存在?!胺从承问健卑ㄕZ素和構(gòu)詞法兩方面)。若某語素只在i或j中出現(xiàn),則屬于“有無”情況b或“無有”情況c,亦將它們所屬的不同語素作為比較項(xiàng),對具有某語素的反映形式標(biāo)記為“1”,不具有此語素的反映形式標(biāo)記為“0”。最后,按照公式1計(jì)算語素項(xiàng)的相關(guān)系數(shù)。在進(jìn)行構(gòu)詞法的比較時(shí),其依據(jù)是:詞的構(gòu)成形式的三個(gè)層次,如圖1。說明:派生中的“其他”項(xiàng)包括中綴、疊綴等形式比較詞構(gòu)成的層次結(jié)構(gòu),其次序?yàn)閷哟?→層次2→層次1,分析時(shí)以最小區(qū)分特征為區(qū)分點(diǎn)。如果在某一層次結(jié)構(gòu)上,反映形式i和j都具有某種結(jié)構(gòu),便將此結(jié)構(gòu)作為比較項(xiàng),兩者都標(biāo)記為“1”,屬于上文中提到的“雙有”情況a。如果在某一層次結(jié)構(gòu)上反映形式i或j具有某種結(jié)構(gòu),亦將此結(jié)構(gòu)作為比較項(xiàng),把具有此結(jié)構(gòu)的反映形式標(biāo)記為“1”;不具有此結(jié)構(gòu)的反映形式標(biāo)記為“0”,屬于上文提到的“有無”或者“無有”情況。具體實(shí)例參見下文(四)。2.音節(jié)數(shù)量的差異因?yàn)樵谟?jì)量過程中,分析語素項(xiàng)的多少實(shí)際上已經(jīng)體現(xiàn)了音節(jié)數(shù)量的差異。如果再將音節(jié)數(shù)作為一個(gè)要素進(jìn)行分析,就會(huì)產(chǎn)生重復(fù)比較的結(jié)果,使得詞匯比較沒有較好的區(qū)分度,因此在計(jì)量時(shí),不需要將音節(jié)作為分析的要素。3.統(tǒng)計(jì)對象的選取在比較詞和詞組的時(shí)候,語素之間的比較可按照詞與詞的比較方式進(jìn)行。本文不將詞組排除在統(tǒng)計(jì)對象之外,是因?yàn)樵~組在方言詞匯中占有較大的比例,若將這部分詞項(xiàng)刪去的話,最后計(jì)量結(jié)果的準(zhǔn)確性將會(huì)受到影響。而現(xiàn)有的方法其實(shí)完全可以對詞和詞組進(jìn)行計(jì)量分析。4.單獨(dú)求出本人型的相關(guān)系數(shù)在方言詞匯的調(diào)查結(jié)果中,單個(gè)詞項(xiàng)在某種方言里往往具有若干個(gè)反映形式。在計(jì)算這個(gè)詞項(xiàng)的相關(guān)系數(shù)時(shí),不能只將其中的某一個(gè)反映形式和另一個(gè)反映形式進(jìn)行簡單的比較分析。根據(jù)王士元和沈鐘偉先生的意見,在同一詞項(xiàng)有多種反映形式的情況下,可按照以下的方法單獨(dú)求出該詞項(xiàng)在兩種方言中的相關(guān)系數(shù)。他們在文章中提到一個(gè)假設(shè)的例子。該例子的表述方式如表1。說明:1表示有這個(gè)反映形式;0表示無這個(gè)反映形式。方言甲中有反映形式A,而方言乙中也有,即“雙有”情況a=1。方言甲中有反映形式B,而方言乙無,即“有無”情況b=1。方言甲中無反映形式無C,而方言乙中有,即“無有”情況c=1。再根據(jù)公式1計(jì)算Skij=a/(a+b+c)=1/(1+1+1)=1/3。可見,在計(jì)算具有多種反映形式的同一詞項(xiàng)時(shí),應(yīng)先找出該詞項(xiàng)在兩種方言中所有的反映形式,然后根據(jù)這些反映形式分別考察它們的語素和構(gòu)詞法在這兩種方言中的存在形式,確定“雙有”、“有無”和“無有”的情況之后,可得到a、b、c三個(gè)系數(shù)的值,最后根據(jù)公式Skij=a/(a+b+c)求出兩種方言中該詞項(xiàng)的相關(guān)系數(shù)。(四)層次2:以最小區(qū)分特征為區(qū)分點(diǎn)例一:“下雨”這個(gè)詞項(xiàng)在梧州話中反映形式是“落雨”,在倒水話中的反映形式是“落水”,如表2。說明:1表示這個(gè)反映形式存在,0表示這個(gè)反映形式不存在。按層次3向?qū)哟?的順序進(jìn)行比較分析(以最小區(qū)分特征為區(qū)分點(diǎn)),表3同。例二:“小孩”這個(gè)詞項(xiàng)在梧州話中有“細(xì)蚊仔”“細(xì)佬仔”“細(xì)佬哥”三個(gè)反映形式,倒水話有“細(xì)子”“細(xì)子兒”兩種反映形式,如表3?!半p有”即“1—1”的情況為a,“有無”即“1—0”的情況為b,“無有”即“0—1”的情況為c。根據(jù)分析結(jié)果確定a、b、c的值后,由公式1計(jì)算相關(guān)系數(shù)數(shù)值。三、根據(jù)福州方言與倒水方方之間的相關(guān)系數(shù)的測量分析(一)強(qiáng)制改革和調(diào)查材料本文所用方言詞匯材料來源:廣州粵語詞匯——白宛如《廣州方言詞典(現(xiàn)代漢語方言大詞典·分卷)》,江蘇教育出版社1998年版。廣州市地方志編纂委員會(huì)編《廣州市志(卷17社會(huì)卷)》,廣州出版社1999年版。饒秉才,歐陽覺亞,周無忌《廣州話方言詞典》,商務(wù)印書館香港分館1981年版。梧州粵語詞匯——筆者2011年暑假在梧州市區(qū)做的方言調(diào)查材料。輔以梧州市地方志編纂委員會(huì)編《梧州市志》,《梧州史志》編輯部1996年版。倒水粵語詞匯——筆者2010年暑假在倒水鎮(zhèn)做的田野調(diào)查材料。輔以蒼梧縣縣編纂委員會(huì)編《蒼梧縣志》,廣西人民出版社1997年版。(二)增增漢語方言詞匯語法調(diào)查表本文選定的詞量適中,有1300多個(gè)。所選用詞來源于中國社會(huì)科學(xué)院語言研究所方言研究室資料室在《方言》2003年第一期刊出的《漢語方言詞語調(diào)查條目表》,并參照詹伯慧主編《漢語方言及方言調(diào)查》中的第九章“漢語方言詞匯語法調(diào)查表”進(jìn)行增刪。確定后的調(diào)查詞表共有27個(gè)詞類,1300多個(gè)詞項(xiàng),如下頁表4。(三)有形式說明的形式首先,將廣州話、梧州話、倒水話按照方言調(diào)查詞表的詞項(xiàng)一一對應(yīng),以Excel表的形式列出。然后根據(jù)每個(gè)詞項(xiàng)的反映形式進(jìn)行語素和構(gòu)詞法的比較,并賦以相應(yīng)的值。最后,按照公式1計(jì)算單個(gè)詞項(xiàng)的相關(guān)系數(shù),以公式2計(jì)算所有詞項(xiàng)的平均相關(guān)系數(shù)。得到三地方言詞匯的相關(guān)系數(shù)值,可以利用Spss統(tǒng)計(jì)工具來進(jìn)行更深一步的統(tǒng)計(jì)分析。(四)比較測量結(jié)果的分析1.州話和倒水話的比較據(jù)統(tǒng)計(jì),廣州話與梧州話的詞匯平均相關(guān)系數(shù)是0.954,梧州話和倒水話的平均相關(guān)系數(shù)是0.757。廣州話和梧州話的平均相關(guān)系數(shù)高于梧州話和倒水話的相關(guān)系數(shù),說明廣州話和梧州話的詞匯相似度高于梧州話和倒水話的相似度。2.州州各調(diào)查條小型化中的不相同字筆者使用Spss19.0統(tǒng)計(jì)軟件處理廣州話和梧州話的數(shù)據(jù)材料,得出在1321個(gè)調(diào)查條目中,梧州話和廣州話相關(guān)系數(shù)為1(即完全相同)的條目有1210個(gè),占總條目的91.6%,相關(guān)系數(shù)為0(即完全不相同)的條目有6個(gè),占同條目的0.5%,剩余105個(gè)詞項(xiàng)的相關(guān)系數(shù)大于0小于1(即部分相同),它們占總條目的7.9%(如圖2)。說明:相關(guān)系數(shù)為1的占91.6%,相關(guān)系數(shù)為0的占0.5%,相關(guān)系數(shù)大于0小于1的占7.9%。在1321個(gè)調(diào)查條目中,梧州話和倒水話相關(guān)系數(shù)為1(即完全相同)的條目有803個(gè),占總條目的60.8%,相關(guān)系數(shù)為0(即完全不相同)的條目有52個(gè),占同條目的3.9%,剩余466個(gè)詞項(xiàng)的相關(guān)系數(shù)大于0小于1(即部分相同),它們占總條目的35.3%,如圖3。說明:相關(guān)系數(shù)為1的占60.8%,相關(guān)系數(shù)為0的占3.9%,相關(guān)系數(shù)大于0小于1的占35.3%。3.州話—相關(guān)系數(shù)的詞類分布比較分析為了更細(xì)致地揭示梧州話和倒水話的關(guān)系,筆者對不同詞類相關(guān)系數(shù)的分布情況進(jìn)行統(tǒng)計(jì)分析,分別求出了“廣州—梧州”、“梧州—倒水”各詞類相關(guān)系數(shù)的平均值,如圖4。說明:圖中有27個(gè)詞類,上面那條折線為“廣州—梧州”、下面那條為“梧州—倒水”。如圖4所示,廣州話和梧州話的各個(gè)詞類的平均相關(guān)系數(shù)值普遍較高,說明它們高度相關(guān)。而梧州話和倒水話的各個(gè)詞類的平均相關(guān)系數(shù)值起伏較大,且均低于廣州話和梧州話的平均相關(guān)系數(shù),說明梧州話和倒水話的詞匯存在著一定的差異。若將梧州話和倒水話各詞類的平均相關(guān)系數(shù)進(jìn)行分組,大致情況見表5和下頁圖5。如表5所示,在梧州話、倒水話中已有相當(dāng)一部分詞類具有較高的相似度,它們大部分是實(shí)詞,虛詞類詞語的相似度不及實(shí)詞類的高。這說明梧州粵語和周邊的勾漏粵語有較為頻繁的生活接觸,因此,兩種方言的實(shí)詞類詞語更加容易發(fā)生趨同。而圖5中,“梧州—倒水”各詞類的平均相關(guān)系數(shù)分布呈現(xiàn)較為明顯的正態(tài)分布,這說明在梧州話和倒水話詞匯計(jì)量比較中,相關(guān)系數(shù)值的分布有一定的普遍性和規(guī)律性。四、統(tǒng)計(jì)方法一:將使用家庭暴力的詞匯相關(guān)度進(jìn)行定量統(tǒng)計(jì),并將進(jìn)一步明確了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論