



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、網(wǎng)絡(luò)博客中話題選擇的性別差異王宇波(武漢大學(xué) 文學(xué)院,湖北 武漢,430072)wangyubo摘要:本文以國家語言資源監(jiān)測與研究中心網(wǎng)絡(luò)媒體語言分中心的男女各50萬篇博客文本為研究基礎(chǔ),首先探討了男女在話題選擇上的不同傾向,進(jìn)而通過正態(tài)驗證、T檢驗和卡方驗證等手段,從統(tǒng)計學(xué)角度證明了:博客文本中男女話題選擇的差異非常大,具有顯著性。關(guān)鍵詞:網(wǎng)絡(luò)媒體監(jiān)測語料庫;話題;性別差異;實證研究 The Gender Differences of Topic Selection Based on Web BlogsWang Yubo(Wuhan University, College of Chines
2、e Language and Literature, Hubei Wuhan, 430079)wangyuboAbstract: Based on 500,000 pieces web blogs of each gender from Network Media Language Branch of NationalLanguage Monitoring and ResearchCenter, the study firstly investigated male and females different tendencies on the selection of b
3、log topics. Then, by means of normal distribution tests, T-tests, chi square tests, and so on, the paper proved a fact from the angle of statistics that, in blog texts, the gender differences of topic selection were significant.Keywords: Network Media-Monitoring Corpora; Topics; Gender Differences;
4、Empirical Study 1引言關(guān)于男女話語選擇差異的研究,歐美學(xué)界的研究關(guān)注比較早,Klein(1971)、Aries(1976,1982)、Myerhoff(1980)、Wardhaugh(1986)等研究認(rèn)為男性談話的焦點總是圍繞政治、經(jīng)濟(jì)、競爭、體育、商業(yè)及逗樂,女性話題傾向于討論自身、感情、家庭、孩子以及夫妻關(guān)系等。中國關(guān)于男女話語選擇的差異研究起步較晚,多是國外研究成果的總結(jié),很少做有針對性的大范圍調(diào)查研究,確少專門針對國內(nèi)男女話題選擇的實際調(diào)查。并且,由于中外文化的差異,不同文化背景下的男女在話題選擇上表現(xiàn)出的差異必定不同。因此,國外的研究結(jié)論不能充分反映中國男女話語選擇的
5、差異。因此,本文通過對大規(guī)模具有性別屬性的博客語料進(jìn)行調(diào)查,比較男女性話題選擇上的差異是十分必要的。2、話題分類及話題選擇傾向根據(jù)網(wǎng)絡(luò)博客文本特點,把博客主題大致分為27類,對男女各50萬篇的博客文本進(jìn)行文本分類處理進(jìn)行文本分類的博客文本一共是1008755篇,其中男性博客500889篇,女性博客507866篇。,實現(xiàn)步驟如下:第一步:對所有文章進(jìn)行繁簡轉(zhuǎn)化。第二步:用自動化所的分詞軟件對所有文章進(jìn)行分詞。第三步:用正則表達(dá)式和停用詞表過濾已分好詞的博客。第四步:對27個類的訓(xùn)練語料進(jìn)行機(jī)器學(xué)習(xí),統(tǒng)計出27個類的詞頻表。第五步:對27個類的詞頻表進(jìn)行人工后干預(yù),利用專家的領(lǐng)域知識加強(qiáng)出現(xiàn)頻率不
6、高但區(qū)別度很高的專有名詞權(quán)重。第六步:按照樸素貝葉斯算法判斷每篇博客屬于各個類別的后驗概率,取后驗概率最大的類別作為分類結(jié)果。得到各個話題的文本數(shù)。見表1。表1 男女各話題的文本數(shù)男性女性D值差I(lǐng)T數(shù)碼383531748220871兩性生理12510115體育運(yùn)動28710471623994健康醫(yī)療27466160-3414軍事國防16841391545歷史文化56598394820哲學(xué)人生407216312441娛樂追星807118017-9946宗教信仰23612732088家庭生活126634208957-82323工作求職1935972963情感婚姻7065979207-8548政治體
7、育培訓(xùn)597314094-8121文學(xué)藝術(shù)649830723426旅游度假728910506-3217時尚消費(fèi)1571337-1180星座占卜16372035-398雜談15151111592535586汽車房產(chǎn)1204457747法律制度30982672831游戲網(wǎng)游73516996652電視影視15622105325090科學(xué)技術(shù)19532791674經(jīng)濟(jì)財經(jīng)34916332858美容護(hù)膚1972118-1921美食佳肴25627315-47532.1男性話題選擇傾向以男性各話題的文本數(shù)為標(biāo)準(zhǔn),由高到底進(jìn)行降序排列可以看出,對男性而言,雜談是27個話題中文本數(shù)最多
8、的主題類別,占男性文本總數(shù)的30.25%,雜談類是我們在進(jìn)行文本分類時,無法把其歸為其他26個話題類別范圍之內(nèi)的文本,其內(nèi)容通常沒有固定的主題,多為隨感而發(fā)記錄作者心情或發(fā)表對相關(guān)事件人物的簡短的看法,文本通常比較簡短,話語量小。其次是家庭生活,占男性文本總數(shù)的25.28%,感情婚姻占14.11%、IT數(shù)碼占7.66%,談?wù)撟钌俚脑掝}是兩性生理,僅占文本總數(shù)的0.025%。Klein(1971)、Aries(1976,1982)、Myerhoff(1980)、Wardhaugh(1986)、Wardhaugh(1998)、趙蓉暉(2003)等都認(rèn)為,在日常閑聊時,男性傾向于討論政治、法律、體育
9、、經(jīng)濟(jì)相關(guān)的話題,但是從上面的研究數(shù)據(jù)可以發(fā)現(xiàn),男性在網(wǎng)絡(luò)博客中最常討論的話題和日常閑聊討論的話題是有明顯差異的。“雜談、家庭生活、感情婚姻、IT數(shù)碼、體育運(yùn)動”是男性在博客中討論最多的五個話題,約占男性被考察文本總數(shù)的83%,而其他22個話題僅占文本總數(shù)的17%,其中經(jīng)濟(jì)財經(jīng)占0.7%、政治體制占0.27%、法律制度占0.62%。可見,話題的選擇與場景有密切的聯(lián)系,不同的場合,男性對話題的選擇傾向有很大的變化。2.2女性話題選擇傾向以女性各話題的文本數(shù)為標(biāo)準(zhǔn),由高到底進(jìn)行降序排列可以看出,27個話題中,家庭生活是女性談?wù)撟疃嗟闹黝},占女性文本總數(shù)的41.14%,其次是雜談?wù)?2.83%,感情
10、婚姻占15.6%、娛樂追星占3.55%,談?wù)撟钌俚氖莾尚陨?,僅10篇,約占全部文本數(shù)的0.002%。女性在網(wǎng)絡(luò)博客中最常討論的話題和日常閑聊討論的話題沒有明顯差異的。對女性各話題文本數(shù)所占百分比分析后可以看出,男女博客話題選擇的差異與國內(nèi)外對日常閑聊情境下男女話題選擇差異的研究成果不盡相同。主要表現(xiàn)在:以往研究認(rèn)為,在閑聊時,女性才會傾向于選擇與家庭生活,感情婚姻相關(guān)的話題,男性不會。但通過以上研究發(fā)現(xiàn)表明,在博客文本中,男性談?wù)摷彝ド詈透星榛橐鱿嚓P(guān)的內(nèi)容是最主要的幾個話題之一,僅這兩個主題的文本數(shù)就占文本總數(shù)的39%。男女最常探討的前3個話題相同,即家庭生活、雜談、感情婚姻,僅是順序不同
11、,男性以沒有主題內(nèi)容的雜談居首,女性以家庭生活為主題內(nèi)容的話題居首。這也說明,在日常閑聊和網(wǎng)絡(luò)博客兩種不同的交際狀態(tài)下,女男性對話題的選擇是有區(qū)別。3、差異顯著性檢驗-X2(卡方)檢驗以往研究都表明,在日常閑聊時,男女在話題選擇上存在差異。本節(jié)將通過統(tǒng)計學(xué)的方法檢驗博客語料中男女話題選擇的差異是否具有顯著性,即話題選擇的性別差異是否具有統(tǒng)計學(xué)上的意義。3.1差異顯著性檢驗T檢驗是最常用的檢驗數(shù)據(jù)是否具有顯著性差異的假設(shè)檢驗,其前提是數(shù)據(jù)必須符合正態(tài)分布。因此,在進(jìn)行T檢驗之前要進(jìn)行數(shù)據(jù)的正態(tài)驗證。3.2正態(tài)驗證由于兩組話題選擇數(shù)據(jù)是由27對配對數(shù)據(jù)組成,因此要對其進(jìn)行正態(tài)驗證,只需驗證他們的差
12、值d是否符合正態(tài)分布關(guān)于成對T檢驗的前提詳見第十二章第三節(jié)。本節(jié)將利用SPSS(17.0)軟件來輔助驗證男女話題選擇兩組數(shù)據(jù)的差值d是否符合正態(tài)分布。3.2.1 Kolmogorov-Smirnov 檢驗為了檢驗?zāi)信掝}選擇差值d是否符合態(tài)分布,我們應(yīng)用非參數(shù)Kolmogorov-Smirnov 正態(tài)性檢驗方法,借助統(tǒng)計軟件SPSS17.0,得到結(jié)果見表2所示。表2 單樣本 Kolmogorov-Smirnov 檢驗One-Sample Kolmogorov-Smirnov Test差值dN27Normal Parametersa,bMean-259.2593Std. Deviation190
13、95.19102Most Extreme DifferencesAbsolute.269Positive.248Negative-.269Kolmogorov-Smirnov Z1.397Asymp. Sig. (2-tailed).040a. Test distribution is Normal.b. Calculated from data.從上表可知,“近似P值(雙尾)”(Asymp. Sig.(2-tailed)為0.04,小于臨界值0.05,故可認(rèn)為差值d不服從正態(tài)分布。3.2.2散點圖驗證也可以通過繪制Q-Q圖和P-P圖來直觀的判斷差值d是否符合正態(tài)分布。由于P-P圖是根據(jù)變量的
14、累積概率對應(yīng)于所指定的理論分布累積概率繪制的散點圖,用于直觀地檢測樣本數(shù)據(jù)是否符合某一概率分布。如果被檢驗的數(shù)據(jù)符合正態(tài)分布,則代表樣本數(shù)據(jù)的點應(yīng)當(dāng)基本在代表理論分布的對角線上。Q-Q圖的結(jié)果與P-P圖非常相似,只是P-P圖是用分布的累計比,而Q-Q圖用的是分布的分位數(shù)來做檢驗。和P-P圖一樣,如果數(shù)據(jù)為正態(tài)分布,則在Q-Q正態(tài)分布圖中,數(shù)據(jù)點應(yīng)基本在圖中對角線上。從下面的兩圖我們發(fā)現(xiàn),散點并不在對角線上,也說明差值d不符合正態(tài)分布。因此,我們不能對男女話題選擇的兩組數(shù)據(jù)進(jìn)行T檢驗和其他類型的參數(shù)檢驗。3.3非參數(shù)檢驗-卡方驗證由于差值d不符合正態(tài)性分布,不滿足參數(shù)檢驗的前提,因此我們采用非參
15、數(shù)檢驗來驗證男女話題選擇是否具有顯著性差異。非參數(shù)檢驗是不依賴總體分布的統(tǒng)計分析方法,是指在總體不服從正態(tài)分布且分布情況不明時,用來檢驗數(shù)據(jù)資料是否來自同一個總體假設(shè)的一類檢驗方法。當(dāng)參數(shù)檢驗的應(yīng)用條件不能滿足,或有些分組數(shù)據(jù)一端或兩端為不確定數(shù)值時,均要用非參數(shù)檢驗??ǚ津炞C是一種非參數(shù)性驗證,馬廣惠(2003:105)指出“當(dāng)需要檢驗分類數(shù)據(jù)或分組數(shù)據(jù)的分布和這些理論上期望的分布是否一致時,X2是最有效的檢驗方法。”“是語言研究中最常用的一種非參數(shù)驗證之一?!毕旅嫖覀儾捎每ǚ津炞C中的獨立性驗證來檢驗博客文本中話題選擇的性別差異是否具有顯著性。借助統(tǒng)計軟件SPSS17.0,得到卡方驗證的結(jié)果
16、,見表3所示。表3 Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square86702.647a26.000Likelihood Ratio92547.88726.000Linear-by-Linear Association138.7161.000N of Valid Cases1008772a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 67.03.卡方檢驗的結(jié)果通過表3“Chi-Square Tests”中的“
17、Pearson Chi-Square”一欄對應(yīng)的Value值和Asymp.Sig值可以查到,Value值86702.647即是x2值,Asymp.Sig值.000即是計算出的P值。當(dāng)P值小于0.05,說明兩者之間存在顯著性差異。假若P值大于0.05,說明兩者之間沒有顯著性差異。由于獨立性驗證中的自由度df=(r-1)*(K-1),即行的數(shù)目減1乘以列的數(shù)目減1,df=(27-1)*(3-1)=52。查卡方分布表,對應(yīng)的自由度df=52,a=0.05的X2的臨界值為67.50,由于檢驗統(tǒng)計值X2為86702.647,遠(yuǎn)遠(yuǎn)大于臨界值,同時P值為0.000<0.05。因此通過檢驗統(tǒng)計值X2和P
18、值兩者可以判定:博客文本中男女話題選擇的差異非常大,具有顯著性。4、結(jié)論通過上面的調(diào)查可以發(fā)現(xiàn):博客文本中,男女對話題選擇的差異具有顯著性;在網(wǎng)絡(luò)博客和日常閑聊兩種不同的語境下,男性對話題的選擇會有明顯變化,日常閑聊中最常出現(xiàn)的“政治、兩性、經(jīng)濟(jì)、體育”等話題,并不是博客文本中男性最常討論的主題,相反,一直被學(xué)界認(rèn)為在閑聊時男性極少談?wù)摷彝?、情感等話題,卻成了男性在博客中最常見的幾個話題之一。我們認(rèn)為,這是由于博客具有的個人性、即時性、開放性、交換性等多重特征,使得博客明顯不同于日常閑聊時的語境,因此,在日常閑聊和網(wǎng)絡(luò)博客兩種語境下,男性對話題的選擇出現(xiàn)了明顯的變化。當(dāng)然,話題選擇上的性別差異
19、不只限于成年人,在少年兒童中也同樣存在,Brooks-Gunn & W·Matthews(1979)、Gookwin(1990)等分別考察過白人和黑人子女的日常話語狀況,他們發(fā)現(xiàn),白人男孩較多地談?wù)擉w育運(yùn)動、交流各種信息,白人女孩卻較多地談?wù)搶W(xué)校的事情、坦露內(nèi)心思想;黑人男孩比較喜歡宣揚(yáng)自己的“成就”,黑人女孩則更多地議論各自的外貌、打扮和相互之間的關(guān)系。參考文獻(xiàn):(1)賈玉新. 跨文化交際學(xué)M.上海:上海外語教育出版社,1997.(2)趙蓉暉. 語言與性別口語的社會語言學(xué)研究M.上海:上海外語教育出版社, 2003.(3)馬廣惠. 外國語言學(xué)及應(yīng)用語言學(xué)統(tǒng)計方法
20、M.西安: 西北農(nóng)林科技大學(xué)出版社 ,2003.(4)Aries, E. 1976. Interaction patterns and themes of male, female, and mixed groups. Small Group Behaviour, 7, pp. 7-18.(5)Aries, E. 1982. Verbal and nonverbal behavior in single-sex and mix-sex groups. Psychologica
21、l Reports 51, 127-34.(6)Klein, J. 1971. The family in“traditional”working-class England. In M. Anderson(ed.) Sociology of the Family, Baltimore, Penguin.(7)Myerhoff, B. 1980. Number Our Day. New York, Simon & Schuster.(8)Brooks-Gunn, J. & Matthews, W. 1979. He and She: How Children Develop T
22、heir Sex-role Identity. Englewood Cliffs, NJ:Prentice-Hall.(9)Goodwin, M. H. 1990. He-Said-She-Said: Talk as Social Organization among Black Children. Bloomington, Indiana University Press.(10)Fasold, R.The Socialinguistics of LanguageM.北京:外語教學(xué)與研究出版社, 2000. (11)Wardhaugh, R.Introduction to Socialing
23、uisticsM. 北京:外語教學(xué)與研究出版社, 1998.References:(1)Jia yuxin.1997. Intercultural Communication studiesM. Shanghai: Shanghai Foreign Language Education Press.(2)Zhao ronghui. 2003. Language and GenderSociolinguistic Studies on Spoken LanguageM. Shanghai: Shanghai Foreign Language Education Press.(3)Ma guanghui. 2003. Statistical Methods of Foreign Linguistics and Applied LinguisticsM. Xian: Northwest A&F University Press.(4)Aries, E. 1976. Interaction patterns and themes of male, female, and mixed groups. Small Group Behaviour, 7, pp. 7-18.(5)Arie
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國祛斑養(yǎng)顏保健品行業(yè)運(yùn)行狀況及前景趨勢分析報告
- 2025-2030年中國電腦電源市場運(yùn)行動態(tài)與營銷策略研究報告
- 邢臺學(xué)院《工程結(jié)構(gòu)抗震設(shè)計原理》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北民族大學(xué)《數(shù)據(jù)庫原理及應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 云南師范大學(xué)《電力系統(tǒng)分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 武漢科技職業(yè)學(xué)院《動物試驗設(shè)計與統(tǒng)計分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川藝術(shù)職業(yè)學(xué)院《針灸學(xué)(實驗)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安明德理工學(xué)院《產(chǎn)品包裝攝影》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年中國電子煙行業(yè)發(fā)展前景與投資戰(zhàn)略規(guī)劃分析報告
- 貨物學(xué)基礎(chǔ) 課件 項目一 任務(wù)一 貨物的基本概念
- 無人機(jī)法律法規(guī)與安全飛行 第2版空域管理
- 我的小學(xué)生活
- 團(tuán)會:紀(jì)念一二九運(yùn)動
- 《商務(wù)溝通-策略、方法與案例》課件 第三章 書面溝通
- 2024具身大模型關(guān)鍵技術(shù)與應(yīng)用報告-哈爾濱工業(yè)大學(xué)
- 提高瓦屋面太陽能板安裝一次驗收合格率
- 2024上海市房屋租賃合同范本下載
- 安徽省六安市裕安區(qū)六安市獨山中學(xué)2024-2025學(xué)年高一上學(xué)期11月期中生物試題(含答案)
- CSC資助出國博士聯(lián)合培養(yǎng)研修計劃英文-research-plan
評論
0/150
提交評論