Smith使用介紹版本_第1頁
Smith使用介紹版本_第2頁
Smith使用介紹版本_第3頁
Smith使用介紹版本_第4頁
Smith使用介紹版本_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、WordSmith使用介紹1. WordSmith介紹這是WordSmith工具控制器的主畫面1WordSmithToob它有四個主要的菜單選項,一個諺語(不斷變化,您可以編輯),主要工具的三個按鈕(Concord是紅色,因為這個工具在使用中),以及一系列的標簽.目前,我們看到它顯示anthony&cleopatra.txt已被選定用做Concord.2.選擇文本文件要選擇文本文件,單擊主控制器中的文件菜單當你單擊選擇文本,你會看到像這樣:在左邊是一個相當標準的文本文件資源管理器中,右邊是一個選中文本區(qū)域.按一下有兩個藍色箭頭的按鈕(如下圖光標處),或拖曳一些文本文件從左至右。您應該會看到類似

2、這樣rhnrajprPMtErhnrajprPMtE目前WordSmith表明(在上圖狀態(tài)欄)7個已被保存.您可以看到文件大小,但WordSmith(還)不知道每個文本文件有多少的詞.我們選擇了Concord的7個文本(見Concord上位于已選文件).按下綠色按鈕或者關閉窗口3. Concord3.1 Concord概況Aconcordance看起來就像這樣:SlConcorcTFieEditViewCaFnule5d:irigfiHdpJCortcoidsflDt|Se1T4qcrtlNoCortcoidsflDt|Se1T4qcrtlNo| |1 11#|1#|% %ESIWhy.hew

3、n&w,kins(i?VIBretorestormyouso?BOITybaltUndBb644omKroninG1id|432 2l l1%he:ar島1w二,HHIij.huihi!Ja-ri-HPiii-ii7nr;rif:iij,AHuwcamitIFiouhilhtr,Mmwrd帆h。也施舊?I10SITIIH。心加wallteaw1.013ornKMcm匚B,ixtl45conaxiztanceahutedoiM匕GWS 胃licnamwmrcbtnelw0 找dau由ATArduMLportH時胤?川巾耽unoc5電叫Pcrwc卜TChtr)1酉1口卜Paneow忸rM。修t宣*

4、cua-fclcjfsl ldealdealVdfekslalionMbliGiUvt依第k k整WIIVWIIV顯w,|,|ConcordConcordfile?availableMartieMartie口IheLiteandDeathofKincJon.口ineLlleofKingHenryY_;har.二jTh已SecondPartolKlrghenry-UTheSecondPartg1KirgIrenry.qFhuThirdFartgfKingHenryVL.Trm即dfofKingRchwdHI.L.TiThfrTragedyofKirgRchsrdl.匐國的團圖ThtFflmods

5、HistoryolThtFflmodsHistoryoltheItheI 甘兒TheFiraPertofKlrwhewIV.IheFirsTheFiraPertofKlrwhewIV.IheFirstPertofKingFertPertofKingFer yVI.TheyVI.TheL L 褥andDearthofandDearthofKincKincJoi.Ihe_ifeofKrJoi.Ihe_ifeofKrigHenryV.tctTheSecondPaloigHenryV.tctTheSecondPalo- -KirgHeKirgHenry.nry.JheSecondPa1TKirsHen

6、ry.33013301323132313031272134313521FoldffFoldffHfenameHfenameSts叫匕姑|UnicodeUnicode叫I IIteiskstIteiskst.mtTanousrist.mtTanousrist.33B07f7MIAMIA 比一.theClHst陽+M-331R?klkl kstkstIhefirstgrt=fIhefirstgrt=f311,2.777 7MskstMskstHitliftanddeat.Hitliftanddeat.279,3.279,3.? ?MskstMskstUitUitliftofkinliftofkin

7、h h. .352,0.352,0. .? ?MsfcstMsfcstUitsecondUitsecondpart.part.3612.3612.? ?CISKStCISKSt.witsecondwitsecondpsrt.psrt.356,6.777 7?.國TieThidPartTieThidPartafafKhgHarryVI.KhgHarryVI.J JTheTrageTheTragefli/fli/ofofKirgRchsrdI.KirgRchsrdI.J JIheTraged/ofKiIheTraged/ofKirgrtchirdrgrtchirdII.II.i3401340129

8、612961413|413|FFIfIfyouyouyouyoucancanwrii*nottsherecnyourtextwrii*nottsherecnyourtextfilefilecolectnn,thensaveyourchcolectnn,thensaveyourchoices(redSavebLttm)asfawurtssoices(redSavebLttm)asfawurtssforforsubsequentsesann?.subsequentsesann?.ItFilesFiles10hid守(57hghght虱stored7filesin1:oldBr(s)(2276KBr

9、te?)FtesseiecfedFtesseiecfed它是所有出現(xiàn)wherefore在RomeoandJuliet的8個文本的concordance.目前只有3項.第一個有644個詞(43%),其源文件是rom06.txt.3.2制作一個Concordance當您按下主控制器Concord按鈕,一個新的Concord工具打開了并出現(xiàn)在Windows任務欄.現(xiàn)在在Concord,選擇File|New.FastExit如果沒有文本文件已選定,會要求您選擇一些.按ChooseTextsNow按鈕.一旦文本被選中,輸入一個合適的SearchWord:在這里,已經(jīng)選擇wherefore作為搜索詞.然后

10、按OK.(3回區(qū))concordance所有wherefore的例子,還在詞前后有一個詞分隔符號,如標點符號,空格等.既然現(xiàn)在我們已經(jīng)做了concordance,WordSmith現(xiàn)在知道每一個文本文件有多少詞:rom06.txt共有1,506次;rom8.txt更大(2,236個單詞).D.beM;5HMESXR0ME0V VmW瓶陽VConcordV V口的3.3查看源文件要查看源文件,雙擊正使用的線.在這里,點擊了突出行包含有whereforeartthouRomeo.1足引網(wǎng)尾,卜Mryt”,kinsman?怕附slormyou60ITybaltUncle,GUg”ATCEOGid43

11、2heai1&her)F5i0Romea,Rameo,tvlii-rKiiieartthaiiRomea?I7fiDenyIhjT31DTiyjjLfnO9,i33,AHowcamffitIhouh尚的JWmBfeGMIMBWI&7Hos1TIIHorchaidwalkaw1j013orriKJctnOS.iirtl4=J(:n-.coid*iceT T即ordNctJordNctJFh|Fh|看concndin曜locdb|dotpatterns|cbileii|Ikrnmea|IQUICQ|力球 ai3就祈daudf口4Ardx*kper七1bgwofgJu巾眈,力伏,力orgRtrwc卜

12、才htr)I理I口口。吊*。Rtrwo.,內(nèi)Mr-for*-FieEditViewCarnuie三吐1%爐Hdp1 1 Concoidsnct|Se1TConcoidsnct|Se1T qcrtlNo.|qcrtlNo.|l lifljiflj% %1E9IWhty,hewn&w,kins(i?愀正怕舊slormQUSO?SOITybaltUHC1BH644omKArDHiDG1ri|4321“r*l*i:1叫rPn|四丐二:iiiiHIi.nhuihik-a1rHRIH-H7Hij1I153Howcamfstlhouliilher!tdlmetandUifrblv?11061Ttiacrch

13、etdvulteaw1j013&ri&c(nD0.itndhaiwmctanowlosotc3曲Concord)Concord)Fi&selectedFolderFilenameFilenameromDl.txtdAH.m口d:Vet.romD3,txtrom04,t)dromOS.tKtd:Mext.rom06,txtrom07,tKtdAtsxt.glTlO&t試Wends27texts0flderj9highlidnledSftc*ed(5E31Ebytesin1folder069033323176笑72126577E297297246686Bz9o036686Bz9o031 1z z回

14、區(qū))回國0sub-foldersO.apfiles喧1RomeoalL148Kb148Kbtx4KD4KD12Kb12Kb5kb5kb5KD5KDFile5日rwihbl已嚼EEm-H雷NameSize31t*srgdaudtIKArdchkper七1bofoniofgairJufeKinoc,力CMTqRcrachtrshtr|I產(chǎn)IQ匚。吊*。fterwe冉MrMos-Concord)Concord)FieEditViewCarnuie三吐1%爐HcHieE*叫 EWEW 匚gpuleWmsHtdp,Mierhebeitricesthe幅沙篦$ingcloudsAnd,值upontlh&h

15、osomofthpAirInertkrowingRomeohtarheriInertkrowingRomeohtarheriDRomeDgIRoirrieojhersforearithouRumeg?Den/thyfatherandrefusethythyname.DiDiififthojwiltnot.thojwiltnot.bebeb billillswornmymylow,ccncordancecolbcates|plotpatternsclusters|uileramesn)urce觸或notesIEsssngdouds1711AndMilsuporthsssngdouds1711An

16、dMilsuporth。banmdbanmdU UIEIE r.Ailirt(mtknowngRoneuhenshvrJlFS0Rcmv/Rnmooj/r.Ailirt(mtknowngRoneuhenshvrJlFS0Rcmv/Rnmooj/或按F8,線會變粗:wherefore,cncwherefore,cncFileEditVievjComputeSettingsHelpConcordancehonourofmyLin115slTostrikehimdeadIholditnot白sin.Capulei(starding)1591Why,hownow,kinsman?Whereforest

17、ormyou與口71601TyballtUncle,thisi與mMantgu&,ourfo9,1511Avillainthati&hithercomein與piteI62IToscornatoursolemnitythisnigM,1631CapuletYoungRomeo,isit?TybaltT由he,thatclouds(7dlAnd甘彳ilmuponth?bosomaltheairJuliet(notknowingRomeohearsher)(751ORomeo,Romeo,wheretoreartthouRomeo?1761Denythy-fatherandresethyname,

18、1771Orifthouwinot,bebutswornmylove,781AndIllnolongerbedCapulet1791Romeo(日 side)ShallIhearmore,orshallIspeakaMontague?11031RomeoNeilher,fairmaid,ileithertheedislike.11041JulietHowearnstthouhither,tellme,andwherefore?n051Theorchardwallsarehighandhardtoclimb,11061Andtheplacedeath,consideringwhothouart,

19、11071Ifanyofmykinsmenfindtheehere.11081RomeoWithloveslightwingsdidIHUconcordanceF F 融匚盯口: 匚 LI 二。 ; fil?rijTi?::口 I, 。 匚,te 打 r-lotot? ?SetSetassingclouds1741And&ail$uponthiebosomnFtiieair.Juliet(notknoRAingRone口hear:或把有興趣d的線拉長或拉粗:將光標放在左欄的2和3數(shù)目之間,它改變形狀:hlConcordance1591Why,hownow,kinsmar?Whereforesl

20、ormyouso?IbOITybaltUnclt1hearsher)17510Romeo,Romeo,whercloreartthouRomeo?1761DenythyHuwcamst1houIhithier,tellme,andwherelbre?11051Theorchardwallsare再拉下來.國wherefore,cncwherefore,cncFileEditViewComputeSettingsHelpN011???11 日口匚日 Net1591Why,hownovu.kinsman?Whereforestormyouso?16(31TybaltUncle,dwmgedmess

21、engerofheaven1711Untothewhiteupturnedworidringeyes1721Ofmortalsthatfallhacktogazaonhim1731Whenhebestridesthelazy-passingclouds1741Andsailsuponthebosomofiheair.Juliet(noiknowingRomeohearsher)17510Romeo,Rameo,whereforeartthouRomeo?1761Denythyfatherandrefusethyname.1771Orifthouwiltnot,hebutawommyhve,17

22、81AndIllnolongerbeaCapulet.1791Romeo(asida)ShallIhearmore,orshallIspeakatthis71801JulietTisbutthynamethatismyenemy.1611Thouartthyself.Howcamstthouhither,tellm序andwherefore?I1O5ITheorchardwallsareconcordance口lot口白,clustB餐filendMEB|soiMGetextJnot。呂也可以把光標放在右邊緣后再拉粗,就在Set的左邊.3.4 Collocates和MutualInformat

23、ion以下是AGO的collocates,用BNC的書面部分計算所得,按頻率排序.Set目5引ngclauds1741Andailsuponthebooinnoftheair-Jufiet(notknowingRcFileEditVievjCompete三日ttinqsHelpNWordWithRelationTotaltaiLgfl|A1 1AGO;明口12,40316.7B5472 2HENSLEY孫。W.631513)AEONS9.S791184FORTNIGHT羽。9.3361211215YEARSaPio9.2W9,0339,9366MOONS明。B84C13121WEEKS期。87

24、541,0471.0298SEASONSaio854881ei9MILLENNIA日加8.6129910MONTHSacio8.3071,3831,36711,MOMENTS明白8.36717917812UNTHINKABLEago8128181513DECADE就。7.9391651EJ14COUPLEago76973G034215TWENTY被。7.668J0538716CENTURIES日印759212612317TEN州。752140546816FIFTY即Q7.50D13312719THac|o7.4951020MOOTED口和7.4715521日 GHTEENaqo7.46654S

25、O22,INCEPTION明。7.427923HUNDREDago7.34325024124FIFTEENacio7.342979 95 5nA Ah hILLIILLIn n二nY=Matches*MutudInformationColoc-atesF10并選擇一個合適的詞表來做比較16,689SetAGOconcordanceallocatesPtpatternsdustersfilenamessourcet由tnotes有AGO的實例近17000個,并且YEARS是首位搭配,9000次鄰現(xiàn)于AGO.關系欄為空,此時只能用頻率對每欄進行排序,或按照詞的字母順序排序.所需的是要知道所有這些c

26、ollocates,每個與AGO關系有多緊密.是否A,THE,WAS等等,真的與AGO關系緊密?如果我們現(xiàn)在選擇菜單計算|MutualInformation,ConfirmFilenameConfirmFilenameC:uvsrnith4.woidlistMoncwritlen.1stHelp:CartelCartel; ;如那么,我們得到以下列表,排序時按關系欄:囹“ECm,匚j區(qū)FieEditViwjCompete5汛i叫5helpNWordWithRelationTotaltaiLeft|;1 1AGO:明。12,40316,785472 2HENSLEY羽。W.S315 513AEO

27、NSaC|09.8791134FORTNIGHT羽。9.3361211216YEARS期口9.2W9.D339,9356MOONS羽口884013127WEEKS日加87541,0471,0296SEASONSaio8.5488 81 1819MILLEMN1A日股8.6129910MONTHSa(io63071,3931,367HiMOMENTS臥8.36717917312UNTHINKABLEaPioS.1281815_13DECADE明)7.93916516J14COUPLEap|o769?3B0342J5TWENTYaqo7.668JOS38716CENTURIES那7.5921261

28、2317TEN7521J0546816FIFTY破口7.50013312719TH破口749510D20MOOTED即Q7.4715521曰 GHTEEN的口7.46654印22INCEPTION明口7.4279B23HUNDREDHUNDREDacio7.343250241_24FIFTEEN翅。7.3429795AilrrI上hLILIn-rnLiconcordanceccllccat&splotpatternsfilen-anesscarceriotes16,689Set此。列表前面幾項能更好地反映AGO隨著時間和數(shù)量的趨勢.首位搭配(HENSLEY)只有5次同現(xiàn)于AGO(BNC書面部分

29、共有17次).3.5使用標注Concordancing如果您的源文件有標注,可要做的第一件事是讓WordSmith知道.要做到這一點,在主控制能,選Settings|AdjustSettingsAdjustSettingsAdjustSettings然后,選TagsandMark-up如果您使用的是英國國家語料庫,在Customsettings里選它,如上所示.然后選Entityfile如果不想見eacute;不選6及類似的,再按Load:ConcordFieFieEditVie*vCoinpMteSettingsHelpNConcordanceTheArts:Talesouto1school

30、Eiy9WH12J3JIU1ennethClarke,theSecretaryofStateforEducation,onElectionCElectionCalllastFriday,talkingcwPRPaboutteachers.Atthisriousthing,havingaradioprogrammePRPanlelevision,butthisRadio,butthisRadio4jointproductionwitliBEC1hasshownhowhasshownhowneatlyitcanworkintherighthands.Thepriorities:clerqjesii

31、ons;answersPPPtothepoint;anyspaceleeblsandtheanswersare,asinacooker/demonstrationclearlypreparedearlier,wPRPOnKingStreetJunior(Radio.Theschoolsecretarywaslookingforotherjobstosupplemenlpacket,therewasntenoughmoneyinthebudgettQpayforthetoteachthenewcurriculum,testsPRPforseen-/ear-oldswerebiii,Nowhewr

32、itesfull-line,PRPfortelevisionaswallasradivIcancordanice.:collocates而206206patternsdutaishlenamesIsourcetetnates你看到的介t和標注(但沒有任何其他標記).4. Wordlist4.1詞表WordSmithTools的詞表像這樣的到目前為止,我們已告訴控制器,忽略以尖括號開始和結束的所有標簽(),把幾個實體引用翻譯成符號,如和,并且刪除了每個文本的題頭(直到).作為一個開端,已經(jīng)不錯了.現(xiàn)在,我們對詞類做concordance.BNC使用的標記,如下所示:atthegreathouse

33、s所以每個介詞標記為在介詞本身前.目的是要看到在BNC選定的文字的所有的介詞.選定一個BNC文本文件后,鍵入*作為搜索詞(星號是必要的,因為一個詞直接在詞類標簽后)并按下OK.WordSmith檢查角括弧內(nèi)是否是文字或標注始標記:在這里,我們選No.再次按下OK.這表明每個單詞在文本文件了出現(xiàn)的頻率,其在文本詞匯中所占比例,以及每個單詞在多少的文本文件中出現(xiàn).4.2制作單詞列表要制作單詞列表,先按WordList按鈕,在主控制器.WordList啟動后,選擇文本然后你會看到這樣的在 這 里 , 我 們 要 作 出 一 個 基 于8文 本 文 件 簡 單 的 詞 列 表 , 文 本 來 自 戲

34、劇R o m e o a n d J u l i e t ,按MakeawordlistnowWordListtool顯示一個頻率列表.最常用的詞是#.有985個#.怎么回事?原來,#在默認情況下被用來代表任何數(shù)字,如65,40或$997.82.在#下,最常見的詞是the,and,Ito,of.旁邊,你可以看到它在我們使用的8文本里的頻率,每個詞的百分比,以及每個詞在8個文本中出現(xiàn)的次數(shù).好彳I的頻率最高,但在8個文本中卻沒有出現(xiàn).要按字母順序排列看詞,請按一下窗口底部附近的alphabetical標簽.現(xiàn)在,向下滾動到wherefore.結果似乎證實了我們做concordance的發(fā)現(xiàn).4.

35、3 Concordancing選定詞一旦你在屏幕上得到了一個詞表,您可能希望看到一些詞所在的語境.選擇一個字(或多個)并選擇計算|Concordance您會得到像這樣(如果制作詞表時的原始文本仍在原位):ConcordFieEditV網(wǎng)ComputeSettingsHelp2122232425262728303132Concordancetwo-tiersystemoftreatmentbetweenpatientsoffundholdersandscouldnotbetendedtoHIpatients.Doctorshw%neveranotherthoroughlydispiritingt

36、imelorpatients,andforthose*/howorkewhichcuUpariientstimeinhaspikhavespentmostofherlifeinhospitaThankstoPeterboroughsHospitafewdaysinihelocaldistricth 口即ita;AtfirstIplannedtostayinhospita:arefullyco-ardmaiedbetweenpatients,hospitaentsarebeingdischargedsojnerfromhospitanhasbeententativeinexpsandinghms

37、pitachildrenwhospendlangperiodsinhospitaSiwdah;andsavesmone.ShewasbornwithatHome(HAH)system,.IVluichofiercarswithJessica,butthishasdoctorsandv/iththeAdvancesinkeyholeservicesirrtothehome,hsledtcsomedevelopmentscanccifdancecollocatesplotpatternsdu&taisFilenamessourcetestnotes474.4lemmatising要手動進行l(wèi)emm

38、atise,用屏幕上的單詞列表把它拖到您想加入到的線上NWordFreq%Texts%ernmas|SetAB4ABBOT540.01屋65ABBOTS31的ABBOTSTOWN3 330.01ABBOTT1080.0368ABBOTTS0330.01田ABBY650.027口ABC22130.0571ABCS1 1172ABDEL440.0173ABDELBASET330.0174ABDELBASGET1 1175ABDICATE99D.03而ABDICATED330.01v v| |再放開:你會看到總數(shù)的變化并且Lemmas欄中的項目為可見如果有很多,您可以雙擊Lemmas欄看到詳細資料L

39、emmdfcrms 區(qū)IABBOTTIOAPBCTTSsAEBCTSIOWN34.5詞表統(tǒng)計4.6多詞單元用二或三個詞(n-grams)制作詞表,如OFTHEINTHEENDONCEUPONATIME等等,你先要計算一個索引文件.這主要是表明每一個單獨的詞在您的語料庫的位置制作一個多詞詞表,你得到像這樣的結果NWordFreq%Texts%?_1ONEOFTHE:1,2080.0438379.792ALOTOF7470.0321345.423THEENDOF7170.0330162714aiJTOFWE53000225152.295PERCENTOF52520.0217035.4235.42目

40、THEREISA5060.0225553137PARTOFTHE5030.0224651.258SOMEOFTHE4540.022344675ASWELLAS4620.0223047.9212THEFACTTHAT4670.02225463011ENDOFTHE44500223248.3312BEABLETO4330.0219039.5812ATTHEEND4150.0122146.041IDONTKMOW3930.0111924.79ITWOULDBE3880.0119741.04L_TOBEA3830.0123743.33THEENDOFTHE3B20.01215447918ANUMBER

41、OF3670011753646ITWASA3620.0119139.792THEREISNO3520.0121043754375irisA3490.0121043.75ATTHEENDOF3470.012034229GOINGTOBE34J0.0114B30.33Z1THEREWASA3290.011623375西1DONTTHINK3220.01129268926INTERMSOF3120.0111324.532THERESTOF3000.0118939.17定IITISNOT2940.0118237.9229ATTHEMOMENT2870.0112326,673口INTHEFIRST2711593313按Ctrl/F2保存它,提示的文件名類似于_index_3-5-wordclusters.在以后可以作為一個普通的詞表打開它.5.KeyWordsWordSmithTools的關鍵詞列表像這樣的.該關鍵詞是與某種參考語料比較,其出現(xiàn)頻率很高的詞關鍵詞旁邊有不同的數(shù)字,告訴您每一個詞在源文本的頻率,以及與參考語料相比的頻率在上述列表中,與英國國家語料庫相比,戲劇RomeoandJuliet的8個文本有許多主要人物的名字,和一些古語詞,如thou、thee、和love.要制作關鍵詞列表,首先按Keywords按鈕,在主控制器.當Keyword

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論