基于在線檢測的英文文獻(xiàn)原創(chuàng)與評論_第1頁
基于在線檢測的英文文獻(xiàn)原創(chuàng)與評論_第2頁
基于在線檢測的英文文獻(xiàn)原創(chuàng)與評論_第3頁
基于在線檢測的英文文獻(xiàn)原創(chuàng)與評論_第4頁
基于在線檢測的英文文獻(xiàn)原創(chuàng)與評論_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于在線檢測的英文文獻(xiàn)原創(chuàng)與評論

1反剽竊行為—引言歷史的過程表明,科技作為第一生產(chǎn)力的科學(xué)技術(shù)加速了社會的發(fā)展。歷史文明也揭示了創(chuàng)造精神財富、促進(jìn)科學(xué)進(jìn)步的知識群體的事實。他們中的一些人可能會打破科學(xué)研究的領(lǐng)域,但他們可能會抵抗住一切利益的誘惑,堅持學(xué)術(shù)道德。2008年,英國《自然》的一項調(diào)查報道指出,每年約有3%的研究人員被發(fā)現(xiàn)有科學(xué)上的不端行為,主要表現(xiàn)為偽造數(shù)據(jù)及剽竊,尤其是醫(yī)學(xué)領(lǐng)域的論文剽竊尤為突出。再如,MounirErrami和HaroldGarner對美國醫(yī)學(xué)索引(Medline)數(shù)據(jù)庫中1975年至2005年大約七百萬篇生物醫(yī)學(xué)論文摘要用eTBLAST進(jìn)行分析,發(fā)現(xiàn)平均7萬多篇出現(xiàn)高度的相似,有重復(fù)發(fā)表之嫌,且該現(xiàn)象呈現(xiàn)逐年嚴(yán)重的趨勢;他們還發(fā)現(xiàn)論文重復(fù)率與各個國家發(fā)表的論文數(shù)大致呈正比關(guān)系,在占據(jù)其數(shù)據(jù)庫75%的主要來自美國、日本、德國、中國、英國、意大利、法國和加拿大等國家的論文中,重復(fù)現(xiàn)象令人擔(dān)憂,尤其中國和日本,其論文重復(fù)率是其發(fā)表論文數(shù)所占比例的兩倍多,追溯其原因或許是不同文種的譯制本,以及文化道德標(biāo)準(zhǔn)的差異所致?學(xué)術(shù)剽竊的行為除了表現(xiàn)為抄襲他人的研究成果之外,自我抄襲的現(xiàn)象也不容忽視。Sorokina等人通過對arXiv預(yù)印本網(wǎng)站上284834的文獻(xiàn)進(jìn)行檢測分析,發(fā)現(xiàn)可疑的剽竊和自我抄襲分別占0.2%和10.5%。面對這些學(xué)術(shù)不端行為,除了需要主觀上不斷陶冶情操和提高學(xué)術(shù)修養(yǎng),客觀上應(yīng)該實施遏制舉措。不少學(xué)術(shù)期刊已經(jīng)使用強(qiáng)硬手段規(guī)范作者的行為,例如,規(guī)定在投稿的一定期限內(nèi)不得一稿多投,或者要求簽署版權(quán)委托書等有法律效應(yīng)的合同,一些國際學(xué)術(shù)出版商還采取了不同的措施去發(fā)現(xiàn)并防止這些學(xué)術(shù)不端行為。例如,大多數(shù)的學(xué)術(shù)出版商采用手動搜索或者依靠專業(yè)領(lǐng)域內(nèi)審稿人的經(jīng)驗去判斷所提交的文章有否剽竊行為;英國醫(yī)學(xué)出版集團(tuán)(BMJ)的一些資深編輯通過Google快訊輔助檢查剽竊結(jié)果;愛思唯爾(Elsevier)出版公司發(fā)布了出版道德資源手冊(PERK)為期刊編輯提供即時和廣泛的在線支持。然而,這些方法必須建立在審稿人或編輯對文章內(nèi)容產(chǎn)生懷疑的前提下,知道從何處下手。那么,是否有更有效的方法能達(dá)到有力地反剽竊的目的呢?CrossCheck就是在這樣的背景下出來的一個基于網(wǎng)絡(luò)平臺的自動檢測文檔原創(chuàng)性的反剽竊工具。它是由CrossRef和iParadigms聯(lián)手在iThenticate技術(shù)基礎(chǔ)上研制的,服務(wù)于CrossRef的成員。在國際出版鏈接協(xié)會(ThepublishersInternationalLinkingAssociation-PILA)牽頭下,國際幾大出版商和電子電氣工程師協(xié)會(IEEE)及美國計算機(jī)學(xué)會(ACM)共同參與了這項全球性項目。正是由于CrossCheck能夠在全球范圍內(nèi)最大程度地檢查和防范學(xué)術(shù)剽竊行為,達(dá)到嚴(yán)正學(xué)術(shù)道德,凈化學(xué)術(shù)空氣的目的,使其一舉贏得了全球?qū)W術(shù)與專業(yè)出版者協(xié)會(ALPSP)頒發(fā)的2008年度全球最佳出版創(chuàng)新獎。目前全球會員有50多家,包括一些國際科學(xué)出版集團(tuán)和科學(xué)學(xué)會:自然出版集團(tuán)(NPG),愛思唯爾(Elsevier),施普林格(Springer),威立·布萊克威爾(WileyBlackwell),英國醫(yī)學(xué)期刊出版集團(tuán)(BMJ),泰勒弗朗西斯出版集團(tuán)(Taylor&Francis),美國科學(xué)進(jìn)步協(xié)會(AAAS),美國物理學(xué)會(APS)等。《浙江大學(xué)學(xué)報(英文版)》在國家自然科學(xué)基金的重點期刊項目的資助下,于2008年10月正式成為中國第一家CrossCheck會員。在繼續(xù)堅持全面嚴(yán)格的國際審稿體制的基礎(chǔ)上,把CrossCheck作為學(xué)術(shù)把關(guān)的“第三只眼睛”,與全球的科學(xué)家和出版者們共同合作,為學(xué)術(shù)期刊質(zhì)量和尊嚴(yán)盡職盡責(zé)。下面簡單介紹CrossCheck的工作原理,并結(jié)合工作中所遇到的各種不合理引用和抄襲現(xiàn)象進(jìn)行歸納分析,提出一些問題與同行商榷。24-s型功能和性能2.1資料管理及在線檢驗CrossCheck的工作原理由兩個部分組成:一是基于全球?qū)W術(shù)出版物所組成的龐大文獻(xiàn)資源,包括其儲備的數(shù)據(jù)庫和互聯(lián)網(wǎng)開放共享資源;二是基于網(wǎng)頁的在線檢驗系統(tǒng),將上傳的英文文本與文獻(xiàn)資源作對比,自動在線產(chǎn)生被檢測文本與各匹配文獻(xiàn)相似度的原創(chuàng)性報告。工作人員可據(jù)此報告結(jié)果分析判斷文件的原創(chuàng)性和引用的合理性,進(jìn)而發(fā)現(xiàn)和指出是否有抄襲或剽竊和重復(fù)發(fā)表等各種不端行為,維護(hù)原創(chuàng)作者的著作權(quán)。2.2具體報告的生成CrossCheck的操作簡單易行。其界面如圖1所示,從左到右依次為文件名(Title),相似度報告(Report),作者名(Author),操作日期(Processed)和操作選項(Action)。其中的相似度報告數(shù)據(jù)為該被檢測文獻(xiàn)對應(yīng)的所有對比匹配文獻(xiàn)的相似度的總和,當(dāng)其總量超過50%時,系統(tǒng)會自動顯示黃色背景,提醒操作者的注意。只要點擊其中的相似度數(shù)據(jù),系統(tǒng)便直接進(jìn)入具體報告列表,在此操作者可以對論文具體的“文本重疊”現(xiàn)象進(jìn)行分析判斷。其中,界面的左欄為上傳的被檢測文本,凡與之匹配的對比文獻(xiàn)相似部分系統(tǒng)以相同的顏色和序列號標(biāo)識;右欄的每個單篇匹配文獻(xiàn)的相似度大小順序排列。界面的上方指出了總相似度(SimilarityIndex)和視圖選項(View),含有四種選項:相似度報告(similarityreport)、內(nèi)容追蹤(contenttracking)、概要報告(summaryreport)、和最大匹配(largestmatches)。點擊左欄相似之處,右欄會自動轉(zhuǎn)換成與其匹配的對比文獻(xiàn)全文(不包括圖表),從而對比兩文件之間的具體相似情況;點擊右欄對比文獻(xiàn)處,則進(jìn)入該文獻(xiàn)所在的頁面。如果它屬于開放存取的期刊或者使用者購買了的數(shù)據(jù)庫,則可以查看全文,進(jìn)一步對其中的圖表公式等具體內(nèi)容的相似性進(jìn)行分析。2.3可減少補(bǔ)漏的文件作為在線檢測工具,CrossCheck不需要下載安裝程序,因此不受電腦系統(tǒng)和時間地點的限制;可檢測的英文文件類型多樣,包括Word和WordXML,WordPerfect,RTF,HTML,Text,PostScript以及PDF文檔;檢測速度快,根據(jù)文件的篇幅(50頁以內(nèi))不同,在幾十秒至幾分鐘之內(nèi)便可產(chǎn)生報告結(jié)果;最重要的是,CrossCheck可以對文本全文進(jìn)行比較全面的對比檢查,同時可供對比的資源極其豐富。與其他反剽竊工具相比,CrossCheck有著不可取代的優(yōu)勢,如iThenticate雖然是CrossCheck的技術(shù)基礎(chǔ),但是它只能對文本的前后部分內(nèi)容進(jìn)行檢測,不夠全面;又如eTBLAST檢測對象局限于美國醫(yī)學(xué)索引數(shù)據(jù)庫中的摘要。作為新生事物,CrossCheck不可避免地存在一些不足之處。例如,CrossCheck只能對論文的文本進(jìn)行檢測,而其中的圖片、表格和數(shù)學(xué)公式等則需要操作者進(jìn)一步查找原文進(jìn)行詳細(xì)分析;CrossCheck是對語言表達(dá)的原創(chuàng)性進(jìn)行分析,但它并不能直接發(fā)現(xiàn)內(nèi)容的造假,需要結(jié)合其他的輔助手段進(jìn)一步分析判斷;目前,CrossCheck檢測的文件語言只局限于英文??上驳氖侵袊鴮W(xué)術(shù)期刊(光盤版)電子雜志社和同方知網(wǎng)有限公司聯(lián)合開發(fā)的“科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”(AMLC),可用于檢測中文文獻(xiàn)的不端學(xué)術(shù)現(xiàn)象,彌補(bǔ)其部分不足。3確保收評《浙江大學(xué)學(xué)報(英文版)》自從成為CrossCheck的會員后,一直堅持在國際同行評審和正式發(fā)表之前對論文先后進(jìn)行至少兩次CrossCheck的檢查。我們從以下幾個問題的不同學(xué)術(shù)角度進(jìn)行分析和評注,以求同行共識。3.1論文作者的自我或自我抄襲在幾個月的工作實踐中,我們通過CrossCheck對不同論文體裁相似度標(biāo)準(zhǔn)的初步確定和分析,發(fā)現(xiàn)大多數(shù)的論文作者是秉著嚴(yán)謹(jǐn)治學(xué)的態(tài)度,其論文相似度比較低。然而,約有20%的文章由于各種各樣的原因具有一定程度不合理的摘用他人和自我抄襲等現(xiàn)象,其中約5%的文章甚至涉及剽竊和侵犯版權(quán)之嫌。根據(jù)不同現(xiàn)象的表現(xiàn)形式,我們歸納出以下五種不合理現(xiàn)象。(1)利用資料篩選和資料的新適用的內(nèi)容在CrossCheck檢查中,發(fā)現(xiàn)一些作者為了增加文章發(fā)表的幾率而一稿多投,又或為了增加發(fā)表的文章數(shù),將已經(jīng)有正式書刊號的會議論文集或者電子期刊上發(fā)表過的文章,經(jīng)過略微增減修飾,或原文不變地重新向有關(guān)期刊投稿。這些行為違背了期刊的發(fā)刊原則,損害了多個期刊的利益,造成了出版資源的浪費(fèi)。如,有一篇來自布基納法索和法國某作者的文章經(jīng)過CrossCheck檢查,雖然沒有在正文中發(fā)現(xiàn)明顯的相似度,但是參考文獻(xiàn)完全一致,因而與其中單篇匹配文章的相似度高為18%。異常的現(xiàn)象促使我們進(jìn)一步對其全文的圖表數(shù)據(jù)進(jìn)行詳細(xì)分析對比,發(fā)現(xiàn)該作者一年前曾在某刊上發(fā)表過類似的文章,兩篇論文的重復(fù)性高達(dá)80%,包括一模一樣的三個圖和一個表格數(shù)據(jù),可見完全是舊數(shù)據(jù)、老資料的重新發(fā)表。另外,還有一個代表性例子,我們在CrossCheck平臺上對某一即將發(fā)表的文章進(jìn)行最后的檢查時,發(fā)現(xiàn)完全相同的摘要,進(jìn)而得知該文作者的博士論文專集已經(jīng)在線某國大學(xué)出版社的電子資源庫,而且與其相關(guān)的核心部分已經(jīng)在五年前發(fā)表兩篇論文。雖然作者認(rèn)為現(xiàn)在的投稿是博士論文專集的一部分仍可以發(fā)表,但是我們認(rèn)為學(xué)科具有即時反應(yīng)的特點,經(jīng)過五年的時滯后,論文沒有補(bǔ)充新的進(jìn)展,沒有創(chuàng)新,也就失去了重新發(fā)表的意義。當(dāng)然相關(guān)的界定標(biāo)準(zhǔn)還有待討論。(2)將已經(jīng)發(fā)表的文章作為發(fā)表文章的合理依據(jù)CrossCheck檢查中發(fā)現(xiàn)的另外一種比較典型的現(xiàn)象就是論文作者的自我抄襲或者相互抄襲,不可避免地導(dǎo)致高相似度產(chǎn)生。相當(dāng)一部分作者持有這樣一個觀點,即已經(jīng)在其他刊物發(fā)表過的內(nèi)容,基于同一個研究課題的不同方向,由于采用的材料設(shè)備和方法相同,因此在新投稿中,尤其是引言、材料方法和討論部分重復(fù)使用已經(jīng)發(fā)表的內(nèi)容應(yīng)該是合理的。這種論調(diào)從理論上是經(jīng)不起推敲的,因為已經(jīng)發(fā)表的文章意味著原創(chuàng)內(nèi)容已經(jīng)公諸于眾,再次充填于新文中對作者本人有拼湊之嫌,對期刊來講是浪費(fèi)出版資源,更重要的是對讀者來講,嚴(yán)重地浪費(fèi)了他們的時間去面對這些有失原創(chuàng)水準(zhǔn)的章節(jié)。如果重復(fù)用一些相似的內(nèi)容寫一篇新的論文,何不把兩篇合并成一篇高質(zhì)量的文章發(fā)表呢?愛思唯爾科技部中國區(qū)副總裁安諾杰指出:“研究人員會發(fā)表一系列相似的論文,這對期刊編輯來說是件很痛苦的事情。因為這五篇文章實際上可以寫成一篇很好的文章。在美國或者歐洲卻很少出現(xiàn)這樣的情況,因為當(dāng)科學(xué)官員或者基金官員在查看出版記錄時,他們會看具體的論文,如果發(fā)現(xiàn)五篇論文都有相似的主題和重復(fù)的內(nèi)容,他們會認(rèn)為這樣做是不嚴(yán)肅的”。科學(xué)的重要性不是通過數(shù)最來衡量的,而是要看論文本身的質(zhì)量。(3)自然或自然還有一種現(xiàn)象在生物醫(yī)學(xué)領(lǐng)域的論文中比較常見,如作者直接復(fù)制他人的試驗方法和操作描述,然后在試驗條件和數(shù)據(jù)上更改替換。有些作者堅稱這種試驗方法借用經(jīng)典文獻(xiàn)的表達(dá)是正常的,且在多個期刊上常見。對此,我們與國際同行進(jìn)行了討論,并研究了一些國際知名期刊(如《科學(xué)》(Sciernce)、《自然》(Nature)等),幾乎沒有發(fā)現(xiàn)類似現(xiàn)象。而且在理論上,這種說法也是不合理的。雖然大多數(shù)的科研是在結(jié)合前人研究成果的基礎(chǔ)上,借鑒或重復(fù)他人成功的方法試驗新的材料,探討新的結(jié)果,但是作者在撰寫論文的時候,除了應(yīng)該引用經(jīng)典文獻(xiàn)外,應(yīng)該根據(jù)時間、地點和條件,用自己的語言去描述自己的工作,總結(jié)自己的觀點,因為語言描述也是一種原始創(chuàng)造過程。(4)內(nèi)容與內(nèi)容相近在CrossCheck檢查中發(fā)現(xiàn)有極少數(shù)文章,幾乎全文大部分的內(nèi)容都能找到與之相匹配的對比文獻(xiàn),甚至大段內(nèi)容的相似,甚少用自己的語言描述。造成這種情況很可能是因為作者整篇文章的寫作是靠東抄西湊完成的。這樣的論文反映了作者對待科學(xué)研究極端不嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度。(5)對內(nèi)容“模仿”的誤讀此外,在CrossCheck檢查中還發(fā)現(xiàn)有些作者在引述他人的觀點或者描述他人的科研成果的時候,文章中大段的句子與匹配的對比文件相似,卻沒有文獻(xiàn)出處。這樣會誤導(dǎo)讀者認(rèn)為是作者自己的觀點,極易引起版權(quán)糾紛。這種取向或許是因為作者英文寫作上的先天不足而去模仿他人的表述。他們從主觀上并沒有抄襲之念,只是在寫作的時候沒有做到模仿量的恰如其分。還有一種現(xiàn)象是一些作者認(rèn)為只要注明了文獻(xiàn)出處,就可以直接大塊照抄他人之段落,這些表現(xiàn)在認(rèn)識上有誤區(qū)。哈佛大學(xué)關(guān)于“抄襲”的規(guī)定指出:“如果你的句子與原始資料在觀點和句子結(jié)構(gòu)上都非常相似,并且結(jié)論與引語相近而非用自己的話重述,即使你注明出處,這也是抄襲。你不能簡單地改變原始資料中的幾個詞語或者對其進(jìn)行摘要性重組,你必須用自己的語言和句子結(jié)構(gòu)徹底地重塑你的總結(jié),要不就直接引用。當(dāng)然對于已經(jīng)成為學(xué)術(shù)界的常識經(jīng)典名句、即使不做說明也不會對提出者的歸屬產(chǎn)生誤會的觀點,則可以不注明出處”。3.2相似度的合理引用值得強(qiáng)調(diào)的是,論文體裁不同,其相似程度也有所不同。如研究論文,尤其是以科學(xué)創(chuàng)新和獨特見解為特點的科學(xué)快報,作者在撰寫文章的時候應(yīng)該充分體現(xiàn)出文章的原創(chuàng)性;而綜述性論文是對某學(xué)科歷史和現(xiàn)在的科研成果進(jìn)行總結(jié)評述,并結(jié)合自己的觀點進(jìn)行分析和討論,引用參考文獻(xiàn)較多,因此,論文總相似度較高尚屬合理范疇。但這并不代表可以大量復(fù)制他人的文章段落組合綜述論文,作者除大量邏輯性引用參考文獻(xiàn)支持其觀點之外,主要應(yīng)該用自己的原創(chuàng)語言進(jìn)行闡述和論證,以期達(dá)到學(xué)科領(lǐng)域內(nèi)綜述之引領(lǐng)作用。盡管因為體裁不同,論文的相似度的總量有所不同,但是與單篇匹配文獻(xiàn)的相似度的要求卻是一致的。一般來說,與單篇匹配文獻(xiàn)的文本重疊少(如200個單詞以內(nèi))為合理引用借鑒;如出現(xiàn)大段文字重疊相似,或單篇匹配文獻(xiàn)相似度超過5%,或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論