論文抄襲是學(xué)術(shù)不端的常見(jiàn)辦法,學(xué)術(shù)不端論文查重體系確實(shí)對(duì)檢測(cè)中文論文的內(nèi)容重復(fù)情況具有重要的實(shí)用價(jià)值,也對(duì)部分學(xué)術(shù)不端者起到了震懾效果。本研討對(duì)山東省部分高校4年間9000多篇職稱(chēng)評(píng)定論文查重成果的計(jì)算剖析,部分地反映了當(dāng)前山東省高校學(xué)術(shù)論文的學(xué)術(shù)不端實(shí)在情況。小
中國(guó)學(xué)術(shù)不端論文檢測(cè)體系本身還存在一些問(wèn)題,這就需求檢測(cè)人員以高度的責(zé)任心對(duì)檢測(cè)陳述細(xì)心解讀,審慎出具檢測(cè)定論。一起也提示檢測(cè)陳述的運(yùn)用組織有必要合理運(yùn)用陳述成果,必要時(shí)應(yīng)進(jìn)行人工的學(xué)術(shù)判定,而不能只關(guān)注檢測(cè)陳述的數(shù)據(jù)?,F(xiàn)在學(xué)術(shù)不端論文檢測(cè)體系不能徹底替代人工比照,仍存在較多檢測(cè)盲區(qū),現(xiàn)就筆者運(yùn)用過(guò)程中發(fā)現(xiàn)關(guān)于“學(xué)術(shù)不端論文檢測(cè)體系存在的幾點(diǎn)問(wèn)題”,具體問(wèn)題列舉如下:
1、合理引證與抄襲的區(qū)別
引證政府文件、領(lǐng)導(dǎo)人說(shuō)話(huà)、權(quán)威作品、前史材料、法律法規(guī)、確診效果規(guī)范、操作規(guī)程等,被誤判為階段抄襲或句子抄襲,導(dǎo)致文字仿制比偏高。生物醫(yī)學(xué)范疇的論文,許多研討辦法和臨床治療計(jì)劃是類(lèi)似的,并且論文的格局根本都是固定的,句子較為簡(jiǎn)略和通用,如:選用SPSS計(jì)算軟件剖析數(shù)據(jù),計(jì)量材料以X±S表明,組間比較選用t查驗(yàn);計(jì)數(shù)材料組間比較選用X2查驗(yàn);P<0.05為差異有計(jì)算學(xué)意義。同一方向的研討往往查詢(xún)的文獻(xiàn)相同、選用的技能和辦法共同,就連在術(shù)語(yǔ)的運(yùn)用和言語(yǔ)的表達(dá)上也簡(jiǎn)單形成重復(fù)。同一作者在前期研討的基礎(chǔ)上持續(xù)深化,后期文章中前語(yǔ)文字、研討辦法、研討儀器、所用材料、計(jì)算學(xué)剖析等許多文字說(shuō)明與前期文章共同,甚至?xí)C前期文章中的數(shù)據(jù)。中醫(yī)藥類(lèi)論文常常引證經(jīng)典句子,學(xué)術(shù)不端檢測(cè)體系尚不能辨認(rèn)這些句子出自經(jīng)典作品。因而,醫(yī)學(xué)類(lèi)文章簡(jiǎn)單呈現(xiàn)文字重復(fù),導(dǎo)致文字仿制比偏高。也有的論文全體文字仿制比偏高,但核心內(nèi)容根本不重復(fù),利用這些體系檢測(cè)醫(yī)學(xué)論文的時(shí)候可能會(huì)呈現(xiàn)檢測(cè)成果“假陽(yáng)性”。學(xué)術(shù)不端檢測(cè)體系遏止了明火執(zhí)仗的抄襲、剽竊,但對(duì)文明開(kāi)展產(chǎn)生了負(fù)面影響。根據(jù)《作品權(quán)法》作者有引證的權(quán)力,體系卻不能保證。此類(lèi)情況應(yīng)由同行評(píng)議的辦法進(jìn)行彌補(bǔ)評(píng)議。
2、學(xué)術(shù)不端查重體系錄入文獻(xiàn)完好性問(wèn)題
cnki、萬(wàn)方、維普數(shù)據(jù)庫(kù)與國(guó)內(nèi)很多期刊均有協(xié)作,但三家數(shù)據(jù)庫(kù)所錄入的期刊并不徹底重合。形成各家錄入論文存在差異性,導(dǎo)致學(xué)術(shù)不端檢測(cè)的成果呈現(xiàn)差異。假如抄襲了回溯建庫(kù)之前的文獻(xiàn),則數(shù)據(jù)庫(kù)無(wú)法查實(shí)。并且cnki、萬(wàn)方數(shù)據(jù)都別離與部分科技期刊編輯部簽訂了獨(dú)家協(xié)作協(xié)議,意味著該刊的所有文獻(xiàn)只能在各自的數(shù)據(jù)庫(kù)中檢索到,形成其他數(shù)據(jù)庫(kù)的計(jì)算源文獻(xiàn)的缺失。此外,現(xiàn)在學(xué)術(shù)不端檢測(cè)體系對(duì)圖書(shū)的錄入還有很大空缺,假如論文抄襲的是圖書(shū)內(nèi)容,現(xiàn)有體系無(wú)法檢測(cè)出來(lái)。
3、檢測(cè)技能問(wèn)題
各檢測(cè)體系在工作辦法、后臺(tái)數(shù)據(jù)庫(kù)、算法特色(對(duì)論文要害語(yǔ)義片斷辨認(rèn)檢測(cè)、字段辨認(rèn)、近義同義辨認(rèn))等方面都存在差異,這些在技能上的不同,會(huì)形成不同的檢測(cè)體系對(duì)同一篇論文檢測(cè)時(shí),得出不同的定論成果,并且有時(shí)差異較大。有抄襲者針對(duì)檢測(cè)體系的檢測(cè)原理研討出“反反抄襲”辦法,把論文寫(xiě)作變成了文字游戲,經(jīng)過(guò)對(duì)句子次序的調(diào)整、近義詞替換、句子表達(dá)辦法的變化而逃避體系的檢測(cè)。更有甚者將外文文獻(xiàn)翻譯成中文后宣布,或?qū)⒆约旱闹形母寮g成英文再投稿。學(xué)術(shù)不端論文檢測(cè)體系在技能上只能檢測(cè)“文字”而不能檢測(cè)“思維”,然后只能避免“文字”抄襲而不能避免“思維”抄襲的缺點(diǎn)。此時(shí)需求經(jīng)過(guò)同行評(píng)議的辦法進(jìn)行彌補(bǔ)評(píng)議。
4、文字辨認(rèn)過(guò)失
關(guān)于同一篇論文,運(yùn)用Word版與PDF版別進(jìn)行檢測(cè)會(huì)得到顯著的論文重復(fù)率的不同,這主要由兩者文字辨認(rèn)率不同引起。一起在檢測(cè)陳述中有時(shí)也會(huì)呈現(xiàn)亂碼,也是由于提交的PDF版別論文或數(shù)據(jù)庫(kù)中論文的文字變換過(guò)失所導(dǎo)致。
5、轉(zhuǎn)頁(yè)文字處理過(guò)錯(cuò)
兩篇論文共用一頁(yè)或同一篇論文排版標(biāo)識(shí)為下轉(zhuǎn)某一頁(yè)時(shí),檢測(cè)成果可能呈現(xiàn)被學(xué)術(shù)不端論文檢測(cè)與其本身重復(fù)或同一文字誤作兩篇的過(guò)錯(cuò),直接導(dǎo)致仿制比增高,有必要人工予以辨別。
6、外文論文檢測(cè)水平需進(jìn)步和打破
在檢測(cè)中發(fā)現(xiàn)現(xiàn)在外文論文檢測(cè)成果仿制比較低,這與檢測(cè)體系錄入外文文獻(xiàn)底層數(shù)據(jù)不足、規(guī)模受限有關(guān),較低的仿制比并不能反映出論文的實(shí)在質(zhì)量水平。
7、檢測(cè)陳述閱讀、解說(shuō)
因檢測(cè)體系沒(méi)有完善,檢測(cè)陳述中可能存在其他問(wèn)題,部分外文會(huì)議論文未標(biāo)引作者,同作者提交的期刊論文重合部分無(wú)法掃除;⑵參考文獻(xiàn)與其他論文的參考文獻(xiàn)重合,也計(jì)入了總重合率(盡管體系中有“去除參考文獻(xiàn)后仿制比”目標(biāo),可是有的參考文獻(xiàn)未被辨認(rèn));⑶外文名字不能自動(dòng)辨認(rèn),如Xiao Yong SUN VS Xiao-Yong Sun;文字辨認(rèn)過(guò)錯(cuò),筆者曾檢測(cè)過(guò)一篇論文,檢測(cè)陳述顯現(xiàn)“去除自己學(xué)位論文會(huì)議論文文獻(xiàn)仿制比”為43.4%,“單篇最大文字仿制比”為18.4%。后與原文比照發(fā)現(xiàn)檢測(cè)字?jǐn)?shù)為376字,與原文變換為文本后的4001字不同較大,故考慮為學(xué)術(shù)不端論文查重體系文字變換有誤。咨詢(xún)相關(guān)技能人員解說(shuō)為:錄入數(shù)據(jù)加工問(wèn)題所致體系無(wú)法讀取原文。后經(jīng)該論文以PDF格局原文上傳檢測(cè),其成果“去除自己學(xué)位論文會(huì)議論文文獻(xiàn)仿制比”為0.9%,“單篇最大文字仿制比”為0.9%。
本文由可以自動(dòng)改重的論文查重系統(tǒng)paperbye整理。