論文查重是根據(jù)什么來判斷重復(fù)?
目前高校使用率最高的論文查重系統(tǒng)是知網(wǎng),那對(duì)于論文查重率,很多人也存在著各種疑問,論文查重到底是根據(jù)什么來判斷重復(fù)的?
首先系統(tǒng)按照換行符來把文章切分成段落,其次按照標(biāo)點(diǎn)符號(hào)把段落分成句子,最后再分別把句子進(jìn)行檢測(cè)。論文的查重粒度是句子,2個(gè)句子的相似度主要取決于句子包含的詞和詞在句子中的位置?,F(xiàn)在句子相似度還只有文字上的對(duì)比,沒有考慮語(yǔ)義上的相似,如果做到語(yǔ)義上的查重,那就沒辦法改重了。
總體相似度=相似字?jǐn)?shù)/檢測(cè)字,被系統(tǒng)自動(dòng)識(shí)別出來的非正文部分(如目錄,標(biāo)題,公式,圖表,參考文獻(xiàn)等)不參與檢測(cè),檢測(cè)字?jǐn)?shù)一般略小于論文字?jǐn)?shù)。相似字?jǐn)?shù)=(句子1字?jǐn)?shù)*句子1相似度+句子2字?jǐn)?shù)*句子2相似度+......+句子n字?jǐn)?shù)*句子n相似度),句子相似度范圍0.00~1.00,綠色句子相似度按照0計(jì)算。
1、一般知網(wǎng)查重只檢測(cè)文字部分,并且最多的是識(shí)別引用內(nèi)容與表格數(shù)據(jù),但對(duì)于圖片、編輯后的公式、代碼是檢測(cè)不到的,所以大家在查重時(shí)可以注意下這些。
2、在知網(wǎng)查重系統(tǒng)后,抄襲內(nèi)容會(huì)用紅色字體標(biāo)注,引用內(nèi)容會(huì)用綠色標(biāo)注,不檢測(cè)的部分用灰色標(biāo)注。
3、表格數(shù)據(jù)中的內(nèi)容知網(wǎng)是會(huì)進(jìn)行對(duì)比的,但對(duì)固定的數(shù)據(jù)結(jié)果或公式來說,有時(shí)候沒辦法做到原創(chuàng),這個(gè)是沒辦法的,被查出來后我們只能等待之后的判定。
4、一般知網(wǎng)查重系統(tǒng)都是以章節(jié)為單位來進(jìn)行檢測(cè)的,例如封面、摘要、第一章、第二章等內(nèi)容都會(huì)進(jìn)行劃分,以此顯示出詳細(xì)的抄襲與查重結(jié)果。對(duì)許多高校來說并不只是看最終結(jié)果,還會(huì)看其中一些區(qū)域劃分的抄襲率是多少,但也不能超過。
5、對(duì)于參考文獻(xiàn)的引用,有的學(xué)校也會(huì)計(jì)入重復(fù)率的,所以在引用文獻(xiàn)內(nèi)容時(shí),盡可能不要過多。
6、知網(wǎng)查重的算法是“13字與其他內(nèi)容相似”就會(huì)被判定為抄襲,實(shí)際上這個(gè)算法官方也沒有給出準(zhǔn)確的答案,有時(shí)發(fā)現(xiàn)7-8個(gè)字也會(huì)判定為重復(fù)。
7、知網(wǎng)的數(shù)據(jù)庫(kù)是非常廣泛的,其中包含了網(wǎng)絡(luò)文獻(xiàn)庫(kù),例如百度文庫(kù)、某些知名論壇的帖子等,所以抄襲的同學(xué)建議還是放棄這個(gè)想法吧。
8、知網(wǎng)查重系統(tǒng)并不是什么神秘的軟件,也不能保證100%查重準(zhǔn)確,知網(wǎng)只能作為一個(gè)重復(fù)內(nèi)容參考的工具,這就跟我們使用的操作系統(tǒng)一樣,也不能保證100%不會(huì)出錯(cuò)。
2019-11-19 | 作者:paperfree
相關(guān)文章
畢業(yè)論文的寫作步驟有哪些? 職稱論文過了查重就能發(fā)表了嗎? 畢業(yè)論文降重語(yǔ)序不對(duì)能過嗎? 碩士論文查重是否會(huì)去查緒論部分的重復(fù)率? 為什么論文抄襲不能完全根除呢? 畢業(yè)論文開題報(bào)告的作用是什么? 每個(gè)學(xué)校的論文查重范圍標(biāo)準(zhǔn)都是一樣的嗎?上一篇: 畢業(yè)論文查重該從哪里著手? 下一篇: 為什么英文論文檢測(cè)出來的重復(fù)率很低?