論文查重是根據(jù)什么來判斷重復?
目前高校使用率最高的論文查重系統(tǒng)是知網(wǎng),那對于論文查重率,很多人也存在著各種疑問,論文查重到底是根據(jù)什么來判斷重復的?
首先系統(tǒng)按照換行符來把文章切分成段落,其次按照標點符號把段落分成句子,最后再分別把句子進行檢測。論文的查重粒度是句子,2個句子的相似度主要取決于句子包含的詞和詞在句子中的位置。現(xiàn)在句子相似度還只有文字上的對比,沒有考慮語義上的相似,如果做到語義上的查重,那就沒辦法改重了。
總體相似度=相似字數(shù)/檢測字,被系統(tǒng)自動識別出來的非正文部分(如目錄,標題,公式,圖表,參考文獻等)不參與檢測,檢測字數(shù)一般略小于論文字數(shù)。相似字數(shù)=(句子1字數(shù)*句子1相似度+句子2字數(shù)*句子2相似度+......+句子n字數(shù)*句子n相似度),句子相似度范圍0.00~1.00,綠色句子相似度按照0計算。
1、一般知網(wǎng)查重只檢測文字部分,并且最多的是識別引用內容與表格數(shù)據(jù),但對于圖片、編輯后的公式、代碼是檢測不到的,所以大家在查重時可以注意下這些。
2、在知網(wǎng)查重系統(tǒng)后,抄襲內容會用紅色字體標注,引用內容會用綠色標注,不檢測的部分用灰色標注。
3、表格數(shù)據(jù)中的內容知網(wǎng)是會進行對比的,但對固定的數(shù)據(jù)結果或公式來說,有時候沒辦法做到原創(chuàng),這個是沒辦法的,被查出來后我們只能等待之后的判定。
4、一般知網(wǎng)查重系統(tǒng)都是以章節(jié)為單位來進行檢測的,例如封面、摘要、第一章、第二章等內容都會進行劃分,以此顯示出詳細的抄襲與查重結果。對許多高校來說并不只是看最終結果,還會看其中一些區(qū)域劃分的抄襲率是多少,但也不能超過。
5、對于參考文獻的引用,有的學校也會計入重復率的,所以在引用文獻內容時,盡可能不要過多。
6、知網(wǎng)查重的算法是“13字與其他內容相似”就會被判定為抄襲,實際上這個算法官方也沒有給出準確的答案,有時發(fā)現(xiàn)7-8個字也會判定為重復。
7、知網(wǎng)的數(shù)據(jù)庫是非常廣泛的,其中包含了網(wǎng)絡文獻庫,例如百度文庫、某些知名論壇的帖子等,所以抄襲的同學建議還是放棄這個想法吧。
8、知網(wǎng)查重系統(tǒng)并不是什么神秘的軟件,也不能保證100%查重準確,知網(wǎng)只能作為一個重復內容參考的工具,這就跟我們使用的操作系統(tǒng)一樣,也不能保證100%不會出錯。
2019-11-19 | 作者:paperfree
相關文章
預查重和正式論文查重有什么差別點不一樣? AI降重和人工降重有什么樣的區(qū)別? 論文查重和答辯的過程不一樣嗎? 正規(guī)的論文查重機構會收錄我們論文嗎? 畢業(yè)論文查重過度嚴格的主要原因是什么? 畢業(yè)論文題目怎么選才不會撞題? 論文查重時出現(xiàn)字數(shù)和論文不對是什么情況?上一篇: 畢業(yè)論文查重該從哪里著手? 下一篇: 為什么英文論文檢測出來的重復率很低?