知网查重原理怎么判断重复的？-中国学术不端查重检测入口

当前位置：学术不端论文查重 > 学术不端论文查重技巧 > 知网查重原理怎么判断重复的？

知网查重原理怎么判断重复的？

发布时间：2020-04-27 09:34:41 作者：www.dentclinic3.com原创来源：www.dentclinic3.com

知网查重原理怎么判断重复的？网上很多详细讲解称论文连续13字，或者连续13个字符就会判断为重复。事实上，知网检测算法并非简单根据句子连续多少字就标红，它在这个依据之上还加了一些前置条件，要两种同时满足才会判断为重复。那么，知网查重原理怎么判断重复的？

知网查重原理

一、知网查重原理详细讲解

知网检测系统会自动识别出参考文献，参考文献不参与正文检测。并且进行剔除，在知网检测报告中参考文献显示灰色字体，说明并没有参与检测。当然这是在参考文献格式完全正确规范的情况下才会自动排除不会标红。

知网查重系统采用了最先进的计算模糊算法，如果整体结构和大纲被打乱，可能会引起同一处的文章检测第一次和第二次标红不一致或者第一次检测没有标红的部分第二次检测被标红。因此在修改重复内容的时候尽量变换句式，不要打乱论文原来的整体大纲和结构。

知网查重原理

知网论文查重为整篇上传，PDF或者Word格式对检测结果可能会造成影响。因为上传PDF检测，PDF会比Word多一个文本转换的过程，这个过程有可能会将你原本正确的的目录和参考文献格式打乱，目录和参考文献等格式错乱，就会导致系统识别不正确而被标红。

中国知网对查重系统的灵敏度设置了一个阀值，该阀值为5%，以段落计，低于5%的抄袭或引用是检测不出来的，这种情况常见于大段落中的小句或者小概念。举个例子：假如检测段落1有10000字，那么引用单篇文献500字以下，是不会被检测出来的。

知网查重原理

二、知网查重原理怎么判断

知网检测论文的重复性是按照13个字的连续性作为判断的根据，若大家希望修改后的论文查重没有那么高，就可以先选择将论文13个字相连的地方做修改，修改后保证13个字与字之间的内容与抄袭的原作者文章内容不一致，这样过检测的概率会很高。

总结：知网查重原理是能自动识别参考文献，采用模糊算法进行分段检测，PDF文档格式比Word更容易出错，抄袭低于5%的灵敏度是不会算抄袭，而判断抄袭的依据是连续13个字相同就会算抄袭，因此要尽量避免大段落抄袭。上述是“知网查重原理怎么判断重复的？”全部内容。