• 采用 Google diff-match-patch 算法,按字符级匹配并计算相似度。
• 结果百分比 =(相同字符数 ÷ 原文字符数)×100%,70% 以上视为高重复。
• 高亮黄色部分为重复/近似内容,便于快速定位。