我有一组句子,我想检查任何重复(或非常相似)的行。
我基本上想删除任何有 X 个共同单词的行。我希望它忽略任何长度小于或等于 4 个字母的共同单词。我希望忽略标点符号(,。':等...)
我已经安装了 TextFX 插件并按长度对行进行了排序,并且我有许多重复的行,标点符号/语法差异很小。我可以去列表并手动删除它们,但这将是非常浪费时间。
任何帮助表示赞赏,感谢您的阅读。
我有一组句子,我想检查任何重复(或非常相似)的行。
我基本上想删除任何有 X 个共同单词的行。我希望它忽略任何长度小于或等于 4 个字母的共同单词。我希望忽略标点符号(,。':等...)
我已经安装了 TextFX 插件并按长度对行进行了排序,并且我有许多重复的行,标点符号/语法差异很小。我可以去列表并手动删除它们,但这将是非常浪费时间。
任何帮助表示赞赏,感谢您的阅读。