notepad++ - Notepad++ 中的质量交叉引用

Question

我有一个包含 20,000 个域名的 txt 文件 (A.txt)，每行一个。我有另一个 txt 文件 (B.txt)，其中包含一起编译的数千条 Whois 记录。我想看看 B.txt 中没有引用 A.txt 中的哪些域。一件一件地做这件事很简单，但我怎么能批量做呢？谢谢

score 0 · Accepted Answer

您可以将文件A.txt编辑为具有样式的行，将example.com A other stuff文件B.txt编辑为具有表单的行example.com B other stuff。然后将这两个文件排序在一起。接下来运行 Notepad++ 正则表达式替换，搜索^([^ ]+) A .*\r\n(\1 B )并替换为\2. 效果是任何与B.txt匹配的A.txt行都被删除，留下B.txt行。如果有多个A.txt行与一个B.txt匹配，则运行替换两次或更多次，直到没有行被替换。最后，删除B.txt行（使用正则表达式查找并标记要查找的行^([^ ]+) B然后删除带书签的行）留下不匹配的A.txt行。

不知道源文件 A.txt 和 B.txt 的格式我不能建议使用正则表达式将 URL 后跟 A 或 B 放在行首。

notepad++ - Notepad++ 中的质量交叉引用

1 回答 1

Related

Reference