4

我有一个非常大的文本文件。此文本文件中的每一行都有一个完整的句子。现在我必须删除其中超过 x 个字符的每一行/句子,只保留带有 <=x 个字符的行。

这甚至可能吗?我可以用 Notepad++/EditPlus 或正则表达式来做到这一点吗?

感谢您的帮助!

4

3 回答 3

8

这是记事本++的解决方案

在搜索模式中选择“正则表达式”。确保“。匹配换行符”复选框未选中

找什么:.{x}.+

替换为:(空)

如果您不想在替换后留下空行:

找什么:.{x}.+(\r?\n|\n|$)

替换x为您选择的数字。

于 2013-01-30T22:00:38.597 回答
6

使用 bash:

$ awk '{if (length($0) <= x) print $0; }'  myfyle.txt

长在哪里x。它将打印小于x.

请参阅awk 教程和介绍了解更多 awk 好东西。

于 2013-01-30T22:02:13.247 回答
1

这是 Editplus 3.70 版的解决方案。

如果要保留 <= 200 的行,以下将删除任何 201 个字符或更多字符的行。

  • 查找内容:^.{201,}.*\n
  • 留空替换
  • 检查正则表达式

注意 201 后面的逗号。

于 2014-07-09T09:41:29.840 回答