我有一个非常大的文本文件。此文本文件中的每一行都有一个完整的句子。现在我必须删除其中超过 x 个字符的每一行/句子,只保留带有 <=x 个字符的行。
这甚至可能吗?我可以用 Notepad++/EditPlus 或正则表达式来做到这一点吗?
感谢您的帮助!
这是记事本++的解决方案
在搜索模式中选择“正则表达式”。确保“。匹配换行符”复选框未选中。
找什么:.{x}.+
替换为:(空)
如果您不想在替换后留下空行:
找什么:.{x}.+(\r?\n|\n|$)
替换x
为您选择的数字。
使用 bash:
$ awk '{if (length($0) <= x) print $0; }' myfyle.txt
长在哪里x
。它将打印小于x
.
请参阅awk 教程和介绍了解更多 awk 好东西。
这是 Editplus 3.70 版的解决方案。
如果要保留 <= 200 的行,以下将删除任何 201 个字符或更多字符的行。
注意 201 后面的逗号。