我正在创建不同长度的文本的测试样本,其中每个样本由换行符分隔。目前我有 3mb+ 的文本文件,没有换行符,只有空格。我希望获得有关正确 reg 表达式的帮助,以确保没有换行符将单词减半。
我对使用 reg 表达式很陌生。但我假设对于 300 个字符长度的行,它会在以下范围内的某个地方:
/.{300,}\s+/&\n/g
(抱歉,我知道这不起作用!)
注意:我知道有关于这个主题的类似帖子,但我相对肯定没有什么专门针对这种情况的。
更新:解决了!使用此命令: perl -lpe's/\b(.{80,300})\b/\1\n/g' file