存在很多解决方案,但这里的特殊性是我需要能够在一行内分割,剪切应该发生在模式之前。前任:
文件:
<?xml 1><blabla1>
<blabla><blabla2><blabla>
<blabla><blabla>
<blabla><blabla3><blabla><blabla>
<blabla><blabla><blabla><?xml 4>
<blabla>
<blabla><blabla><blabla>
<blabla><?xml 2><blabla><blabla>
应该变成带图案<?xml
输出文件1:
<?xml 1><blabla1>
<blabla><blabla2><blabla>
<blabla><blabla>
<blabla><blabla3><blabla><blabla>
<blabla><blabla><blabla>
输出文件2:
<?xml 4>
<blabla>
<blabla><blabla><blabla>
<blabla>
文件3:
<?xml 2><blabla><blabla>
实际上,此处perl
验证答案中的脚本适用于我的小示例。但它会为我更大(约 6GB)的实际文件生成错误。错误是:
panic: sv_setpvn called with negative strlen at /home/.../split.pl line 7, <> chunk 1.
我没有评论的权限,这就是我开始新帖子的原因。最后,一个Python
解决方案将更加感激,因为我更好地理解它。