0

首先,我对此有点陌生,所以答案可能是由消费者决定,但是,我有以下代码:

#!/usr/bin/perl

open(RESPONSE,"response.xml")
$result ="";
while(<RESPONSE>){
  next unless $. > 1
  $line = $_
  $line =~ "<html><body>";
  $line =~ "</body></html>";
  $result .= $line
}
print "$result";
exit 0;

但这仍然明确输出 \n 和 \r\n 。我尝试添加以下...

use Encode
...
$final = decode_utf8($result);
print "$final";

但是当我打开这个 shell 命令生成的文档时,我仍然看到这些字符......

perl parse.pl > "outfile.csv"

所以例如

<html><body>test,a\r\ntest2,b<body></html>

在 csv 中保持 test,a\r\ntest2,b

谢谢!

4

1 回答 1

0

如果要解析 HTML 或 XML,请使用HTMLXML解析器。如果要创建 CSV 文件,请使用CSV 文件模块

这个问题与 Unicode 和 ASCII 之间的差异无关。

于 2013-09-12T09:25:47.240 回答