1

我想打印出关联数组的内容。为此,我使用 Data::dumper。

因此,例如,如果关联数组称为“%w”,我会写:

  print OUT Dumper(\%w);

这就是问题所在:有一些像“récente”这样的词被打印为“r\x{e9}​​cente”。

如果我只写:

print OUT %w;

我没有问题,所以“récente”将打印为“récente”。

用于脚本的所有文本文件都是 utf8 格式。此外,我使用模块“utf8”并始终指定字符编码系统。

例如。:

open( IN, '<', $file_in);
binmode(IN,":utf8");

我很确定问题与 Data::dumper 有关。有没有办法解决这个问题或打印出关联数组的内容的另一种方法?

谢谢你。

4

4 回答 4

4

这是故意的。当使用 Perl 代码时,输​​出Data::Dumper的目的是产生相同的数据结构。eval为了限制字符编码的影响,将使用转义转储非 ASCII 字符。除此之外,设置$Data::Dumper::Useqq = 1任何不可打印的字符都使用转义转储是明智的。

Data::Dumper并不是真正意义上的一种显示数据结构的方式——如果您有特定的格式要求,只需自己编写必要的代码。例如

use utf8;
use feature 'say';
open my $out, ">:utf8", $filename or die "Can't open $filename: $!";
my %hash = (
    bárewørdş => '–Uni·code–',
);

say { $out } "{";
for my $key (sort keys %hash) {
    say { $out } "  $key: $hash{$key}";
}
say { $out } "}";

生产

{
  bárewørdş: –Uni·code–
}
于 2014-04-01T09:48:00.713 回答
2

您还可以使用Data::Dumper::AutoEncode

use utf8;
use Data::Dumper::AutoEncode;

warn eDumper($hash_ref);

cpan Data::Dumper::AutoEncode

于 2014-04-01T09:59:15.693 回答
0

这对我有用:

use strict;
use warnings;
use Data::Dumper;
$Data::Dumper::Useperl = 1;
binmode STDOUT, ":utf8";
{ no warnings 'redefine';
    sub Data::Dumper::qquote {
        my $s = shift;
        return "'$s'";
    }
}
my $s = "rcente\x{3a3}";
my %w = ($s=>12);
print Dumper(\%w), "\n";
于 2014-04-01T09:59:59.950 回答
0

Data::Dumper 是一个调试工具。它让您知道字符串包含的内容,而不会使其容易受到编码错误的影响。这不是问题,这是一个特点。它发出的 ( "r\x{e9}cente") 是您拥有的字符串 () 的充分可读的表示72 E9 63 65 6E 74 65

于 2014-04-01T13:48:15.603 回答