我战斗了超过 1 天,谷歌提出了很多解决这个问题的请求,但没有任何结果。:(
实际上,我有以下代码读取使用名称列表编码的文本文件 UTF8,并且我的 perl 脚本在找到特定名称时应该停止。这些名字是用法语给出的,并且经常带有一些口音。那是它开始表现出意外的时候:
所以这里是代码:
#!/usr/bin/perl
$ErrorWordFile = "./myFile.txt";
open FILEcorpus, $ErrorWordFile or die $!;
while (<FILEcorpus>)
{
chomp;
$_=~ s/\r|\n//g;
$normWord=$_;
$string="stéphane";
if( $normWord eq $string )
{
print"\nYES!! does work";
}
else
{
print"\nNO does NOT work";
}
}
close(FILEcorpus)
实际上,语料库文件(./myFile.txt)包含“stéphane\n”作为唯一的字符。
它显然来自文件的 UTF8 编码和重音符号,但显然不是那么容易。我尝试了很多东西,包括
use uft8
或者
utf8::decode($normWord); without results
没有任何成功:(
任何想法???
非常感谢您的宝贵帮助!
西蒙