0

我正在使用 Selenium 工作,我从“//ul”中提取了一些数据,不幸的是,这些数据包含换行符,我尝试使用 chomp() 函数来删除它(因为我需要写入 CSV 文件)但是它不起作用,代码部分是:

open (INFO, '>>file.csv') or die "$!";  
print INFO ("codice\;descrizione\;prezzo\;URLFoto\n");
my $sel = Test::WWW::Selenium->new( host => "localhost", 
                                    port => 4444, 
                                    browser => "*chrome", 
                                    browser_url => "http://www.example.com/page.htm" );
$sel->open_ok("/page.htm");
$sel->click_ok("//table[2]/tbody/tr/td/a/img");
$sel->wait_for_page_to_load_ok("30000");
my $descrizione = $sel->get_text("//ul");
my $prezzo = $sel->get_text("//p/font");
my $codice = $sel->get_text("//p/font/b");
my $img = $sel->get_attribute ("//p/img/\@src");
chomp ($descrizione);
print INFO ("$codice\;$descrizione\;$prezzo\;$img\n");
$sel->go_back_ok();

# Close file
close (INFO);

但输出是:

Art. S500 Set Yoga "Siddhartha";Idea regalo ?SET YOGA Siddhartha? Elegante scatola in cartone lucido contenente:  

 2 mattoni in legno naturale mis. cm 20 x 12,5 x 7

 1 cinghia in cotone mis. cm 4 x 235  

 1 stuoia in cotone mis. cm 70 x 170    

 1 manuale di introduzione allo yoga stampato

Tutto rigorosamente realizzato con materiali natural;€ 82,50;../images/S500%20(Custom).jpg
4

3 回答 3

1

chomp从一个字符串或一组字符串的末尾删除平台特定的行尾字符序列。

在您的情况下,您似乎有一个带有嵌入换行符和/或回车符的字符串。因此,您可能想用其他东西替换任何可能的行结尾序列,比如说一个空格字符。在这种情况下,你会这样做:

$descrizione =~ s/[\r\n]+/ /g;
于 2012-04-06T18:01:53.003 回答
0

如果你想替换所有垂直空格,Perl 有一个特殊的字符类快捷方式:

 use v5.10;
 $descrizione =~ s/\v+/ /g;
于 2012-04-06T21:02:56.683 回答
-1

也可以使用它来删除\r

$descrizione =~ s#[\r\n]+\z##;

问候,

于 2012-04-06T16:26:05.127 回答