0

此脚本从下载的网页中提取 url。我在使用这个脚本时遇到了一些问题——当我使用"my $csv_html_line = @_ ;" 然后打印出来时"@html_LineArray"——它只是打印出来"1's"。当我用脚本替换时 "my $csv_html_line = @_ ;"工作"my $csv_html_line = shift ;"正常。我不知道两者之间有什么区别"= @_" and shift-因为我认为在没有指定某些内容的情况下,在子例程中, shift shift froms"@_".

#!/usr/bin/perl
use warnings;
use strict ;

sub find_url {
    my $csv_html_line = @_ ;
    #my $csv_html_line = shift ;
    my @html_LineArray = split("," , $csv_html_line ) ;
    print "@html_LineArray\n" ;
    #foreach my $split_line(@html_LineArray) {
    #    if ($split_line =~ m/"adUrl":"(http:.*)"/) {
    #        my $url = $1;
    #        $url =~ tr/\\//d;
    #        print("$url\n")  ;
    #    }
    #}
}



my $local_file = "@ARGV" ;
open(my $fh, '<', "$local_file") or die "cannot open up the $local_file $!" ;
while( my $html_line = <$fh>) {
    #print "$html_line\n";
    find_url($html_line) ;
}

这是上面打印出来的。

1
1
1
1
1
1
1
1
1
1
1
1

这很好用 - 它使用班次而不是“@_”

#!/usr/bin/perl
use warnings;
use strict ;

sub find_url {
    #my $csv_html_line = @_ ;
    my $csv_html_line = shift ;
    my @html_LineArray = split("," , $csv_html_line ) ;
    #print "@html_LineArray\n" ;
    foreach my $split_line(@html_LineArray) {
        if ($split_line =~ m/"adUrl":"(http:.*)"/) {
            my $url = $1;
            $url =~ tr/\\//d;
            print("$url\n")  ;
        }
    }
}



my $local_file = "@ARGV" ;
open(my $fh, '<', "$local_file") or die "cannot open up the $local_file $!" ;
while( my $html_line = <$fh>) {
    #print "$html_line\n";
    find_url($html_line) ;
}
4

2 回答 2

6

它是

my ($csv_html_line) = @_ ;

您编写@_在标量上下文中评估的代码并获取其长度(元素数)的方式。正如你所指出的,

my $csv_html_line = shift;

之所以有效,是因为shift运算符接受一个列表并删除第一个元素并将其作为标量返回。

于 2016-02-22T03:27:50.480 回答
2

你需要

my ($csv_html_line) = @_ ;

因为将数组分配给标量将返回其长度(带一个参数为 1)

于 2016-02-22T03:28:36.150 回答