1

我写了一个代码,我需要使它成为多线程的。Evething 有效,但每个循环重复 4 次:

use LWP::UserAgent;
use HTTP::Cookies;
use threads;
use threads::shared;

$| = 1;

$threads = 4;
my @groups :shared = loadf('groups.txt');

my @thread_list = ();
$thread_list[$_] = threads->create(\&thread) for 0 .. $threads - 1;
$_->join for @thread_list;
thread();

sub thread
{
    my $url = 'http://www.site.ru/';
    my $response = $web->post($url, Content =>
                    ['st.redirect' => ''
                    ]);
    foreach $i (@groups)
    {

        my $response  = $web->get($i);
        if(!($response->header('Location')))
        {
            ---------;
        }
        else
        {
            ----------;
        }

    }

}

sub loadf {
    open (F, "<".$_[0]) or erroropen($_[0]); 
    chomp(my @data = <F>);
    close F;
    return @data;
}

组.txt:

http://www.odnoklassniki.ru/group/47357692739634
http://www.odnoklassniki.ru/group/56099517562922

我知道我需要使用 threads::shared; 但我无法理解如何使用它。


您的帖子没有太多上下文来解释代码部分;请更清楚地解释您的情况。

4

2 回答 2

6

问题是您永远不会从中删除@groups,因此所有线程都在@groups.

这是一个解决方案。

use threads;
use Thread::Queue 3.01 qw( );

my $NUM_WORKERS = 4;

sub worker {
   my ($url) = @_;
   ... download the page ...
}

my $q = Thread::Queue->new();
for (1..$NUM_WORKERS) {
   async {
      while (my $url = $q->dequeue()) {
         worker($url);
      }
   };
}

$q->enqueue($_) for loadf('groups.txt');
$q->end();
$_->join() for threads->list;
于 2012-08-28T23:09:19.507 回答
3

为什么你需要让它线程化?在大多数情况下,perl 使用分叉做得更好。

也就是说,您的代码启动了 4 个线程,每个线程处理 @groups 中的所有内容。听起来那不是你想要做的。如果您希望 @groups 成为一个工作队列,请查看 Thread::Queue(或 Parallel::ForkManager)。

于 2012-08-28T23:13:16.187 回答