0

如果有人可以提供帮助,那就太好了。我真的被困住了。

我正在从 SEC edgar 下载主文件,并从 -<a href="http://brage.bibsys.no/bi/bitstream/URN:NBN:no-bibsys_brage_38213/1/Norli_SRFE_2012.pdf" rel 获取脚本="nofollow">http://brage.bibsys.no/bi/bitstream/URN:NBN:no-bibsys_brage_38213/1/Norli_SRFE_2012.pdf(第14页..现在发布)

我收到错误 404 master.gz not found 调试时我粘贴了 url,当我在浏览器中使用它时,我可以下载文件。它在 QTR1 之前正确解析 url,但之后它无法找到实际存在的文件..请帮助。

1)出于调试原因,现在我将代码更改为 1995(但后来计划将 1995 年添加到 2012 年)

2)它不适用于任何文件。当我说 QTR1 abovr - 我的意思是没有文件名的相同代码(仅用于测试) - ....full-index/1995/QTR1/ (没有文件名)返回状态代码 OK 但是...... ftp.sec.gov/edgar/full-index/1995/QTR1/master.gz 返回 404 file not found 错误。它不适用于任何季度。

我在这个看似简单的事情上浪费了很多时间,它应该可以工作,但它只是不工作......你能复制过去并运行......它对你有用吗?

下面的代码从 QTR 文件夹中获取主文件。粘贴我的代码::

—————-

use LWP::UserAgent;
my $ua = LWP::UserAgent->new;
$ua->timeout(250);
$ua->env_proxy;

for($year=1995; $year<1996; $year=$year+1){
for($i=1; $i<5; $i=$i+1){
$quarter = “QTR” . $i;
$filegrag = “ftp://ftp.sec.gov/edgar/full-index/” . $year . “/” . $quarter .       “/master.gz”;
print $filegrag;

# This command gets the file from EDGAR
my $response = $ua->get($filegrag);
print $response;
  print $response->status_line;

# Now just pipe the output to a file named appropriately
$filename = $year . $quarter . “master”;
open(MYOUTFILE, “&gt;” . $filename);
if ($response->is_success)  {
print MYOUTFILE $response->decoded_content;
}
else {
die $response->status_line;
}
close(MYOUTFILE);
}
}
4

1 回答 1

0

我意识到有一些防火墙问题导致了我遇到的问题。现在一切都很好。

于 2013-10-09T12:08:19.377 回答