2

是否可以使用 PHP 获取下面给出的页面链接中显示的信息。我希望将页面上显示的所有文本内容复制到变量或文件中。

http://www.ncbi.nlm.nih.gov/nuccore/24655740?report=fasta&format=text

我也尝试过 cURL,但它没有用。cURL 与我知道的其他一些网站一起工作的地方。但即使有 cURL 的解决方案也会发布。我可能已经尝试过各种可以使用 cURL 的方法。

4

2 回答 2

2

使用 cURL 获取页面内容然后解析它 - 提取<pre>部分。

$ch = curl_init();

// Set query data here with the URL
curl_setopt($ch, CURLOPT_URL, 'val=24655740&db=nuccore&dopt=fasta&extrafeat=0&fmt_mask=0&maxplex=1&sendto=t&withmarkup=on&log$=seqview&maxdownloadsize=1000000'); 

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_TIMEOUT, '3');
$content = trim(curl_exec($ch));
curl_close($ch);
// show ALL the content
print $content;

$start_index = strpos($content, '<pre>')+5;
$end_index = strpos($content, '</pre>');
$your_text = substr($content, $start_index, $end_index-$start_index);

更新

使用来自@ovitinho 的答案的链接 - 它现在可以工作了:)

于 2013-08-02T18:05:49.147 回答
1

您需要请求表单使用的 url 以通过 javascript 显示此结果。

我创建了这个最终网址

http://www.ncbi.nlm.nih.gov/sviewer/viewer.fcgi?val=24655740&db=nuccore&dopt=fasta&extrafeat=0&fmt_mask=0&maxplex=1&sendto=t&withmarkup=on&log$=seqview&maxdownloadsize=1000000

请注意在此请求的第一个链接中使用24655740

您可以使用 cURL。

于 2013-08-02T18:06:13.243 回答