是否可以使用 PHP 获取下面给出的页面链接中显示的信息。我希望将页面上显示的所有文本内容复制到变量或文件中。
http://www.ncbi.nlm.nih.gov/nuccore/24655740?report=fasta&format=text
我也尝试过 cURL,但它没有用。cURL 与我知道的其他一些网站一起工作的地方。但即使有 cURL 的解决方案也会发布。我可能已经尝试过各种可以使用 cURL 的方法。
是否可以使用 PHP 获取下面给出的页面链接中显示的信息。我希望将页面上显示的所有文本内容复制到变量或文件中。
http://www.ncbi.nlm.nih.gov/nuccore/24655740?report=fasta&format=text
我也尝试过 cURL,但它没有用。cURL 与我知道的其他一些网站一起工作的地方。但即使有 cURL 的解决方案也会发布。我可能已经尝试过各种可以使用 cURL 的方法。
使用 cURL 获取页面内容然后解析它 - 提取<pre>
部分。
$ch = curl_init();
// Set query data here with the URL
curl_setopt($ch, CURLOPT_URL, 'val=24655740&db=nuccore&dopt=fasta&extrafeat=0&fmt_mask=0&maxplex=1&sendto=t&withmarkup=on&log$=seqview&maxdownloadsize=1000000');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_TIMEOUT, '3');
$content = trim(curl_exec($ch));
curl_close($ch);
// show ALL the content
print $content;
$start_index = strpos($content, '<pre>')+5;
$end_index = strpos($content, '</pre>');
$your_text = substr($content, $start_index, $end_index-$start_index);
更新
使用来自@ovitinho 的答案的链接 - 它现在可以工作了:)
您需要请求表单使用的 url 以通过 javascript 显示此结果。
我创建了这个最终网址
http://www.ncbi.nlm.nih.gov/sviewer/viewer.fcgi?val=24655740&db=nuccore&dopt=fasta&extrafeat=0&fmt_mask=0&maxplex=1&sendto=t&withmarkup=on&log$=seqview&maxdownloadsize=1000000
请注意在此请求的第一个链接中使用24655740。
您可以使用 cURL。