0

我有一个文本文件中的 URL 列表,每行一个。我想通过 lynx 运行它们中的每一个,以使用以下方法获取无标记文本的转储:

foreach ($result as $url) {
//lynx each url and append to output file
exec("lynx -dump 'http://mysite.co.uk/?p=12' >> output.txt");
$i++;
}

(我也尝试过 shell-exec)但它不起作用 - 我得到一个空的输出文件或消息:'lynx' 不被识别为内部或外部命令、可运行程序或批处理文件。我通过 cygwin 运行它,lynx 以这种方式正常工作。

问题:

  1. 应该这样吗?
  2. 是否可以通过 cygwin 控制台通过“包含”文本文件并循环遍历每个 URL 来完成?
  3. 你会推荐一种不同的方式吗?

提前感谢您的帮助。

DM

4

1 回答 1

0

您告诉我们您在 cygwin 中执行此操作,所以我会使用这样的脚本:

#!/bin/bash
for result in `cat url.txt`
do
   (echo;echo "$result";echo;echo )>>output.txt
   lynx -dump $result >>output.txt
done

其中 url.txt 是您的带有 URL 的文件。

于 2014-09-28T05:09:56.657 回答