1

我的印象是您可以使用 TagSoup 将 HTML 转换为 XHTML。我将 tagsoup jar 文件保存为 tagsoup.jar 我使用了以下命令wget -O usa_stock.html "http://markets.usatoday.com/custom/usatoday-com/new/html-mktscreener.asp#" | java -jar tagsoup.jar usa_stock.html当我使用此命令时,它会生成 html 和 xhtml 文件,但是当我在 firefox 中打开 xhtml 时,它是空的。我怀疑当我流水线时它只是不知道我试图转换哪个文件。

有人可以帮我解决这个问题吗?

谢谢。

4

1 回答 1

3

您的代码中使用的管道 ( |) 肯定是错误的,更改它&&可能会解决您的问题。

  1. 由于wget没有将检索网页输出到stdout,因此您没有将任何内容输入到 tagoup 中。
  2. 尽管您还为 jsoup 指定了输入文件和输出文件,但您使用了管道。所以在java-jar开始执行时,wget仍在运行。您为 tagoup 指定的输入文件尚未准备好。

所以你需要在 jsoup 启动之前先wget以退出状态退出,这里将用于此目的。0&&

于 2012-12-03T17:51:00.840 回答