我的印象是您可以使用 TagSoup 将 HTML 转换为 XHTML。我将 tagsoup jar 文件保存为 tagsoup.jar 我使用了以下命令wget -O usa_stock.html "http://markets.usatoday.com/custom/usatoday-com/new/html-mktscreener.asp#" | java -jar tagsoup.jar usa_stock.html
当我使用此命令时,它会生成 html 和 xhtml 文件,但是当我在 firefox 中打开 xhtml 时,它是空的。我怀疑当我流水线时它只是不知道我试图转换哪个文件。
有人可以帮我解决这个问题吗?
谢谢。