有人可以帮我从 HTML 页面中获取元素吗?我不想使用库,我只想要一个或两个关于如何使用正确的正则表达式等的指针。我有点坚持这一点,感谢所有帮助。
问问题
67 次
2 回答
1
您必须首先决定您是在谈论 HTML 还是 XML。
如果您的文本是有效的 XML 文档,那么您可以使用 JAXP 解析文档并以编程方式访问元素/属性(在正则表达式中不需要)。
如果您的文本不是有效的 XML 文档,那么在 100% 的情况下,没有设置的正则表达式对您有效;最好的办法是使用作为 Swing 框架的一部分提供的 JDK 的内置 HTML 解析器。
于 2012-11-17T01:27:27.083 回答
0
JDK 包括一个基本的HTML 解析器。它不是很健壮,但是您确实指定了“不想使用库”。所以......我想,把自己打晕?
于 2012-11-17T00:24:45.490 回答