-1

我一直在尝试使用 XPath 从网站中提取电子邮件地址。整个页面只有 1 个电子邮件地址。有没有一种使用 XPath 引用该电子邮件地址的简单方法?

就像是://a/contains(@href,'@')

我尝试了类似于我在上面发布的内容但没有成功,我将不胜感激任何有关使用 Xpath 提取电子邮件地址的可靠方法的建议。假设页面上只有 1 个电子邮件地址,除了一个简单的<a href="mailto:example@george.com">标签之外没有任何识别信息。

谢谢

4

1 回答 1

1
//a[contains(text(), "@")]

这将返回包含电子邮件地址的节点(@至少是一个符号),而不是电子邮件地址本身。

如果您可以确定该节点包含电子邮件地址而没有其他相邻文本,则可以使用

//a[contains(text(), "@")]/text()

如果您不能确定,则必须手动从文本中对其进行字符串处理。这在 XPath 1.0 中会非常痛苦,因为根据您的实现,您可能无法访问任何 REGEX 功能。

于 2012-06-29T19:18:55.973 回答