Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我一直在尝试使用 XPath 从网站中提取电子邮件地址。整个页面只有 1 个电子邮件地址。有没有一种使用 XPath 引用该电子邮件地址的简单方法?
就像是://a/contains(@href,'@')
//a/contains(@href,'@')
我尝试了类似于我在上面发布的内容但没有成功,我将不胜感激任何有关使用 Xpath 提取电子邮件地址的可靠方法的建议。假设页面上只有 1 个电子邮件地址,除了一个简单的<a href="mailto:example@george.com">标签之外没有任何识别信息。
<a href="mailto:example@george.com">
谢谢
//a[contains(text(), "@")]
这将返回包含电子邮件地址的节点(@至少是一个符号),而不是电子邮件地址本身。
@
如果您可以确定该节点仅包含电子邮件地址而没有其他相邻文本,则可以使用
//a[contains(text(), "@")]/text()
如果您不能确定,则必须手动从文本中对其进行字符串处理。这在 XPath 1.0 中会非常痛苦,因为根据您的实现,您可能无法访问任何 REGEX 功能。