2

很长一段时间以来,我一直在尝试使用 xpath 从以下代码中提取电子邮件地址,但没有成功...

http://pastie.org/4172907(第 78 行)

这是我到目前为止所尝试的:

//tr/td/div[@class='geTextA5'][2]/a

我在 xpath 上玩了三个多小时,尝试了许多不同的变体。我对 xpath 很陌生,所以我希望有一种更简单的方法来实现这一点。

我很感激这方面的任何帮助。

4

2 回答 2

10

如果您确信所有电子邮件都具有示例中的 mailto 超链接,那么您可以尝试以下 xpath。

//a[starts-with(@href, 'mailto')]/text()
于 2012-07-01T08:54:02.793 回答
2

进一步补充,如果您想从文本中解析电子邮件但它们没有包含在锚点中:

//*[contains(text(), '@')]
于 2014-02-23T02:04:32.117 回答