1

第一次在这里发帖,也是谷歌应用程序的新手。我正在为linkedin公司的电子表格中整理一个网址。例如:http ://www.linkedin.com/company/National-Renewable-Energy-Laboratory

我可以使用谷歌电子表格中的 =importXML 和 Xpath 来获取每个公司页面上列出的网站 url。

我已经到了可以从页面中提取所有href的地步,我需要的链接就在其中,但我只想要网站网址。

这是我目前使用的:

=importXML(R2, "//*[@href]")

这是我的电子表格的链接:https ://docs.google.com/spreadsheet/ccc?key=0AheVK6uxf6AvdHhILTFrR1k4Wl9tWW5OVWpRRUJKMlE

代码在 S2

感谢您的回复。

4

2 回答 2

1

//*[@href]匹配具有 href 的元素,而不是 href 属性本身。试试//@href吧。

于 2012-06-22T00:27:56.283 回答
0

它更复杂,但一个好的解决方案是使用LinkedIn API,您可以使用UrlFetchApp访问它。

于 2012-06-21T23:59:45.943 回答