我想提取网页中所有可用的链接并阅读它。但是使用 HTML 模式,我们可以窥探单个链接。而不是链接列表。谁能帮帮我吗?
问问题
1873 次
2 回答
1
您可以使用导航阶段操作“插入 Javascript 片段”插入 Javascript 代码,该代码将读取所有a
标记的href
属性并以竖线分隔的方式输出它们。下面的功能应该让你开始:
function getLinks() {
var output = ""; // instantiate string variable
var links = document.getElementsByTagName("a"); // enumerate all anchor tag nodes
for (var i = 0; i < links.length; i++) { // loop results
if (i != 0) { // if this isn't the first item in the list...
output = output + "|"; // add a pipe between each URL
}
output = output + links[i].getAttribute("href"); // append the href attribute for each link
}
return output; // return the enumerated string
}
必须添加的唯一剩余的 Javascript 行是将管道分隔的列表放置到页面上的特定位置以供 Blue Prism 读取的功能。
于 2018-03-03T05:17:00.233 回答
0
您可以使用例如动作“获取 HTML”,然后使用正则表达式来获取每个链接标签,并获取“href”属性的属性。
于 2018-03-06T11:55:23.530 回答