Greg 敏锐地发现你真的想要链接“标签”,而不是 href URL。但是我会使用getElementsByTagName('A')来获取所有元素。然后遍历它们的firstChild节点。
获取' firstChild '的' nodeValue '就像获取innerHTML或(innerText,有人提到,支持较少)一样容易。
这是一个最小的例子,寻找“word1”、“word2”和“word3”。
我将补充一点,如果您想将为此查看的链接限制为页面或站点上链接的子集,您可以通过将特定的 className 设置为您要搜索的链接来区分其他方式。检查您抓取的链接的类名只会使事情变得复杂一些。因此,一个简单的 A 节点迭代:
例子:
<html>
<head>
<title>JavaScript match link label</title>
<script type="text/javascript">
var keywords = ['word1','word2','word3'];
function linklabels() {
var aels = document.getElementsByTagName && document.getElementsByTagName('A');
var aelsCt = aels.length;
var keywordsCt = keywords.length;
for (var i = 0; i < aels.length; i++) {
var v= aels[i].firstChild.nodeValue;
//this is the link label, the text seen as the link
for (var j=0; j < keywordsCt; j++) {
var re = new RegExp(keywords[j]);
if (re.test(v)) {
alert('refreshing to http://google.com/' + v);
//window.location.href = "http://google.com/" + v;
}
}
}
}
window.onload=linklabels;
</script>
</head>
<body>
<p><a href="#">word1</a> | <a href="#">word2</a> | <a href="#">word3</a>
<br /><a href="#">word1</a> | <a href="#">word2</a> | <a href="#">word3</a></p>
</body>
</html>