如果我知道文本标签包含什么,如何在 html 页面中获取标签。例如:
<a ...>SearchingText</a>
您可以使用 xpath 来完成此操作
var xpath = "//a[text()='SearchingText']";
var matchingElement = document.evaluate(xpath, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;
您还可以使用此 xpath 搜索包含某些文本的元素:
var xpath = "//a[contains(text(),'Searching')]";
您必须手动遍历。
var aTags = document.getElementsByTagName("a");
var searchText = "SearchingText";
var found;
for (var i = 0; i < aTags.length; i++) {
if (aTags[i].textContent == searchText) {
found = aTags[i];
break;
}
}
// Use `found`.
使用目前可用的最现代的语法,它可以像这样非常干净地完成:
for (const a of document.querySelectorAll("a")) {
if (a.textContent.includes("your search term")) {
console.log(a.textContent)
}
}
或使用单独的过滤器:
[...document.querySelectorAll("a")]
.filter(a => a.textContent.includes("your search term"))
.forEach(a => console.log(a.textContent))
自然,旧版浏览器无法处理此问题,但如果需要旧版支持,您可以使用转译器。
您可以使用 jQuery :contains() 选择器
var element = $( "a:contains('SearchingText')" );
function findByTextContent(needle, haystack, precise) {
// needle: String, the string to be found within the elements.
// haystack: String, a selector to be passed to document.querySelectorAll(),
// NodeList, Array - to be iterated over within the function:
// precise: Boolean, true - searches for that precise string, surrounded by
// word-breaks,
// false - searches for the string occurring anywhere
var elems;
// no haystack we quit here, to avoid having to search
// the entire document:
if (!haystack) {
return false;
}
// if haystack is a string, we pass it to document.querySelectorAll(),
// and turn the results into an Array:
else if ('string' == typeof haystack) {
elems = [].slice.call(document.querySelectorAll(haystack), 0);
}
// if haystack has a length property, we convert it to an Array
// (if it's already an array, this is pointless, but not harmful):
else if (haystack.length) {
elems = [].slice.call(haystack, 0);
}
// work out whether we're looking at innerText (IE), or textContent
// (in most other browsers)
var textProp = 'textContent' in document ? 'textContent' : 'innerText',
// creating a regex depending on whether we want a precise match, or not:
reg = precise === true ? new RegExp('\\b' + needle + '\\b') : new RegExp(needle),
// iterating over the elems array:
found = elems.filter(function(el) {
// returning the elements in which the text is, or includes,
// the needle to be found:
return reg.test(el[textProp]);
});
return found.length ? found : false;;
}
findByTextContent('link', document.querySelectorAll('li'), false).forEach(function(elem) {
elem.style.fontSize = '2em';
});
findByTextContent('link3', 'a').forEach(function(elem) {
elem.style.color = '#f90';
});
<ul>
<li><a href="#">link1</a>
</li>
<li><a href="#">link2</a>
</li>
<li><a href="#">link3</a>
</li>
<li><a href="#">link4</a>
</li>
<li><a href="#">link5</a>
</li>
</ul>
当然,一个更简单的方法仍然是:
var textProp = 'textContent' in document ? 'textContent' : 'innerText';
// directly converting the found 'a' elements into an Array,
// then iterating over that array with Array.prototype.forEach():
[].slice.call(document.querySelectorAll('a'), 0).forEach(function(aEl) {
// if the text of the aEl Node contains the text 'link1':
if (aEl[textProp].indexOf('link1') > -1) {
// we update its style:
aEl.style.fontSize = '2em';
aEl.style.color = '#f90';
}
});
<ul>
<li><a href="#">link1</a>
</li>
<li><a href="#">link2</a>
</li>
<li><a href="#">link3</a>
</li>
<li><a href="#">link4</a>
</li>
<li><a href="#">link5</a>
</li>
</ul>
参考:
功能方法。返回所有匹配元素的数组并在检查时修剪周围的空格。
function getElementsByText(str, tag = 'a') {
return Array.prototype.slice.call(document.getElementsByTagName(tag)).filter(el => el.textContent.trim() === str.trim());
}
用法
getElementsByText('Text here'); // second parameter is optional tag (default "a")
如果您正在查看不同的标签,即跨度或按钮
getElementsByText('Text here', 'span');
getElementsByText('Text here', 'button');
默认值 tag = 'a' 将需要旧浏览器的 Babel
只需将您的子字符串传递到以下行:
外部 HTML
document.documentElement.outerHTML.includes('substring')
内部 HTML
document.documentElement.innerHTML.includes('substring')
您可以使用这些来搜索整个文档并检索包含您的搜索词的标签:
function get_elements_by_inner(word) {
res = []
elems = [...document.getElementsByTagName('a')];
elems.forEach((elem) => {
if(elem.outerHTML.includes(word)) {
res.push(elem)
}
})
return(res)
}
用法:
用户“T3rm1”在此页面上被提及了多少次?
get_elements_by_inner("T3rm1").length
1
jQuery 被提及了多少次?
get_elements_by_inner("jQuery").length
3
获取包含单词“Cybernetic”的所有元素:
get_elements_by_inner("Cybernetic")
如果需要,从 <=IE11 中的user1106925获取过滤器方法
您可以将扩展运算符替换为:
[].slice.call(document.querySelectorAll("a"))
并且包含调用a.textContent.match("your search term")
效果很好:
[].slice.call(document.querySelectorAll("a"))
.filter(a => a.textContent.match("your search term"))
.forEach(a => console.log(a.textContent))
与其他答案相比,我发现使用较新的语法要短一些。所以这是我的建议:
const callback = element => element.innerHTML == 'My research'
const elements = Array.from(document.getElementsByTagName('a'))
// [a, a, a, ...]
const result = elements.filter(callback)
console.log(result)
// [a]
您可以使用 aTreeWalker
遍历 DOM 节点,并找到包含文本的所有文本节点,并返回它们的父节点:
const findNodeByContent = (text, root = document.body) => {
const treeWalker = document.createTreeWalker(root, NodeFilter.SHOW_TEXT);
const nodeList = [];
while (treeWalker.nextNode()) {
const node = treeWalker.currentNode;
if (node.nodeType === Node.TEXT_NODE && node.textContent.includes(text)) {
nodeList.push(node.parentNode);
}
};
return nodeList;
}
const result = findNodeByContent('SearchingText');
console.log(result);
<a ...>SearchingText</a>
虽然可以通过内部文本获得,但我认为您走错路了。那个内部字符串是动态生成的吗?如果是这样,你可以给标签一个类或者——更好的是——当文本进入那里时的ID。如果它是静态的,那就更容易了。
这可以完成工作。
返回包含 的节点数组text
。
function get_nodes_containing_text(selector, text) {
const elements = [...document.querySelectorAll(selector)];
return elements.filter(
(element) =>
element.childNodes[0]
&& element.childNodes[0].nodeValue
&& RegExp(text, "u").test(element.childNodes[0].nodeValue.trim())
);
}
我认为您需要更具体一些,我们才能为您提供帮助。
如果文本是唯一的(或者真的,如果不是,但你必须遍历一个数组)你可以运行一个正则表达式来找到它。使用 PHP 的 preg_match() 就可以了。
如果您使用的是 Javascript 并且可以插入 ID 属性,那么您可以使用 getElementById('id')。然后,您可以通过 DOM 访问返回元素的属性:https ://developer.mozilla.org/en/DOM/element.1 。
我只需要一种方法来获取包含特定文本的元素,这就是我想出的。
用于document.getElementsByInnerText()
获取多个元素(多个元素可能具有相同的确切文本),并用于document.getElementByInnerText()
仅获取一个元素(第一个匹配项)。
此外,您可以使用元素(例如someElement.getElementByInnerText()
)而不是document
.
您可能需要对其进行调整以使其跨浏览器或满足您的需求。
我认为代码是不言自明的,所以我将保持原样。
HTMLElement.prototype.getElementsByInnerText = function (text, escape) {
var nodes = this.querySelectorAll("*");
var matches = [];
for (var i = 0; i < nodes.length; i++) {
if (nodes[i].innerText == text) {
matches.push(nodes[i]);
}
}
if (escape) {
return matches;
}
var result = [];
for (var i = 0; i < matches.length; i++) {
var filter = matches[i].getElementsByInnerText(text, true);
if (filter.length == 0) {
result.push(matches[i]);
}
}
return result;
};
document.getElementsByInnerText = HTMLElement.prototype.getElementsByInnerText;
HTMLElement.prototype.getElementByInnerText = function (text) {
var result = this.getElementsByInnerText(text);
if (result.length == 0) return null;
return result[0];
}
document.getElementByInnerText = HTMLElement.prototype.getElementByInnerText;
console.log(document.getElementsByInnerText("Text1"));
console.log(document.getElementsByInnerText("Text2"));
console.log(document.getElementsByInnerText("Text4"));
console.log(document.getElementsByInnerText("Text6"));
console.log(document.getElementByInnerText("Text1"));
console.log(document.getElementByInnerText("Text2"));
console.log(document.getElementByInnerText("Text4"));
console.log(document.getElementByInnerText("Text6"));
<table>
<tr>
<td>Text1</td>
</tr>
<tr>
<td>Text2</td>
</tr>
<tr>
<td>
<a href="#">Text2</a>
</td>
</tr>
<tr>
<td>
<a href="#"><span>Text3</span></a>
</td>
</tr>
<tr>
<td>
<a href="#">Special <span>Text4</span></a>
</td>
</tr>
<tr>
<td>
Text5
<a href="#">Text6</a>
Text7
</td>
</tr>
</table>
你可以这样做,不确定这是否被推荐,但它对我有用。
[... document.querySelectorAll('a')].filter(el => el.textContent.includes('sometext'));