230

如果我知道文本标签包含什么,如何在 html 页面中获取标签。例如:

<a ...>SearchingText</a>
4

15 回答 15

268

您可以使用 xpath 来完成此操作

var xpath = "//a[text()='SearchingText']";
var matchingElement = document.evaluate(xpath, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;

您还可以使用此 xpath 搜索包含某些文本的元素:

var xpath = "//a[contains(text(),'Searching')]";
于 2015-03-26T21:26:57.537 回答
193

您必须手动遍历。

var aTags = document.getElementsByTagName("a");
var searchText = "SearchingText";
var found;

for (var i = 0; i < aTags.length; i++) {
  if (aTags[i].textContent == searchText) {
    found = aTags[i];
    break;
  }
}

// Use `found`.
于 2010-09-28T13:42:55.497 回答
63

使用目前可用的最现代的语法,它可以像这样非常干净地完成:

for (const a of document.querySelectorAll("a")) {
  if (a.textContent.includes("your search term")) {
    console.log(a.textContent)
  }
}

或使用单独的过滤器:

[...document.querySelectorAll("a")]
   .filter(a => a.textContent.includes("your search term"))
   .forEach(a => console.log(a.textContent))

自然,旧版浏览器无法处理此问题,但如果需要旧版支持,您可以使用转译器。

于 2017-03-20T15:42:03.487 回答
44

您可以使用 jQuery :contains() 选择器

var element = $( "a:contains('SearchingText')" );
于 2015-06-28T19:42:26.877 回答
18

function findByTextContent(needle, haystack, precise) {
  // needle: String, the string to be found within the elements.
  // haystack: String, a selector to be passed to document.querySelectorAll(),
  //           NodeList, Array - to be iterated over within the function:
  // precise: Boolean, true - searches for that precise string, surrounded by
  //                          word-breaks,
  //                   false - searches for the string occurring anywhere
  var elems;

  // no haystack we quit here, to avoid having to search
  // the entire document:
  if (!haystack) {
    return false;
  }
  // if haystack is a string, we pass it to document.querySelectorAll(),
  // and turn the results into an Array:
  else if ('string' == typeof haystack) {
    elems = [].slice.call(document.querySelectorAll(haystack), 0);
  }
  // if haystack has a length property, we convert it to an Array
  // (if it's already an array, this is pointless, but not harmful):
  else if (haystack.length) {
    elems = [].slice.call(haystack, 0);
  }

  // work out whether we're looking at innerText (IE), or textContent 
  // (in most other browsers)
  var textProp = 'textContent' in document ? 'textContent' : 'innerText',
    // creating a regex depending on whether we want a precise match, or not:
    reg = precise === true ? new RegExp('\\b' + needle + '\\b') : new RegExp(needle),
    // iterating over the elems array:
    found = elems.filter(function(el) {
      // returning the elements in which the text is, or includes,
      // the needle to be found:
      return reg.test(el[textProp]);
    });
  return found.length ? found : false;;
}


findByTextContent('link', document.querySelectorAll('li'), false).forEach(function(elem) {
  elem.style.fontSize = '2em';
});

findByTextContent('link3', 'a').forEach(function(elem) {
  elem.style.color = '#f90';
});
<ul>
  <li><a href="#">link1</a>
  </li>
  <li><a href="#">link2</a>
  </li>
  <li><a href="#">link3</a>
  </li>
  <li><a href="#">link4</a>
  </li>
  <li><a href="#">link5</a>
  </li>
</ul>

当然,一个更简单的方法仍然是:

var textProp = 'textContent' in document ? 'textContent' : 'innerText';

// directly converting the found 'a' elements into an Array,
// then iterating over that array with Array.prototype.forEach():
[].slice.call(document.querySelectorAll('a'), 0).forEach(function(aEl) {
  // if the text of the aEl Node contains the text 'link1':
  if (aEl[textProp].indexOf('link1') > -1) {
    // we update its style:
    aEl.style.fontSize = '2em';
    aEl.style.color = '#f90';
  }
});
<ul>
  <li><a href="#">link1</a>
  </li>
  <li><a href="#">link2</a>
  </li>
  <li><a href="#">link3</a>
  </li>
  <li><a href="#">link4</a>
  </li>
  <li><a href="#">link5</a>
  </li>
</ul>

参考:

于 2014-10-27T19:46:07.417 回答
17

功能方法。返回所有匹配元素的数组并在检查时修剪周围的空格。

function getElementsByText(str, tag = 'a') {
  return Array.prototype.slice.call(document.getElementsByTagName(tag)).filter(el => el.textContent.trim() === str.trim());
}

用法

getElementsByText('Text here'); // second parameter is optional tag (default "a")

如果您正在查看不同的标签,即跨度或按钮

getElementsByText('Text here', 'span');
getElementsByText('Text here', 'button');

默认值 tag = 'a' 将需要旧浏览器的 Babel

于 2017-07-13T19:54:22.627 回答
12

只需将您的子字符串传递到以下行:

外部 HTML

document.documentElement.outerHTML.includes('substring')

内部 HTML

document.documentElement.innerHTML.includes('substring')

您可以使用这些来搜索整个文档并检索包含您的搜索词的标签:

function get_elements_by_inner(word) {
    res = []
    elems = [...document.getElementsByTagName('a')];
    elems.forEach((elem) => { 
        if(elem.outerHTML.includes(word)) {
            res.push(elem)
        }
    })
    return(res)
}

用法

用户“T3rm1”在此页面上被提及了多少次?

get_elements_by_inner("T3rm1").length

1

jQuery 被提及了多少次?

get_elements_by_inner("jQuery").length

3

获取包含单词“Cyber​​netic”的所有元素:

get_elements_by_inner("Cybernetic")

在此处输入图像描述

于 2019-03-13T19:44:10.237 回答
9

如果需要,从 <=IE11 中的user1106925获取过滤器方法

您可以将扩展运算符替换为:

[].slice.call(document.querySelectorAll("a"))

并且包含调用a.textContent.match("your search term")

效果很好:

[].slice.call(document.querySelectorAll("a"))
   .filter(a => a.textContent.match("your search term"))
   .forEach(a => console.log(a.textContent))
于 2020-04-23T07:02:18.550 回答
5

与其他答案相比,我发现使用较新的语法要短一些。所以这是我的建议:

const callback = element => element.innerHTML == 'My research'

const elements = Array.from(document.getElementsByTagName('a'))
// [a, a, a, ...]

const result = elements.filter(callback)

console.log(result)
// [a]

JSfiddle.net

于 2017-04-20T07:33:28.483 回答
2

您可以使用 aTreeWalker遍历 DOM 节点,并找到包含文本的所有文本节点,并返回它们的父节点:

const findNodeByContent = (text, root = document.body) => {
  const treeWalker = document.createTreeWalker(root, NodeFilter.SHOW_TEXT);

  const nodeList = [];

  while (treeWalker.nextNode()) {
    const node = treeWalker.currentNode;

    if (node.nodeType === Node.TEXT_NODE && node.textContent.includes(text)) {
      nodeList.push(node.parentNode);
    }
  };

  return nodeList;
}

const result = findNodeByContent('SearchingText');

console.log(result);
<a ...>SearchingText</a>

于 2019-10-12T18:23:50.753 回答
1

虽然可以通过内部文本获得,但我认为您走错路了。那个内部字符串是动态生成的吗?如果是这样,你可以给标签一个类或者——更好的是——当文本进入那里时的ID。如果它是静态的,那就更容易了。

于 2010-09-28T13:44:27.823 回答
1

这可以完成工作。
返回包含 的节点数组text

function get_nodes_containing_text(selector, text) {
    const elements = [...document.querySelectorAll(selector)];

    return elements.filter(
      (element) =>
        element.childNodes[0]
        && element.childNodes[0].nodeValue
        && RegExp(text, "u").test(element.childNodes[0].nodeValue.trim())
    );
  }
于 2019-10-13T15:13:42.567 回答
0

我认为您需要更具体一些,我们才能为您提供帮助。

  1. 你怎么找到这个?Javascript?php?珀尔?
  2. 您可以将 ID 属性应用于标签吗?

如果文本是唯一的(或者真的,如果不是,但你必须遍历一个数组)你可以运行一个正则表达式来找到它。使用 PHP 的 preg_match() 就可以了。

如果您使用的是 Javascript 并且可以插入 ID 属性,那么您可以使用 getElementById('id')。然后,您可以通过 DOM 访问返回元素的属性:https ://developer.mozilla.org/en/DOM/element.1 。

于 2010-09-28T13:59:19.027 回答
0

我只需要一种方法来获取包含特定文本的元素,这就是我想出的。

用于document.getElementsByInnerText()获取多个元素(多个元素可能具有相同的确切文本),并用于document.getElementByInnerText()仅获取一个元素(第一个匹配项)。

此外,您可以使用元素(例如someElement.getElementByInnerText())而不是document.

您可能需要对其进行调整以使其跨浏览器或满足您的需求。

我认为代码是不言自明的,所以我将保持原样。

HTMLElement.prototype.getElementsByInnerText = function (text, escape) {
    var nodes  = this.querySelectorAll("*");
    var matches = [];
    for (var i = 0; i < nodes.length; i++) {
        if (nodes[i].innerText == text) {
            matches.push(nodes[i]);
        }
    }
    if (escape) {
        return matches;
    }
    var result = [];
    for (var i = 0; i < matches.length; i++) {
        var filter = matches[i].getElementsByInnerText(text, true);
        if (filter.length == 0) {
            result.push(matches[i]);
        }
    }
    return result;
};
document.getElementsByInnerText = HTMLElement.prototype.getElementsByInnerText;

HTMLElement.prototype.getElementByInnerText = function (text) {
    var result = this.getElementsByInnerText(text);
    if (result.length == 0) return null;
    return result[0];
}
document.getElementByInnerText = HTMLElement.prototype.getElementByInnerText;

console.log(document.getElementsByInnerText("Text1"));
console.log(document.getElementsByInnerText("Text2"));
console.log(document.getElementsByInnerText("Text4"));
console.log(document.getElementsByInnerText("Text6"));

console.log(document.getElementByInnerText("Text1"));
console.log(document.getElementByInnerText("Text2"));
console.log(document.getElementByInnerText("Text4"));
console.log(document.getElementByInnerText("Text6"));
<table>
    <tr>
        <td>Text1</td>
    </tr>
    <tr>
        <td>Text2</td>
    </tr>
    <tr>
        <td>
            <a href="#">Text2</a>
        </td>
    </tr>
    <tr>
        <td>
            <a href="#"><span>Text3</span></a>
        </td>
    </tr>
    <tr>
        <td>
            <a href="#">Special <span>Text4</span></a>
        </td>
    </tr>
    <tr>
        <td>
            Text5
            <a href="#">Text6</a>
            Text7
        </td>
    </tr>
</table>

于 2017-12-14T13:56:31.293 回答
0

你可以这样做,不确定这是否被推荐,但它对我有用。

[... document.querySelectorAll('a')].filter(el => el.textContent.includes('sometext'));
于 2022-03-05T10:13:58.760 回答