6

我正在尝试编写 javascript 代码来查找 div 中的所有 url。现在,如果 div 中的所有 url 都用空格分隔,这将非常容易,在这种情况下,我可以对 div 中的内容执行正则表达式来找到它们。但是,此外部 div 中的 url 可能位于子 div(或任何其他 html 标记)中,我也想将子 div 视为分隔符(并且我不想摆脱这些子 div)。举个例子,在下面我想在 id 为“outer”的 div 中找到 www.foo.com 和 www.bar.com:

<div id="outer"><div>www.foo.com</div>www.bar.com</div>

这样做的好方法是什么?

4

3 回答 3

3

您可以对所有非文本子节点应用递归调用。

function replaceWwwInNodes(node) {
    //text node
    if (node.nodeType === 3) {
        node.textContent = node.textContent.replace(/* ??? */)
    }
    else {
        Array.prototype.forEach.call(node.childNodes, function (elem) {
            replaceWwwInNodes(elem);
        });
    }
}

replaceWwwInNodes(document.getElementById('outer'));

http://jsfiddle.net/UDX5V/

于 2013-06-05T05:59:19.557 回答
0

尝试使用此示例http://jsfiddle.net/iklementiev/TaCx9/1/

var data = document.getElementById("outer").innerText;
var myRe = /www\.[0-9a-z-]+\.[a-z]{2,4}/igm;
var matches=  data.match(myRe)

for (var i = 0; i < matches.length; i++) {
    alert('match: ' + matches[i]);
}

这有助于查找所有网址。

于 2013-06-05T05:52:41.377 回答
0

试试这个

var expression = /[-a-zA-Z0-9@:%_\+.~#?&//=]{2,256}\.[a-z]{2,4}\b(\/[-a-zA-Z0-9@:%_\+.~#?&//=]*)?/gi;
 var regex = new RegExp(expression);
var regContent = $("#outer").html();
var newContent = regContent;                                                                     
if(regContent.match(regex))
{    
    var textContent = regContent.match(regex);                                                                         
for(var i=0;i<regContent.match(regex).length;i++)
{
    newContent = newContent.replace(new RegExp(regContent.match(regex)[i], "g"), "test");
}    
$("#outer").html(newContent);
}   

这将获取所有 url 内容并将其替换为“test”。

于 2013-06-05T06:02:38.360 回答