所以我试图获取我网页中使用的所有单词的数组。
应该很容易吧?
我遇到的问题是$("body").text().split(" ")
返回一个数组,其中一个元素的开头和另一个元素的结尾处的单词连接为一个。
IE:
<div id="1">Hello
<div id="2">World</div>
</div>
["HelloWorld"]
当我希望它返回时返回["Hello", "World"]
。
我也试过:
wordArr = [];
function getText(target)
{
if($(this).children())
{
$(this).children(function(){getText(this)});
}
else
{
var testArr = $(this).text().split(" ");
for(var i =0; i < testArr.length; i++)
wordArr.push(testArr[i]);
}
}
getText("body");
但$(node).children()
对于 DOM 中存在的任何节点都是真实的,所以这不起作用。
我确定我遗漏了一些明显的东西,所以我会很感激多一双眼睛。
对于它的价值,我不需要唯一的单词,只需要文档正文中的每个单词作为数组中的一个元素。我正在尝试使用它来生成上下文和与另一组单词的词汇共现,因此仅复制给定单词的上下文重要性。
提前感谢您的任何想法。
见小提琴