2

我正在构建一个 Meteor.js 应用程序,我想做的一件事是从保存的页面中提取标题和元描述标签。我正在使用这个跨域程序并且有一半的代码可以工作。

这是摘录;它采用标记为“url”的表单中给出的值并运行代码:

$.get(url, function(response){
      if ((suggestedTitle=((/<title>(.*?)<\/title>/m).exec(response.responseText))) != null){
          $('#title').val(suggestedTitle[1]);
      }else{
          $('#title').val(url);
      }
      if ((suggestedDesc=($('meta[name=description]').attr('content'))) != undefined){
        $('#desc').val(suggestedDesc[1]);
      }else{
        $('#desc').val('Description for this page cannot be found.');
      }
   });

我认识到使用正则表达式解析 HTML 不是最佳实践(对替代方案的建议开放,但我没有仔细研究过),但除此之外,此脚本成功地从 URL 中提取标题或返回网址,如果找不到,但描述失败,只返回后备文本。将不胜感激一些帮助,谢谢:)

4

1 回答 1

1

不要使用 regex 或 jQuery 来解析响应,而是使用 DOM 方法来遍历响应文本。试试这个:

$.ajax({
    url: "http://www.google.com",
    type: "GET",
    async: true
}).done(function (response) {
    var div = document.createElement("div"),
        responseText = response.results[0],
        title, metas, meta, name, description, i;
    div.innerHTML = responseText;
    title = div.getElementsByTagName("title");
    title = title.length ? title[0].innerHTML : undefined;
    metas = div.getElementsByTagName("meta");
    for (i = 0; i < metas.length; i++) {
        name = metas[i].getAttribute("name");
        if (name === "description") {
            meta = metas[i];
            description = meta.getAttribute("content");
            break;
        }
    }
    console.log("Title:", title);
    console.log("Description:", description);
}).fail(function (jqXHR, textStatus, errorThrown) {
    console.log("AJAX ERROR:", textStatus, errorThrown);
});

演示:http: //jsfiddle.net/KLdsG/3/

我把你提供的插件放在最上面(它被缩小了,所以它适合你,你仍然可以看到你自己的代码。

显然,这使用了http://www.google.com,但是您应该能够将任何 URL 放入其中并且它的工作方式相同。此外,您可以将其放入可重用函数中 - 我只是想展示一个示例。我会假设它与$.get()而不是相同$.ajax()

您不能直接使用response.responseText,因为返回的项目是由一些东西组成的对象。要获取 HTML,您可以使用response.results[0]. response.results显然是一个数组,我不确定那里还有什么(比如索引 1、2、3 等)。

当我尝试使用 时,我发现发生了奇怪的事情$(response.results[0]),所以我只是坚持使用正常的 DOM 操作。

于 2013-05-23T00:39:40.157 回答