6

嗨,这里是新手,所以请多多包涵。似乎是一项简单的工作,但我似乎无法找到一种简单的方法来做到这一点。

所以我需要从网页“www.example.com/index.php”中提取特定的文本。我知道文本将在具有特定 id 的 p 标签中可用。如何使用 javascript 提取这些数据?

我目前正在尝试的是我的计算机上有我的javascript文件(trying.js),代码如下:

$(document).ready(function () {
    $.get("www.example.com/index.php", function(data) {
        console.log(data)
    }) ;
});

和一个运行 javascript 文件的 html。

当我用 Firefox 打开这个 html 页面时,它不会在控制台中显示任何内容。我如何获取网站的数据?我在正确的轨道上吗?有一个更好的方法吗?

4

2 回答 2

6

您正在寻找的是页面抓取工具。Javascript 无法成功,因为它只能从您所在的域收集数据。

例如,您可以在 Ruby 中构建它,并使用众多现有 gem 之一来完成此类任务,例如https://github.com/assaf/scrapihttp://nokogiri.org/

于 2013-10-04T13:34:26.903 回答
3

请看一下Javascript 可以读取任何网页的源代码吗?

讨论了多种方法。希望它可以帮助你。

于 2013-10-04T13:43:20.663 回答