我正在尝试从https://en.wikipedia.org/wiki/List_of_hedge_funds抓取 URL
具体来说,我正在尝试使用 Apify 来抓取该页面并从 HTML 中存在的锚标记返回 URL 列表。在我的控制台中,我希望href
在名为myValue
. 我还希望在名为 的属性中看到页面标题title
。相反,我只看到以下URL
属性及其值。
我的 Apify 演员使用 Puppeteer 平台。所以我正在使用pageFunction
类似于 Puppeteer 使用它的方式。
下面是我运行之前 Apify UI 的屏幕截图。
页面功能function pageFunction( context ) {
// called on every page the crawler visits, use it to extract data from it
var $ = context.jQuery;
var result = {
title: $('.wikitable').text,
myValue: $('a[href]').text,
};
return result;
}
我究竟做错了什么?