1

我正在寻找用于导出 Facebook 页面和 facebook 应用程序的 facebook 洞察数据的工具或流程。目前我只是从他们的 Insights 界面手动下载 csv 文件,但理想情况下我想自动化这个过程并将数据加载到 Pentaho Kettle 中,这样我就可以对数据执行一些操作。

有没有办法自动下载和输入 csv 文件?还是我必须使用 facebook graph api explorer?我目前正在研究一个设置,我使用 NetBeans 和 RestFB 来提取我想要的数据,然后使用 Pentaho Kettle 访问该数据。我不确定这是否可行,或者它是否是最好的方法。

4

1 回答 1

0

正如 Codek 所说,Kettle 插件是一个非常好的主意,并且对 Kettle 项目非常有帮助。然而,这也是一项认真的努力。

如果您不想付出这种努力,您当然可以使用 Kettle Job 下载文件,只要文件可通过标准传输方法(FTP、SFTP、SSH 等)获得。我从未使用过 RestFB,所以我不知道有什么可用的。您可以通过REST 客户端转换步骤直接从 Web 服务获取。

下载文件后,您可以将它们发送到要加载的转换。您可以对每个输入行执行此操作吗?转换作业步骤上的选项,或者您可以使用Get files from result 从转换中作业的结果集中获取文件名。

然后,您可以在使用Copy 或 Move result filenames加载后归档文件。在一项工作中,我使用Get File NamesMerge Join仅找到不在我的存档中的文件,然后在转换中的结果步骤中设置文件,因此如果需要也可以这样做。

要使其自动化,您可以使用 Kitchen.bat/Kitchen.sh 从调度程序运行您的作业。由于我经常使用 PostgreSQL,所以我使用 PGAgent 作为我的调度程序,但 Windows 调度程序或 cron 也可以工作。

希望有帮助。

于 2013-02-20T20:26:59.820 回答