3

我目前被分配创建一个网络爬虫来自动化我所做的一些报告任务。此网络爬虫必须使用我的凭据登录,在不同字段中搜索特定内容(一些与当前日期相关),如果有任何可用数据,则下载包含数据的 CSV,快速解析 CSV 以获得快速编号计数,创建附有 CSV 的电子邮件并发送。

我目前非常了解 C++ 和 Python,正在学习 C,但有人告诉我 Ruby 或 Ruby on Rails 是一个很好的方法。Ruby on Rails 是否仅用于创建 Web 应用程序,如果是,我的任务是否符合 Web 应用程序的描述,或者我可以只制作一个运行并完成所有工作的独立程序?

我想知道哪种语言最容易编码(具有易于使用的模块),具有与这些任务相关的良好库/模块。在执行此任务之前,我需要考虑什么?我要到 12 月底才能完成这个,而且我每周只在这里工作 12 个小时左右(我是学生,这是我的实习)。这可行吗?

谢谢。

4

3 回答 3

5

你已经知道 Python,那就去吧。CSV 解析和邮件发送是非常琐碎的任务,我假设您可以通过 Google 解决这些问题。

至于网络爬虫?使用机械化

于 2012-10-02T15:12:56.103 回答
1

添加到机械化:

如果您的页面有一个无法处理的 javascript 组件,则 selenium 会驱动一个实际的 Web 浏览器。如果你一心想要使用 ruby​​,你也可以使用 WATIR,但是 selenium 同时具有 ruby​​ 和 python 绑定。

于 2012-10-02T19:52:50.210 回答
0

虽然这不是一个很好的Stackoverflow问题,但由于您是一名学生并且是为了实习,因此标记它或否决它似乎是一种糟糕的形式。:)

基本上,您几乎可以使用您列出的任何语言完成此任务。如果你想学习 Ruby 作为你实习经历的一部分,那么这可能是一个很棒的项目和学习它的一种方式。但是,python 也会很好用(你可能会使用 Mechanize)。我可能应该透露我是一名 Python 开发人员并且我喜欢它。我认为它是一种很棒的语言,有很好的支持和工具。我敢肯定 Ruby 的人对他们的语言也有同样的感受。同样,我认为这是你在实习期间想要完成的事情。你想带走什么经验,等等。祝你好运。

于 2012-10-02T15:17:36.493 回答