这个问题与实际代码关系不大,更多的是与底层方法有关。
在我的假实习期间,我的“老板”要求我给他写一个脚本,该脚本将从用户的推文中抓取链接列表(该列表每周出现一次,并且始终是同一用户),然后将所述列表发布到该公司的 Tumblr 帐户。
目前,我正在考虑这种结构:基础将是一个 bash 脚本,它首先调用一些脚本,该脚本使用 Twitter API 来查找给定主题标签的帖子并解析列表(当前候选语言是 Perl、PHP 和 Ruby,在没有特别的顺序)。然后,该脚本会将解析后的列表(带有一些标记)存储到一个文本文件中,另一个使用 Tumblr API 的脚本将从该文本文件中格式化该列表,然后将其发布。
这是一种明智的做法吗?到目前为止,在计划中,我只能获取 Twitter 帖子,但我已经在使用 API 获取帖子或仅获取他们提供的提要并尝试解析它之间陷入困境。我知道这并不是一个真正的大项目,但它肯定是我开始的最大的项目,所以当我做出决定时,我害怕得瘫痪!