我对 Python 非常陌生,阅读了大约一半的 Python3 初学者书籍。我认为这样做会让我开始学习我真正想做的事情,而不是通过一些“无聊”的练习。
我想构建一个应用程序,它会从 Reddit 中获取顶级 URL,然后将它们发布到我自己的页面上。它每天只会检查几次,所以这里根本没有锤击。
我想将 Reddit json (http://www.reddit.com/.json) 和其他 subreddit json 解析为 URL,我可以将它们组织到我自己的顶部列表中,并且在我的页面上也有我自己的类别,所以我不不必继续访问 Reddit。
该网站将是一个 Wordpress 模板,其数据库托管在它自己的服务器 (mysql) 上。我将在 AWS 上使用 RDS、ELB、Auto-scaling 和 EC2 实例在 Web 服务器上托管它。
我的问题是:
- 让 Python 抓取应用程序在它自己的服务器上运行是否有意义,然后将抓取的 URL 写入数据库?
-我听说拆分应用程序可能有意义,一个读,另一个写,这是怎么回事?
- Python 代码的流程会是什么样子?我可以摸索着写它,但我只是不完全确定它应该如何流动。
-还有什么我没有想到的,有什么建议吗?