对于我的链接抓取程序(用 python3.3 编写),我想使用一个数据库来存储大约 100.000 个网站:
- 只是网址,
- 时间戳
- 并为每个网站列出几个属性
我对数据库一无所知,但发现以下内容可能符合我的目的:
- PostgreSQL
- SQLite
- 火鸟
我对速度感兴趣(访问数据库并获取所需信息)。例如:对于网站 x,属性 y 是否存在,如果存在,请阅读它。写作速度当然也很重要。
我的问题:速度是否有很大差异,或者对我的小程序无关紧要?也许有人可以告诉我哪个数据库符合我的要求(并且很容易用 Python 处理)。