0

一位朋友想开始为他希望我尝试构建的数据量大的网站抓取数据。我是一名(相对较新的)Rails 开发人员,对这一切的数据方面知之甚少。如果他将抓取外包出去,是否知道一旦我启动了站点,我可以/应该以哪种格式获取数据以便轻松地将其导入 PostgreSQL 数据库?

希望这不是一个太模糊的问题。我不知道从哪里开始寻找这个。

4

1 回答 1

1

CSV 文件格式与几乎所有数据库系统兼容,它是一个很好的入门。甚至,如果你以后改变主意,至于你将使用什么数据库系统,你不必太担心改变格式。

如果您考虑数据挖掘,那么 NoSQL 数据库系统可能是更好的解决方案(MongoDB、CouchDB 等)。然后,文件格式也可以是 JSON。

于 2013-06-15T00:04:28.483 回答