0

有人可以建议哪种数据库更适合存储文本信息,例如用 python 编写的 NLP 项目中使用的词性序列、依赖关系、句子。现在这些信息存储在文件中,每次都需要对其进行解析,以提取提到的块,这些块用作下一个处理阶段的输入。考虑的选项 - MongoDB、Cassandra 和 MySQL。NoSQL 数据库在这种类型的应用程序中是否更好。谢谢。

4

1 回答 1

6

这实际上取决于您存储的具体内容以及您将对这些数据执行哪些操作。

SQL vs. NoSQL 是一个非常基本的决定,没有人可以在这里给你一个好的建议。如果您的数据非常适合关系模型,那么 SQL(PostgreSQL 或 MySQL)是您的选择。如果您的数据更像文档,请使用 MongoDB。

也就是说,就在最近我做了一个搜索引擎。我们必须存储索引页面(原始文本)、相同的文本但标记化和一些额外的元数据。MongoDB 表现得非常好。

于 2013-06-01T13:07:30.160 回答