0

假设我们要存储一个数据,该数据代表所有可能的英语单词(最终),包括其所有形式同义词词性。包括时态常用表达方式成语。甚至更多 - 很多我们现在甚至不知道的联系。

查词要求:。我可以立即获得所有使用“go”一词的成语。或者我可以得到所有包含 3 个字母的单词,这些单词与业务(标签)相关,并且在所有时态中都具有相同的形式。

你会使用什么样的数据库来解决这类问题?

  1. NOSQL数据库,比如 Mongo DB?可能不会 - 因为有很多联系。但乍一看,这可能是个不错的主意 - json 可以清楚地代表我们的图片(对于人类)?
  2. Relational DatabaseSQL一个'like MySql,whateverSQL .. 也许不是 - 因为三个可能有很多连接,很多索引,这甚至可能还不够?或者即使使用集群,那么理解和支持这种结构可能会很混乱?
  3. [Graph database][1]? 这似乎都是关于对象之间的链接和连接,它似乎更接近于OO表示数据的方式(很容易理解通过某些名称和类型标记连接 - 例如连接/关联:同义词)。但即使它可能比较慢关系数据库(如果遵循维基百科)?(我从未使用过这种类型的数据库)。那么扩展呢(也许那些类型的数据库还没有被证明可以用于实际任务)?
  4. 创建你自己的?(我不会走这条路..)

问题是:

  1. 是否有另一种类型的数据库/数据表示您可以用于此类任务?
  2. 是否有人根据处理类似问题的一些经验得出了一些经过验证的强有力的意见基础?
4

1 回答 1

1

我会尝试使用图形数据库。您可能会在本次演讲中找到一些灵感:http: //skillsmatter.com/podcast/home/case-study-using-graph-theory-graph-databases-to-understand-user-intent/mh-6603

只是简单地挑选一下:图数据库也被认为是 NoSQL。查看 Martin Fowler 的精彩演讲:http ://www.youtube.com/watch?v=qI_g07C_Q5I

于 2013-10-25T12:03:27.237 回答