我在为我正在设计的标签驱动软件的架构提出一个小问题。
我想要做的是将纯文本存储在数据库中,这对于所有者和其他实体来说是很喜欢的。纯文本充满了标签,就像 Twitter 的主题标签一样,应该是可搜索/可索引的。这可以在应用程序端完成,因此我将拥有大量需要为商业智能处理的小块数据。
没有人会准备好纯文本,它只是关于不需要一致并且可以异步运行的分析。
我知道 Twitter 使用多个数据库:用于推文的 Gizzard 和 Cassandra 以及用于关系的 FlockDb。
我不想使用混合来完成关系,我也不想建立下一个社交网络。我需要做的是分析与其他实体相关的所有标签。
如何解决哈希标签问题,或者如何处理文本以使其工作?
我真的在寻找一个不错的解决方案,而不仅仅是任何解决方案。我真的知道如何为 SQL 创建模式。
感谢您帮助我度过了那个数据库丛林。