Digg、Del.icio.us 和 StackOverflow 等网站如何实现标记?
我知道这个其他问题有一个与交叉引用表的多对多关系的公认答案。但是“大男孩”是怎么做到的呢?一样的方法?它是如何扩展的?
这是经常被引用的文章,它通过实际性能指标分解标记模式:http: //tagging.pui.ch/post/37027746608/tagsystems-performance-tests
作者指出,delicious 的创始人解释说,使用 RDBMS 进行标记根本无法扩展到负载下的数百万个项目。在这种情况下,像Lucene这样的替代品可能更适合。
我确信在一个非常大的系统中额外的 JOIN 查询会太昂贵。
标签要么非规范化地存储在主表中,要么可能有一个单独的标签表,每个标签项都有一行。