0

我有一堆文章,我想做词频和趋势分析。

文章标有日期、作者、主题和主题。我想使用这些标签对数据进行切片,以便我可以获得用于特定作者(或作者组)、主题或主题的最常用词。总体和随着时间的推移(趋势)。

我将如何设计这个数据库(关系型或其他)还是应该创建一个数据立方体?

4

1 回答 1

0

Rizzoma.com 使用 couchDB (noSQL) 和 Sphinx (全文搜索引擎) 实现了这一目标。如果需要,您可以尝试以另一种方式制作它,或者测试现有解决方案并重复它。

于 2013-10-16T11:11:50.367 回答