我有一堆文章,我想做词频和趋势分析。
文章标有日期、作者、主题和主题。我想使用这些标签对数据进行切片,以便我可以获得用于特定作者(或作者组)、主题或主题的最常用词。总体和随着时间的推移(趋势)。
我将如何设计这个数据库(关系型或其他)还是应该创建一个数据立方体?
我有一堆文章,我想做词频和趋势分析。
文章标有日期、作者、主题和主题。我想使用这些标签对数据进行切片,以便我可以获得用于特定作者(或作者组)、主题或主题的最常用词。总体和随着时间的推移(趋势)。
我将如何设计这个数据库(关系型或其他)还是应该创建一个数据立方体?