我有一个关于将元数据附加到我们的热衷的网页浏览事件的最佳实践的问题。在内部,我们使用 3 个不同的关键字类别来识别一段内容,这些关键字位于每个页面的标签中。一个很好的例子是这样的:
<meta name="namespace:tier1" content="Programming" />
<meta name="namespace:tier2" content="Web Development, Web Operations" />
<meta name="namespace:tier3" content="JavaScript, Analytics, jQuery, HTML, CSS" />
我们希望能够根据这些层对我们的用户进行细分,并进行如下查询:
- 查看按 tier1 关键字细分的所有流量
- 查看属于特定 tier1 关键字的最流行的 tier2 关键字
- ... 等等。
这是我的问题:似乎我们可以将这些元数据与页面浏览事件一起发送,但我们最终会拥有大量可能存在于单独位置的冗余数据。例如,如果我们每天为我们的页面抓取关键字,我们可以通过 URL 对它们进行索引,并且不会将所有重复的元数据保存在敬业度.io 中。
你会如何处理这个问题?我是否被困在 SQL 领域,我应该不担心重复数据吗?
一个相关的问题是,我们的关键字基本上是列表,并且热衷于.io 文档说我们应该远离列表。那么我需要Metadata
为每个单词创建一个事件吗?在每次浏览量上发送 +10 请求似乎有点矫枉过正。