2

我有一个关于将元数据附加到我们的热衷的网页浏览事件的最佳实践的问题。在内部,我们使用 3 个不同的关键字类别来识别一段内容,这些关键字位于每个页面的标签中。一个很好的例子是这样的:

<meta name="namespace:tier1" content="Programming" />
<meta name="namespace:tier2" content="Web Development, Web Operations" />
<meta name="namespace:tier3" content="JavaScript, Analytics, jQuery, HTML, CSS" />

我们希望能够根据这些层对我们的用户进行细分,并进行如下查询:

  • 查看按 tier1 关键字细分的所有流量
  • 查看属于特定 tier1 关键字的最流行的 tier2 关键字
  • ... 等等。

这是我的问题:似乎我们可以将这些元数据与页面浏览事件一起发送,但我们最终会拥有大量可能存在于单独位置的冗余数据。例如,如果我们每天为我们的页面抓取关键字,我们可以通过 URL 对它们进行索引,并且不会将所有重复的元数据保存在敬业度.io 中。

你会如何处理这个问题?我是否被困在 SQL 领域,我应该不担心重复数据吗?

一个相关的问题是,我们的关键字基本上是列表,并且热衷于.io 文档说我们应该远离列表。那么我需要Metadata为每个单词创建一个事件吗?在每次浏览量上发送 +10 请求似乎有点矫枉过正。

4

1 回答 1

1

简短的回答——不用担心重复。对于事件数据,非规范化是您的朋友。Keen 的查询界面被设计为在每个事件包含大量属性时最强大——实际上是当时世界的状态。

Michelle 写了一篇思考事件数据的指南,将其与关系数据进行对比。我们中的许多人(包括我)以前都被困在 SQL 领域,并且发现本指南很有帮助:)

至于列表 - 它主要是您想要避免的对象列表。在这种情况下,您的列表是字符串之一,因此您仍然可以对该属性进行大量查询。

有关 Keen 和对象列表的更多信息,请查看这个 SO 问题:Nested JSON Objects In Keen IO

于 2014-10-28T21:17:01.037 回答