0

我目前正在使用 Watson 发现中的直方图功能,但我需要为每个切片记录文档,这样我就可以再次对它们进行处理。(比如看平均情绪)

这是我的查询,它将我的数据分解为 15 分钟的块

filter(enriched_tweet.concepts.text:"'Hockey'").histogram(extracted_metadata.utc_timestamp,interval:900000)

但响应只告诉我每个“切片”中有多少文档。

{
"matching_results": 444530,
"aggregations": [
    {
        "type": "filter",
        "match": "enriched_tweet.concepts.text:\"'Hockey'\"",
        "matching_results": 69556,
        "aggregations": [
            {
                "type": "histogram",
                "field": "utc_timestamp",
                "interval": 900000,
                "results": [
                    {
                        "key": 1498227300000,
                        "matching_results": 180
                    },
                    {
                        "key": 1498228200000,
                        "matching_results": 258
                    },

延伸到下面的答案

因此,您可以对存储桶中的数据执行操作,即使您的结果中没有这些数据,例如,以下操作将起作用:

filter(enriched_tweet.concepts.text:"'Hockey'").histogram(utc_timestamp,interval:900000).sum(followers)

我想要的是每个切片的一组文档,所以我可以检查它们,然后对它们求和,以计算出例如 15 分钟间隔的情绪。

4

1 回答 1

1

您可以运行嵌套在直方图聚合下的总和聚合,该聚合可以对直方图存储桶中的字段求和。有关聚合的更多信息,请参阅https://www.ibm.com/watson/developercloud/doc/discovery/query-reference.html#aggregations

于 2017-07-06T14:05:17.440 回答