2

我已经设法使用pytrends提取给定关键字的 Google Trends 历史趋势数据。

pytrends = get_pytrends()
keywords = {'q': 'chelsea', 'date' : 'now 12-H'}
print(json.dumps(pytrends.trend(keywords, return_type='json'), indent=4))

注意:以上数据是过去 12 小时内获得的。

以下部分重点介绍了输出 JSON 数据的一小部分。

{
    "status": "ok",
    "sig": "707079741",
    "table": {
        "cols": [
            {
                "type": "date",
                "id": "date",
                "label": "Date",
                "pattern": ""
            },
            {
                "type": "number",
                "id": "query0",
                "label": "chelsea",
                "pattern": ""
            }
        ],
        "rows": [
            {
                "c": [
                    {
                        "f": "Jan 31, 2017, 02:08 PST",
                        "v": "2017-01-31"
                    },
                    {
                        "f": "13",
                        "v": 13.0
                    }
                ]
            },
            {
                "c": [
                    {
                        "f": "Jan 31, 2017, 02:16 PST",
                        "v": "2017-01-31"
                    },
                    {
                        "f": "13",
                        "v": 13.0
                    }
                ]
            },
            {
                "c": [
                    {
                        "f": "Jan 31, 2017, 02:24 PST",
                        "v": "2017-01-31"
                    },
                    {
                        "f": "13",
                        "v": 13.0
                    }
                ]
            },
...

很明显,上述数据指的是表的值,但我不知道键“f”和“v”指示的值的定义。我打算将这些数据用作我从社交网络(主题标签等)中提取的趋势主题的评分计算的一部分,但由于指示数据的含义不明确,我不确定如何使用它. 没有关于使用这些数据的准确资源。

这个关于类似 JavaScript 库的链接提供了一些有用的信息,但我收到的输出似乎不同。

我如何有效地使用这些数据?

4

1 回答 1

2

我浏览了谷歌趋势的官方文档,发现了这个资源,它定义了如何阅读搜索兴趣线图和新闻文章条形图。相信表格结果中每个时间区间对应的历史趋势值必须根据以上数值计算出来。链接将您引导至有关识别趋势时使用的计算的综合文档。

pytrends 文档指出,除非指定特定国家或地区,否则生成的值基于作为位置的世界。因此,上述值对应于世界级统计数据。

注意:希望这个答案能够深入了解从 Google 趋势中提取的数据,尽管我还没有找到有效使用数据的方法。希望这对将来对该问题的参考有用。

于 2017-02-01T07:14:40.160 回答