23

现在,我意识到对此的最初反应可能是“你不能”或“使用分析”,但我会继续希望有人比这更有洞察力。

带有“自动标记”的 Google 广告词会在链接上附加一个“gclid”(可能是“google click id”),将您发送到广告网站。它出现在网络日志中,因为它是一个查询参数,分析使用它来将该访问与广告/活动联系起来。

我想做的是从 gclid 中提取任何有用的信息,以便对我们的流量进行我们自己的分析。原因如下:

  • 统计数据是不完善的,但如果我们对它们进行整理,我们就会确切地知道我们做了什么假设,以及它们是如何计算的。
  • 我们可以将数据与其他数据联系起来,并生成更准确的转化​​率统计数据。
  • 我们不必依赖 javascript 进行转换。

现在很明显 gclid 是 base64 编码的(或一些接近的变体),它的某些部分比其他部分变化更大。除此之外,我无法确定它与什么有关。

有没有人对我如何解码这个有任何见解,或者是否有人已经将 gclids 关联回了compaigns 甚至帐户​​?

我和谷歌的几个人谈过,尽管他们有“不作恶”的座右铭,但他们完全不愿意讨论泄露这些信息的可能性,即使是在保密协议下。似乎他们喜欢他们对我们的网络统计数据的垄断。

4

11 回答 11

23

到目前为止,最简单的解决方案是使用 Google Analytics(分析)活动跟踪参数(utm_source、utm_campaign、utm_medium 等)手动标记您的链接,然后提取该数据。

gclid 不仅仅依赖于 adwords 帐户/广告系列/等。如果您两次点击相同的 adwords 广告,它可能会为您提供不同的 gclid,因为还有与该特定点击相关的各种会话和费用数据。

Gclid 可能不是 100% 随机的,真的,但如果可以从该数字中提取所有 Adwords 数据,我会感到非常惊讶和担忧。这将是一个巨大的安全漏洞(即任意用户可以查看您的 Adwords 数据)。更有可能的是,每次展示都会生成一个伪随机 gclid,如果点击该广告,则 gclid 会登录到 Adwords 中(否则它会被丢弃)。然后,Analytics 使用该数字在事后将数据与 Adwords 进行核对。除此之外,gclid 号码本身没有内在价值。

关于您的最后一点,在 Google Analytics 和 Google Adwords 服务条款中都明确禁止尝试破解或反向工程此信息,并且是永久禁止的理由。此外,您在注册这些服务时同意的 TOS 表明,您的数据不能以您喜欢的任何方式使用。谷歌提供免费服务,所以有附加条件。如果您不喜欢无法完全控制您的数据,那么还有很多其他解决方案。但是,您将为这种控制支付额外费用。

谷歌几乎所有的收入都来自销售广告。Adwords 是他们最大的赚钱产品。他们不会向您提供有关其运作方式的机密信息。他们不知道你是谁,也不知道你将如何处理这些信息。如果您签署 NDA 并且他们有法律追索权起诉您,这并不重要;如果您将该信息泄露给竞争对手,您的生命将不足以偿还您将失去的钱。

很抱歉打扰您,但不管是否“不要作恶”,Google 是一家企业,而不是一家慈善机构。他们并没有通过将搜索算法提供给第一个提出要求的人而成为世界上最成功的公司之一。

于 2009-02-16T21:06:49.857 回答
19

该参数在Protocol Buffersgclid中编码,然后在 Base64 的变体中。

请参阅本指南以解码和解释gclid ,包括您可以使用的(Apache 许可的)PHP 函数。

里面基本上编码了3个参数,其中一个是时间戳。其他2个暂时未知。

就理解这些其他参数的含义而言,将其与以极其相似的方式编码ei的参数进行比较可能会有所帮助(基本上是去掉了键的协议缓冲区)。该参数还有一个时间戳,似乎是微秒,以及 2 个其他整数。ei

于 2013-12-16T16:47:21.243 回答
10

仅供参考,我刚刚在这篇文章中发布了对我网站上的一些 glcid 数据的快速分析。gclid 肯定有一些结构,但很难破译。

于 2009-04-15T14:24:20.200 回答
4

我也一直在我们公司解决这个问题。我们希望能够更好地了解我们的 AdWords 正在做什么,但我们对 Google Analytics(分析)的局限性感到沮丧。

我们当前的解决方案是使用正则表达式在 Apache 访问日志中查找 GET 请求:

.*[?&]gclid=([^$&]*)

如果存在,那么我们查看引用字符串以获取关键字:

.*[?&]q=([^$&]*).*

另一种选择是更改您的 Apache 网络日志以开始记录 google 设置的 __utmz cookie,该 cookie 中应包含 utmctr 中的关键字。Google __utmz cookie,您应该能够找到大量信息。

引用字符串的准确性如何?不是100%。防火墙和安全设备会将其剥离。但是自己解析它确实比谷歌分析给你更多的灵活性。将 gclid 发送到 AdWords 并取回数据将是一项很棒的功能,但该功能似乎不可用。

编辑:由于我写了这个,我们还创建了我们自己的标签,这些标签作为请求参数附加到每个目标 url。每个标签只是文本、广告组和广告系列名称的 md5 哈希。我们使用正则表达式从访问日志中获取它并在 SQL 数据库中查找它。

于 2011-05-04T18:11:10.637 回答
4

我认为您可以通过 google 的 adword api 获得与 gclid 相关联的所有好东西。具体可以查询点击效果报告。

https://developers.google.com/adwords/api/docs/appendix/reports#click

于 2014-03-11T21:06:01.870 回答
1

好吧,这不是答案,但是这种方法类似于您解决任何密码学问题的方法。

可能性1:它们只是随机的,在这种情况下,你就完蛋了。这类似于一次性垫。

可能性2:它们“意味着”某些东西。在这种情况下,您必须控制环境。

  1. 获取它们的良好数据库。为您的站点和其他站点查找 gclid。记录所有点击发生的所有时间,以及任何其他可能有用的数据
  2. 开裂!正如您已经开始的那样,开始将您收集的数据与您的已知数据进行回归,看看您是否可以找到使用解密技术的模式
  3. 开始抓取随机 gclid,看看它们带你去哪里。

虽然我不希望这会成功,但我祝你好运!

于 2008-12-13T23:08:14.957 回答
1

看起来我的代表很弱,所以我只会发布另一个答案而不是评论。

显然,这不是答案。只是表达一些想法。

当您在 Adwords 中启用自动标记时,gclid 参数不会添加到目标 URL。相反,它们在运行时由 Google 点击跟踪服务器附加到目标 URL。因此,正在发生以下两件事之一:

  1. 点击服务器将 gclid 与 Adwords 实体标识符一起存储,以便 Google Analytics(分析)以后可以查找它们。

  2. gclid 具有以某种方式编码的实体标识符,以便 Analytics 可以对其进行解码。

从性能的角度来看,Google 似乎不太可能实施类似于选项 1 的任何东西。强制 Analytics 将 gclid “加入”到 Adwords ID 似乎在规模上非常低效。

于 2013-02-14T22:47:46.553 回答
1

这是解码 GCLID 参数的非编程方式。您可能只是想弄清楚推动点击和转化的广告系列、广告组、关键字、展示位置和广告。为此,您可以将 GCLID 作为单独的转化类型上传到 AdWords 中,然后按转化类型细分以深入了解触发转化的条件。这些步骤:

  1. 在 AdWords 用户界面中,转到“工具”->“转化”->“通过点击导入”来源添加转化
  2. 访问有关导入转化的 AdWords 帮助主题https://support.google.com/adwords/answer/7014069并使用您的 GCLID 值创建一个批量加载文件,将转化分配给您新的“从点击导入”转化类型
  3. 在左侧导航栏中的工具->转化->转化操作(上传)中将转化上传到 AdWords
  4. 转到广告系列标签,细分->转化->转化名称
  5. 在细分列表中找到您的新转化名称,这就是转化的来源。在广告组和关键字标签上继续执行相同的过程,直到您知道 GCLID 发起条件
于 2016-09-09T14:00:35.193 回答
0

另一种方法是简单地查看推荐人数据,该数据至少会提供被搜索的关键字。

于 2009-12-22T18:41:06.027 回答
0

这里有一个想法:gclid 是否有可能只是一个密码哈希、la bit.ly 或其他一些 URL 缩短器?

在这种情况下,散列文本的内容将被写入数据库,并替换为唯一 ID。

毕竟,gclid 正在缩短一堆原本很长的文本。

举个例子:www.example.com?utm_source=google&utm_medium=cpc

转换为:www.example.com?gclid=XDF

就像 URL 缩短器一样。

需要一个替换密码才能对加密哈希进行逆向工程......这不是一件容易的事:https ://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

也许一些深入挖掘日志,寻找模式等......

于 2013-01-16T19:03:05.140 回答
-1

I agree with Ophir and Chris. My feeling is that it is purely a serial number / unique click ID, which only opens up its secrets when the Analytics and Adwords systems talk to each other behind the scenes.

Knowing this, I'd recommend looking at the referring URL and pulling as much as possible from this to use in your back end click tracking setup.

For example, I live in NZ, and am using Firefox. This is a search from the Firefox Google toolbar for "stack overflow": http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en-GB

You can see that: a) im using .NZ domain, b) my keyword "stack+overflow", c) im running firefox.

Finally, if you also stash the full landing page URL, you can store the GCLID, which will tell you the visitor came from paid, whereas if it doesn't have a GCLID, then the user must have come from natural search (if URL tagging is enabled of course).

This would theoretically allow you to then search for the keyword in your campaign, and figure out which adgroup them came from. Knowing the creative would probably be impossible though, unless you split test your landing URLs or tag them somehow.

于 2010-01-13T21:25:56.013 回答