-1

你好我有一个 php 代码爬虫来检测一个网站,如果它有一个异步谷歌代码。这是检测异步谷歌代码的片段:

$async_ga_string = "ga.async";

if(!strpos($str, $async_ga_string))$async_ga = '';
            else $async_ga = 'yes';

它工作正常。但我真正需要的是能够在这个谷歌代码片段中获得异步 UA 代码:

     var _gaq = _gaq || [];
  _gaq.push(['_setAccount', 'UA-2595901-1']);
  _gaq.push(['_trackPageview']);

我需要得到'UA-2595901-1'

4

1 回答 1

0

这是一个不完美的解决方案,但 Google Analytics(分析)帐户 ID 几乎是唯一的,足以使用简单的正则表达式找到它:

<?php
$gaRegExp = '/UA-\d+-\d+/';

$testText = "var _gaq = _gaq || [];
  _gaq.push(['_setAccount', 'UA-2595901-1']);
  _gaq.push(['_trackPageview']);"

preg_match( $gaRegExp , $testText , $matches )

// Returns, within the $matches variable, the following
// array (
//  0 => 'UA-2595901-1',
// )
于 2012-04-16T01:48:25.647 回答