6

我计划录制有关特定主题的实时推文。同样,我在 PHP 中使用带有 cURL 的 twitter 流 API。

这是代码:

<?php

$username = "xxxxx";
$password = "xxxxx";


$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, 'https://stream.twitter.com/1/statuses/filter.json?         track=SEARCH_PARAMETER');
curl_setopt($ch, CURLOPT_USERPWD, $username.":".$password);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$result = curl_exec($ch);
$jsonOBJ = json_decode ($result);

curl_close($ch);

print_r($jsonOBJ);
?>

我的问题是,如果我将 CURLOPT_RETURNTRANSFER 设置为 0,我可以在终端上看到推文。但我无法存储在变量 $jsonOBJ 中并打印它。

请帮忙!

4

4 回答 4

4

更新:请参阅消息末尾的新代码,这实际上用 cURL 很容易做到,但我第一次做错了。

我无法让 Twitter 流 API 使用 cURL 和 a 一起工作,CURLOPT_READFUNCTION但使用fsockopen()fread(). 我不确定为什么 readfunction 没有像我之前成功使用它那样工作,但它一定与响应数据是“流式传输”并且不是使用 HTTP 分块编码发送的事实有关。本质上,我的读取函数从未被调用,因此我无法处理数据。

我使用的方法现在有效:

  • 使用 fsockopen 连接到ssl://stream.twitter.com
  • 使用流数据发出基本 HTTP 请求fputs
  • 使用 HTTP 响应标头并确保没有错误
  • fread使用无限循环读取数量数据
  • 每次读取一大块数据时,我都会调用一个内部缓冲区函数
  • 缓冲区函数将新数据附加到缓冲区
  • 缓冲区函数然后尝试处理缓冲区中的所有消息(如果我们有 1 条或更多完整消息)
  • 在处理每条消息时,缓冲区会减少,直到它为空,然后函数返回并再次读取数据

我已经让它运行了几个小时,并且没有断开连接,并且我已经处理了超过 30,000 条消息,还没有出现任何错误。

基本上我实现了一个回调系统,这样每次从缓冲区中读取完整的消息时,它都会使用 json 消息调用用户定义的回调,这样应用程序就可以对消息执行任何它需要做的事情(例如插入到数据库)。

我还没有任何简短的片段可以在这里发布,但是如果你愿意,可以通过访问我的个人资料中列出的网站并填写联系表格给我发消息,我很乐意分享。如果有人有兴趣,也许我们可以一起工作。我这样做只是为了好玩,我对 Twitter 没有兴趣,也没有出于经济原因使用它。也许我最终会把它放在 GitHub 上。

编辑:

这是一些 cURL 代码,它们将连接到流 API 并将 JSON 消息传递给回调函数,因为它们可用。此示例使用 gzip 编码来节省带宽。

<?php

$USERNAME = 'youruser';
$PASSWORD = 'yourpass';
$QUERY    = 'nike';

/**
 * Called every time a chunk of data is read, this will be a json encoded message
 * 
 * @param resource $handle The curl handle
 * @param string   $data   The data chunk (json message)
 */
function writeCallback($handle, $data)
{
    /*
    echo "-----------------------------------------------------------\n";
    echo $data;
    echo "-----------------------------------------------------------\n";
    */

    $json = json_decode($data);
    if (isset($json->user) && isset($json->text)) {
        echo "@{$json->user->screen_name}: {$json->text}\n\n";
    }

    return strlen($data);
}

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, 'https://stream.twitter.com/1/statuses/filter.json?track=' . urlencode($QUERY));
curl_setopt($ch, CURLOPT_USERPWD, "$USERNAME:$PASSWORD");
curl_setopt($ch, CURLOPT_WRITEFUNCTION, 'writeCallback');
curl_setopt($ch, CURLOPT_TIMEOUT, 20); // disconnect after 20 seconds for testing
curl_setopt($ch, CURLOPT_VERBOSE, 1);  // debugging
curl_setopt($ch, CURLOPT_ENCODING,  'gzip, deflate'); // req'd to get gzip
curl_setopt($ch, CURLOPT_USERAGENT, 'tstreamer/1.0'); // req'd to get gzip

curl_exec($ch); // commence streaming

$info = curl_getinfo($ch);

var_dump($info);
于 2012-04-27T00:26:09.510 回答
1

@Reza Sanaie 和其他可能觉得这很有帮助的人。

我使用了 SEARCH TWITTER API 并获得了实时推文。所以这可能会有所帮助。这是代码:

<?php
$query = "SEARCH_PARAMETER";
$request = "http://search.twitter.com/search.json?q=".urlencode($query);
$response = file_get_contents($request);
$jsonobj = json_decode($response);
 print_r($jsonobj);
?>

我还设置了 MySQL 连接设置以将其推送到数据库中,并将此脚本添加到 crontab 中以自动化整个过程。

于 2012-04-27T16:51:39.867 回答
1

我也在做同样的事情 :) 问题是当你在终端中做这件事时,它是一个流,所以连接会保持活动状态,直到你杀死它。(即 curl_exec() 没有完成)

尝试查看 CURLOPT_PROGRESSFUNCTION 和 CURLOPT_READFUNCTION。他们可能会给你一些提示。

于 2012-04-26T17:10:42.477 回答
0

我只是匆匆忙忙给你一个答案,就像今天要离开一样。看起来它应该工作。

下面是我使用的一个函数,我将一个 URL 和一些 XML 数据传递给它,它返回一个关联数组,表示成功为真或假,返回值作为字符串。

function do_curl($url, $data)
    {
    $ch = curl_init();    
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_POST, 1); 
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
    curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
    $result = curl_exec ($ch);

    $curl_return=array();

    if (!is_string($result))
        {
        $curl_return['STATUS'] = FALSE;
        $curl_return['ERRMSG'] = curl_error($ch);
        }
    else
        {
        $curl_return['STATUS'] = TRUE;
        $curl_return['RESPONSE'] = $result;
        }
    curl_close($ch); 
    return $curl_return;
    }
于 2012-04-26T17:24:44.557 回答