2

我的 php 项目正在使用 reddit JSON api 来获取当前页面提交的标题。

现在,每次加载页面时我都在运行一些代码,并且遇到了一些问题,即使没有真正的 API 限制。

我想以某种方式在本地存储提交的标题。你能推荐最好的方法吗?该网站在 appfog 上运行。你会推荐什么?

这是我当前的代码:

<?php

/* settings */

$url="http://".$_SERVER['HTTP_HOST'].$_SERVER['REQUEST_URI'];

$reddit_url = 'http://www.reddit.com/api/info.{format}?url='.$url;

$format = 'json'; //use XML if you'd like...JSON FTW!
$title = '';

/* action */
$content = get_url(str_replace('{format}',$format,$reddit_url)); //again, can be xml or json
if($content) {
    if($format == 'json') {
        $json = json_decode($content,true);
        foreach($json['data']['children'] as $child) { // we want all children for this example
            $title= $child['data']['title'];
        }
    }
}

/* output */


/* utility function:  go get it! */
function get_url($url) {
    $ch = curl_init();
    curl_setopt($ch,CURLOPT_URL,$url);
    curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
    curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,1);
    $content = curl_exec($ch);
    curl_close($ch);
    return $content;
}
?>

谢谢!

4

4 回答 4

4

介绍

这是您的代码的修改版本

$url = "http://stackoverflow.com/";
$loader = new Loader();
$loader->parse($url);
printf("<h4>New List : %d</h4>", count($loader));
printf("<ul>");
foreach ( $loader as $content ) {
    printf("<li>%s</li>", $content['title']);
}
printf("</ul>");

输出

新名单:7

  • Joel Spolsky 和 ​​Jeff Atwood 的新播客。
  • 示例代码/ Pyhton 的好网站
  • stackoverflow.com 显然拥有互联网历史上最好的 Web 代码,reddit 最好开始复制它。
  • 一个类似 reddit 的 OpenID 程序员网站
  • 很棒的开发者网站。让知道的人回答您的问题。
  • Stack Overflow 公开发布
  • Stack Overflow,一个编程问答网站。& Reddit 可以从他们的界面中学到很多东西!

简单演示

问题

我看到你想在这里实现的一些事情,即

  • 我想以某种方式在本地存储提交的标题
  • 现在我每次加载页面时都在运行一些代码

据我了解,您需要的是 数据的简单缓存副本,这样您就不必一直加载 url。

简单的解决方案

您可以使用的一个简单的缓存系统是memcache ..

示例 A

$url = "http://stackoverflow.com/";

// Start cache
$m = new Memcache();
$m->addserver("localhost");
$cache = $m->get(sha1($url));

if ($cache) {
    // Use cache copy
    $loader = $cache;
    printf("<h2>Cache List: %d</h2>", count($loader));
} else {

    // Start a new Loader
    $loader = new Loader();
    $loader->parse($url);
    printf("<h2>New List : %d</h2>", count($loader));
    $m->set(sha1($url), $loader);
}

// Oupput all listing
printf("<ul>");
foreach ( $loader as $content ) {
    printf("<li>%s</li>", $content['title']);
}
printf("</ul>");

示例 B

您可以 Last Modification Date用作缓存键,以便仅在修改文档时才保存新副本

$headers = get_headers(sprintf("http://www.reddit.com/api/info.json?url=%s",$url), true);
$time = strtotime($headers['Date']); // get last modification date 
$cache = $m->get($time);

if ($cache) {
    $loader = $cache;
}

由于您的类实现了JsonSerializable您可以对结果进行 json 编码并存储在 MongoDB 或 MySQL 等数据库中

 $data = json_encode($loader);
 // Save to DB 

使用的类

class Loader implements IteratorAggregate, Countable, JsonSerializable {
    private $request = "http://www.reddit.com/api/info.json?url=%s";
    private $data = array();
    private $total;

    function parse($url) {
        $content = json_decode($this->getContent(sprintf($this->request, $url)), true);
        $this->data = array_map(function ($v) {
            return $v['data'];
        }, $content['data']['children']);
        $this->total = count($this->data);
    }

    public function getIterator() {
        return new ArrayIterator($this->data);
    }

    public function count() {
        return $this->total;
    }

    public function getType() {
        return $this->type;
    }

    public function jsonSerialize() {
        return $this->data;
    }


    function getContent($url) {
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 1);
        $content = curl_exec($ch);
        curl_close($ch);
        return $content;
    }
}
于 2012-12-11T17:23:17.503 回答
0

我不确定您的问题到底是什么,但弹出的第一件事如下:

foreach($json['data']['children'] as $child) { // we want all children for this example
    $title= $child['data']['title'];
}

您确定要覆盖$title吗?实际上,这只会保留最后一个$child标题。

现在,回答你的问题。我假设您正在寻找某种机制来缓存请求的 URL 的内容,这样您就不必每次都重新发出请求,对吗?我对 appFog 没有任何经验,只有 Orchestra.io,但我相信他们在写入文件方面有相同的限制,因为你只能写入临时文件。

我的建议是将(已处理的)响应缓存在:

  • 具有短 TTL 的 APC 共享内存
  • 临时文件
  • 数据库

您可以使用 URL + 参数的哈希作为查找键,在内部进行此检查get_url()意味着您不需要更改代码的任何其他部分,并且只需要 ~3 LOC。

于 2012-12-10T10:50:10.137 回答
0

在这之后:

if($format == 'json') {
    $json = json_decode($content,true);
    foreach($json['data']['children'] as $child) { // we want all children for this example
        $title = $child['data']['title'];
    }
}

}`

然后存储在一个 json 文件中并将其转储到您的本地文件夹网站路径中

$storeTitle = array('title'=>$title)

$fp = fopen('../pathToJsonFile/title.json'), 'w');
fwrite($fp, json_encode($storeTitle));
fclose($fp);

然后下次可以随时调用json文件,解码,提取标题到变量中使用

于 2012-12-16T10:32:06.730 回答
0

我通常只是将数据按原样存储为平面文件,如下所示:

<?php
define('TEMP_DIR', 'temp/');
define('TEMP_AGE', 3600);

function getinfo($url) {
    $temp = TEMP_DIR . urlencode($url) . '.json';

    if(!file_exists($temp) OR time() - filemtime($temp) > TEMP_AGE) {
        $info = "http://www.reddit.com/api/info.json?url=$url";
        $json = file_get_contents($info);
        file_put_contents($temp, $json);
        }
    else {
        $json = file_get_contents($temp);
        }

    $json = json_decode($json, true);
    $titles = array();
    foreach($json['data']['children'] as $child) {
        $titles[] = $child['data']['title'];
        }
    return $titles;
    }

$test = getinfo('http://imgur.com/');
print_r($test);

PS。我file_get_contents用来获取 json 数据,您可能有自己的理由使用 curl。我也不检查格式,因为显然你更喜欢 json。

于 2012-12-17T05:23:52.483 回答