4

我正在使用 PHP 的 APC 来存储大量信息(使用apc_fetch()等)。这些信息有时需要分析并转储到别处。

故事是这样的,我每秒有几百次点击。这些命中增加了各种计数器(与apc_inc(),和朋友)。每小时,我都想遍历我积累的所有值,并对它们进行一些其他处理,然后将它们保存在磁盘上。

我可以在每个请求中作为随机或基于时间的切换来执行此操作,但这可能是一个很长的操作(可能需要 20-30 秒,如果不是几分钟的话),我不想将请求挂起那么久。

我认为一个简单的 PHP cronjob 可以完成这项任务。但是,我什至无法让它读回缓存信息。

<?php
  print_r(apc_cache_info());
?>

产生一个看似不同的 APC 内存段,具有:

[num_entries] => 1

(单个条目似乎是其自身的操作码缓存)

虽然我的网络服务器由 nginx/php5-fpm 提供支持,但产生:

[num_entries] => 3175

因此,它们显然不共享同一块内存。如何在 CLI 脚本中访问相同的内存块(首选),或者如果这根本不可能,那么执行长时间运行的序列(例如每小时随机 HTTP 请求)绝对最安全的方法是什么?

对于后者,是否会register_shutdown_function()立即使用 andset_time_limit(0)ignore_user_abort(true)确保执行完成并且不会“挂起”任何人的浏览器?

是的,我知道 redis、memcache 等不会有这个问题,但我现在坚持使用 APC,因为它们都无法展示与 APC 相同的速度。

4

1 回答 1

0

这实际上是一个设计问题,也是选择首选成本与收益的问题。

APC 的速度让您兴奋不已,因为您无需花时间保存数据。您还想保留数据,但现在性能影响太大了。你必须以某种方式平衡这些。

如果持久性很重要,请在每个请求上接受并持久化(文件、数据库等)。如果你只关心速度,那就什么都不做——这整个问题变得毫无意义。有一些具有持久存储的缓存系统可以通过聚合写入磁盘的内容和时间来优化磁盘写入,但您通常总是会在两者之间获得不同的临界点的回报。您只需要选择哪些适合您的目标。

可能永远不会有一个持久的、有益健康的技术解决方案来解决狼吃饱、羔羊完整的问题。

如果你真的必须按照自己的方式去做,你可以有一个 CURL 向你的应用程序发送一个特殊请求,这会触发将你的缓存持久化到磁盘。这样您就可以控制请求、超时等,而不必担心用户可能会为终止他们的请求所做的一切。

但是,这种情况下的潜在风险是数据完整性(因为您将在缓存被其他请求更新的同时将缓存写入磁盘)以及在持久化缓存时提供的请求会导致性能损失你的服务器很忙。

从本质上讲,我们为狼/羊的困境引入了一堆干草;)

于 2014-07-23T23:22:04.860 回答