2

我有一个程序可以抓取网站的数据。如果自上次检索后仅几分钟,我希望能够缓存该数据而不是加载它。我看着烧杯,但我对缓存非常陌生,不确定这是否是我需要的。我也不太明白 Cachemanager 是什么以及为什么我只使用“cache.get”而不是同时使用“cache.set”和“cache.get”。我已经包含了我一直用来测试的脚本。

from beaker.cache import CacheManager
from beaker.util import parse_cache_config_options
import sched, time
from datetime import datetime

cache_opts = {
             'cache.type': 'file',
             'cache.data_dir': '../Beaker/tmp/cache/data',
             'cache.lock_dir': '../Beaker/tmp/cache/lock'
             }

cache = CacheManager(**parse_cache_config_options(cache_opts))
tmpl_cache = cache.get_cache('mytemplate', type='file', expire=5)

def get_results():
    # do something to retrieve data
    print 'hey'
    data = datetime.now()
    return data

def get_results2():
    return 'askdjfla;j'

s = sched.scheduler(time.time, time.sleep)
def get_time(sc):     
    results = tmpl_cache.get(key='gophers', createfunc=get_results)    
    results2 = tmpl_cache.get(key='hank', createfunc=get_results2)   
    print results,results2
    sc.enter(1, 1, get_time, (sc,))

s.enter(1, 1, get_time, (s,))
s.run()

我会以正确的方式解决这个问题吗?

4

1 回答 1

2

您只使用了 cache.get,这是正确的,因为如果在缓存中找不到它,它将调用该函数来创建它。如果您改为使用装饰器 API,这将变得更加清晰和容易:

@cache.cache('gophers', expire=3600)
def get_results():
    # do something to retrieve data
    print 'hey'
    data = datetime.now()
    return data

@cache.cache('hank', expire=3600)
def get_results2():
    return 'askdjfla;j'

s = sched.scheduler(time.time, time.sleep)
def get_time(sc):     
    results = get_results()
    results2 = get_results2()
    print results,results2
    sc.enter(1, 1, get_time, (sc,))
于 2013-04-30T05:30:25.943 回答