9

我有一个从其他页面获取信息并使用 BeautifulSoup 和 Twisted 的 getPage 解析它们的程序。稍后在程序中,我打印延迟进程创建的信息。目前我的程序尝试在不同的返回信息之前打印它。我怎样才能让它等待?

def twisAmaz(contents): #This parses the page (amazon api xml file)
    stonesoup = BeautifulStoneSoup(contents)
    if stonesoup.find("mediumimage") == None:
       imageurl.append("/images/notfound.png")
    else:
      imageurl.append(stonesoup.find("mediumimage").url.contents[0])

    usedPdata = stonesoup.find("lowestusedprice")
    newPdata = stonesoup.find("lowestnewprice")
    titledata = stonesoup.find("title")
    reviewdata = stonesoup.find("editorialreview")

    if stonesoup.find("asin") != None:
        asin.append(stonesoup.find("asin").contents[0])
    else:
        asin.append("None")
    reactor.stop()


deferred = dict()
for tmpISBN in isbn:  #Go through ISBN numbers and get Amazon API information for each
    deferred[(tmpISBN)] = getPage(fetchInfo(tmpISBN))
    deferred[(tmpISBN)].addCallback(twisAmaz)
    reactor.run()

.....print info on each ISBN
4

3 回答 3

8

看起来你正在尝试制造/运行多个反应器。一切都连接到同一个反应堆。以下是如何使用 aDeferredList等待所有回调完成。

另请注意,twisAmaz返回一个值。该值通过callbacks DeferredList并输出为value。由于 aDeferredList保持放入其中的内容的顺序,因此您可以将结果索引与您的 ISBN 索引进行交叉引用。

from twisted.internet import defer

def twisAmazon(contents):
    stonesoup = BeautifulStoneSoup(contents)
    ret = {}
    if stonesoup.find("mediumimage") is None:
        ret['imageurl'] = "/images/notfound.png"
    else:
        ret['imageurl'] = stonesoup.find("mediumimage").url.contents[0]
    ret['usedPdata'] = stonesoup.find("lowestusedprice")
    ret['newPdata'] = stonesoup.find("lowestnewprice")
    ret['titledata'] = stonesoup.find("title")
    ret['reviewdata'] = stonesoup.find("editorialreview")
    if stonesoup.find("asin") is not None:
        ret['asin'] = stonesoup.find("asin").contents[0]
    else:
        ret['asin'] = 'None'
    return ret

callbacks = []
for tmpISBN in isbn:  #Go through ISBN numbers and get Amazon API information for each
    callbacks.append(getPage(fetchInfo(tmpISBN)).addCallback(twisAmazon))

def printResult(result):
    for e, (success, value) in enumerate(result):
        print ('[%r]:' % isbn[e]),
        if success:
            print 'Success:', value
        else:
            print 'Failure:', value.getErrorMessage()

callbacks = defer.DeferredList(callbacks)
callbacks.addCallback(printResult)

reactor.run()
于 2010-08-15T20:26:52.770 回答
4

另一个很酷的方法是使用@defer.inlineCallbacks。它使您可以像常规顺序函数一样编写异步代码:http: //twistedmatrix.com/documents/8.1.0/api/twisted.internet.defer.html#inlineCallbacks

于 2012-12-19T02:14:42.603 回答
2

首先,你不应该在你的 deferred 方法中放置一个 reactor.stop(),因为它会杀死一切。

现在,在 Twisted 中,“等待”是不允许的。要打印回调的结果,只需在第一个回调之后添加另一个回调。

于 2010-08-15T19:26:52.170 回答