4

我刚刚在 Ubuntu12.04 电脑上安装,lxml安装easy_install了 Python 3.2.3。 lxml是最新的3.0Alpha版本。

我尝试了以下代码:

import lxml.html

def proc_tweet(ss):
    html=lxml.html.fragment_fromstring(ss)
    ps=html.xpath("//p[@node-type='feed_list_content']")

def test():
    ss=''
    f=open('test')
    for l in f: ss+=l.strip()
    f.close()
    while True: proc_tweet(ss)

if __name__=='__main__':
    test()

这里,'test' 是一个文件,包含一个简短的 HTML 片段:

<dl action-type="feed_list_item" mid="3409553360609821" class="feed_list W_linecolor"> 
    <dd class="content"> 
        <p node-type="feed_list_content">This is a drill.</p> 
    </dd> 
    <dd class="clear"></dd> 
</dl>

问题是lxml随着时间的推移会吞噬我所有的记忆。我试过这个

del ps
del html

它不起作用。有谁知道为什么?

4

1 回答 1

1

这是在 3.0 beta 1 中修复的错误。

为了将来参考,最好将软件工具的问题直接报告给维护它的项目,而不是将其发布在 Internet 上的任意位置。启动板错误跟踪器是报告 lxml 错误的正确位置。github 跟踪器主要用于拉取请求。

于 2012-09-28T18:29:09.810 回答