0

我正在关注此处找到的示例代码。作者有一些文档,其中列出了用于编写程序的一些步骤。当我一起运行整个程序时,它运行完美,但是当我按照他提出的步骤进行操作时,我得到了一个 AttributeError。

这是我的代码

pdf = pdfquery.PDFQuery("Aberdeen_2015_1735t.pdf")
pdf.load()
pdf.tree.write("test3.xml", pretty_print=True, encoding="utf-8")

sept = pdf.pq('LTPage[pageid=\'1\'] LTTextLineHorizontal:contains("SEPTEMBER")')
print(sept.text())

x = float(sept.get('x0'))
y = float(sept.get('y0'))
cells = pdf.extract( [
     ('with_parent','LTPage[pageid=\'1\']'),
     ('cells', 'LTTextLineHorizontal:in_bbox("%s,%s,%s,%s")' % (x, y, x+600, y+20))
])

一切运行良好,直到它到达“sept.get”,它说“'PyQuery' 对象没有属性'get'”。有谁知道为什么程序在一起运行时不会遇到此错误,但在运行一段代码时会发生?

4

1 回答 1

0

根据PyQuery API 参考PyQuery对象确实没有get成员。代码示例必须过时。

根据https://pypi.python.org/pypi/pdfquery,属性通过以下方式检索.attr

x = float(sept.attr('x0'))

's的历史pyqueryREADME.rst来看,get从未记录在案,只是由于某些副作用而起作用(dict也许是对 a 的一些委托)。

于 2016-02-29T20:28:47.690 回答