1

我刚刚在我的机器上安装了 pdfquery,我正在尝试从他们的站点运行该示例

import pdfquery
pdf = pdfquery.PDFQuery("examples/sample.pdf")
pdf.load()
label = pdf.pq(':contains("Your first name and initial")')
left_corner = float(label.attr('x0'))
bottom_corner = float(label.attr('y0'))
name = pdf.pq(':in_bbox("%s, %s, %s, %s")' % (left_corner, bottom_corner-30, left_corner+150, bottom_corner)).text()
print name

问题是我收到此错误

 Traceback (most recent call last):
  File "testePdfQuery.py", line 1, in <module>
    import pdfquery
  File "/home/ubuntu/Downloads/pdfquery-0.1.3/pdfquery/__init__.py", line 1, in <module>
    from .pdfquery import PDFQuery
  File "/home/ubuntu/Downloads/pdfquery-0.1.3/pdfquery/pdfquery.py", line 23, in <module>
    cssselect.Function._xpath_in_bbox = _xpath_in_bbox
AttributeError: 'module' object has no attribute 'Function'

有什么想法可以解决这个问题并运行示例吗?提前致谢。

4

1 回答 1

2

这是因为不支持 lxml 版本。

请执行下列操作 :

1. pip uninstall pdfquery
2. pip install -e git+https://github.com/jcushman/pdfquery.git#egg=pdfquery

这应该可以解决问题。有关该问题的更多详细信息,请访问:https ://github.com/jcushman/pdfquery/issues/6

于 2013-08-12T14:12:00.777 回答