from pyconll import load_from_file
data = load_from_file("filename.conll")
data
我正在按照pyconll的文档读取.conll
文件,但出现以下错误,我不明白它的含义。该数据集应该是可读的,因为它是一个基准数据集。而且我没有看到pyconll.load_from_file()
可以在文档中指定的任何其他参数。有人可以帮我吗?
另外,有没有办法.conll
通过包读取文件nltk
?
ParseError Traceback (most recent call last)
<ipython-input-14-06859f7ce8b2> in <module>()
----> 1 data = load_from_file("filename.conll")
2 data
5 frames
/usr/local/lib/python3.6/dist-packages/pyconll/unit/token.py in __init__(self, source, empty)
661 error_msg = 'The number of columns per token line must be 10. Invalid token: {}'.format(
662 source)
--> 663 raise ParseError(error_msg)
664
665 # Assign all the field values from the line to internal equivalents.
ParseError: The number of columns per token line must be 10. Invalid token: @paulwalk O