我有一个理论上是 CoNLL 格式的 txt 文件。像这样:
a O
nivel B-INDC
de O
la O
columna B-ANAT
anterior I-ANAT
del I-ANAT
acetabulo I-ANAT
existiendo O
minimos B-INDC
cambios B-INDC
edematosos B-DISO
en O
la O
medular B-ANAT
(...)
我需要将其转换为句子列表,但我没有找到办法。我尝试使用 conllu 库的解析器:
from conllu import parse
sentences = parse("location/train_data.txt")
但他们给出了错误:ParseException:行格式无效,行必须包含制表符或两个空格。
我怎样才能得到这个?
["a nivel de la columna anterior del acetabulo", "existiendo minimos cambios edematosos en la medular", ...]
谢谢