5

我正在尝试使用 CRFSuite,但我不知道如何使用 example/ner.py 和 pos.py

准确地说,我如何输入表单:

# Ner.py
fields = 'y w pos chk'

或者

# Pos.py
fields = 'w num cap sym p1 p2 p3 p4 s1 s2 s3 s4 y'

例如,我可以从 CoNNL 模型中获得“yw pos”,但我并没有真正获得 pos.py 中的“chk”部分和所有这些字段。

此外,鉴于我有一个训练有素的模型,有没有办法用 CRFSuite 处理原始文本(没有所有这些标签)?

4

3 回答 3

2

@michele 是对的。此任务需要另一个数据集。我相信数据集在这里:http ://www.cnts.ua.ac.be/conll2003/ner/

于 2013-07-17T22:11:47.693 回答
1

您不能使用ner.pypos.py与教程作者提供的数据一起使用。您需要一个合适的 CoNLL-2000 数据集。:)

仅作为示例,您可以在此处找到它

我希望我已经正确回答了你的问题。

于 2012-02-21T15:09:54.990 回答
0

事实证明,稍微修改pos.py文件来做它应该做的事情会更简单。现在的输入格式pos.py'w y',而特征'num cap sym p1 p2 p3 p4 s1 s2 s3 s4'都是由脚本本身生成的。这应该可以解决pos.py问题。这是要点:

https://gist.github.com/fnl/21116fa57527946c5dbe

至于ner.py脚本,正如@Legend 已经回答的那样,可以找到相关的输入数据格式,例如,here:

http://www.cnts.ua.ac.be/conll2003/ner/

于 2014-09-25T10:07:29.103 回答