到目前为止,我只阅读了有关 CRF 的理论,并想在我的硕士论文中使用 python crfsuite 从食谱中提取成分。感谢您的每一次帮助。
据我了解,我可以通过下图的形式给crfsuite提供训练数据,其中w[0]提供当前单词的标识,w[i]是相对于i的世界,pos[i]是它的一部分相对于 i 的-of-speech-tag。
然后 crfsuite 在给定属性的基础上训练自己的特征函数。
但我找不到提供自定义特征函数的方法,例如“w[i] 在字典中”(例如食谱成分字典)或“在句子中是否定”(例如“不是”,或“不”)。
一般来说,好的教程很受欢迎,因为手册(https://python-crfsuite.readthedocs.io/en/latest/或http://www.chokkan.org/software/crfsuite/manual.html)不是初学者 -从我的角度来看很友好