所以,我构建了一个 NLP 程序,学习从句子中提取语义事件描述,但现在我的训练集仅限于我已经解析成语义事件组件的句子。
虽然这种方法确实可以完成工作,但它很难替代大量预先解析的文本语料库。不幸的是,我所有寻找这样一个语料库的尝试都被证明是徒劳的。
我特别需要的是一个语料库,它标记了句子中每个单词(或一组单词)的语义角色。我想到的角色示例如下:
- 代理人
- 行动
- 病人
- 乐器
- 共同代理
- 共同患者
- 地点
- 副词
如果需要更多细节,请随时询问,或参考这篇论文,该论文使用了与我的约束相同的玩具 corpa。