我需要我的聊天机器人向用户查询地址,因此我需要rasa NLU将消息中包含的地址组件(例如邮政编码、门牌号、街道名称等)作为实体返回。
当然,一种明显的方法是创建一个包含适当训练数据的训练文件。但既然这肯定是一个普遍的问题,我希望可能有另一种解决方案。此外,对我来说,在哪里可以获得大量各种格式的标记地址并不是很明显。
我需要我的聊天机器人向用户查询地址,因此我需要rasa NLU将消息中包含的地址组件(例如邮政编码、门牌号、街道名称等)作为实体返回。
当然,一种明显的方法是创建一个包含适当训练数据的训练文件。但既然这肯定是一个普遍的问题,我希望可能有另一种解决方案。此外,对我来说,在哪里可以获得大量各种格式的标记地址并不是很明显。
在这篇博文中进行了一些评估,表明如果您添加足够的训练数据,实体提取器ner_crf对于地址的性能非常好。博文中的地址注释如下:
Take me to [123 Washington Street](address) please