1

我正在尝试在 WKS 中创建机器学习模型,目前正在注释文档。我希望模型提取地址实体。我更广泛的目标是了解作者将其邮寄地址从旧地址转换为新地址的意图。挑战在于文本中将有两个或多个地址提及,并且模型需要区分这两者。我已经看到了将地址的每一部分都视为离散实体的示例

IE

  • [735] [Airport Rd], [Bismarck], [ND] [58504] 实体:街道号码、街道名称、城市、州、邮编

-VS-

  • 将整个地址视为一个实体 [735 Airport Rd, Bismarck, ND 58504] 实体:地址

我想将整个地址视为一个实体的原因是因为我需要模型来区分旧地址新地址我相信如果我将地址视为一个实体,那么我可以使用识别子句之间的关系,例如作为:

  • 新地址:[new_address] 或者,新地址是 [new_address]

有没有人尝试在 WKS 或其他 NLP 工具中做类似的事情?是否可以将每一块地址视为一个实体,并分别定义每一块地址与 old_address/new_address 之间的关系?

4

1 回答 1

1

您可以定义地址实体类型并将多个标记注释为地址提及。WKS 不限制提及单个标记(但不建议提及太长的注释)

于 2018-03-22T01:01:02.427 回答