我目前正在使用 lstm。我有一个包含许多关于交易信息的句子的数据集,我想提取信息,假设金额、日期和 transactionWith。我已经尝试过使用基本的 lstm,我的系统尝试将给定序列的每个单词预测为金额、日期、transactionWith 或不相关。
我的训练数据是这样的:
输入:
你在 2018 年 8 月 13 日给了约翰 100.00
目标:(标记每个单词)
ir ir 金额 ir transactionWith ir 日期
您可以看到整个数据集有很多“ir”或不相关的标签,我认为这会使我的系统偏向于预测测试数据的“ir”。
现在我想尝试使用张量流的 seq2seq 模型,其中输入是事务句,目标是提取信息的 seq。一个例子是这样的 -
输入:
你在 2018 年 8 月 13 日给了约翰 100.00。
目标:
100.00 13-08-2018 约翰
在这里,我所有的目标序列都将保持固定格式,例如第一个是金额,第二个是日期,第三个是 transactionWith 等。
我可以像语言翻译模型那样做吗?
提前感谢所有很棒的人。:)