在项目中,我们使用语音到文本的谷歌服务。
它带来了很多优势,一方面简化了音频处理,另一方面我们注意到特殊的数据格式,例如:
字段类型:金钱
Current Output : no payment due
Expected Output : $0
Current Output : no outstanding balance
Expected Output : $0
字段类型:日期
Current Output : May 1st 2020
Expected Output : 05/01/2020
Current Output : May 1st 2020.
Expected Output : 05/01/2020
Current Output : June 1st 2020.
Expected Output : 06/01/2020
Current Output : March 13th.
Expected Output : 03/13/2020 (automatically infer the year)
我们试图查看class-token,但这种方法没有提供满足我们需求的工具。我们已经检查了几次 API,研究了行为——结果还是一样。我相信我们错过了一些东西,并希望得到社区的帮助。
附言
我们的项目语言是java
并且我们相信在问题的范围内它并不那么重要。