我有数千行文本,我需要在其中找到金钱代表,例如:
Lorem ipsum dolor sit amet, 100.000,00 USD sadipscing elitr, sed diam nonumy eirmod
GBP 400 ut labore et dolore magna aliquyam erat, sed diam voluptua. At USD 20 eos et
accusam et justo duo dolores et 100,000.00 USD ea rebum. Stet 3,-- USD gubergren, no
Python 脚本应返回转换为美元的金额。(例如 100000USF、400 GBP -> USD 等)
到目前为止,我所做的是手动为数字 - 货币组合创建正则表达式以检索值,然后将货币与数据库进行比较并计算兑换。
然而,这既不是有效的,也不是未来的证明(例如,如果添加了另一种货币)所以我想知道是否有一种有效的机器学习算法,我可以用一些例子“训练”,然后它试图找到 sich “价值 - 货币“组合?