我正在使用 Portia 从页面中提取信息。但是,提取的值之一不是我可以使用的格式。
更具体地说,我想提取一个使用点而不是逗号来表示千位的数值,例如“1.000”而不是“1,000”。
是否可以提取然后使用 Portia 进行转换?我可以设置一个正则表达式来提取数字,但也可以替换它们吗?
我现在正在做的是将数据导出到 csv,然后用于sed
替换有问题的数字。
谢谢
我正在使用 Portia 从页面中提取信息。但是,提取的值之一不是我可以使用的格式。
更具体地说,我想提取一个使用点而不是逗号来表示千位的数值,例如“1.000”而不是“1,000”。
是否可以提取然后使用 Portia 进行转换?我可以设置一个正则表达式来提取数字,但也可以替换它们吗?
我现在正在做的是将数据导出到 csv,然后用于sed
替换有问题的数字。
谢谢
检查:如果字符串中有逗号作为千位分隔符,如何使用 Python 将字符串转换为数字?
import locale
locale.setlocale( locale.LC_ALL, 'de_DE.UTF-8' )
locale.atoi('1.000')
# 1000
基本上它是带有正确格式掩码的数字字符串