我有成千上万的包含数字的文章描述。
他们看起来像:
约 2760h3x1000.5DIN345x1500e34
结果数字应为:
- 2760
- 1000.5
- 1500
- h3 或 3 不应是解析的结果,因为 h3 只是一个容差
- e34 也一样
- DIN345 是一个需要排除的规范(每个数字都带有尾随 DIN 或 BN)
我目前的正则表达式是:
[^hHeE]([-+]?([0-9]+\.[0-9]+|[0-9]+))
这解决了一切,但规范。我怎样才能让这个“DIN”和“BN”被视为一个字符?
谢谢,汤姆