我有一个像这样的字符串:
$str1 = "12 ounces";
$str2 = "1.5 ounces chopped;
我想从字符串中获取数量,无论它是否为小数(12 或 1.5),然后获取前一个测量值(盎司)。
我能够使用一个非常基本的正则表达式来获取测量值,但是获取小数/整数一直给我带来问题。
谢谢你的帮助!
如果您只想获取数据,则可以使用松散的正则表达式:
([\d.]+)\s+(\S+)
([\d.]+)
:[\d.]+
将匹配一系列严格的数字和.
(这意味着4.5.6
或....
将匹配,但这些情况并不常见,这只是为了抓取数据),括号表示我们将捕获匹配的文本。这里.
在字符类里面[]
,所以不需要转义。
后跟任意空格\s+
和非空格字符的最大序列(由于贪心量词)\S+
(非空格真的是非空格:它将匹配 Unicode 中的几乎所有内容,除了空格、制表符、换行符、回车符)。
您可以获取第一个捕获组中的编号,以及第二个捕获组中的单元。
您可以对数字更严格一些:
(\d+(?:\.\d*)?|\.\d+)\s+(\S+)
(\d+(?:\.\d*)?|\.\d+)
,所以我只解释这部分。这有点严格,但是否更严格取决于输入域和您的要求。它将匹配整数34
,带小数部分的数字,3.40000
并允许.5
和34.
案例通过。它将拒绝带有过多的数字.
,或者只包含一个.
。|
充当分隔 2 种不同模式的 OR :\.\d+
和\d+(?:\.\d*)?
.\d+(?:\.\d*)?
:这将匹配并(隐式)声明整数部分中的至少一位数字,然后是可选 .
的(需要转义,\
因为.
表示任何字符)和小数部分(可以是 0 位或更多位)。可选性?
在末尾表示。()
可用于分组和捕获 - 但如果不需要捕获,(?:)
则可用于禁用捕获(节省内存)。\.\d+
: 这将匹配诸如.78
. 它匹配.
后跟至少一个(由 表示+
)数字。如果您想确保从输入字符串中获得有意义的内容,这不是一个好的解决方案。您需要先定义所有预期单位,然后才能编写仅捕获有效数据的正则表达式。
使用这个正则表达式\b\d+([\.,]\d+)?
要获取使用逗号或点加上下一个单词的整数和小数,请使用以下正则表达式:
/\d+([\.,]\d+)?\s\S+/