我想使用正则表达式从 HTML 中提取电话号码。我正在使用这个正则表达式
\d{4}\s\d{3}\s\d{3}
电话号码1234 546 567
。此正则表达式成功地从 HTML 中提取给定的电话号码。
但是当有另一个数字(我不想提取)时会出现问题:1234 567 89023
. 现在它也在从这个数字中提取1234 567 890
,但我不希望它从那个数字中提取任何东西。
然后我将正则表达式更改为
^\d{4}\s\d{3}\s\d{3}$
但现在它甚至没有提取任何有效数字。
我应该怎么办?编辑:
string MatchAusPhoneNumber = @"\D(\d{4}\s\d{3}\s\d{3})\D";
MatchCollection mathph2 = Regex.Matches(chk, MatchAusPhoneNumber);
foreach (Match matchio in mathph2)
{
foreach (Capture capture in matchio.Captures)
{
if (my.ContainsKey(capture.Value) == false)
{
my.Add(capture.Value, capture.Value);
mylist.Add(capture.Value);
}
}
}