6

我有一个正则表达式,我想以各种方式匹配纬度/经度对,例如

123 34 42
-123* 34' 42"
123* 34' 42"
+123* 34' 42"
45* 12' 22"N
45 12' 22"S
90:00:00.0N

我希望能够成对匹配这些,这样

90:00:00.0N 180:00:00.0E是一个纬度/经度对。

或者

45* 12' 22"N 46* 12' 22"E是一个纬度/经度对(1 度 x 1 度单元格)。

或者

123* 34' 42" 124* 34' 42"是一个纬度/经度对

ETC

使用下面的正则表达式,当我输入 123 时,它匹配。我想这是真的,因为 123 00 00 是一个有效的坐标。但是,我想使用这个正则表达式来匹配上面相同格式的对

   "([-|\\+]?\\d{1,3}[d|D|\u00B0|\\s](\\s*\\d{1,2}['|\u2019|\\s])?"
 + "(\\s*\\d{1,2}[\"|\u201d|\\s])?\\s*([N|n|S|s|E|e|W|w])?\\s?)"

我正在使用 Java。

*表示学位。

我在正则表达式中做错了什么?

4

3 回答 3

11

好吧,一方面,你正在用一堆不必要的管道字符填充你的字符集 - 交替隐含在一[]对中。额外的清理:+不需要在字符类中转义。您的正则表达式似乎解决了比您给我们的更大的问题陈述 - 您没有提及dD作为可匹配字符。而且您已经将 RegEx 的整个后半部分设置为可选。我认为您最初的问题陈述是,我构建了以下正则表达式:

^\s*([+-]?\d{1,3}\*?\s+\d{1,2}'?\s+\d{1,2}"?[NSEW]?|\d{1,3}(:\d{2}){2}\.\d[NSEW]\s*){1,2}$

这有点笨拙,但我会为您或将来发生这种情况的任何人分解它(您好,未来!)。

^

字符串开头,简单。

\s*

任何数量的空格 - 甚至没有。

( 

表示一个组的开始——我们会回到那个。

[-+]?

可选标志

\d{1,3}

1 到 3 位数

\*?

一个可选的星号 - 这里的转义是星号的关键,但如果你想用 unicode 代码点替换它以获得实际学位,你将不需要它。

\s+

至少一个空格字符

\d{1,2}

1 或 2 位数。

'?

可选撇号

\s+\d{1,2}+

你以前见过这些,但是有一个新的曲线球——{1,2}量词后面有一个加号!这使它成为一个所有格量词,这意味着匹配器不会放弃它与该组的匹配以使另一个成为可能。这几乎完全是为了防止1 1 11 1 1匹配,但可用于在您 100% 确定不需要回溯的任何地方提高速度。

"?

可选的双引号。你必须在 Java 中逃避它。

[NSEW]?

可选的基本方向,由字母指定

|

或 - 您可以匹配此之前组中的所有内容,或之后匹配组中的所有内容。

\d{1,3}

旧闻。

(:\d{2})

一个冒号,后跟两个字符...

{2}

两次!

\.\d

小数点,后跟一个数字。

[NSEW]

和以前一样,但这次是强制性的。

\s*)

一些空间,终于结束了小组。现在,第一组匹配了整个经度/纬度表示,最后有任意数量的空间。紧随其后的是:

{1,2}

这样做一次或两次 - 匹配一个或一对,然后最后:

$

字符串的结尾。

这并不完美,但非常接近,我认为它回答了最初的问题陈述。另外,我觉得我的解释已经足够揭开它的神秘面纱,您可以对其进行编辑以进一步满足您的需求。它不会(也不会)做的一件事是强制第一个坐标与样式中的第二个坐标匹配。这对正则表达式来说太过分了。

怀疑者: 这是在行动。请享受。

于 2012-11-28T23:03:45.580 回答
1

一般来说,我不认为这是一个好方法。在您的界面中尝试使用一种特定格式的 DMS 坐标。
用户应在 3 个单独的文本字段中输入。

此外,这个正则表达式不是很容易维护。

标注 DMS 坐标的可能性要多得多,您甚至无法想象。人类是有创造力的。

例如:

将 N,S 放在前面
或:北,157 度 50 分 55.796 秒
或:来自 wiki:NGS 现在在 1993 年说该点是 21-18-02.54891 N 157-50-45.90280 W

于 2012-11-28T18:23:17.123 回答
0

我不是 RE 向导,但对于您的格式,如果您从单个文本框进行解析,您需要有某种约定,首先是哪一对(可能是纬度)。

从那里,您有六个数字字段(度、分、秒,每个字段可能带有小数点)、两个符号(每个 + 或 -)和最多两个半球(每个一个)。

据我所知,如果您只要求首先是纬度,其次是经度,那么每次从您的输入中解析这 8-10 个字段都会以相同的顺序发生。其余符号(保存小数点)基本上可以视为分隔符。

这会让事情变得更容易吗?

于 2012-11-28T18:35:54.990 回答