3

我正在研究验证法律描述中的季度数据的查询。我们的标准是输入像“SE/4”来标记东南角或“SE/4 NW/4”来标记西北角的东南角。我正在努力解决如何通过正则表达式来检查空格或字符串结尾的结构。

到目前为止,这是我的正则表达式的一些示例数据。

WITH test_data AS (
  SELECT 'NW/4' AS quarter_cd FROM dual UNION ALL --VALID
  SELECT 'E/2 SW/4' FROM dual UNION ALL           --VALID
  SELECT 'W/2' FROM dual UNION ALL                --VALID
  SELECT 'SW/4 NE/4' FROM dual UNION ALL          --VALID
  SELECT 'SW/4 NE/4 NW/4' FROM dual UNION ALL     --VALID, THEY CAN REPEAT AN UNKNOWN NUMBER OF TIMES
  SELECT 'E/2 N/2' FROM dual UNION ALL            --TECHNICALLY VALID BUT WOULD LIKE TO EXCLUDE (1/2 of 1/2 is a 1/4) -> NE/4
  SELECT 'E/2 SW/4, SE/4' FROM dual UNION ALL     --INVALID, HAS A COMMA (TWO QUARTER ENTRIES ON ONE ROW)
  SELECT 'E/2 SW/4 & SE/4' FROM dual UNION ALL    --INVALID, HAS AN AMPERSAND (TWO QUARTER ENTRIES ON ONE ROW)
  SELECT 'E/2 SW/' FROM dual UNION ALL            --INVALID, INCOMPLETE ENTRY
  SELECT 'SE/4SW/4' FROM dual UNION ALL           --INVALID, NO SPACE BETWEEN DEFINITIONS
  SELECT 'SE/2' FROM dual UNION ALL               --INVALID, SOUTHEAST HALF DOES NOT MAKE SENSE
  SELECT 'N/4' FROM dual UNION ALL                --INVALID, NORTH QUARTER DOES NOT MAKE SENSE
  SELECT 'LOT 1' FROM dual                        --INVALID, LOTS WILL BE DEALT WITH SEPARATELY
)
SELECT * FROM test_data 
WHERE regexp_like(quarter_cd, '^([NSEW]/[2]{1}|[NSEW]{2}/[4]{1})+', 'c');

我的代码中的正则表达式只是我的众多尝试之一。我已经在查询中标记了应该返回的结果。为了简单起见,我愿意允许返回“E/2 N/2”,尽管从技术上讲它是无效的,因为北半部的东半部最好简化为东北部。上面的所有示例都是从我的数据中的实际条目中提取的。

任何帮助,将不胜感激。

4

2 回答 2

2

这是我的低级尝试:

select *
  from test_data
 where regexp_like(quarter_cd
        , '^((([NSEW]{1}/2)|[NS]{1}[EW]{1}/4)([[:space:]]|$))+$'
        , 'c')

E/2 N/2恐怕它确实会回来。

这个

  • 允许 NSEW 之一后跟 2
  • NSEW 之一,后跟 4
  • 后面必须跟一个空格或行尾
  • 允许这个贪婪地匹配
  • 必须在行尾结束

通过拆分你的[NSEW]它会排除在 NS 或 EW 等上的匹配。

这是一个要演示的SQL Fiddle 。我在您自己的基础上添加了几个额外的案例。这样做的问题是它将允许所有四个部分。

我会认真考虑使用正则表达式来验证这些数据。而是通过 PL/SQL 函数传递它。拆分空间并添加您必须检查的内容,以确保您没有超出限制。然后,您可以使用较小的正则表达式来验证空格分隔符之间的基础数据。

于 2012-06-19T21:51:41.430 回答
1

我认为这样的事情会给你你想要的:

SELECT * FROM 
  test_data 
WHERE 
  regexp_like(quarter_cd, 
  '^([NSEW]/[2]{1}|[NSEW]{2}/[4]{1})( [NSEW]/[2]{1}| [NSEW]{2}/[4]{1})*$', 'c');

不过,它将匹配“E2 / N2”的情况。如果您改为这样做:

SELECT * FROM 
  test_data 
WHERE 
  regexp_like(quarter_cd, 
  '^([NSEW]/[2]{1}|[NSEW]{2}/[4]{1})( [NSEW]{2}/[4]{1})*$', 'c');

那么它不会匹配,但它也不会匹配在初始位置之后包含 [NSEW]/2 的任何大小写。因此,如果您需要匹配,例如“NW/4 E/2”...西北区的东半部,这将不是很好。

于 2012-06-19T20:47:09.237 回答