regex - 用于重复 2 组重复字符的 Oracle 数据库正则表达式

Question

我想知道如何在 Oracle 中编写一个可以检测以下表达式的正则表达式：

aaaaabbb
aaaaaccc
aaaaaddd
...
aaaaazzz

我努力了：

a{5}\w{3}

和

a{5}[a-z]{3}

和

a{5}(\w)\1{2}

但如果失败，它也会检测到aaaaadef。

谢谢你的帮助。

score 1 · Accepted Answer

为了进一步扩展Felipe关于不需要正则表达式的答案，这里根本不需要任何复杂的东西。如果我窃取了他的表创建脚本，以下将起作用：

SQL> select *
  2    from t1
  3   where replace(substr(field1, 1, 5), 'a') is null
  4     and substr(field1,6,1) = substr(field1,7,1)
  5     and substr(field1,6,1) = substr(field1,8,1);

FIELD1
---------------------------------------------------------------

aaaaabbb
aaaaaccc
aaaaaddd
aaaaafff

如果你想让它稍微整洁一些，你可以使用REGEXP_COUNT()，但我看不出它有什么不同：

SQL> select *
  2    from t1
  3   where regexp_count(substr(field1, 1, 5), 'a') = 5
  4     and regexp_count(substr(field1,6), substr(field1,6,1)) = 3;

FIELD1
----------------------------------------------------------------------

aaaaabbb
aaaaaccc
aaaaaddd
aaaaafff

这是一个要演示的SQL Fiddle 。

score 0 · Accepted Answer

with x as (
select 'aaaaabbb' as val from dual
union
select 'aaaaaccc' as val from dual
union
select 'aaaaadef' as val from dual
union
select 'aaaaa___' as val from dual
)
select *
from x
where regexp_like(x.val, 'a{5}([a-z])\1{2}')

输出：

aaaaabbb
aaaaaccc

请注意， 'a{5}(\w)\1{2}' 不起作用，因为 (\w) 将匹配字母数字和下划线，并且从您的示例中您只需要 az 。

score 0 · Accepted Answer

~~你想从中匹配什么？~~ 编辑我想我现在明白你在找什么，所以调整了下面的正则表达式

您将需要类似oracle 的反向引用的东西

^a{5}((?!a)\w)\1{2}?$ // will match aaaaaddd but not bbbbbddd - this is probably what you need

编辑 2如果您在数据库中而不是在访问数据库的 java 中执行此操作，那么您可能必须放弃(?!a)上面的前瞻，因为 db 可能不支持它。其他替代方案（删除了前瞻）是：

^([a-zA-Z0-9])\1+([a-zA-Z0-9])\2+?$ // will match aaaaaddd, aaaadd, bbbbdd, aaaaaaaa
^([a-zA-Z0-9])\1+([b-zB-Z0-9])\2+?$ // will match aaaaaddd but not aaaaaaaa
^([a-zA-Z0-9])\1{4}([b-zB-Z0-9])\2{2}?$ // will match aaaaaddd but not aaaaadd
^a{5}([b-zB-Z0-9])\1{2}?$ // will match aaaaaddd but not bbbbbddd

这将找到一个字母数字，旁边有另一个相同的字母数字，n 次，然后是另一组。这将成为您需要的基础。注意\w不一定与相同a-zA-Z0-9，但[b-zB-Z0-9]如果您不想a在第二组中，可能是您可以做的最好的事情。

编辑添加^并$根据添加的注释强制整个字符串匹配，并根据可能的要求添加选项

score 0 · Accepted Answer

在你的情况下，我根本不会做正则表达式。如果您尝试进行的比较与您的示例一样简单，那么我会做一个简单的喜欢。我假设您正在尝试在 SELECT 语句中进行这些比较？

 create table t1 (field1 varchar2(100));

 -- what you want
 insert into t1 values ('aaaaabbb');
 insert into t1 values ('aaaaaccc');
 insert into t1 values ('aaaaaddd');
 insert into t1 values ('aaaaafff');

 -- what you dont want
 insert into t1 values ('aaaaaabc');
 insert into t1 values ('aaaaadef');
 insert into t1 values ('aaaaafgj');

 -- Just do a simple like
 with regex 
 as
 (-- all the possibilities
  select 'aaaaa' || rpad(alphabet, 3 , alphabet) lookup
  from  (-- a through z
         select chr(96 + rownum) alphabet
         from   dba_objects
         where  rownum <= 26) 
  ) 
 select *
 from   t1
 where  exists (select *
                from regex
                where t1.field1 like '%' || regex.lookup || '%')

如果表中的一行匹配多个 regex.lookup，我执行了 EXISTS 而不是连接。不过只是一个想法。

regex - 用于重复 2 组重复字符的 Oracle 数据库正则表达式

4 回答 4

Related

Reference