我正在尝试获取模式的最后 3 个字符。但我被困在如何做到这一点上。
请分享您对此的看法。
PACKAGE uima.ruta.example;
Document{->RETAINTYPE(SPACE)};
DECLARE VarA;
((W|NUM)* (W|NUM)*){REGEXP(".{12}")-> MARK(VarA),MARK(EntityType,1), UNMARK(VarA)};
I/P - AB1234567CAB
O/P - 驾驶室
您可以使用$
来指示源字符串的结尾应在模式中的位置。对于您的示例,您需要最后 3 个字符,因此您可以使用如下模式:
.{3}$
获取最后 3 个字符。这将获得任何字符(除了 a \n
),但您可以更具体,例如,如果您只想要大写字母,您可以使用:
[A-Z]{3}$
或者如果您可以接受大写、小写或数字,您可以使用
\w{3}$
在 regex101.com 上进行实验,看看什么对你有用。
假设您在单元格 A1 中的数据您可以使用这两个宏中的第二个宏
Option Explicit
Sub Extract_Laste_3Carachters(st As Range, Patt$, n)
Dim Obj As Object
Set Obj = CreateObject("Vbscript.RegExp")
With Obj
.Pattern = Patt
.Global = True
End With
If Len(st) <= 3 Then st.Offset(, 1) = st: Exit Sub
If Obj.test(st) Then
If n > Obj.Execute(st).Count Then n = Obj.Execute(st).Count
st.Offset(, 1) = _
Obj.Execute(st)(n - 3) _
& Obj.Execute(st)(n - 2) _
& Obj.Execute(st)(n - 1)
End If
End Sub
'+++++++++++++++++++++++++++++++++
Sub Test_Me()
Call Extract_Laste_3Carachters(Range("a1"), ("\w"), Len(Range("a1")))
End Sub
我尝试了下面的代码,它现在可以工作了!
PACKAGE uima.ruta.example;
Document{->RETAINTYPE(SPACE)};
"(?i)\\b(?=.*\\d)[1]{0,1}[A-Z0-9]{2}[\\s |-]{0,2}[A-Z0-9]{7}[\\s |-]{0,2}([A-Z]{3})\\b" ->1 = EntityType;