我需要正则表达式来解析文本中的项目。
数据结构为:
- 包含任何内容的项目代码
- 一些可选标志 AA BB CC DD
- 和数量
我正在使用这个正则表达式:
.*\n(.+) (AA|BB|CC|DD|EE|[, ]+){0,6}(\d+).*
使用此文本字符串:
Sveiki,
I need these items:
1508-dkh-ą9 AA, BB 100
1efae 468 BB, CC 100
2efae 468 BB 100
3efae 468 100
Ačiū už dėmesį ir skirtą laiką!
它返回
<row>
<ID>0</ID>
<Match>1508-dkh-Ä…9 AA, BB 100</Match>
<Group1>1508-dkh-Ä…9 AA, BB</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
<row>
<ID>1</ID>
<Match>1efae 468 BB, CC 100</Match>
<Group1>1efae 468 BB, CC</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
<row>
<ID>2</ID>
<Match>2efae 468 BB 100</Match>
<Group1>2efae 468 BB</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
<row>
<ID>3</ID>
<Match>3efae 468 100</Match>
<Group1>3efae 468</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
我需要这样的结果
<row>
<ID>0</ID>
<Match>1508-dkh-Ä…9 AA, BB 100</Match>
<Group1>1508-dkh-Ä…9</Group1>
<Group2>AA, BB</Group2>
<Group3>100</Group3>
</row>
....
我怎样才能达到这个结果?(也许有比正则表达式更好的解决方案?)