我有这个示例字符串:
≪! [If Gte Mso 9]>≪Xml> ≪Br /> ≪O:Office Document Settings> ≪Br /> ≪O:Allow Png/> ≪Br /> ≪/O:Off...
我想专门针对以“≪”开头并以“>”结尾的任何内容,并将其替换为无空格“”。
一直在使用 Rubular,但我在学习如何设置它时遇到了棘手的问题。
有科吗?
我有这个示例字符串:
≪! [If Gte Mso 9]>≪Xml> ≪Br /> ≪O:Office Document Settings> ≪Br /> ≪O:Allow Png/> ≪Br /> ≪/O:Off...
我想专门针对以“≪”开头并以“>”结尾的任何内容,并将其替换为无空格“”。
一直在使用 Rubular,但我在学习如何设置它时遇到了棘手的问题。
有科吗?
result = subject.gsub(/≪[^>]*>/, '')
应该做的伎俩。
[^>]*
表示:匹配除 . 之外的任意数量的字符>
。
模式很简单:
≪[^>]*>
看起来您确实在尝试使用正则表达式解析 XML,这是从该文档中提取所需数据的一种非常困难且脆弱的方法。
您最好使用 XPath 或 DOM 解析它并选择您需要的信息。
只是一个有用的提示,我使用Rubular来帮助 regex 编写调试。