ruby-on-rails - RegEx 的新手

Question

我有这个示例字符串：

&Lt;! [If Gte Mso 9]>&Lt;Xml>  &Lt;Br /> &Lt;O:Office Document Settings>  &Lt;Br /> &Lt;O:Allow Png/>  &Lt;Br /> &Lt;/O:Off...

我想专门针对以“≪”开头并以“>”结尾的任何内容，并将其替换为无空格“”。

一直在使用 Rubular，但我在学习如何设置它时遇到了棘手的问题。

有科吗？

score 2 · Accepted Answer

result = subject.gsub(/&Lt;[^>]*>/, '')

应该做的伎俩。

[^>]*表示：匹配除 . 之外的任意数量的字符>。

score 2 · Accepted Answer

2

模式很简单：

&Lt;[^>]*>

于 2010-07-07T15:53:41.600 回答

score 0 · Accepted Answer

看起来您确实在尝试使用正则表达式解析 XML，这是从该文档中提取所需数据的一种非常困难且脆弱的方法。

您最好使用 XPath 或 DOM 解析它并选择您需要的信息。

score 0 · Accepted Answer

0

只是一个有用的提示，我使用Rubular来帮助 regex 编写调试。

于 2010-07-07T17:16:02.497 回答

4 回答 4