我想使用 Ruby 清理其标签的 HTML 页面。我有原始 HTML,并且想定义一个标签列表,例如 ['span'、'li'、'div'],并创建一个可以按顺序运行的正则表达式数组,这样我就有了
clean_text = raw.gsub(first_regex,' ').gsub(second_regex,' ')...
每个标签有两个正则表达式(开始和结束)。
我是否有办法以编程方式执行此操作(即从标记数组预先构建正则表达式数组,然后以流畅的模式运行它们)?
编辑:我意识到我实际上一次问了两个问题 - 第一个关于将标签列表转换为正则表达式列表,第二个关于调用正则表达式列表作为流利的。感谢您回答这两个问题。我将尝试使我的下一个问题成为单一主题。