给定一封 HTML 电子邮件,我使用以下内容来精简为文本:
body = body.gsub(/\\r\\n?/, "\n");
body = body.gsub(/\\n\\n?/, "\n");
body = simple_format(body)
body = strip_tags(body)
但我现在看到一个标签通过了这个:
<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">
输出如下:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
任何想法为什么?