问题标签 [bleach]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
786 浏览

python - 制作 Bleach 以允许代码标记

我正在尝试使用漂白剂来转义 HTML 标签。它工作得很好,除非我试图插入一个被剪断为页面内容的代码。片段插入如下:

代码示例可能包含 html 标签。如果它们在里面,我怎样才能使漂白剂不逃脱标签<pre><code>?我知道我可以将一些标签列入白名单,但似乎没有办法将所有标签列入白名单,如果它们在代码块内,然后在其他情况下列入黑名单。外部 html 标记是从 Markdown 生成的。

此外,bleach 会转义所有 < 和 > 符号,但如果它们出现在代码片段中,则如下所示:

如果漂白剂不能做到这一点,你能建议另一个逃生者,那可以做我需要的吗?

0 投票
1 回答
165 浏览

python - Bleach:如何将 nofollow 属性添加到现有链接?

我知道可以链接尚未成为 html 链接的 URL,并且 Bleach 会自动添加rel="nofollow". (来源:http ://bleach.readthedocs.io/en/latest/linkify.html )

但是如何将 nofollow 属性添加到已经是 html 链接的 URL(即它们已经是<a>标签)?

0 投票
1 回答
1573 浏览

python - 在漂白安装中找不到 html5lib

我在 centos6.5(python3.5) 上安装 tensorflow-gpu,它需要张量板,它需要漂白剂 ==1.5.0,它需要:

所以我从源代码安装了 html5lib 0.9999999(7 个九):

我通过在 python 中导入 html5lib 验证了安装:

似乎很成功。然后我尝试安装bleach1.5.0:

并发生错误:

由于某种原因,安装计算机没有网络连接。因此,我从另一台计算机下载所需的 whl 文件和 tar.gz 并将其上传到安装计算机。我也尝试了 html5lib 0.999,它也没有工作并报告同样的错误。我参考了这个enter link description here,并确保已经安装了六个 1.10.0。

0 投票
1 回答
323 浏览

python - SQLAlchemy 模型中的处理字段(使用 flask_sqlalchemy)

我通过flask_sqlalchemy 使用SQLAlchemy。模型接收来自 HTML 表单的输入。我希望这个输入被剥离任何标签。我认为最好在模型对象中以某种方式实现它,而不是在分配之前在代码中执行几次。

我能想到的可能性是:

  • 派生自己的列类型
  • 围绕列类型包装代理类
  • 定义执行上述操作的装饰器类型
  • 修改模型对象以拦截分配

前三个解决方案似乎更优雅,但我不明白我需要如何实现这些。主要原因是我不明白 SQLAlchemy 如何准确地从列变量中提取表结构和列类型,以及如何处理对它们的分配,特别是在通过 flask_sqlalchemy 类访问时。

我尝试了上面列表中的最后一个选项,并提出了这个(部分)解决方案:

这在使用创建对象时有效Example(field1='foo', field2='bar')。但是,我不确定如何处理各个字段的分配。我在考虑这些方面的事情,但不确定标记为 ASSIGN 的部分:

更一般地说,我的印象是这不是处理标签过滤的最佳方式。因此,我很感激有关如何最好地实现此行为的任何提示,最好是使用新列类型的装饰器。

看起来这可以通过使用漂白剂的 TypeDecorator(链接)来完成process_bind_param。但是,我无法弄清楚如何将此装饰器应用于上面 db.Model 派生类中基于 flask_sqlalchemy 的列定义。

0 投票
0 回答
952 浏览

python - 防止 pip 升级依赖项

我有一个基于 Mezzanine 的网站,其中 Bleach 作为依赖项安装。Bleach 2.0 与我的 Mezzanine 版本不兼容。我尝试在我的 requirements.txt 文件中将 Bleach 的版本指定为 ==1.5,但每个 pip 安装仍然会升级版本。我在想另一个依赖不断迫使升级。

有没有办法告诉 pip 锁定包的版本,或者禁止用这种方法查看依赖树?最坏的情况是操作系统的 python 强制 Bleach 2.0。

0 投票
0 回答
260 浏览

html - Bleach 和 html5lib 与 tensorboard 不兼容

在安装 tensorflow 时,我收到以下错误:

分布式 1.21.8 需要 msgpack,未安装。我尝试通过执行以下命令来解决

但是它给出了以下我无法解决的错误

tensorboard 1.8.0 要求漂白剂==1.5.0,但您将拥有不兼容的漂白剂 2.1.3。tensorboard 1.8.0 要求 html5lib==0.9999999,但您将拥有不兼容的 html5lib 1.0.1。

如何更新漂白剂和 html5lib 使其与 tensorboard 兼容?

Ubuntu 18.04

0 投票
1 回答
1086 浏览

python - 表名上的 SQL 语法错误

我刚刚完成了关于阻止论坛数据库中的垃圾邮件的部分,现在是清理它们的时候了。

目标是使用update语句更新数据库记录并删除标记为垃圾邮件的帖子。在挠头并从在线讲师(这是针对在线课程)那里收到模糊的提示和指示后,我遇到了一个错误。

这可能不是正确的方法,我在谷歌上没有运气后正在寻找指导。这是一个片段forumdb.py

这是我得到的错误:

如果有帮助,这里是 forum.py:

提前感谢任何有能力提供帮助的人!

0 投票
0 回答
32 浏览

node.js - 如何在不使用 npm install 的情况下安装漂白模块?

运行以下命令时出现一些代理错误:

是否有任何替代方法可以下载此模块并在 node_modules 下添加或任何其他替代方法。请帮忙

0 投票
1 回答
701 浏览

python - 蟒蛇漂白剂:不一致的清洁行为

我想使用漂白剂来格式化一些可能不干净的 HTML。在以下示例中,理想情况下漂白剂应去除:

  • 第一个开口中的额外空间<p >
  • 结束链接标签中的属性</a attr="test">
  • 最后关闭的多余空格</p >

我的代码如下所示:

如您所见,漂白剂非常不一致:

  • 开始和结束p标记的 < 和 > 转义为&lt;and &gt;。对于链接标签,这不会发生
  • 中的空格</p >被删除,在开口中<p >它们不是
  • 另外,如果我在结束p标记中添加一个属性</p attr="test">,它不会被删除,而关闭</a attr="test">非法属性会被删除。

这里发生了什么?

0 投票
1 回答
55 浏览

python - 使用 Python 清理 HTML 内容

我正在使用一个外部 API,它从 HTML 电子邮件中向我发送文本。文本通过没有 HTML 结构(例如<html> ... </html>等)。我需要清理此文本并输出到 Slack。我尝试过使用 BeautifulSoup 和 Bleach,这两种方法都不起作用,大概是由于输入中 HTML 的部分性质。

输入文本的示例如下所示:

我想要上面输入的以下输出:

我使用了以下简单的漂白程序:

使用 BeautifulSoup,我还使用了一些正则表达式来清理输出: