问题标签 [html5lib]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
500 浏览

python - Mechanize Select First Form 返回“ImportError: No module named html5lib”

阅读本教程后,我想出了这段代码,

不断收到此错误:

但是,我知道我已经成功安装了 html5lib,因为当我运行时pip3 freeze我看到

最新: 我认为我的问题可能与我的 easy-install.pth 文件有关。在我的站点包目录中,我实际上没有看到 html5lib。我只有这个:

当我跑的时候easy_install html5lib,我得到了Adding html5lib 0.999999999 to easy-install.pth file。但是,在它成功完成对 html5lib 的依赖项处理后,我打开了我的 easy_install.pth 文件,却没有看到任何地方提到的 html5lib?

除非 html5lib 位于上述软件包之一中?我想知道是否需要在我的 python 代码中导入 html5lib 并列出根路径?

真的不知道为什么这会被否决?:/

0 投票
2 回答
1689 浏览

python - 尝试安装 html5lib 时出错

我对python还是很陌生,我需要一个项目的html5lib,但是当我运行时pip install html5lib,这就是我得到的:

错误:[(' /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/ init .py','/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/init .py', "[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/ pip -uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/ init .py'"), ('/System/Library/Frameworks/Python.framework/Versions/2.7 /Extras/lib/python/_markerlib/ init .pyc','/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2。7/附加/lib/python/_markerlib/init .pyc', "[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/ python/_markerlib/初始化.pyc'"), ('/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/markers.py', '/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip- uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/markers.py', "[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/ T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/markers.py'"), ('/System/Library/Frameworks/Python.framework/版本/2.7/Extras/lib/python/_markerlib/markers.pyc', '/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras /lib/python/_markerlib/markers.pyc', "[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib/markers.pyc'"), ('/ System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib', '/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework /Versions/2.7/Extras/lib/python/_markerlib', "[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework /Versions/2.7/Extras/lib/python/_markerlib'")]/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib','/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python。 framework/Versions/2.7/Extras/lib/python/_markerlib',“[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python。框架/版本/2.7/Extras/lib/python/_markerlib'")]/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib','/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python。 framework/Versions/2.7/Extras/lib/python/_markerlib',“[Errno 1] 不允许操作:'/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python。框架/版本/2.7/Extras/lib/python/_markerlib'")]/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib'")]/var/folders/yr/8762117x5h7_pwb9fx5f0tzr0000gn/T/pip-uiZ0aQ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/_markerlib'")]

我知道真的很长的严重错误,但我不确定发生了什么。实际上,我在尝试安装其他 python 包时也遇到了错误,我不确定问题是什么。任何帮助或见解将不胜感激,谢谢!

0 投票
0 回答
222 浏览

python - Docker 上 Django 的 Python 依赖问题

我是 Docker 新手,在将我已经存在且正在工作的 Django 项目移植到 Docker 时遇到了麻烦,我现在几乎陷入困境,因为问题在于我的 requirements.txt 中的依赖项被冻结并且实际上正在我的其他环境中工作(Live在带有 Ubuntu 的 VPS 和带有 Arch 的 VM 上的 Dev 上)。

问题本身是在使用 djangocms_text_ckeditor/html5lib 迁移数据库时,并在例如下报告。https://github.com/divio/djangocms-text-ckeditor/issues/336

Docker 环境有何不同,以便在具有相同 Python 和依赖项版本的相同基本操作系统上发生此错误?

到目前为止我尝试了什么:

  • 最新的依赖版本(解冻)
  • 问题报告中提到的不同软件包版本。
  • 不同的 python 版本 3.4 - 3.6(标准和高山)(在 3.5 标准上实时运行)
  • 不同的基础镜像(ubuntu 16.04 - 16.06)
  • 删除包和包依赖(导致迁移不一致)

我的需求文件的依赖版本:

任何想法如何解决这个问题?

0 投票
1 回答
1771 浏览

web-scraping - 尝试使用 beautifulsoup 提取 div 元素下的表格

我是 bs4 的新手,我期待提取价格表。

我面临的主要问题是,在 html 页面中,表格元素并没有出现,但它是一个div. 我试过看classid但我无法获得价格。

这是我尝试过的:

以下是我为获取价格表而应用的过滤器,但未成功

在这两种情况下,回报都是no tables were found

谁能告诉我如何获得所需的表格?

0 投票
1 回答
1119 浏览

python - BeautifulSoup (bs4), html5lib, HTMLParseError: malformed start tag, at line 1, column 11

我需要将源代码从网站复制到本地存储的 html 文件中,因为直接从 url 解析不会捕获所有页面元素。我希望在源代码中的表中提取位置元素以用于地理编码。我的程序遍历了几页搜索结果,将每页的源代码写入本地存储的 html 文件中。地址元素仅占每页材料的三分之一左右,因此最好去掉额外的元素以减小文件大小。

为此,我希望程序打开一个空白的 html 文档进行编写,将当前页面的源代码写入其中,关闭文档,重新打开它进行解析(现在在 'r' 模式下),打开一个新的文档进行编写,并使用美丽的汤从第一个文档中捕获所有地理编码数据并将其写入新文档。然后程序将关闭第一个文档,然后再次以“w”模式重新打开它。

这将在循环中完成,因此第一个文档将始终被当前页面的源代码覆盖,而第二个文档将保持打开状态并保持仅写入地理编码数据,直到没有更多页面为止。

循环和导航以及将源代码写入文件的一切工作正常,但我无法弄清楚解析部分。我尝试使用以下代码在交互式环境中进行试验:

我收到以下错误:

所以我尝试了以下修复:

唉:

我也尝试过使用 lxml、ertree,但似乎没有任何效果。我无法直接从 url 获取需要解析的元素。我需要从 html 文件中解析。

0 投票
2 回答
51 浏览

python - 试图解析表格的真正斗争

我正在尝试从网络上解析一张(价格表),结果却是一场真正的斗争

这是网络

使用 bs4:

使用 html5lib:

在这两种情况下都没有找到表格,有人可以帮我解析表格或至少了解问题所在吗?

如果可能,我想放弃xml安装有问题的选项,所以根本不要使用。

先感谢您

0 投票
1 回答
1573 浏览

python - 在漂白安装中找不到 html5lib

我在 centos6.5(python3.5) 上安装 tensorflow-gpu,它需要张量板,它需要漂白剂 ==1.5.0,它需要:

所以我从源代码安装了 html5lib 0.9999999(7 个九):

我通过在 python 中导入 html5lib 验证了安装:

似乎很成功。然后我尝试安装bleach1.5.0:

并发生错误:

由于某种原因,安装计算机没有网络连接。因此,我从另一台计算机下载所需的 whl 文件和 tar.gz 并将其上传到安装计算机。我也尝试了 html5lib 0.999,它也没有工作并报告同样的错误。我参考了这个enter link description here,并确保已经安装了六个 1.10.0。

0 投票
0 回答
52 浏览

python - 没有一个解析器找到所有漂亮的汤蟒

我正在尝试对包含正文中的单元测试结果的 html 文件进行简单解析

我能从中得到的最好的结果是 1 个带有 lxml 和 html5lib 的文本实例(当接近 50 个时)。其他解析器找不到。无论如何我可以解决损坏的html吗?

身体的一个例子是这个

********* LogLevelTypeTest 测试完成 *********
********* AppLoggerConfigTest 开始测试 *********
配置:使用 QTest 库 4.8 .1,Qt 4.8.1
通过:initTestCase
通过:testSetFromEnvironment
通过:cleanupTestCase
总计:3 通过,0 失败,0 跳过

看起来像这样

0 投票
1 回答
3752 浏览

python - 已安装 html5lib 但 BeautifulSoup 找不到它

我已经安装了 html5lib 包。我敢肯定,因为当我尝试安装它时,我会收到一条消息,指出它已安装。

我也能够成功导入该包。

然而,当我尝试将解析器用作 BeautifulSoup 构造函数的一部分时

我不成功

是否可以强制 bs4 查找已安装的解析器并成功找到 html5lib?

0 投票
2 回答
6406 浏览

python-3.x - 使用 pip 安装时出现传输编码错误

尝试通过 pip 安装任何 python 包时,我在 parse() 中遇到意外的 arg:keyword encoding。

我遇到了这个问题,因为我为 python 3.6 安装了 tensorflow,这可能导致 html5lib 和 setuptools 出现一些问题。已使用 tar.gz 文件(管理员安装)重新安装了 html5lib1.0b10,但问题仍然存在。请帮忙!!