问题标签 [mechanize-python]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby-on-rails - 使用mechanize在html页面中查找字符串
我正在尝试查找给定的字符串,比如说“Hello”是否存在于给定的页面中。到目前为止,我有以下内容:
我现在该怎么办?我见过搜索方法,但它只接受 XPath/CSS 表达式。我可以尝试使用 xpath 进行搜索,但有更好的方法吗?
python - 强制 Mechanize 使用 SSLv3
您将如何强制mechanize将 SSLv3 用于需要它的 HTTPS URL?如果我尝试对所有仅限 SSLv3 的 URL 使用 mechanize,则会收到错误消息:
python - 使用机械化选择表单名称
我正在尝试使用 Mechanize 在网页上的下拉菜单表单中选择一个选项。
到目前为止,我有以下内容:
效果很好。但后来我尝试使用以下方法查找页面上所有表单的名称:
但我得到的只是看起来像一堆gobbledygook的东西。
如何从标题为“容器类型”的下拉菜单中选择“VRACS LIQUIDES”选项?无论如何我可以使用 br.forms() 方法来获得更好的效果吗?
提前致谢
编辑:
返回的 gobbledygook 如下:
django - 在 Python 2.7 和 Django 中使用机械化库
如何在 Django 中使用 mechanize 库?
我在网上读到我可以把它放在一个目录中(例如/lib/)并根据需要包含。
问题是,我找到的源代码没有显示从配置到初始使用如何使用它。不幸的是,我也在谷歌的其他地方到处找东西,一无所获。我还检查了我在 django 上的一本书,没有任何信息..
谁能帮我吗?
我正在使用 python 2.7 本地安装 django。
谢谢
python - 关注 Google 结果的前 5 页 Python Mechanize
我目前只抓取谷歌搜索结果的第一页,但我想抓取前 5 页。
得到一个字符串,如:https://encrypted.google.com/search?hl=en&q=site%3Asomedomain.com&start=0
该变量urls
获取第一页的所有 10 个结果,但我开始添加条件以检查第一页上的 10 个 url,如果这是真的并且有 10 个 url,我希望它继续转到下一个 url,例如(提供下一个 url 也有 10 个结果)使用类似follow_link()
下面的 url:
我该怎么做呢?有人可以帮我吗?
python-2.7 - 机械化 - Python
我在 python 中使用mechanize登录到 HTTPS 页面。登录成功,但输出只是一个 SAML 响应。我无法获得使用浏览器打开时获得的实际页面源。
我得到了加密的 SAML 输出,但我不知道如何回复该 SAML 帖子以访问实际页面。
python - 在不同的计算机上处理我的 Python 脚本
Python新手在这里。
我正在寻找一种方法来在线保存我的 python 脚本,以便我可以在工作和在家中处理它们。我想构建一些(简单的)网络抓取工具,使用 Mechanize,也许还有 Scrapy。
在做了一些研究之后,我想我需要的是一个在线 IDE(对吗?)。我找到了 c9.io。问题是 c9.io 被证明太慢了,即使对于非常简单的任务,例如使用 Mechanize 打开和阅读页面也是如此。
您对我应该使用什么来在线编写、保存和运行网络抓取脚本有任何想法吗?
请记住,我无法在工作时使用命令行保存或运行脚本。我需要网上的东西。
python-2.7 - 机械化打开函数给出 BadStatusLine: ' ' 错误
我编写了这个脚本来下载我的歌曲的歌词并将它们存储在一个文本文件中:
这似乎工作了一段时间,我下载了一些歌曲的歌词,突然它引发了 BadStatusLine 错误
那么,为什么 br.open 函数突然停止工作?提前致谢 。
python - 模拟浏览器访问以加载所有 html 元素
我正在尝试加载一个 youtube 页面并按<embed>
如下方式获取元素。但是,找不到嵌入元素(soup.find('embed')
返回None
)。
但是,当我将汤写入 html 文件并将其加载到浏览器中时,它会加载<embed>
元素。大概这与浏览器不同的机械化和某种document.onload()
魔法有关吗?
如何模拟浏览器加载页面以便我可以看到<embed>
元素?
python - Python 的请求或机械化以登录站点
我想从道歉开始。我知道这很可能已经完成了足够多的时间,而且我只是在打死马,但我真的很想知道如何让它发挥作用。我正在尝试使用 Python 的 Requests 模块来登录网站并验证它是否有效。我还在代码中使用 BeautifulSoup 来查找一些我必须用来处理请求的字符串。
我对如何正确形成标题感到困惑。标题信息中究竟需要什么?
此外,如果使用 mechanize 模块会更好/更pythonic,我会接受建议。