1

即使在阅读了一些文档之后,我仍然无法理解机械汤的状态浏览器的select_form()作用。它需要一个ID还是需要一个名字?我使用的表单没有 id,但有名称。将使用select_form()身份证或姓名?我尝试使用的表单看起来像这样(没有 ID)。

<div class="fsLoginForms">
    <div id="fsLoginForm" class="fsLogin" >
        <form name="userlogin" action="" method="post">

            <p class="fsLoginTitle">Site Login</p>
            <p class="fsLoginMessage">Please provide your username and password to log in:</p>

            <label for="username">username</label><input type="text" class="fsLoginUser" name="username" placeholder="Username" id="username" maxlength="50" value=""><br>
            <label for="password">password</label><input type="password" class="fsLoginPass" name="password" placeholder="Password" id="password" maxlength="50" value="" ><br>

        </form>
    </div>
</div>

我试过使用

stateful_browser.select_form("#userlogin")

stateful_browser.select_form("userlogin")

它一直在扔这个

Traceback (most recent call last):
  File "loginScrape.py", line 25, in <module>
    browser.select_form('#userlogin')
  File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/mechanicalsoup/stateful_browser.py", line 175, in select_form
    raise LinkNotFoundError()
mechanicalsoup.utils.LinkNotFoundError

更新:我尝试使用不正确的凭据对该网站进行身份验证,但遇到了同样的错误。我不太确定这意味着什么。

4

1 回答 1

3

根据http://mechanicalsoup.readthedocs.io/en/stable/mechanicalsoup.html?highlight=select_form#mechanicalsoup.StatefulBrowser.select_form上的文档

如果它是页面上唯一的表单,您应该能够不使用任何参数来获取表单。

或者,使用 CSS 选择器:

stateful_browser.select_form('form[name="userlogin"]')

CSS 选择器的详细信息:https ://www.crummy.com/software/BeautifulSoup/bs4/doc/#css-selectors

于 2017-12-13T16:45:06.523 回答