2

我正在尝试为包含选项列表的页面生成 HTML 帖子。有一个下拉列表,用户在其中选择一个项目,然后单击生成按钮。根据选择的选项,它会返回各种结果。我对之前和之后的 HTML 进行了比较,可以看到如下差异:

<option value="Option1">Option 1</option>
<option value="Option2">Option 2</option>
<option value="Option3">Option 3</option>

<option value="Option1">Option 1</option>
<option selected="selected" value="Option2">Option 2</option>
<option value="Option3">Option 3</option>

我不知道生成 jsoup 文档的语法。到目前为止,我有这个,但它只是不断返回原始 HTML,没有结果:

doc = Jsoup.connect("MYurl...")
.timeout(5000)
.userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
.cookie("auth", "token")
.data("selected", "Option2")
.post();
4

1 回答 1

6

您必须使用数据通过其name属性设置字段的值。

当您使用:

.data("selected", "Option2")

与在请求页面上有此元素相同form(注意name="selected"):

<select name="selected">
    <option value="Option1">Option 1</option>
    <option selected="selected" value="Option2">Option 2</option>
    <option value="Option3">Option 3</option>
</select>

因此,您尝试的方式POST是正确的。事情可能是(您试图模拟的)selected中不存在命名的参数(字段),因此发送它与不发送相同。form

发表评论后编辑:

在解析之前,我真正需要做的是点击网页元素,据我所知,这不能用 Jsoup 完成。

你是对的。Jsoup 不支持这一点 - 单击可能会产生一些副作用,例如 JavaScript 事件等。处理它们是一件大事。

但是,对于您的具体情况,jsoup 更改 DOM 的功能可能很有用。检查下面的示例。在其中,我们通过将其selected属性显式设置为selected(并将其从其他所有选项中删除)来“选择”一个选项。

import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.*;

public class JSoupChangeDom {
    public static void main(String[] args) {
        Document doc = Jsoup.parse(""+
        " <html><body>                                            " +
        " <div>example</div>                                      " +
        " <form>                                                  " +
        "    <select name='mySelect'>                             " +
        "       <option value='Option1'>Option 1</option>         " +
        "       <option value='Option2'>Option 2</option>         " +
        "       <option value='Option3'>Option 3</option>         " +
        "    </select>                                            " +
        " <form>                                                  " +
        " </body></html>                                          ");
        Element mySelect = 
                      doc.getElementsByAttributeValue("name", "mySelect").get(0);
        String optionValueToBeSelected = "Option2";
        Elements options = mySelect.getElementsByTag("option");
        for (Element option : options) {
            if (option.attr("value").equals(optionValueToBeSelected)) {
                option.attr("selected", "selected");
            } else {
                option.removeAttr("selected");
            }
        }
        System.out.println(doc);
    }
}

输出:

<html>
    <head></head>
    <body>
        <div>example</div>
        <form>
            <select name="mySelect">
                <option value="Option1">Option 1</option>
                <option value="Option2" selected="selected">Option 2</option>
                <option value="Option3">Option 3</option>
            </select>
        </form>
    </body>
</html>
于 2013-06-28T01:25:31.350 回答