我必须从http://money.rediff.com/companies/20-microns-ltd/15110088中提取 d 公司名称和面值
我注意到这个任务可以使用 xpath api 来完成。因为这是一个 html 页面,所以我使用的是 jtidy 解析器。
这是我必须提取的面值的 xpath。
/html/body/div[4]/div[6]/div[9]/div/table/tbody/tr[4]/td[2]
这是我的代码
URL oracle = new URL("http://money.rediff.com/companies/20-microns-ltd/15110088");
URLConnection yc = oracle.openConnection();
InputStream is = yc.getInputStream();
is = oracle.openStream();
Tidy tidy = new Tidy();
tidy.setQuiet(true);
tidy.setShowWarnings(false);
Document tidyDOM = tidy.parseDOM(is, null);
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xPath = xPathFactory.newXPath();
String expression = "/html";
XPathExpression xPathExpression = xPath.compile(expression);
Object result = xPathExpression.evaluate(tidyDOM,XPathConstants.NODESET);
System.out.println(result.toString());
请进一步指导我,因为我找不到上述问题的正确解决方案