2

我需要从互联网上获取一组 html 格式的向量。

我正在以这种方式阅读网页:

add=url
doc=htmlTreeParse(add)

这是文档的外观:

文档 $file [1] "http://ifis.iowafloodcenter.org/ifis/ifis5/ws/objects.php?id=741&type=4"

  $version
  [1] ""

  $children
  $children$html
  <html>
  <body>
  <p>743,762,754,759,761,744,741,755,758,742,757,716,760</p>
  </body>
 </html>


  attr(,"class")
 [1] "HTMLDocument"

我希望获得以下数字

作为向量。

我尝试使用:

xmlValue(xmlRoot(doc) )

但这并没有给我向量。

如何做呢?

感谢您阅读

4

2 回答 2

2

就这个:

getURL(add,encoding = "iso8859-8") 
v2=strsplit(v, "\\,")
as.numeric(v2[[1]][[2]])
于 2012-06-15T05:16:39.117 回答
1

尝试使用

 `getURL(add)`        

来自 RCurl 包

于 2012-06-15T05:07:18.403 回答