我想在 R 中分析一些地震数据。源 HTML 中的一个典型(许多)输出是
<pre>
Year,Month,Day,Time(hhmmss.mm)UTC,Latitude,Longitude,Magnitude,Depth,Catalog
2012, 01, 01, 003008.77, 12.008, 143.487, 5.1, 35, PDE-W
.....
</pre>
我已经设法将逗号分隔的数据转换为一个字符串,其中 \n 应该分隔行,但不清楚如何进一步进行 - 并且不确定这是最好的方法。
library(XML)
url <- "http://neic.usgs.gov/cgi-bin/epic/epic.cgi?SEARCHMETHOD=1&FILEFORMAT=6&SEARCHRANGE=HH&SYEAR=2012&SMONTH=01&SDAY=01&EYEAR=2012&EMONTH=1&EDAY=31&LMAG=4&UMAG=&NDEP1=&NDEP2=&IO1=&IO2=&CLAT=0.0&CLON=0.0&CRAD=0.0&SUBMIT=Submit+Search"
data <- xpathSApply(basicInfo, "//*/pre/text()", xmlValue)
str(data) #chr "\n Year,Month,Day, .... Catalog\n 2012,
任何帮助表示赞赏