查看此 NOAA 网页上的“估计的全球趋势每日值”文件。它是一个.txt
包含 50 个标题行(用前导#
s 标识)后跟数千行表格数据的文件。下载文件的链接嵌入在下面的代码中。
我怎样才能读取这个文件,以便我最终得到一个具有适当列名和数据的数据框(或小标题)?
我所知道的所有文本到数据的功能都被这些标题行所阻碍。这是我刚刚尝试过的,从这个 SO Q&A中抽离出来。#
我的想法是将文件读入行列表,然后从列表中删除以开头的行,然后删除do.call(rbind, ...)
其余行。顶部的下载部分工作正常,但是当我运行该函数时,我得到一个空列表。
temp <- paste0(tempfile(), ".txt")
download.file("ftp://aftp.cmdl.noaa.gov/products/trends/co2/co2_trend_gl.txt",
destfile = temp, mode = "wb")
processFile = function(filepath) {
dat_list <- list()
con = file(filepath, "r")
while ( TRUE ) {
line = readLines(con, n = 1)
if ( length(line) == 0 ) {
break
}
append(dat_list, line)
}
close(con)
return(dat_list)
}
dat_list <- processFile(temp)