我正在将这个网页上的文本文件读入 R。如果我读到这个数据并且read.table
数据被正确解析并且我得到了所有 12 个月的数据:
url <- "http://academic.udayton.edu/kissock/http/Weather/gsod95-current/OHCINCIN.txt"
temp_df1 <- read.table(url,
col.names = c("Month", "Day", "Year", "Avg_Temp"),
na = "-99")
head(temp_df1)
Month Day Year Avg_Temp
1 1 1 1995 41.1
2 1 2 1995 22.2
3 1 3 1995 22.8
4 1 4 1995 14.9
5 1 5 1995 9.5
6 1 6 1995 23.8
unique(temp_df1$Month)
[1] 1 2 3 4 5 6 7 8 9 10 11 12
但是,如果我用它读取这些数据,read_table
首先会出现它被正确解析;但是,两位数的月份代码(10、11、12)正在被剥离,因此只解析了第一个数字。
temp_df2 <- read_table(url,
col_names = c("Month", "Day", "Year", "Avg_Temp"),
na = "-99")
head(temp_df2)
# A tibble: 6 × 4
Month Day Year Avg_Temp
<int> <int> <int> <dbl>
1 1 1 1995 41.1
2 1 2 1995 22.2
3 1 3 1995 22.8
4 1 4 1995 14.9
5 1 5 1995 9.5
6 1 6 1995 23.8
unique(temp_df2$Month)
[1] 1 2 3 4 5 6 7 8 9
数据的维度相同;但是,我无法弄清楚如何导入数据read_table
以保留完整的月份编码。
dim(temp_df1)
[1] 7963 4
dim(temp_df2)
[1] 7963 4