2

我从 twitter 收集了不同用户位置的数据。我正在尝试在 R 中的地图中绘制这些数据。问题是用户提供了无效/不正确的地址,导致地理编码功能失败。我怎样才能避免这种失败?有没有办法检查这个错误情况而不继续?例如,对于任何文件 geocode9.csv,用户位置数据都是这样的。

可用地点,布法罗,纽约,thsjf,华盛顿,美国密歇根,nkjnt,篮球,ejhrbvw

library(ggmap)
fileToLoad <- file.choose(new = TRUE)
origAddress <- read.csv(fileToLoad, stringsAsFactors = FALSE)
geocoded <- data.frame(stringsAsFactors = FALSE)
for(i in 1:nrow(origAddress))
{

  result <- geocode(origAddress$available_locations[i], output = "latlona", source = "google")
  origAddress$lon[i] <- as.numeric(result[1])
  origAddress$lat[i] <- as.numeric(result[2])
  origAddress$geoAddress[i] <- as.character(result[3])

}
write.csv(origAddress, "geocoded.csv", row.names=FALSE)

当代码通过位置列表的“thsjf”运行时,它会引发错误。我怎样才能克服这个错误?我想要类似 if(false){ # do not run geocode function}

4

1 回答 1

0

如果它们实际上是错误的,我不确定如何对这些地址进行地理编码。如果它是错误的,机器怎么会发现它?我认为您需要更正地址,然后对所有内容进行地理编码。这是一些示例代码。

#load ggmap
library(ggmap)

startTime <- Sys.time()

# Select the file from the file chooser
fileToLoad <- file.choose(new = TRUE)


# Read in the CSV data and store it in a variable 
origAddress <- read.csv(fileToLoad, stringsAsFactors = FALSE)


# Initialize the data frame
geocoded <- data.frame(stringsAsFactors = FALSE)


# Loop through the addresses to get the latitude and longitude of each address and add it to the
# origAddress data frame in new columns lat and lon
for(i in 1:nrow(origAddress))

{
# Print("Working...")
result <- geocode(origAddress$addresses[i], output = "latlona", source = "google")
origAddress$lon[i] <- as.numeric(result[1])
origAddress$lat[i] <- as.numeric(result[2])
origAddress$geoAddress[i] <- as.character(result[3])
}


# Write a CSV file containing origAddress to the working directory
write.csv(origAddress, "geocoded.csv", row.names=FALSE)

endTime <- Sys.time()
processingTime <- endTime - startTime
processingTime

检查此以获取更多信息。

http://www.storybench.org/geocode-csv-addresses-r/

于 2018-01-19T02:39:05.143 回答