我正在尝试使用 R 中的 ggplot2 生成世界地图。它应该是基于国家/地区的热图。我正在处理的数据来自推特,我想显示推文的来源。有2个问题:
综合数据
map_data("world")
给我一张 20 年前的地图(苏联)。
map_data("world2")
似乎损坏了。或者有一些订购问题,但我不知道如何解决。
http://schloegl.net/supersambo/world2.pdf
- 我想更改颜色中断,但不知道如何访问它。由于巴西是唯一一个易于阅读的国家,因此编辑休息时间并显示推文少于 1000 条的国家之间的差异非常重要。
http://schloegl.net/supersambo/world.pdf
这是我的代码
WD <- getwd()
if (!is.null(WD)) setwd(WD)
library(maps)
library(plyr)
library(ggplot2)
twitter=read.csv("/Users/stephanschloegl/Studium/Diplomarbeit/rawData/c_userInfo/c_userInfo.csv",header=TRUE,check.names=FALSE,sep=";")
#read geodata
cities=read.csv("GeoWorldMap/cities.txt",header=TRUE,check.names=FALSE,sep=",")
countries=read.csv("GeoWorldMap/countries.txt",header=TRUE,check.names=FALSE,sep=",")
#find countries for twitter$timezone
lista <- twitter$time_zone
country_ids <- cities$CountryID[match(lista,cities$City)]
country <- countries$Country[match(country_ids,countries$CountryId)]
#FREQENCIES
frequencies <- as.data.frame(table(country))
names(frequencies) <- c("region","freq")
#change 0's to NA
frequencies$freq[frequencies$freq==0] <- NA
#load world data
world <- map_data("world2")
#Delete Antarctica
world <- subset(world,region!="Antarctica")
#merge twitterdata and geodata
world$tweets <- frequencies$freq[match(world$region,frequencies$region,nomatch=NA)]
map <- qplot(long, lat, data = world, group = group,fill=tweets,geom ="polygon",ylab="",xlab="")
#this does'nt work
map + scale_colour_hue(name="Number of\nTweets",breaks=levels(c(10,20,100,200,1000)))
map