0

我的数据集有 2 个变量:

1)Match_City(足球比赛所在城市的名称) 2) Home_score(主队进球数)

问题是有超过 1500 个城市,无法确定哪些城市的 Home_score 总数最高。我想知道我是否可以获得该柱形图的数据,即A市总共有20个来自主队的进球。我目前正在使用 geom_col() 来制作柱形图。我需要帮助!

4

1 回答 1

0

理解您的问题有点困难,正如其他人所指出的那样,您应该尝试给我们一个可重现的代码示例。

但是,如果我正确理解您的问题...

您有一个包含两列(Match_City 和 Home_score)的大型数据框,并且您制作了一个柱形图来比较每个 Match_City 的 Home_score 总数。

现在您可以直观地看到哪个 Match_City 的 Home_score 总得分最高,但您希望 R 以您可以使用的方式计算这些数字。聚合函数是你最好的选择。

一些示例代码:

#Let's Create Some Data

df <- data.frame(Match_City=sample(LETTERS[1:5], size = 100, replace = TRUE), Home_score=sample(1:6, size = 100, replace = TRUE))

#Aggregate will find the sum of Home_score for each Match_City

score_summary<-aggregate(Home_score~Match_City, data = df, FUN = sum)

#You can then sort the score_summary data frame so that the Home_score sums are in decreasing order

score_summary<-score_summary[order(score_summary$Home_score, decreasing = TRUE),]

于 2020-04-11T21:34:08.127 回答