0

我目前正在努力处理数据集。我有一些不同公司不同年份的基本价值观。我想将年份添加到该数据集中。

Current dataset:
FirmA  EBITDA
FirmA  EBITDA
FirmA  EBITDA
FirmB  EBITDA
FirmB  EBITDA
FirmB  EBITDA

目标是添加日期,而我知道 FirmA 的第一个条目是 2017 年,第二个是 2016 年,第三个是 2015 年,并且无一例外地重复。

2017 FirmA  EBITDA
2016 FirmA  EBITDA
2015 FirmA  EBIDTA
2017 FirmB  EBITDA
2016 FirmB  EBITDA
2015 FirmB  EBITDA

关于如何做到这一点的任何建议?我正在使用 R,但如果 Python 或 Excel 中有一个简单的解决方案,我愿意尝试一下。

4

2 回答 2

3

您可以利用 R 的回收规则

transform(df, year = 2017:2015)
#     V1     V2 year
#1 FirmA EBITDA 2017
#2 FirmA EBITDA 2016
#3 FirmA EBITDA 2015
#4 FirmB EBITDA 2017
#5 FirmB EBITDA 2016
#6 FirmB EBITDA 2015

或者干脆

df$year <- 2017:2015

样本数据

df <- read.table(text =
    "FirmA  EBITDA
FirmA  EBITDA
FirmA  EBITDA
FirmB  EBITDA
FirmB  EBITDA
FirmB  EBITDA", header  = F)
于 2018-07-18T13:04:42.927 回答
0

或者你可以使用data.table

# I used sample data from @Maurits Evers
library(data.table)
setDT(df)[, year:= paste(2017:2015), by = V1]

和输出

      V1     V2 year
1: FirmA EBITDA 2017
2: FirmA EBITDA 2016
3: FirmA EBITDA 2015
4: FirmB EBITDA 2017
5: FirmB EBITDA 2016
6: FirmB EBITDA 2015
于 2018-07-18T13:12:47.340 回答