3

使用 Python 3 Pandas,花费大量时间试图弄清楚如何从 CSV 中获取一列日期并仅使用 MM/YYYY 或 YYYY/MM/01 创建一个新列。

数据看起来像 Col1,但我正在尝试生成 Col2:

Col1        Col2
2/12/2017   2/1/2017
2/16/2017   2/1/2017
2/28/2017   2/1/2017
3/2/2017    3/1/2017
3/13/2017   3/1/2017

我能够解析年份和月份:

df['Month'] = pd.DatetimeIndex(df['File_Processed_Date']).month
df['Year'] = pd.DatetimeIndex(df['File_Processed_Date']).year
df['Period'] = df['Month'] + '/' + df['Year']

最后一行是错误的。是否有一种聪明的 python 方式来显示 2/2017?

得到错误:“TypeError:ufunc'add'没有包含签名匹配类型dtype的循环('

更新,由 piRsquared 回答:

d = pd.to_datetime(df.File_Processed_Date)
df['Period'] = d.dt.strftime('%m/1/%Y')

这将在将 Col1 成功转换为 Col2 的数据框中创建一个 pandas 列。谢谢!

4

2 回答 2

3

让我们d转换'Col1'Timestamp

d = pd.to_datetime(df.Col1)

然后

d.dt.strftime('%m/1/%Y')

0    02/1/2017
1    02/1/2017
2    02/1/2017
3    03/1/2017
4    03/1/2017
Name: Col1, dtype: object

​

d.dt.strftime('%m%Y')

0    02/2017
1    02/2017
2    02/2017
3    03/2017
4    03/2017
Name: Col1, dtype: object

d.dt.strftime('%Y/%m/01')

0    2017/02/01
1    2017/02/01
2    2017/02/01
3    2017/03/01
4    2017/03/01
Name: Col1, dtype: object

d - pd.offsets.MonthBegin()

0   2017-02-01
1   2017-02-01
2   2017-02-01
3   2017-03-01
4   2017-03-01
Name: Col1, dtype: datetime64[ns]
于 2017-03-13T20:42:23.003 回答
1

您正在寻找的功能是strftime

于 2017-03-13T20:37:21.710 回答