我正在从 R 过渡到 Python。我刚开始使用熊猫。我有一个很好的子集的 R 代码:
k1 <- subset(data, Product = p.id & Month < mn & Year == yr, select = c(Time, Product))
现在,我想在 Python 中做类似的事情。这是我到目前为止所得到的:
import pandas as pd
data = pd.read_csv("../data/monthly_prod_sales.csv")
#first, index the dataset by Product. And, get all that matches a given 'p.id' and time.
data.set_index('Product')
k = data.ix[[p.id, 'Time']]
# then, index this subset with Time and do more subsetting..
我开始觉得我做错了。也许,有一个优雅的解决方案。任何人都可以帮忙吗?我需要从我拥有的时间戳中提取月份和年份并进行子集化。也许有一个单线可以完成所有这些:
k1 <- subset(data, Product = p.id & Time >= start_time & Time < end_time, select = c(Time, Product))
谢谢。