1

我有一个熊猫数据框,我想根据行中的值为每一行分配一个随机数并写出一个数据框。

所以我正在尝试:

for index, row in person[person['AGE_R'] == 1].iterrows():
    row = index, random.randint(1, 15)

但我不太清楚如何从中写出数据帧(不可能?)。我能够得到一个元组列表,我可以将其转换为可行的格式,但我确信有更好的方法。

我之前尝试过:

person[person['AGE_R'] == 1] = random.randint(1, 15)

但这会将 'AGE_R 的所有 1 设置为 randint 的值。有用,但不是我想要的。

有什么建议么?

谢谢!

4

1 回答 1

1

如果要进行矢量化操作,可以使用 numpy.random.randint:

>>> df = pd.DataFrame({'AGE_R':[1,2,3,5,4,3,1]})
>>> df
   AGE_R
0      1
1      2
2      3
3      5
4      4
5      3
6      1
>>> df.ix[df['AGE_R'] == 1, 'AGE_R'] = np.random.randint(1, 15, len(df[df['AGE_R'] == 1]))
>>> df
   AGE_R
0      5
1      2
2      3
3      5
4      4
5      3
6      11

或者您可以使用应用:

>>> df.ix[df['AGE_R'] == 1, 'AGE_R'] = df.ix[df['AGE_R'] == 1].apply(lambda x: np.random.randint(1, 15), axis = 1)
>>> df
   AGE_R
0      5
1      2
2      3
3      5
4      4
5      3
6     12
于 2013-11-02T06:34:14.497 回答