pandasfactorize
函数将系列中的每个唯一值分配给一个从 0 开始的顺序索引,并计算每个系列条目所属的索引。
我想pandas.factorize
在多列上完成相当于:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
也就是说,我想确定数据帧的几列中每个唯一的值元组,为每个值分配一个顺序索引,并计算数据帧中的每一行属于哪个索引。
Factorize
仅适用于单列。pandas 中是否有多列等效函数?