-1

我对熊猫有一个相当基本的问题,但我尝试过合并和加入但没有成功 - 编辑:这些在同一个数据框中,这不清楚。我们确实在压缩数据。

         print df

       product_code_shipped    quantity  product_code
     0   A12395                   1        A12395 
     1   H53456                   4        D78997
     2   A13456                   3        E78997
     3   A12372                   8        A13456 
     4   E28997                   1        D83126
     5   B78997                   2        C64516
     6   C78117                   9        B78497
     7   B78227                   1        H53456
     8   B78497                   2        J12372

因此,我只想拥有一个包含唯一产品代码及其其他数据的产品代码列。所以数量和颜色说,我只想要发货产品的产品代码(在另一列中有颜色)。如何在同一个数据框中执行此操作?所以我应该得到 print df2

       product_code_shipped    quantity  product_code   color 
     0   A12395                   1        A12395        red
     1   H53456                   4        H53456        blue
     2   B78497                   2        B78497        yellow
4

1 回答 1

2

我对您的问题有些困惑,特别是“唯一产品代码”输入的位置……我们是否在压缩数据?这个例子并没有说明这一点。尽管如此,我还是会试一试:

许多 DataFrame 方法依靠索引来自动对齐数据。在您的情况下,将这些 DataFrame 的索引设置为产品代码似乎很方便。所以你会有这个:

In [132]: shipped
Out[132]: 
                      quantity
product_code_shipped          
A                            1
B                            4
C                            2

In [133]: info
Out[133]: 
               color
product_code        
A                red
B               blue
C             yellow

现在,join不需要额外的参数;它给了你(我认为)你想要的东西。

In [134]: info.join(shipped)
Out[134]: 
               color  quantity
product_code                  
A                red         1
B               blue         4
C             yellow         2

如果这不能回答您的问题,请通过提供示例输入来澄清它,包括来自哪里color以及来自该输入的确切输出。

于 2013-09-10T13:26:12.863 回答