1

我正在尝试在 retweeting_id 列上合并下面的这两个数据框

                retweeting_id           retweeting_username     retweeting_followers_count
207857          822215673812119553      WhiteHouse              26139914
        id                      user_id  retweet_count      tweet                              prediction   retweeting_id   username    
4682    1341442941642928129     64932923    191     RT @WhiteHouse: Over 80% of Americans say they...   2   8.222157e+17    Erika   
4683    1341443049067479041     64932923    332     Hope—and help—are on the way!\n\n"The first sh...   2   8.222157e+17    Erika   
5764    1339008184997064705     232598875   694     "Yesterday, the United States witnessed a medi...   1   8.222157e+17    Wm R Collie IV MD   
10065   1338931792800325634     1105109168  297     "Yesterday, the United States witnessed a medi...   1   8.222157e+17    President-elect       

但是当我使用

df1 = pd.merge(test2, test1, on= 'retweeting_id')

我得到一个空的数据框。我认为第二个数据框中的科学记数法搞砸了,但我知道数字是一样的,因为我正在使用

test2 = df_merge2[(df_merge2['retweeting_id'] == 822215673812119553  )]

获取第二个数据框。任何关于如何让这两者合并的想法,任何帮助将不胜感激。谢谢

4

2 回答 2

0

尝试将 retweeting_id 更改为第二个数据帧上的整数。然后,再次尝试合并。

于 2021-01-06T18:40:52.637 回答
0

我通过使用转换为字符串来修复它

test2.retweeting_id = test2.retweeting_id.map(lambda x: '{:.0f}'.format(x))

在两个数据帧上,现在它们正确合并。

于 2021-01-06T19:30:08.950 回答