我有两个数据框,如下所示。
import databricks.koalas as ks
input_data = ks.DataFrame({'code':['123a', '345b', '678c'],
'id':[1, 2, 3]})
my_data = ks.DataFrame({'code':['123a', '12a', '678c'],
'id':[7, 8, 9], 'stype':['A', 'E', '5']})
这两个数据框有一个名为的列code
,我想检查列code
中存在my_data
和也存在于的列中的值,input_data
并将它们存储在名为的结果数据框中output
。数据框将output
仅包含code
input_data 中存在的列值。每个数据框中的列数可能不同,我只是在这里展示了一个示例
根据output
此问题中提供的示例,数据框将具有如下结果。
display(output)
# Result is below
Code id
'123a' 7
我在网上找到了主要使用 for 循环的解决方案,但我想知道是否有更有效的方法来解决这个问题。
谢谢你们!