我正在玩熊猫,并且在弄清楚如何解决以下问题时遇到了问题。给定一个 bookId 和 readerId 的数据框,对于给定的 A 读者,我想获得阅读过 A 所读任何一本书的其他读者的数量。
这是一个示例数据框
import pandas as pd
df = pd.DataFrame({'bookId': [1,1,2,2,3,3,3,4,4,4,4,4],
'readerId': [1,2,1,3,1,3,4,1,3,4,5,6]})
有人可以帮我解决这个问题,或者在使用熊猫时给我解决这个问题的直觉吗?一个带有 readerId 和 count 列的新数据框将是输出。
更新:
实际上,我不想计算每本书的读者人数,而是想计算所有阅读过我读过的书的读者人数。因此,如果一个读者读了 3 本书,而其他 20 人读了这些书中的任何一本,那么我真的希望有 20 个作为答案,如果所有 20 个读者都是不同的,并且不一定阅读所有给定读者的书单。