0

我想在index两个columns比较数据库的信息相等的情况下进行配对。这可以使用index记录链接类来实现吗?

# dfg and dfm are databases that both contain the columns 'N_name' and 'N_cp'
import recordlinkage as rl

indexer_try = rl.Index()
indexer_try.block('N_name','N_name','N_cp','N_cp')
candidate_links = indexer_try.index(dfg, dfm)

我希望该类创建包含与这些标准匹配的索引的多索引。

相反,我得到了,init () 需要 1 到 3 个位置参数,但给出了 5 个

4

1 回答 1

0

有必要将列包含为数组

# Indexation step
import recordlinkage as rl

indexer = rl.Index()
indexer.block(['N_name'],['N_name']) # 25k
indexer.block(['N_address', 'N_cp'],['N_address','N_cp']) #211k
indexer.block('latlng', 'latlng') # 320k
candidate_links = indexer.index(dfg, dfm)
于 2019-06-27T08:01:08.117 回答