0

我正在使用 python pandas_dedupe 包,特别是 pandas_dedupe.dedupe_dataframe。

我已经通过交互式提示训练了 dedupe_dataframe 模块。但现在我需要重新训练 dedupe_dataframe 模块。如何擦除训练集并从头开始?

我曾尝试删除 dedupe_dataframe_learned_settings 和 dedupe_dataframe_training.json 文件,但随后 python 脚本引发错误。

我使用 PyCharm 作为我的 IDE。

任何提示将不胜感激。谢谢!

4

1 回答 1

0

pandas-dedupe v1.3.1,您只需要执行以下操作:

  1. 删除 dedupe_dataframe_learned_settings 和 dedupe_dataframe_training.json;
  2. 运行 dedupe_dataframe 设置update_model=False[注意:这是默认设置]。

这是标准程序。如果它不起作用,请提供与您收到的错误相关的更多信息。

于 2020-07-05T18:26:29.953 回答