0

我有这个泡菜文件https://github.com/Nilabhra/ethnicity/blob/master/models/ethnicity_classifier_last_name.pkl它是从 json 文件生成的https://github.com/Nilabhra/ethnicity/blob/master/json_counts/ last_name_ethnicity.json

我的问题:如何删除旧数据集并将新数据集放入 .pkl 文件中。

import pickle

ethinicity= {"Kumari": {"Hindu,Brahmin": 1.0},"Choopra": {"Jain,Digambar": 1.0}}
pickle.dump(ethinicity, open("ethnicity_classifier_last_name.pkl", "wb"))

但是上面代码生成的pickle文件具有不同的结构,因此当我运行此代码时它会抛出错误

4

2 回答 2

1

删除旧的泡菜文件并转储新的泡菜文件,其中包含新的数据集。

于 2018-02-23T06:56:51.927 回答
0

在写入泡菜文件之前,您需要使用新条目更新旧字典

import pickle 
import json

#Loading the old json
old_ethnicity = json.load(open('last_name_ethnicity.json','rb'))
ethinicity= {"Kumari": {"Hindu,Brahmin": 1.0},"Choopra": {"Jain,Digambar": 1.0}}

#Add the changes to old dict
new_ethnicity = dict(old_ethnicity, **ethinicity)
pickle.dump(new_ethnicity, open("ethnicity_classifier_last_name.pkl", "wb"))`
于 2018-02-23T07:51:41.337 回答