我想将NER引擎的输出插入到数据帧中,如下所示
ID |
---|
1 |
2 |
我如上所述读取数据帧以获取 ID,然后使用它从路径读取,我试图创建一个 dfindex 变量以用作数据帧中的 loc,但它一直覆盖
dfner = pd.DataFrame()
dfindex = 0
for index, row in dfl.iterrows():
id = row['id']
path = "C:\\Users\\myfolder\\"+str(row['chart'])+".txt"
with open(path,"r") as myfile:
target_string = myfile.read()
print(id)
#here i do the NER
doc = nlp(target_string)
for ent in doc.ents:
print(ent.text,ent.label_)
dfner.loc[dfindex,'id'] = str(id)
dfner.[dfindex,'match'] = ent.label_
dfindex+=1
输出 :
1
约翰的名字
母公司名
2
克里斯的名字
克拉克名称
我想将其存储到如下数据框
ID | 匹配 |
---|---|
1 | 约翰 |
1 | 母鹿 |
2 | 克里斯 |
2 | 克拉克 |