0

我想将NER引擎的输出插入到数据帧中,如下所示

ID
1
2

我如上所述读取数据帧以获取 ID,然后使用它从路径读取,我试图创建一个 dfindex 变量以用作数据帧中的 loc,但它一直覆盖

dfner = pd.DataFrame()
dfindex = 0
for index, row in dfl.iterrows():
    id = row['id']
    
    path = "C:\\Users\\myfolder\\"+str(row['chart'])+".txt"
    with open(path,"r") as myfile:
       target_string = myfile.read()
       print(id)
       #here i do the NER
       doc = nlp(target_string)
       for ent in doc.ents:
           print(ent.text,ent.label_)
           dfner.loc[dfindex,'id'] = str(id)
           dfner.[dfindex,'match'] = ent.label_
           dfindex+=1

输出 :

1

约翰的名字

母公司名

2

克里斯的名字

克拉克名称

我想将其存储到如下数据框

ID 匹配
1 约翰
1 母鹿
2 克里斯
2 克拉克
4

1 回答 1

0

我可能已经想通了。我使用了一个空列表来计算条目数,下面是代码

dfner.loc[len(listname)-1, 'match'] = ent.label_
dfner.loc[len(listname)-1, 'id'] = str(id)
于 2021-08-27T20:46:39.810 回答