0

输入 DataFrame X 包含列名 A

一个
类风湿关节炎
母乳喂养,独家
失智
髋部骨折
HIV爱滋病

DataFrame Y 包含列名 B

类风湿关节炎
高血压前期
肝细胞癌
HIV爱滋病
白血病,骨髓
白血病,骨髓,急性
母乳喂养!独家

所需的输出 如果 X[A] 匹配到 Y[B] 它应该只是替换它并且 DataFrame Y 应该是 。

类风湿关节炎
HIV爱滋病
母乳喂养,独家

并且 X[A] 与 Y[B] 的不匹配创建了一个空的数据帧 non_match ,它应该看起来像这样

高血压前期
肝细胞癌
白血病,骨髓
白血病,骨髓,急性
regex = r"[a-zA-Z]"
regex1 = r'\W+'
for x in master_condition.iteritems():
  for y in sample.iteritems():
    if (sorted(re.split(regex1, str(x) , re.MULTILINE | re.IGNORECASE)) == 
                sorted(re.split(regex1, str(y), re.MULTILINE | 
                   re.IGNORECASE))):
  sample["Conditions"] = 
          sample["Conditions"].replace(master_conditions["TA_Conditions"])
else:
  print("Hello")



B["B"] = B["B"].str.replace(r"[A-Za-z]", "", regex=True)\
           .str.lower()\
           .str.strip()  # if there is trailing spaces

B_matched = B.merge(A, how="inner", left_on="B", right_on="A")[["B"]]

 B_non = B[~B["B"].isin(B_matched["B"])].rename(columns={"B": "non"})

这两个代码都不起作用?请帮我另一个代码

4

0 回答 0