我有一个文本文件,其中包含许多单词的几种拼写变体:
例如
identification ... ID .. identity...contract.... contr.... contractor...medicine...pills..tables
所以我想要一个包含单词同义词的同义词文本文件,并希望用主要单词替换所有变体。本质上我想要规范化输入文件。
例如,我的同义词列表文件看起来像
identification = ID identify
contracting = contract contractor contractors contra......
word3 = word3_1 word3_2 word3_3 ..... word3_n
.
.
.
.
medicine = pills tables drugs...
我希望最终输出文件看起来像
identification ... identification .. identification...contractor.... contractor.... contractor...medicine...medicine..medicine
我如何在 python 中编程?
非常感谢你的帮助!!!