我有以下 txt 文件,其中包含每个单词的 POS(词性)标签。
不用/jj 到/to 说/vb ,/, 我/ppss 被/bedz furious/jj at/in this/dt 无双/jj 侵/nn 上/in free/jj 企业/nn./。如何/wrb 敢/vbn 他们/ppss
有没有办法在没有 POS 标签的情况下读取文件,所以结果将是:
不用说,我对这种对自由企业的空前侵犯感到愤怒。他们怎么敢
所以,基本上我想删除/
.
words = re.findall('\w+',open(input_file).read())
上面的代码将删除 / 但仍然出现 jj , ppss 等缩写。那么,如何删除 / 后跟任何字符。