我读到这个: 从 Python 中的字符串中剥离除字母数字字符之外的所有内容
还有这个: Python:去除除空格和字母数字之外的所有内容
不太明白,但我尝试了一下自己的代码,现在看起来像这样:
import re
decrypt = str(open("crypt.txt"))
crypt = re.sub(r'([^\s\w]|_)+', '', decrypt)
print(crypt)
当我运行脚本时,它会返回这个答案: C:\Users\Adrian\Desktop\python>python tick.py ioTextIOWrapper namecrypttxt moder encodingcp1252
我试图从文档中删除所有额外的代码,只保留数字和字母,在文档中可以找到以下文本:http: //pastebin.com/Hj3SjhxC
我正在尝试解决这里的任务:http: //www.pythonchallenge.com/pc/def/ocr.html
任何人都知道“ioTextIOWrapper namecrypttxt 现代编码cp1252”是什么意思?我应该如何格式化代码以正确地将其从除字母和数字之外的所有内容中剥离出来?
真挚地