import fileinput, sys, codecs, re, unicodedata
def remove_control_characters(s):
return "".join(ch for ch in s if unicodedata.category(ch)[0]!="C")
file_in = 'file_with_ctrl_characters.XML'
file_out = 'out_file.xml'
with open(file_out, 'a') as out:
for line in fileinput.input([file_in]):
out.write(remove_control_characters(line)+'\n')
out.close()
os.remove(file_in)
os.rename('out_file.xml', file_in)
简而言之,此代码适用于 jupyter notebook。它读取一个文件,删除特殊字符,然后将其他所有内容写入一个新的 xml 文件。
然后它删除旧文件,并将旧文件名赋予新文件。我留下了相同的文件名,但没有特殊字符。
我想从命令提示符调用它,传递它(一个?)参数 - 我需要它来删除特殊字符的文件的路径。
如何从 Jupyter 笔记本代码转到可以从命令提示符调用的脚本,方法是向其提供要从中删除字符的文件?