1
import fileinput, sys, codecs, re, unicodedata

def remove_control_characters(s):
    return "".join(ch for ch in s if unicodedata.category(ch)[0]!="C")


file_in = 'file_with_ctrl_characters.XML'
file_out = 'out_file.xml'

with open(file_out, 'a') as out:
    for line in fileinput.input([file_in]):
        out.write(remove_control_characters(line)+'\n')
out.close()
os.remove(file_in)
os.rename('out_file.xml', file_in)

简而言之,此代码适用于 jupyter notebook。它读取一个文件,删除特殊字符,然后将其他所有内容写入一个新的 xml 文件。

然后它删除旧文件,并将旧文件名赋予新文件。我留下了相同的文件名,但没有特殊字符。

我想从命令提示符调用它,传递它(一个?)参数 - 我需要它来删除特殊字符的文件的路径。

如何从 Jupyter 笔记本代码转到可以从命令提示符调用的脚本,方法是向其提供要从中删除字符的文件?

4

0 回答 0