我想创建一个 Python 解析器来解析文件中的空格和语法。我想要做的是读取一个文件,并将每个空格、标点符号和单词放入列表中自己的元素中。到目前为止,我有以下用于分割空格的内容:
with open(fname, 'r') as f:
words = re.split("(\s+)", f.read())
withwords
保存文件内容列表,每个空格作为其自己的元素。但是,我在解析标点符号时遇到了麻烦,因为列表元素可以包含元素中"Hello"
的引号等项目。相反,我希望它看起来像这样:
list = ['"', 'Hello', '"', '@', 'World']
相对于:
list = ['"Hello"', '@World']
如果有人可以帮助我,那就太好了!