我正在尝试找到最pythonic的方式来拆分字符串,例如
“字符串中的一些单词”
成单个词。string.split(' ')
工作正常,但它会在列表中返回一堆空白条目。当然我可以迭代列表并删除空格,但我想知道是否有更好的方法?
只需使用my_str.split()
没有' '
.
此外,您还可以通过指定第二个参数来指示要执行多少次拆分:
>>> ' 1 2 3 4 '.split(None, 2)
['1', '2', '3 4 ']
>>> ' 1 2 3 4 '.split(None, 1)
['1', '2 3 4 ']
怎么样:
re.split(r'\s+',string)
\s
是任何空格的缩写。\s+
连续的空白也是如此。
不带参数使用string.split()
或 re.split(r'\s+', string)
代替:
>>> s = 'some words in a string with spaces'
>>> s.split()
['some', 'words', 'in', 'a', 'string', 'with', 'spaces']
>>> import re; re.split(r'\s+', s)
['some', 'words', 'in', 'a', 'string', 'with', 'spaces']
从文档:
如果
sep
未指定或 isNone
,则应用不同的拆分算法:连续空格的运行被视为单个分隔符,如果字符串具有前导或尾随空格,则结果将在开头或结尾不包含空字符串。因此,使用分隔符拆分空字符串或仅包含空格的字符串会None
返回[]
.
>>> a = "some words in a string"
>>> a.split(" ")
['some', 'words', 'in', 'a', 'string']
split 参数不包含在结果中,所以我想关于你的字符串还有更多的东西。否则,它应该工作
如果您有多个空格,只需使用不带参数的 split()
>>> a = "some words in a string "
>>> a.split()
['some', 'words', 'in', 'a', 'string']
>>> a.split(" ")
['some', 'words', 'in', 'a', 'string', '', '', '', '', '']
或者它只会将 a 拆分为单个空格
最 Pythonic 和正确的方法是不指定任何分隔符:
"some words in a string".split()
# => ['some', 'words', 'in', 'a', 'string']
text = "".join([w and w+" " for w in text.split(" ")])
将大空间转换为单个空间