1
sample = ",,"
values = shlex.shlex(sample, posix=True)
values.quotes = '"'
values.whitespace = ','
values.whitespace_split = True

received_output = list(values)

在上面的代码示例中,我希望将["", "", ""]的值作为received_output,但received_output只是一个空列表[]。似乎没有任何关于如何接收这种预期行为的信息。

这适用于sample.split(','),但我更喜欢使用 shlex,因为我有带有标记的复杂句子,如果它们是组的一部分(例如以下示例中的纬度、经度),则不应将其拆分。

另一个例子:

sample = '9267,BELMONT,KEELER,,62.4,35.2,10/01/2012,Weekday,"(41.93897000, -87.73212000)"'

expected_output = ['9267', 'BELMONT', 'KEELER', '', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
retrieved_output = ['9267', 'BELMONT', 'KEELER', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
4

2 回答 2

2

shlex文档状态:

  • 即使被引用,也无法解析空字符串。

如果您想在输出中包含空字符串,那么 shlex 库是不适合这项工作的工具。

正如@PadraicCunningham 在评论中指出的那样,csv(逗号分隔值)库应该可以正常工作:

>>> list(csv.reader(['9267,BELMONT,KEELER,,62.4,35.2,10/01/2012,Weekday,"(41.93897000, -87.73212000)"']))[0]
['9267', 'BELMONT', 'KEELER', '', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
>>> list(csv.reader([',,']))[0]
['', '', '']
于 2016-02-16T21:27:18.050 回答
0

所以我最初赞成另一个答案,但事实证明这是错误的。文档中的引用来自关于非 Posix 行为的部分,但默认情况下使用 Posix 行为。使用 Posix 行为,您可以获得一个空字符串,如下所示:

shlex.split('x ""')
# ['x', '']

请注意,引号不会在 Posix 模式下分隔单词,因此会发生这种情况:

shlex.split('x""')
# ['x']

这有点令人困惑,但是您仍然可以使用 shlex 获得空字符串。

在您的特定情况下,由于您似乎无论如何都在解析类似 CSV 的输入,因此使用 CSV 模块是有意义的。

于 2020-04-03T10:45:47.370 回答