假设我有一个字符串,其中包含来自数据库或电子表格的逗号分隔格式的数据。
例如:
data = "hello,how,are,you,232.3354,good morning"
假设这些“记录”中可能有 200 个字段。
我有兴趣查看此记录的某些字段。Python 中最快的方法是什么?
最简单的方法是:
fields = data.split(",")
result = [fields[4], fields[12], fields[123]]
有没有更快的方法来做到这一点,利用以下事实:
- 您只需要为结果分配一个包含 3 个元素和 3 个字符串对象的列表。
- 到达字段 123 后,您可以停止扫描数据字符串。
我尝试使用重复调用来编写一些代码来查找以跳过传递的逗号,但是如果最后一个字段在字符串下方太远,这将比基本拆分解决方案慢。
我正在处理几百万条记录,因此欢迎任何加速。