0

我拥有的数据文件如下所示:

Title
10000XX   1.09876543e+02

此表格中有许多行,第 1 列的值范围为 1000000-2000099,第 2 列的值范围为 -9000 到 9000,包括一些具有负指数的值。我对正则表达式很陌生,所以任何帮助都会很有用。我的程序的其余部分是用 python 编写的,所以我正在使用:

re.search()

这种语法的一些帮助会很棒。谢谢

4

1 回答 1

3

正如罗伯特所说,您可以使用该split()功能。

假设分隔符是问题中的空格,您可以运行下面的代码以提供值列表,然后按照您的意愿进行操作:

>>> line = "10000XX   1.09876543e+02"
>>> line.split()
['10000XX', '1.09876543e+02']

您可以使用 将第二项转换为浮点数float()。例如float('1.09876543e+02')

只需遍历您的行并忽略任何不以数字开头的行。

正则表达式有点复杂。

于 2012-06-11T18:31:21.260 回答