3

我在一个文件中有一个数据点列表,我将其插入到我构建的链表类中。
该文件是这样组织的,即有一系列负值,然后是一系列来回交替的正值。一个例子:

-2323 

-2324

-53434

-1027

-34232

 343434

 5657

 6565

 6500

-343434

-3434

-565

5845

4667

5453

98356

这种模式持续了许多行。每个部分的负值或正值的数量永远不会相同。

我想以某种方式分隔这些值,以便第一个列表对象包含第一组正数到负数,在本例中为 from -2323to 6500。下一个列表对象将包含来自-343434to的值98356,依此类推。

我无法弄清楚如何让 python 在读取文件时知道如何分离这些数据集。任何帮助,将不胜感激!

4

2 回答 2

4
import itertools
groups = itertools.groupby(l, lambda x : x > 0)
result = [list(groups[i][1]) + list(groups[i + 1][1]) for i in range(0, len(groups), 2)]

这将首先根据元素是否为正对元素进行分组,然后将组中的相邻对组合成一个列表,然后将其作为结果列表的一个元素。

编辑:我一直忘记 itertools 使对象不像普通的可迭代对象那样工作。

如果有点混乱,以下应该实际工作。

import itertools
groups = itertools.groupby(l, lambda x : x > 0)
grouplist = [[i for i in y] for (x, y) in groups]
result = [grouplist[i] + grouplist[i + 1] for i in range(0, len(grouplist), 2)]
于 2013-08-16T20:20:55.647 回答
2
def takeSection(sequence):
    it = iter(sequence)
    a = -1
    group = []
    while True:
        try:
            a, last = next(it), a
        except StopIteration:
            if group:
                yield group
            return
        if a < 0 and last >= 0:
            if group:
                yield group
            group = [a]
        else:
            group.append(a)

>>> sequence = [-2323, -2324, -53434, -1027, -34232, 343434, 5657, 6565, 6500, -343434, -3434, -565, 5845, 4667, 5453, 98356]
>>> list(takeSection(sequence))
Out[2]: 
[[-2323, -2324, -53434, -1027, -34232, 343434, 5657, 6565, 6500],
 [-343434, -3434, -565, 5845, 4667, 5453, 98356]]

编辑

如果您想在一对值中的第一个值上过滤它,您可以更改 if 条件来测试它。例如,您可以将条件行更改为if a[0] < 0 and last[0] >=0,并且您还需要初始化aa = (-1, -1)

但是,我很想改用更通用和更有用的功能。

def sections(sequence, key):
    it = iter(sequence)
    a = placeholder = object()
    group = []
    while True:
        try:
            a, last = next(it), a
        except StopIteration:
            if group:
                yield group
            return
        if last is not placeholder and key(a, last):
            if group:
                yield group
            group = [a]
        else:
            group.append(a)

>>> sequence = [(-2323, -7465), (-2324, -7687), (-53434, -1027), (-34232, 343434), (5657, 6565), (6500, 978987), (-343434, -987), (-3434, -565), (-98, -8798), (-89898, -898), (5845, 4667), (5453, 98356)]
>>> list(sections(sequence, key=lambda current, last: current[0] < 0 and last[0] >= 0))
Out[1]:
[[(-2323, -7465), (-2324, -7687), (-53434, -1027), (-34232, 343434), (5657, 6565), (6500, 978987)],
 [(-343434, -987), (-3434, -565), (-98, -8798), (-89898, -898), (5845, 4667), (5453, 98356)]]
于 2013-08-16T20:19:58.237 回答