2

作为 SAT 求解器的结果,我有一个逻辑公式模型的大型嵌套 int 列表。该列表有一百万个长度约为 30 的子列表。

示例数据:

[[-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, -31, 32, 33, -34, 35, 36, -37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, -31, 32, 33, -34, 35, 36, 37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, -31, 32, 33, 34, 35, 36, -37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, -31, 32, 33, 34, 35, 36, 37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, -31, 32, 33, 34, -35, 36, -37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, -31, 32, 33, 34, -35, 36, 37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, 31, 32, 33, 34, -35, 36, -37], [-1, -2, 3, -4, -5, 6, 7, -8, -9, -10, -11, -12, 13, 14, 15, -16, 17, -18, -19, -20, 21, 22, 23, 24, 25, -26, -27, 28, 29, 30, 31, 32, 33, 34, -35, 36, 37]]

我需要检查一个列表,比如 [4,5,6] 是否包含属于其中一个嵌套列表的元素。

说我的清单是:

[ [5,12,46,4,99,6],[23,66,99,32,77] ]

如果我运行我的程序

[4,5,6]

它应该返回true

因为我需要使用不同的列表执行 500 次测试,所以我猜问题是性能关键。

这是我的计划:

  • 对列表进行排序以检查
  • 对大嵌套列表进行排序
  • 总是先比较两个最小的数字(比如我搜索 2 并且子列表以 3 开头,我可以继续下一个子列表)

还是有更好的方法,例如,通过使用字典?

(PS:因为我只寻找正数,所以我之前问过这个问题以摆脱所有负数。)

4

2 回答 2

3

使用集:

>>> data = [ [5,12,46,4,99,6],[23,66,99,32,77] ]
>>> set_data = [set(s) for s in data]
>>> set_data
[set([99, 4, 5, 6, 12, 46]), set([32, 66, 99, 77, 23])]
>>> myset = set([4,5,6])
>>> [myset.issubset(s) for s in set_data]
[True, False]
于 2013-11-08T23:01:16.163 回答
1

不要使用在内存中不必要地创建一个全新列表的列表推导,使用带有 any() 的生成器表达式。使用 Visser 的代码作为起点:

>>> data = [ [5,12,46,4,99,6],[23,66,99,32,77] ]
>>> set_data = [set(s) for s in data]
>>> set_data
[set([99, 4, 5, 6, 12, 46]), set([32, 66, 99, 77, 23])]
>>> myset = set([4,5,6])
>>> any(myset.issubset(s) for s in set_data)
True
于 2013-11-09T05:01:48.223 回答