7

让我从一些背景开始。

假设我有这个列表:

interactions = [ ['O1', 'O3'],
               ['O2', 'O5'],
               ['O8', 'O10']
               ['P3', 'P5'],
               ['P2', 'P19'],
               ['P1', 'P6'] ]

列表中的每个条目(例如:)O1, O3是两个实体之间的交互(尽管我们在这里处理的所有内容都是字符串)。列表中有许多不同的实体。

我们还有以下列表:

similar = ['O1', 'P23'],
          ['O3', 'P50'],
          ['P2', 'O40'],
          ['P19', 'O22']

其中每个条目是两个不同实体之间的相似关系。

所以O1类似于P23并且O3类似于P50并且 [O1, O3] 交互因此交互 ['P23', 'P50'] 是一个转换的交互。

同样,P2O40相似,P19与O22相似,并且[P2, P19] 相互作用,因此相互作用 ['O40', 'O22'] 是转换后的相互作用。

转换后的交互将始终来自同一类型,例如:[PX, PX] 或 [OX, OX]。

代码

所以我编写了以下代码来生成这些关系转移:

from collections import defaultdict

interactions = [ ['O1', 'O3'],
                 ['O2', 'O5'],
                 ['O8', 'O10']
                 ['P3', 'P5'],
                 ['P2', 'P19'],
                 ['P1', 'P6'] ]

similar = [ ['O1', 'H33'],
            ['O6', 'O9'],
            ['O4', 'H1'],
            ['O2', 'H12'] ]

def list_of_lists_to_dict(list_of_lists):
  d = defaultdict(list)
  for sublist in list_of_lists:
    d[sublist[0]].append(sublist[1])
    d[sublist[1]].append(sublist[0])
  return d

interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)


for key, values in interactions_dict.items():
  print "{0} interacts with: {1}".format(key, ', '.join(values))
    if key in similar_dict:
      print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
      forward = True
  for value in values:
    if value in similar_dict:
      print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
      reverse = True
      if forward and reverse:
        print "     thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]), 
         ',  '.join(similar_dict[value]))
  forward = reverse = False

我的尝试确实产生了正确的输出,但它也产生了不需要的输出。例如,有时它会在不同类型的实体之间生成输出:O1, P1,以及完全相同的实体之间:O1, O1。它还以不同的形式输出重复的结果,例如:O1, P1, P1, O1- 两者的意思相同,所以我们只想要这个条目一次。所有这些都是不受欢迎的行为。

所以我的问题是,我该如何重组我的尝试来解决这个问题?

谢谢。

4

3 回答 3

1

我对整体算法有一些建议:

  • 保留所有相似关系的字典,例如 O1:P23 和 P23:O1 都可以在字典中。
  • 在找到转换之前,请检查以确保交互的两个部分都可以转换,例如 O1 和 O3 必须都是字典中的键
  • 这应该防止任何转换被列为 O 和 P 一起,你说这是不需要的输出。
  • 如果您认为这将是一个问题,您还可以保留结果字典以检查重复项。

JF Sebastian 的回答解决了其中一些问题,但我认为您应该注意原始字典的构造方式,这将使得出有意义的结果变得容易得多。

于 2013-06-12T17:13:28.813 回答
1

如果相似关系既不是对称的也不是传递的:

from collections import defaultdict
from itertools import product

# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
    d[k].append(v)

for a, b in interactions:
    for x, y in product(d[a], d[b]): 
       # a, b interact; a is similar to x, b is similar to y
       #note: filter undesired x, y interactions here
       print x, y # transformed interaction
于 2013-01-28T18:00:53.993 回答
0

如果您将列表转换为字典,那么您可以轻松匹配字典的键并检索这些键的值。

于 2013-02-21T11:05:56.040 回答