1

我有这个文件:

domain|nsservers
virus.am.|['ns101.yourhostservice.com.', 'ns102.yourhostservice.com.']
rochemme.ae.|['auhans1.ecompany.ae.', 'auhans2.ecompany.ae.', 'dxbans1.ecompany.ae.', 'dxbans2.ecompany.ae.']
virus.am.|['ns101.yourhostservice.com.', 'ns102.yourhostservice.com.','ns103.yourhostservice.com.']
rochemme.ae.|['auhans2221.ecompany.ae.']

我想用这种格式创建一个新文件。

domain|list of all unique nsservers
 virus.am.|['ns101.yourhostservice.com.', 'ns102.yourhostservice.com.','ns103.yourhostservice.com.']
 rochemme.ae.|['auhans1.ecompany.ae.', 'auhans2.ecompany.ae.', 'dxbans1.ecompany.ae.', 'dxbans2.ecompany.ae.','auhans2221.ecompany.ae.']

这是我使用的代码。但它并没有给我想要的结果:

from collections import defaultdict


file = './test'
dns_dic = defaultdict(set)

f = open(file,'r')
for line in f:
    line = line.strip()
    domain,nslist = line.split('|')
    if domain in dns_dic:
        dns_dic[domain].append(nslist)
    else:
        dns_dic[domain] = (nslist)
print(dns_dic)

如何将这些列表组合成一个唯一的键值(在这种情况下是域名?)有人可以帮助我吗?

4

1 回答 1

2

当你创建一个defaultdict喜欢 -

dns_dic = defaultdict(set)

这意味着set()它将用作字典中未找到的键的默认值。但这并不意味着您直接包含在字典中的值(使用 - dns_dic[domain] = (nslist))将转换为set) 。当您直接为其设置字符串/列表时,不会发生此类转换。

另一件事是你正在使用defaultdict这样你就不必检查密钥是否已经存在等等。但你仍然在做那个检查 - if domain in dns_dic:。你不需要那个。

另一个问题——

  1. nslist是一个字符串(不是列表),因此它没有任何.append()方法,因此这应该会为您出错 - dns_dic[domain].append(nslist)

您应该利用defaultdict'set默认情况下创建而不是直接分配值的能力。只有这样,您才能将集合作为值。为此,您可以执行以下操作 -dns_dic[domain].update(nslist)

您应该ast.literal_eval在将字符串list添加到字典/集合之前将其转换为 a。

此外,您应该使用with语句打开文件(以便它自动为您处理关闭文件。

例子 -

from collections import defaultdict
import ast

file = './test'
dns_dic = defaultdict(set)

with open(file,'r') as f:
    for line in f:
        line = line.strip()
        domain,nslist = line.split('|')
        nslist = ast.literal_eval(nslist)
        dns_dic[domain].update(nslist)

print(dns_dic)

在此之后,您可以打开一个文件并将字典的元素写入文件。例子 -

with open('filetowrite','w') as of:
    for k,v in dns_dic.items():
        of.write('{}|{}'.format(k,v))
于 2015-10-07T09:32:13.183 回答