我有一个庞大的文件,它只不过是这些块的重复单元:
//WAYNE ROONEY (wr10)
90 [label="90"];
90 -> 11 [weight=25];
90 -> 21 [weight=23];
90 -> 31 [weight=17];
90 -> 41 [weight=12];
90 -> 51 [weight=1];
90 -> 62 [weight=50];
90 -> 72 [weight=7];
90 -> 82 [weight=27];
90 -> 92 [weight=9];
90 -> 102 [weight=43];
我需要转换成看起来像这样的格式
90 11 25
即我只需要删除所有额外的东西,只需保持数字不变。
我尝试使用正则表达式,这行代码:
for line in filein:
match = re.search('label=" "', line)
if match:
print (match.group())
但它只是打印文件中的所有实例'label'
。如果我尝试搜索'label=" "'
,则没有输出。如果我能知道如何阅读标签,那么阅读权重将与它非常相似。