python - Python 2.7 - min 内置函数未按预期工作

Question

我正在做 Google Python 练习并且不理解 min() 内置函数的行为，这似乎不会产生预期的结果。练习是“babynames”，我正在使用“baby1990.html”文件（https://developers.google.com/edu/python/exercises/baby-names）测试代码

def extract_names(filename):
    f = open(filename, 'r').read()
    res = []
    d = {}
    match = re.search(r'<h3(.*?)in (\d+)</h3>', f)
    if match:
            res.append(match.group(2))

    vals = re.findall(r'<td>(\d+)</td><td>(\w+)</td><td>(\w+)</td>', f)
    for n, m, f in vals:
            if m=='Adrian' or f=='Adrian':
                    if m not in d:
                            d[m] = n
                    else:
                            d[m] = min(n, d[m])

                    if f not in d:       
                            d[f] = n
                    else:
                            print "min( "+str(n)+", "+str(d[f])+") = "+str( min(n, d[f]) ) 
                            d[f] = min( [n, d[f]] )

    for name,rank in sorted(d.items()):
    res.append(name+" "+str(rank))

    return res

vals 是一个元组列表（rank、male_name、female_name），我想将每个名称（男性和女性）存储在字典“d”中，名称为键，排名为值。如果有重复，我想保留较低的排名值。

我注意到“Adrian”这个名字在集合中出现了两次，第一次是男性名字，排名 94，第二次是女性名字，排名 603，我想要两个值中较小的一个。

因此，第一次匹配 'Adrian' 时，它被存储在排名为 94 的字典中（正确）。第二次匹配时，执行流程正确进入了第二个if的第二个分支，但是结果变成了603，即使min(94, 603) = 94。所以结果是：

min( 603, 94) = 603
1990
Adrian 603
Anton 603
Ariel 94

我不明白错误在哪里。正如预期的那样，通过解释器，min(94, 603) = 94。我错过了什么？

感谢帮助

PS：我也试过 min(n, d[f] ) 那是没有列表的相同函数，但结果总是 603

score 5 · Accepted Answer

您正在比较字符串，而不是数字：

>>> min('603', '94')
'603'

按字典顺序，'6'排序在'9'. 正则表达式适用于字符串，即使数字匹配，返回的匹配项也是字符串。用于int()将字符串转换为整数：

vals = re.findall(r'<td>(\d+)</td><td>(\w+)</td><td>(\w+)</td>', f)
for n, m, f in vals:
    n = int(n)
    # ...

在尝试调试 Python 代码时，使用repr()而不是str()检测类型问题；如果你使用过repr()，你会看到它'94'会被打印出来而不是94（所以用引号来表示一个字符串）。

python - Python 2.7 - min 内置函数未按预期工作

1 回答 1

Related

Reference