python - Python 挑战 2 级

Question

我正在尝试解决pythonchallenge.com中的 Python 挑战。我在第 2 级。我被要求在网页源代码中给出的非常大的文本中查找稀有字符。这是： http: //www.pythonchallenge.com/pc/def/ocr.html

首先，我不想要任何解决方案。我只想自己解决它，但我不是高级 Python 程序员。那么你能告诉我要研究什么来解决这个问题吗？我也不知道如何很好地处理文件。在论坛的一些线索中，提到应该使用文件来解决这个问题。那你能告诉我要学什么吗？

score 2 · Accepted Answer

首先，将所有字符读入一个字符串。您可以使用urllib2下载文件、open从本地磁盘读取文件或对其内容进行硬编码。要在 Python 程序中包含如此长的字符串，您可能需要使用三引号字符串，如下所示：

"""
%%$@_$^__#)^)&!_+]!*@&^}@[@%]()%+$&[(_@%+%$*^@$^!+]!&_#)_*}{}}!}_]$[%}@[{_@#_^{*
@##&{#&{&)*%(]{{([*}@[@&]+!!*{)!}{%+{))])[!^})+)$]#{*+^((@^@}$[**$&^{$!@#$%)!@(&
...
"""

要找出每个字符的出现次数，请查看collections.Counter.

score 2 · Accepted Answer

使用Counterfrom 集合来计算每个字符的出现次数以查找“稀有”字符。

剩下的留给您查看计数结果后自行计算。

score 1 · Accepted Answer

提示 1：要打开和读取文件的内容，请使用

with open("filename") as f:
    contents = f.read()

提示 2：要计算字符数，一种选择是使用Counter.

python - Python 挑战 2 级

3 回答 3

Related

Reference