-1

我正在尝试解决pythonchallenge.com中的 Python 挑战。我在第 2 级。我被要求在网页源代码中给出的非常大的文本中查找稀有字符。这是: http: //www.pythonchallenge.com/pc/def/ocr.html

首先,我不想要任何解决方案。我只想自己解决它,但我不是高级 Python 程序员。那么你能告诉我要研究什么来解决这个问题吗?我也不知道如何很好地处理文件。在论坛的一些线索中,提到应该使用文件来解决这个问题。那你能告诉我要学什么吗?

4

3 回答 3

2

首先,将所有字符读入一个字符串。您可以使用urllib2下载文件、open从本地磁盘读取文件或对其内容进行硬编码。要在 Python 程序中包含如此长的字符串,您可能需要使用三引号字符串,如下所示:

"""
%%$@_$^__#)^)&!_+]!*@&^}@[@%]()%+$&[(_@%+%$*^@$^!+]!&_#)_*}{}}!}_]$[%}@[{_@#_^{*
@##&{#&{&)*%(]{{([*}@[@&]+!!*{)!}{%+{))])[!^})+)$]#{*+^((@^@}$[**$&^{$!@#$%)!@(&
...
"""

要找出每个字符的出现次数,请查看collections.Counter.

于 2012-04-05T13:26:23.043 回答
2

使用Counterfrom 集合来计算每个字符的出现次数以查找“稀有”字符。

剩下的留给您查看计数结果后自行计算。

于 2012-04-05T13:32:16.300 回答
1

提示 1:要打开和读取文件的内容,请使用

with open("filename") as f:
    contents = f.read()

提示 2:要计算字符数,一种选择是使用Counter.

于 2012-04-05T13:26:34.643 回答