我目前正在开发一个 python 机器人,它从 HTML 页面上的元块中检索信息。我得到了元块的内容,现在我一直试图将它解析为两个不同的字符串。
内容的一个例子是:
Lowercase Words WITH UPPERCASE CONTAINING 2 AND ALSO ', AND MANY MORE CHARACTERS
到目前为止,我有:
lowercase = ' '.join(w for w in content.split() if (not w.isupper()) and (not w.isdigit()))
uppercase = ' '.join(w for w in content.split() if (w.isupper() or w.isdigit()))
其中大写字符串旨在包含不是“小写”或“单词”的所有内容
我无法在此类问题上找到太多帮助,并且想知道是否有人会知道技巧或解决方法?谢谢