我需要在 Python 中使用 BeautifulSoup 找到 HTML 文件中段落元素内的所有可见标签。
例如,
<p>Many hundreds of named mango <a href="/wiki/Cultivar" title="Cultivar">cultivars</a> exist.</p>
应该返回:
Many hundreds of cultivars exist.
PS 某些文件包含需要提取的 Unicode 字符(印地语)。
任何想法如何做到这一点?