我需要将外部源生成的数百个 html 句子转换为可读文本,并且我有一个关于abbr
标签转换的问题。下面是一个例子:
from bs4 import BeautifulSoup
text = "<abbr title=\"World Health Organization\" style=\"color:blue\">WHO</abbr> is a specialized agency of the <abbr title=\"United Nations\" style=\"color:#CCCC00\">UN</abbr>."
print (BeautifulSoup(text).get_text())
此代码返回“WHO 是联合国的专门机构”。. 但是,我要的是“WHO(世界卫生组织)是联合国(United Nations)的一个专门机构”。有没有办法做到这一点?也许是另一个模块而不是 BeautifulSoup?