背景:我在 Webflow 中创建网站,然后将它们导出以与 PHP 后端集成。Webflow 的默认文件结构与我们的后端不同,因此在实际“集成”导出的代码之前,我使用 Python 和 BeautifulSoup 来帮助纠正一些繁琐的事情。
我要解决的第一件事是将所有图像更改src
为'images/xxx'而不是'../images/xxx',我可以这样做:
img['src'] = img['src'].replace('../images/', 'images/')
现在我想找到所有链接并将它们href
的 s 替换为我们在后端使用的结构,如下所示:
<a href="<?=$website_info->url?>/page"></a>
我已经能够毫无问题地找到 BS 中的所有链接,并且我正在尝试href
像这样替换它们:
links = soup.find_all('a', href=True)
for link in links:
link['href'] = '<?=$website_info->url?>/page'
print(link)
但这会导致这样的输出,其中 every<
和分别>
替换为<
和>
:
<a class="inner-page-nav-link w-nav-link" href="<?=$website_info->url?>/link">Page Name</a>
有谁知道我如何替换链接href
s 而不会<
像>
这样转义 and 字符?