-2

我试图了解 BeautifulSoup 的工作原理。请注意,我对 Python 真的很陌生,所以我可能遗漏了一些东西。

我打开一个 Python 终端并这样写:

from bs4 import BeautifulSoup
import re
ytchannel = '/home/XXX/Documents/test2'
soup = BeautifulSoup(ytchannel)
print(soup.prettify())

这就是我得到的:

<html>
 <body>
  <p>
   /home/XXX/Documents/test2
  </p>
 </body>
</html>

为什么?对我来说完全是无稽之谈。我只想要test2. 我正在写的正是 BeautifulSoup 网站上的内容。

4

1 回答 1

1

您将字符串传递给BeautifulSoup(); 确定它是一个文件名,但BeautifulSoup()不会为您打开文件名。它仅对字符串或打开的文件对象进行操作。

先打开文件;BeautifulSoup()如果您将文件对象传入:

with open(ytchannel) as infile:
    soup = BeautifulSoup(infile)

请参阅制作汤

于 2013-10-17T14:12:03.020 回答