如果我理解正确,您正在寻找图像的 src,以便在此之后提取它。
首先,您需要找到(使用检查器)HTML 中的哪个位置是图像。例如,在我正在报废足球队盾牌的粒子案例中,我需要:
m_url = 'http://www.marca.com/futbol/primera/equipos.html'
client = uOpen(m_url)
page = client.read()
client.close()
page_soup = BS(page, 'html.parser')
teams = page_soup.findAll('li', {'id': 'nombreEquipo'})
for team in teams:
name = team.h2.text
shield_url = team.img['src']
然后,您需要处理图像。你必须选择。
第一:使用numpy:
def url_to_image(url):
'''
Función para extraer una imagen de una URL
'''
resp = uOpen(url)
image = np.asarray(bytearray(resp.read()), dtype='uint8')
image = cv2.imdecode(image, cv2.IMREAD_COLOR)
return image
盾牌 = url_to_image(shield_url)
第二使用scikit-image库(您可能需要安装):
shield = io.imread('http:' + shield_url)
注意:就在这个特定的示例中,我需要在开头添加 http:。
希望能帮助到你!