1

我需要创建一个名称数组,这些名称对应于我存储在另一个数组中的图像的链接。图像的名称和链接都在同一个文本文件中,并且图像的链接遵循文件中相应的名称。我通过使用以下代码解析文本文件来构建图像链接数组:

import re
images = []
with open('html_test.txt') as f:
    for line in f:
        images.extend(re.findall(r'"([^"]*\.(?:jpg|gif)[^"]*)"',line))

如果每个图像链接只有一个名称,我可以使用类似的方法构建一个名称列表。不幸的是,每个名称后面的图像链接数量是可变的,有些名称后面只有一个图像链接,有些名称后面有很多。

我认为我需要做的是计算每个名称后面有多少个图像链接,然后在名称数组中为每个名称创建重复条目,然后是一个以上的图像。(每个名称的重复名称条目数将等于每个名称后面的图像链接数减去 1。)但是,当我尝试这样做时,我得到的只是整个文本中名称总数的计数文件。有谁知道如何构建一个名称数组,以便为​​每个指向其后的图像文件的链接将每个名称输入到数组中一次?(文本文件中的下一个名称除外)

下面是文本文件的示例:

<a href="/admin/user/view/41900" title="example_name_1" rel="41900">
<div class="thumb"><a href="#"><img src="https://jibbertyjob.com/asset/image/resize/2/32/32/1/5d4e6a0fjfe94980ny8en9uf98frnoad1876c00.jpg" width="32" height="32" alt="" /></a></div>
<a href="/admin/user/view/41900" title="example_name_2" rel="41900">
<div class="thumb"><a href="#"><img src="https://jibbertyjob.com/asset/image/resize/2/32/32/1/5d4e6a0fjfe9dfgsdfg9uf98frnoad1876l00.jpg" width="32" height="32" alt="" /></a></div>
<div class="thumb"><a href="#"><img src="https://jibbertyjob.com/asset/image/resize/2/32/32/1/5d4e6a0fjf4567w034098h9h5fg4gr33r3rggr376c09940.jpg" width="32" height="32" alt="" /></a></div>

非常感谢我已经坚持了半天!

4

0 回答 0