我正在开发第 3 方应用程序,我已经阅读了网页源内容的视图。从那里我们必须只收集一些href
具有类似/aems/file/filegetrevision.do?fileEntityId
. 是否可以?我的一个给了我所有的href
价值观。
HTML *(HTML 的一部分) *
<td width="50%">
<a href="/aems/file/filegetrevision.do?fileEntityId=10597525&cs=9b7sjueBiWLBEMj2ZU4I6fyQoPv-g0NLY9ETqP0gWk4.xyz">
screenshot.doc
</a>
</td>
代码
for a in soup.find_all('a', {"style": "display:inline; position:relative;"}, href=True):
href = a['href'].strip()
href = "https://xyz.test.com/" + href
print(href)
谢谢
谢谢,