我正在尝试解析 LinkedIn 求职页面。我想访问包含在<a>
标签中的数据class = job-card-search__link-wrapper js-focusable disabled ember-view
。这应该返回所有职位搜索结果的所有职位名称。find_all方法只返回 10 个结果,但总共有 10 个以上的结果。
这是我用来在列表中返回结果的python代码:
soup = BeautifulSoup(browser.page_source)
job_loc = results.find_all('a',{'class':'job-card-search__link-wrapper js-focusable disabled ember-view'}) #returns all jobs under the results section
job_name=[]
for job in job_loc:
job_name.append(job.get_text().strip().replace('\n \n Promoted',""))
print(job_name)
以下是 LinkedIn 页面上包含职位名称的 HTML 代码示例:
<a data-control-id="QyH5kElpSqqo8A7osUD+gg==" href="/jobs/view/1776859827/?eBP=CwEAAAFxjTMFYu0O-NJ50iRn84irOgoKIm_5169VkEgel8TqEDHartYAQgujawNHVilEARzzgM-9kSMZ5WEWapR1_XzxkH-J8iFmA1m96Q5UjVtBx-NdvkQGUrDlhsfs1vwiYGPtiiOishZ5NUot4TWaMGguIZVpPPdIzdbhIlSdl2El2dva9S8-66ZJTOaJsodHLwfHmmHHt8SNuKKzlJYEslmZN_zR7UnkQ0IwSQQc9xX4_xBFBlaAZ9Zt6u12Qa2GQWia7xxCSBIT8fYBx0wYf0z4USPeX-D3OQDjGS5kB97zl3N3AK4f672c8B8SZGMmneeF32c_kI4fTu_YBYrcBCm_6rPM7gA24Wfrf5GdRhnPq-cUaZGlgSdEL-PXdDjA_vZFdFo1vpN6ZLXw&recommendedFlavor=SCHOOL_RECRUIT&refId=fcdb0a51-09a5-43fe-93d9-cd9680a46f11&trk=d_flagship3_search_srp_jobs" id="ember1010" class="job-card-search__link-wrapper js-focusable disabled ember-view">
Data Analyst (2 months contract)
<span class="job-card-search__promoted-tag label-16dp ml1">
Promoted
</span>
</a>
但是,每个作业都有类似的 HTML 代码,并且文本应根据作业名称进行相应更改。因此,我希望我的 python 代码返回所有的工作搜索。
抱歉,这是我第一次这样做,任何帮助将不胜感激。谢谢!