给定公司代码或名称,我想使用 python获取其部门。
我已经尝试了几种潜在的解决方案,但没有一个成功
最有前途的两个是:
1) 使用以下脚本:https ://gist.github.com/pratapvardhan/9b57634d57f21cf3874c
from urllib import urlopen
from lxml.html import parse
'''
Returns a tuple (Sector, Indistry)
Usage: GFinSectorIndustry('IBM')
'''
def GFinSectorIndustry(name):
tree = parse(urlopen('http://www.google.com/finance?&q='+name))
return tree.xpath("//a[@id='sector']")[0].text, tree.xpath("//a[@id='sector']")[0].getnext().text
但是我正在使用python --version 3.8
我已经能够调整这个解决方案,但最后一行不起作用,我对抓取网页完全陌生,所以如果有人有一些建议,我将不胜感激。
这是我当前的代码:
from urllib.request import Request, urlopen
from lxml.html import parse
name="IBM"
req = Request('http://www.google.com/finance?&q='+name, headers={'User-Agent': 'Mozilla/5.0'})
webpage = urlopen(req)
tree = parse(webpage)
但是最后一部分不起作用,我对这种xpath
语法很陌生:
tree.xpath("//a[@id='sector']")[0].text, tree.xpath("//a[@id='sector']")[0].getnext().text
2) 另一个选项是嵌入R
的TTN
包,如下所示:查找股票属于哪个部门
但是,我想在我的 Jupyter 笔记本中运行它,而且运行它需要很长时间ss <- stockSymbols()