我正在尝试抓取此页面https://www.ncbi.nlm.nih.gov/gene/2597以使用IMPORTXML
.
对于“官方全名”(e.g. glyceraldehyde-3-phosphate dehydrogenase
),我试试这个:
=IMPORTXML("https://www.ncbi.nlm.nih.gov/gene/55054", "//*[@id="summaryDl"]/dd[2]/text()")
给我#N/A
因此,我尝试更改""
,''
以使用放置 URL 和查询的单元格,以所有可能的方式更改查询:D。
我注意到我可以使用IMPORTHTML
(并且在页面内有一些关于表格的信息)或者IMPORTRSS
但无法获得我想要的信息。所以我认为该网站不会阻止抓取。
我认为这是一个 JS 或 XML 问题,但似乎并非如此(在我看来......也许我错过了一些东西)。我什至尝试IMPORTJSON
从某人的代码中使用,但什么也得不到(老实说,可能太复杂而无法使用)。
我真的被封锁了,所以如果有人可以帮忙......?