问题标签 [google-sheets-importxml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - Google 表格上 ImportXML 的问题
我用大约 500 个 URL 和 Xpath 填写了一个谷歌电子表格。在发现 ImportXML 有一些缺点之后(即使只有 10 个左右的函数在运行,它也会出现永久加载错误)。我正在寻找另一种填充工作表的方法。我的第一次尝试是一个迭代脚本,它只是将 ImportXML 函数写入工作单元,然后写入每个 URL 的值。我认为一次只运行一个 ImportXML 就可以正常工作,但它仍然会出现永久加载错误。
(请注意,示例表实际上可以与迭代 ImportXML 脚本一起使用,仍然返回一些错误,但我认为历史 ImportXML 函数必须有一些限制,而不仅仅是工作表上的当前函数,因为我的主工作表现在只有几个处理问题)
是否有一个简单的脚本可以工作?我尝试过使用 URLFetch、xml.evaluate、xmlService 的变体,但由于我的知识有限,我无法让它工作。
非常感谢任何指导。谢谢!
xpath - Google 表格:来自 Yahoo Finance 的 IMPORTXML
我正在尝试从雅虎金融导入当前股价。我使用了某个网站的公式,它部分有效。我只知道如何告诉它寻找一个特定的查询,它对于我需要的其他一些数据点工作得很好,但是价格变化查询从
至
取决于当天的价格是上涨还是下跌。
在这种情况下,如何修改我在下面使用的公式以使用“或”运算符?这样无论当天股票是上涨还是下跌,它都会拉低价格。谢谢!
我正在使用的公式:
=IMPORTXML("https://finance.yahoo.com/quote/IBM","//span[@class='Fw(500) Pstart(10px) Fz(24px) C($dataRed)']")
web-scraping - 通过 Google Docs 阻止网站抓取
我经营一个网站,以图表/表格格式提供各种数据供人们阅读。最近我注意到来自 Google Docs 的网站请求有所增加。查看 IP 和用户代理,它似乎确实来自 Google 服务器 -此处的示例 IP 查找。
每天的点击数在 2,500 到 10,000 个请求之间。
我假设有人创建了一个或多个从我的网站上抓取数据的 Google 表格(可能使用IMPORTHTML功能或类似功能)。我宁愿这没有发生(因为我不知道数据是否被正确归因)。
是否有首选方法来阻止 Google 支持/批准的这种流量?
我宁愿不基于 IP 地址进行阻止,因为阻止 Google 服务器感觉不对,可能会导致未来出现问题或 IP 可能会更改。目前我基于包含GoogleDocs
or的用户代理阻止(返回 403 状态) docs.google.com
。
目前流量主要来自 66.249.89.221 和 66.249.89.223,始终使用用户代理Mozilla/5.0 (compatible; GoogleDocs; apps-spreadsheets; http://docs.google.com)
作为第二个问题:有没有办法追踪文档或其帐户所有者?我可以访问他们正在访问的 URL,但由于请求似乎是通过 Google Docs 服务器代理的(HTTP 日志中没有Referer、Cookie 或其他此类数据),因此几乎没有其他操作可做。
谢谢你。
xml - 从 Google 结果中抓取时 ImportXML 错误
我正在尝试通过 Google Sheets ImportXML 函数从 Google 返回第一个 URL。我已经从谷歌搜索的元素中复制了 XPath,并有这个公式:
我希望它搜索的字段位于 A2、B2、C2 和 D2 中,但由于某种原因,它没有返回任何结果并且卡在“正在加载...”。
有谁知道我做错了什么?
xpath - 无法使用来自动态网页的 importXML 获取数据?
该网站是:https ://www.futbin.com/18/player/2600/Ayhan/
我检查元素并获得 XPath,它是://*[@id="ps-lowest-1"]
然后我使用:
=IMPORTXML("https://www.futbin.com/18/player/2600/Ayhan/","//*[@id='ps-lowest-1']")
获取应该是的数据2000
但相反,它只显示:-
在工作表上。没有错误只是没有显示我想要的数据。反正有没有得到我需要的数据?
谢谢
xml - 将网站数据提取到 Google 表格
示例帖子。我想使用 IMPORTXML 函数将数据提取到电子表格中。我尝试了许多排列和组合,但我似乎无法让它发挥作用。这就是我正在做的事情:
我右键单击专家名称,检查并复制了 XPath,结果如下:
我正在使用这个公式:
但我总是最终得到这个错误:
无法解析导入的 Xml 内容。
谁能帮帮我吗?
我从未使用过此功能,也不知道 xml 是什么,这就是为什么我似乎无法自己解决它。
google-sheets - 谷歌电子表格使用 importxml 获取文本
我试过这个和其他版本都没有用?有人可以帮忙吗?
xpath - Google 表格 IMPORTXML XPATH 查询失败
Google Sheets IMPORTXML 查询的 Xpath 似乎不起作用:
xpath - 从 ASX 刮取当前股价数据
我正在尝试将当前股价数据从 ASX 抓取到 Google 电子表格中。
我不使用=googlefinance("ASX.NEA","price")
瞬时延迟价格,因为分辨率四舍五入便士股票的价值。
我没有使用=INDEX(googlefinance("ASX.NEA","price", today()-10, today()),2,2)
历史价格,即使分辨率价格准确,也无法获得当前价格。
网址:
https://www.asx.com.au/asx/share-price-research/company/NEA
xpath(xPath 查找器):
/html/body/section[3]/article/div[1]/div/div/div[4]/div[1]/div[1]/company-summary/table/tbody/tr[1]/td[1]/span
方程:
=IMPORTXML(url, xpath)
结果:#N/A 错误导入的内容为空
我尝试过的其他 xpath 是:
- 路径:
//table/tbody//span
- 路径:
//span[@ng-show="share.last_price"]
- 路径:
//span[@ng-show="share.last_price"]
当我查看页面源代码时,最新的股价是通过 javascript 加载的。
示例:股价为 0.910