“google-sheets-importxml”的相关标签问题

0 投票

1 回答

3582 浏览

javascript - Google 表格上 ImportXML 的问题

我用大约 500 个 URL 和 Xpath 填写了一个谷歌电子表格。在发现 ImportXML 有一些缺点之后（即使只有 10 个左右的函数在运行，它也会出现永久加载错误）。我正在寻找另一种填充工作表的方法。我的第一次尝试是一个迭代脚本，它只是将 ImportXML 函数写入工作单元，然后写入每个 URL 的值。我认为一次只运行一个 ImportXML 就可以正常工作，但它仍然会出现永久加载错误。

样本表： https ://docs.google.com/spreadsheets/d/1QgW4LVkB_oraO9gdS5DsnNta3GVlqsH0_uC1QP0iE7w/edit?usp=sharing

（请注意，示例表实际上可以与迭代 ImportXML 脚本一起使用，仍然返回一些错误，但我认为历史 ImportXML 函数必须有一些限制，而不仅仅是工作表上的当前函数，因为我的主工作表现在只有几个处理问题）

是否有一个简单的脚本可以工作？我尝试过使用 URLFetch、xml.evaluate、xmlService 的变体，但由于我的知识有限，我无法让它工作。

非常感谢任何指导。谢谢！

2016-12-21T00:25:00.753

0 投票

4 回答

20580 浏览

xpath - Google 表格：来自 Yahoo Finance 的 IMPORTXML

我正在尝试从雅虎金融导入当前股价。我使用了某个网站的公式，它部分有效。我只知道如何告诉它寻找一个特定的查询，它对于我需要的其他一些数据点工作得很好，但是价格变化查询从

至

取决于当天的价格是上涨还是下跌。

在这种情况下，如何修改我在下面使用的公式以使用“或”运算符？这样无论当天股票是上涨还是下跌，它都会拉低价格。谢谢！

我正在使用的公式： =IMPORTXML("https://finance.yahoo.com/quote/IBM","//span[@class='Fw(500) Pstart(10px) Fz(24px) C($dataRed)']")

xpath google-sheets google-sheets-importxml

2017-01-09T23:34:59.313

0 投票

2 回答

2052 浏览

web-scraping - 通过 Google Docs 阻止网站抓取

我经营一个网站，以图表/表格格式提供各种数据供人们阅读。最近我注意到来自 Google Docs 的网站请求有所增加。查看 IP 和用户代理，它似乎确实来自 Google 服务器 -此处的示例 IP 查找。

每天的点击数在 2,500 到 10,000 个请求之间。

我假设有人创建了一个或多个从我的网站上抓取数据的 Google 表格（可能使用IMPORTHTML功能或类似功能）。我宁愿这没有发生（因为我不知道数据是否被正确归因）。

是否有首选方法来阻止 Google 支持/批准的这种流量？

我宁愿不基于 IP 地址进行阻止，因为阻止 Google 服务器感觉不对，可能会导致未来出现问题或 IP 可能会更改。目前我基于包含GoogleDocsor的用户代理阻止（返回 403 状态） docs.google.com。

目前流量主要来自 66.249.89.221 和 66.249.89.223，始终使用用户代理Mozilla/5.0 (compatible; GoogleDocs; apps-spreadsheets; http://docs.google.com)

作为第二个问题：有没有办法追踪文档或其帐户所有者？我可以访问他们正在访问的 URL，但由于请求似乎是通过 Google Docs 服务器代理的（HTTP 日志中没有Referer、Cookie 或其他此类数据），因此几乎没有其他操作可做。

谢谢你。

web-scraping google-sheets google-docs google-sheets-importxml

2017-01-24T14:40:59.987

0 投票

1 回答

656 浏览

xml - 从 Google 结果中抓取时 ImportXML 错误

我正在尝试通过 Google Sheets ImportXML 函数从 Google 返回第一个 URL。我已经从谷歌搜索的元素中复制了 XPath，并有这个公式：

我希望它搜索的字段位于 A2、B2、C2 和 D2 中，但由于某种原因，它没有返回任何结果并且卡在“正在加载...”。

有谁知道我做错了什么？

xml google-sheets formula screen-scraping google-sheets-importxml

2017-03-14T10:53:13.593

0 投票

1 回答

4124 浏览

xpath - 无法使用来自动态网页的 importXML 获取数据？

该网站是：https ://www.futbin.com/18/player/2600/Ayhan/

我检查元素并获得 XPath，它是：//*[@id="ps-lowest-1"]

然后我使用：

=IMPORTXML("https://www.futbin.com/18/player/2600/Ayhan/","//*[@id='ps-lowest-1']")

获取应该是的数据2000

但相反，它只显示：-在工作表上。没有错误只是没有显示我想要的数据。反正有没有得到我需要的数据？

谢谢

xpath google-sheets google-sheets-importxml

2017-10-14T18:05:52.857

0 投票

1 回答

145 浏览

xml - 将网站数据提取到 Google 表格

示例帖子。我想使用 IMPORTXML 函数将数据提取到电子表格中。我尝试了许多排列和组合，但我似乎无法让它发挥作用。这就是我正在做的事情：

我右键单击专家名称，检查并复制了 XPath，结果如下：

我正在使用这个公式：

但我总是最终得到这个错误：

无法解析导入的 Xml 内容。

谁能帮帮我吗？

我从未使用过此功能，也不知道 xml 是什么，这就是为什么我似乎无法自己解决它。

xml xpath web-scraping google-sheets google-sheets-importxml

2017-11-10T10:57:49.740

0 投票

1 回答

4866 浏览

google-sheets - 谷歌电子表格使用 importxml 获取文本

我试过这个和其他版本都没有用？有人可以帮忙吗？

google-sheets xml-parsing google-sheets-importxml

2017-11-20T00:19:50.807

0 投票

1 回答

807 浏览

html - Google Sheets importxml() 抓取不适用于从控制台复制的 xpath

我正在尝试从 tradingview 网站上抓取内容。特别是描述中给出的特定股票代码的行业。

我有从浏览器的元素检查器复制的 xpath。但它似乎不起作用，我得到的输出是“#N/A”。

我使用的公式是

html xpath google-sheets google-sheets-formula google-sheets-importxml

2018-04-13T10:04:39.403

0 投票

0 回答

79 浏览

xpath - Google 表格 IMPORTXML XPATH 查询失败

Google Sheets IMPORTXML 查询的 Xpath 似乎不起作用：

链接：https ://merchos.net/app/item.php?id=1215

xpath google-sheets google-sheets-importxml

2018-05-16T23:52:11.377

0 投票

1 回答

3845 浏览

xpath - 从 ASX 刮取当前股价数据

我正在尝试将当前股价数据从 ASX 抓取到 Google 电子表格中。

我不使用=googlefinance("ASX.NEA","price")瞬时延迟价格，因为分辨率四舍五入便士股票的价值。

我没有使用=INDEX(googlefinance("ASX.NEA","price", today()-10, today()),2,2)历史价格，即使分辨率价格准确，也无法获得当前价格。

网址：https://www.asx.com.au/asx/share-price-research/company/NEA
xpath（xPath 查找器）： /html/body/section[3]/article/div[1]/div/div/div[4]/div[1]/div[1]/company-summary/table/tbody/tr[1]/td[1]/span
方程：=IMPORTXML(url, xpath)
结果：#N/A 错误导入的内容为空

我尝试过的其他 xpath 是：

路径：//table/tbody//span
路径：//span[@ng-show="share.last_price"]
路径：//span[@ng-show="share.last_price"]

当我查看页面源代码时，最新的股价是通过 javascript 加载的。

示例：股价为 0.910

铬检查元素

xpath web-scraping google-sheets google-sheets-importxml

2018-06-01T04:58:37.760

问题标签 [google-sheets-importxml]

Reference