问题标签 [yql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
html - 使用 Yahoo YQL 查询 html
在尝试使用 YQL 提供的 Yahoo Query Language 和 xpath 功能解析 html 时,我遇到了无法提取“text()”或属性值的问题。
例如
永久链接
以 xml 形式给出锚点列表
现在,当我尝试使用提取节点值时
我得到连接的结果而不是节点列表,例如
如何将其分成节点列表以及如何选择属性值?
像这样的查询
给了我相同的查询结果div/h3/a
html - 各种网站分析方法的优缺点是什么?
我想编写一些代码来查看网站及其资产并创建一些统计数据和报告。资产将包括图像。我希望能够跟踪链接,或者至少尝试识别页面上的菜单。我还想根据类名等猜测一下 CMS 创建了该站点的原因。
我将假设该站点是相当静态的,或者由 CMS 驱动,但与 RIA 不同。
关于我如何进步的想法。
1) 将网站加载到 iFrame 中。这会很好,因为我可以用 jQuery 解析它。或者我可以吗?似乎我会受到跨站点脚本规则的阻碍。我已经看到解决这些问题的建议,但我假设浏览器将继续压制这些问题。小书签会有帮助吗?
2) 一个火狐插件。这可以让我解决跨站点脚本问题,对吗?似乎可行,因为 Firefox(和 GreaseMonkey,就此而言)的调试工具可以让你做各种各样的事情。
3) 在服务器端抓取网站。使用服务器上的库进行解析。
4) YQL。这不是为解析站点而构建的吗?
twitter - 推特关注者推文的 YQL
如何获取特定 Twitter 帐户关注者的推文列表?我可以通过以下方式获取关注者 ID 的列表:
我的假设是,要检索所有这些 id 的推文,我应该能够编写:
但我没有得到任何结果。
注意- 为了比较以下查询,它获取朋友的推文(我关注的人,而不是关注我的人),确实有效:
yql - 困惑如何在 yql 中使用 opentables
我正在尝试使用 YQL 访问白页。不幸的是,我对 opentables 没有太多经验。
我被定向到 whitepages xml 文件:http: //github.com/spullara/yql-tables/blob/c63212b2ac9db6feb77ae3cecace51ed52e08c01/whitepages/whitepages.search.xml
有谁知道如何使用此表来使用 YQL 提取有意义的信息?
具体来说,我不确定如何使用此表在 YQL 中进行查询以搜索人名。
帮助?
apache - Apache 访问日志的 YQL 表
YQL SHOW TABLES有 CSV 和 HTML。Apache 访问日志的表呢?
xpath - Yahoo Pipes 和 YQL:我可以从我的项目中去除 HTML 标签吗?
鉴于此管道,我试图从 -div class="post-text"- 中删除所有 HTML 标记并返回纯文本。
换句话说,对于这个 stackoverflow question,第一项应该返回:
“背景:在接下来的一个月里,我将进行三场演讲......
{...}
复杂的通用签名(例如 Enumerable.Join)”
有人可以帮忙吗?
从表面上看,在 YQL 选择子句中获取无 HTML 文本内容会很方便,但如果这是唯一的方法,我会选择后续的 Regex 模块。
json - 带有自定义命名空间的 YQL XML 输出
我正在尝试使用 YQL 解析来自 Yahoo Pipes 的 JSON 提要以将其转换为 XML。我的查询是:
“从 json 中选择 *,其中 url=' http://pipes.yahoo.com/pipes/pipe.run?_id=[pipe-id]&_render=json '”
问题是原始管道正在解析一个 RSS 提要,其中填充了都柏林核心标签(例如:dc:title、dc:source 等)。XML 输出无法处理这些标签,Yahoo Pipes 也无法正确删除它们。每当我尝试在任何浏览器中运行 XML 输出时,它都会因为文档开头的缺失而出现问题。
如何从 YQL 的 XML 输出中定义自定义命名空间?
javascript - 有没有办法用 yql 获取页面的整个源代码?
我正在尝试将任何页面的源代码加载到仅客户端 html 编辑器的文本框中。我需要能够获取网页的整个来源,而不仅仅是正文。这个 yql 查询只返回正文:
有没有办法获得整个源代码,或者有没有其他免费的 json-px 网络服务可以?
javascript - How to use YQL to retrieve web results?
I am having difficulty setting up a simple html file using javascript to display the results of YQL Query.
I understand how to setup the select statement (example: select title,abstract,url from search.web where query="pizza") in the YQL Console. But I don't know how to display it on the html file?
Can somebody help in explaining how to display the results of that statement? Code snippets would be appreciated!
BTW, I've read the YQL Docs but they are somewhat complicated.
javascript - 如何处理对象文字?
我是 Javascript 的新手,并试图提取一些存储在对象中的文本。
该对象被定义为一个对象字面量,并被传递给调用该函数的Javascript 脚本中的函数。脚本(和对象)具有以下结构:
该对象被传递给名为“foo”的回调函数:
我的问题:我知道如何使用上面的回调函数打印出查询计数变量,但我不知道如何打印出结果数组中第一个结果的标题。
如何更改回调函数以显示第一个结果标题?此外,是否有一个 foreach 语句,我可以在其中打印出所有结果中的所有标题?
谢谢!
更新:此代码的 JSBIN 位于: http: //jsbin.com/ejiwa/edit