问题标签 [google-news]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rss - 有没有办法让 bing 和 google 新闻搜索作为 rss?
有没有办法将 Google 和 Bing 新闻搜索作为 RSS?
如果可能的话,我希望将最新的放在结果的顶部(按时间排序)。
如果可能的话,显示 100 个结果。
我在 Google 上找到了这个,但它只显示 5 个左右的项目,不是很好。
https://news.google.com/news/feeds?output=rss&q=politics
我只想搜索他们的新闻类别并以 RSS 形式获得结果。
zend-framework - Zend\Feed 验证警告与作者
当我创建一个提要并使用该$entry->setAuthor()
方法时,生成的提要将为每个条目包含一个<dc:creator>
和一个<author>
。
如果您验证此提要(例如: http://validator.w3.org/feed/check.cgi?url=http%3A%2F%2Fwww.gamempire.it%2Frss-custom% 2Fgnews),您会注意到有一个警告条目不能同时包含<dc:creator>
和<author>
此外,我收到了来自 Google 新闻助理的警告,告诉我他们不能将我的 rss 包含在他们的“Editor's Pick”框中,因为它没有通过 w3c 验证器进行验证。
那么,如何解决这个问题呢?例如,如何删除<dc:creator>
并只留下<author>
?
谢谢,奥斯卡
python - 谷歌饲料 API | 超出速率限制 | 没有返回结果
我正在尝试使用 python 获取大约 5000 家公司的 Google 新闻。
我已经安排工作每 12 小时运行一次。
我实际上做的是使用 Google 新闻链接 ( https://news.google.com/news/feeds?q=MyQuery&output=rss ) 我为公司创建一个链接,然后解析返回的 XML 以获得所需的数据。
问题是它每 20 分钟返回 500 家公司的结果并给我提要,但之后它开始向我返回空结果。如果我打开链接,它有条目,但在代码执行期间,它会在为 500 家公司提供新闻后停止返回结果。
现在我想知道谷歌新闻是否有速率限制或单位时间限制?
下面是我的代码
非常感谢您的帮助。
谢谢
algorithm - 检测字符串中的相似性
如果我在 Google 新闻上搜索某些内容,我可以单击“深入探索”按钮并从多个来源获取相同的新闻文章。使用什么样的算法来比较文本文章,然后确定它是关于同一事物的?我在这里看到了这个问题:
但是,使用那里提到的方法,我觉得如果有性质相似但故事不同的文章,它们会使用那里提到的方法组合在一起。有没有一种标准的方法来检测大致相同的字符串并将它们分组,同时将相似的字符串分开?例如。如果我搜索“美国边境”,我可能会得到有关美国边境问题的故事,但是什么会阻止这些故事集中在一起呢?我能想到的只是出版日期,但如果许多故事的出版时间非常接近怎么办?
rss - 您如何在 Google 新闻 RSS 提要中获取相关文章集群?
Google 包含以下要求以使用 RSS 新闻提要:
使用 Google 新闻提要中提供的链接,为每个新闻项目添加一个指向 Google 新闻相关文章集群的链接。
此链接应包含与当前项目相关的其他文章的集合。RSS 提要中每个节点中的 xml 属性之一如下所示:
但是,我无法弄清楚如何使用它来获取相关文章的列表。有谁知道如何做到这一点?
google-api - Google News API,付费版
谷歌是否为谷歌新闻提供任何类型的 API 等。无论是免费的还是付费的。我知道以前的版本已被弃用。它应该用于商业用途,所以我想我不能使用他们的 RSS 提要。
我知道 Bing 提供付费 API,但他们的新闻来源要少得多。
javascript - 如何从 google new iframe 中删除 Google Web Elements?
如何从 iframe 的谷歌新闻中删除谷歌网页元素。
java - 从 Google 新闻中获取文章并用 Java 下载它们
我将如何编写一个可以从 Google 新闻中获取文章并将其下载到我的计算机的程序?
我发现 Google 新闻已经内置了 RSS 功能,但我需要实际下载整篇文章(文本和所有内容),而不仅仅是标题。
我最好将这些文章下载为 PDF 或 HTML 文件,但对于初学者来说,只需获取一些 URL 就可以了。
这里有一些关于从谷歌新闻中获取文章的问题,但到目前为止我发现没有什么特别有用的。任何帮助将不胜感激。
谢谢!
sitemap - 谷歌新闻站点地图是否需要包含在 robots.txt 中
我已经阅读了关于谷歌新闻站点地图的指南,但找不到是否需要在 robots.txt 上引用谷歌新闻站点地图。
https://support.google.com/news/publisher/answer/74288?hl=en#sitemapguidelines
有人可以确认吗
python - 抓取谷歌新闻头条
谷歌新闻可以通过关键字搜索,然后可以将搜索范围缩小到某个时间段。
我尝试在网站上进行搜索,然后使用结果页面的 url 对 python 中的搜索进行反向工程,因此:
但是,我收到 403 错误。此方法适用于其他网站,例如 bbc.co.uk。所以显然谷歌不希望我用 python 抓取网站。
所以我有两个问题:1)是否可以绕过谷歌设置的这个限制?如果是这样,如何?2)是否有任何其他可抓取的新闻网站,我可以在给定时期内搜索关键字的新闻。
对于任何一个选项,我都不介意使用付费服务。所以也欢迎这样的建议。
在此先感谢,K。