问题标签 [google-news]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
79 浏览

qtranslate - WP Plugin qTranslate Google 新闻中的错误帖子标题

我是网站的管理员:我几天前才www.hansa-online.de开始使用。qTranslate X一切正常,除了在谷歌新闻中显示帖子标题。标题包含语言标签,也是由标题的 2 种不同语言版本构建而成。(谷歌新闻中的标题如下:[:de]Rickmers verkauft Trust-Manager[:en]Rickmers sells all tr​​ustee)

我必须为这个问题找到一个快速的解决方案,因为新闻网站非常大,如果我不能在一天结束之前解决这个问题,我必须停止使用plugin. 由于其他一切正常,我希望任何人都可以帮助我解决这个问题。

谢谢伦尼

0 投票
0 回答
975 浏览

google-news - 谷歌新闻 XML RSS 按分页或按日期

我正在使用谷歌新闻通过邮政编码获取新闻 RSS

现在我需要添加分页

或者从 1 天前、2 天前...

到目前为止,我正在使用该网址

例如,我需要的是

获取新闻的第 6 页

0 投票
1 回答
1180 浏览

python - Python遍历页面谷歌搜索

我正在编写一个更大的代码,它将显示谷歌报纸搜索结果的链接,然后分析这些链接的某些关键字、上下文和数据。我已经完成了这一部分的所有工作,现在当我尝试遍历结果页面时,我遇到了一个问题。如果没有我不知道如何使用的 API,我不确定如何做到这一点。我只需要能够遍历搜索结果的多个页面,然后我就可以对其进行分析。似乎有一个简单的解决方案可以遍历结果页面,但我没有看到。

对解决这个问题的方法有什么建议吗?我对 Python 有点陌生,并且一直在自学所有这些抓取技术,所以我不确定我是否只是在这里遗漏了一些简单的东西。我知道这可能是谷歌限制自动搜索的一个问题,但即使拉入前 100 个左右的链接也是有益的。我从常规的谷歌搜索中看到了这样的例子,但没有从谷歌报纸搜索中看到

这是代码的主体。如果您有任何建议,那将很有帮助。提前致谢!

0 投票
1 回答
1590 浏览

python - 谷歌新闻爬虫返回带有网址、标题和简报的结果

我是爬虫新手,我正在使用 Python 3.X。目前我正在练习抓取谷歌新闻以重新开始,但我的代码遇到了一些问题(代码运行但没有返回任何内容)。我希望代码爬取谷歌新闻进行查询,并返回结果中出现 url、标题和简报的结果。

非常感谢您的时间。我的代码如下:

0 投票
1 回答
2732 浏览

rss - 谷歌新闻主题url参数列表?

我目前正在尝试构建一个新闻阅读器,从不同的谷歌新闻主题获取 rss 提要,我发现这个网站很好地分解了 url 参数,但是在topic参数下,它为主题列表提供的链接给你带来了到这个页面,它什么也没说主题关键字。我能找到的唯一主题键是tc技术主题的键。

有谁知道我在哪里可以找到这些主题的列表,或者如果该topic=[topic]参数已被弃用,我可以使用什么来代替?

0 投票
1 回答
206 浏览

bing-api - 必应新闻搜索 API v7 是否支持高级运算符?

基于Bing News API v7文档,它们支持高级运算符

例如搜索:

“Dan Bilzerian” AND(女性或金钱或“有什么问题”)

在 Google 新闻中返回大量结果,但在 Bing 新闻中没有返回任何结果。然而

“Dan Bilzerian” AND(女性或金钱)

两者都返回结果,这对于 Google 新闻来说是一样的。

你能建议吗?

0 投票
2 回答
3456 浏览

python - 微调预训练的 word2vec 谷歌新闻

我目前正在使用在 Google 新闻语料库上训练的 Word2Vec 模型(从这里开始)因为直到 2013 年才对新闻进行训练,所以我需要更新向量并根据 2013 年之后的新闻在词汇表中添加新单词。

假设我在 2013 年之后有一个新的新闻语料库。我可以重新训练、微调或更新 Google News Word2Vec 模型吗?可以使用 Gensim 完成吗?可以使用 FastText 完成吗?

0 投票
1 回答
520 浏览

spring - Spring RestTemplate 给出了来自所有其他浏览器的不同响应,甚至 wget 等

使用两个不同的网络浏览器(清除了 cookie 等)和 wget,我从 google-news rss url 得到了正确的响应https://news.google.com/news/rss/headlines/section/q/QUERY/My%20Search?ned=us&hl=en

但是,我尝试通过 Spring 的 RestTemplate 假装是 wget

从语法的角度来看,结果是正确的,除了没有项目,即没有新闻文章。

我用 进行了测试http://httpbin.org/headers,所以我知道我正在发送与 wget 完全相同的标头(确实有效)。

httpbin.org 使用 wget 输出

使用上述代码配置的 RestTemplate 的 httpbin.org 输出:

完全相同的标题但完全不同的结果。任何人都知道 tcp 或 http google 的哪些方面用于审查他们对基于 Spring 的程序的输出?

0 投票
2 回答
886 浏览

php - 无法连接到 news.google.com 端口 80

我有以下代码用于从谷歌新闻中获取提要。它工作了几次。如果我们尝试在短时间内调用此函数超过 2 或 3 次,则会显示错误。

错误:无法连接到 news.google.com 端口 80:连接被拒绝

我知道原因是,谷歌会在几次请求后阻止访问。SI有什么可以做的吗?我正在使用linux服务器。

0 投票
0 回答
90 浏览

wordpress - 如何硬编码 WordPress 博客元标签?

我已经尝试过寻找一切可能的东西。我找不到添加<meta name="news_keyword">到我的博客文章页面的方法。我还尝试编辑我的博客硬编码,但没有这样做。

我找到了 Yoast 的新闻插件,它确实帮助我完成了我的工作,但它是 69 美元,这只是我买不起的一个小型博客网站所有者。