问题标签 [google-news]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
qtranslate - WP Plugin qTranslate Google 新闻中的错误帖子标题
我是网站的管理员:我几天前才www.hansa-online.de
开始使用。qTranslate X
一切正常,除了在谷歌新闻中显示帖子标题。标题包含语言标签,也是由标题的 2 种不同语言版本构建而成。(谷歌新闻中的标题如下:[:de]Rickmers verkauft Trust-Manager[:en]Rickmers sells all trustee)
我必须为这个问题找到一个快速的解决方案,因为新闻网站非常大,如果我不能在一天结束之前解决这个问题,我必须停止使用plugin
. 由于其他一切正常,我希望任何人都可以帮助我解决这个问题。
谢谢伦尼
google-news - 谷歌新闻 XML RSS 按分页或按日期
我正在使用谷歌新闻通过邮政编码获取新闻 RSS
现在我需要添加分页
或者从 1 天前、2 天前...
到目前为止,我正在使用该网址
例如,我需要的是
获取新闻的第 6 页
python - Python遍历页面谷歌搜索
我正在编写一个更大的代码,它将显示谷歌报纸搜索结果的链接,然后分析这些链接的某些关键字、上下文和数据。我已经完成了这一部分的所有工作,现在当我尝试遍历结果页面时,我遇到了一个问题。如果没有我不知道如何使用的 API,我不确定如何做到这一点。我只需要能够遍历搜索结果的多个页面,然后我就可以对其进行分析。似乎有一个简单的解决方案可以遍历结果页面,但我没有看到。
对解决这个问题的方法有什么建议吗?我对 Python 有点陌生,并且一直在自学所有这些抓取技术,所以我不确定我是否只是在这里遗漏了一些简单的东西。我知道这可能是谷歌限制自动搜索的一个问题,但即使拉入前 100 个左右的链接也是有益的。我从常规的谷歌搜索中看到了这样的例子,但没有从谷歌报纸搜索中看到
这是代码的主体。如果您有任何建议,那将很有帮助。提前致谢!
python - 谷歌新闻爬虫返回带有网址、标题和简报的结果
我是爬虫新手,我正在使用 Python 3.X。目前我正在练习抓取谷歌新闻以重新开始,但我的代码遇到了一些问题(代码运行但没有返回任何内容)。我希望代码爬取谷歌新闻进行查询,并返回结果中出现 url、标题和简报的结果。
非常感谢您的时间。我的代码如下:
bing-api - 必应新闻搜索 API v7 是否支持高级运算符?
基于Bing News API v7文档,它们支持高级运算符。
例如搜索:
“Dan Bilzerian” AND(女性或金钱或“有什么问题”)
在 Google 新闻中返回大量结果,但在 Bing 新闻中没有返回任何结果。然而
“Dan Bilzerian” AND(女性或金钱)
两者都返回结果,这对于 Google 新闻来说是一样的。
你能建议吗?
python - 微调预训练的 word2vec 谷歌新闻
我目前正在使用在 Google 新闻语料库上训练的 Word2Vec 模型(从这里开始)因为直到 2013 年才对新闻进行训练,所以我需要更新向量并根据 2013 年之后的新闻在词汇表中添加新单词。
假设我在 2013 年之后有一个新的新闻语料库。我可以重新训练、微调或更新 Google News Word2Vec 模型吗?可以使用 Gensim 完成吗?可以使用 FastText 完成吗?
spring - Spring RestTemplate 给出了来自所有其他浏览器的不同响应,甚至 wget 等
使用两个不同的网络浏览器(清除了 cookie 等)和 wget,我从 google-news rss url 得到了正确的响应https://news.google.com/news/rss/headlines/section/q/QUERY/My%20Search?ned=us&hl=en
。
但是,我尝试通过 Spring 的 RestTemplate 假装是 wget
从语法的角度来看,结果是正确的,除了没有项目,即没有新闻文章。
我用 进行了测试http://httpbin.org/headers
,所以我知道我正在发送与 wget 完全相同的标头(确实有效)。
httpbin.org 使用 wget 输出
使用上述代码配置的 RestTemplate 的 httpbin.org 输出:
完全相同的标题但完全不同的结果。任何人都知道 tcp 或 http google 的哪些方面用于审查他们对基于 Spring 的程序的输出?
php - 无法连接到 news.google.com 端口 80
我有以下代码用于从谷歌新闻中获取提要。它工作了几次。如果我们尝试在短时间内调用此函数超过 2 或 3 次,则会显示错误。
错误:无法连接到 news.google.com 端口 80:连接被拒绝
我知道原因是,谷歌会在几次请求后阻止访问。SI有什么可以做的吗?我正在使用linux服务器。
wordpress - 如何硬编码 WordPress 博客元标签?
我已经尝试过寻找一切可能的东西。我找不到添加<meta name="news_keyword">
到我的博客文章页面的方法。我还尝试编辑我的博客硬编码,但没有这样做。
我找到了 Yoast 的新闻插件,它确实帮助我完成了我的工作,但它是 69 美元,这只是我买不起的一个小型博客网站所有者。