问题标签 [google-search-platform]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
436 浏览

google-search - JobPosting 结构化数据

此处 JobPosting 结构化数据的定义似乎存在逻辑冲突:https ://developers.google.com/search/docs/data-types/job-postings 。HiringOrganization 被列为必需属性,结构化数据测试工具 ( https://search.google.com/structured-data/testing-tool ) 不会弹出“预览”按钮这一事实证实了这一要求。一个 JobPosting 除非 HiringOrganization 属性同时存在和填充(稍后会详细介绍)。

但是,在上面的同一页面上,列出了一个可接受/有效的发布示例是“具有未指定公司的申请流程的招聘广告。这是可以接受的,因为角色定义明确并且公司确实存在,即使它没有透露。在这种情况下,hiringOrganization 标记必须为空白(请参阅自我、产品、服务、工作或公司的虚假陈述)。[强调我的]

我尝试将hiringOrganization 属性完全排除在外并包含元素,但name 属性具有空白值或空格值,甚至只有一组空引号且没有子属性。在任何这些情况下,预览按钮都不会出现在测试工具上(这让我认为我也不会在搜索结果中获得丰富的片段<---这是我尝试添加结构化的主要原因数据)。

任何人都可以确认或否认我关于“结构化数据测试中没有预览”和“搜索结果中没有丰富网页摘要”之间相关性的假设吗?此外,如果有人对这种明显的差异和/或如何解决它有任何额外的信息,我将非常感激!

0 投票
1 回答
50 浏览

google-index - 您为什么要阻止 Google 将您网站中的页面编入索引?

我已经阅读了一些关于如何停止索引的文章,但我不清楚你为什么要这样做。

1)我找到的解释是:

“对于营销人员来说,一个常见的原因是防止重复的内容(当搜索引擎索引多个版本的页面时,例如在您的内容的打印机友好版本中)被索引。

另一个好例子?感谢页面(即访问者在您的一个登陆页面上转换后登陆的页面)。这通常是访问者可以访问着陆页承诺的任何优惠的地方,例如电子书 PDF 的链接。” [基本上,您不希望用户在不注册的情况下通过搜索找到带有免费赠品的感谢页面]

但是,在这两种情况下,阻止索引实际上似乎是个坏主意?您宁愿在用户找到您后重定向到登录页面(在第二个示例中)?至少用户将能够访问您的网站。

2)还提到索引与出现在谷歌搜索结果中的不同,但不清楚有什么区别。有人能解惑吗?

TIA。

0 投票
0 回答
303 浏览

r - 如何使用 R 用特定的搜索条件抓取 Google?

我正在尝试使用 R 在特定日期范围内从特定站点使用特定搜索字词抓取 Google。

例子

  • 搜索词:“Miroslava Breach Velducea”
  • 网站:www.jornada.com.mx
  • 日期:2011 年 1 月 1 日 - 2012 年 1 月 1 日

该特定搜索的链接是:https ://www.google.com/search?q=Miroslava+Breach+Velducea+site:www.jornada.com.mx&tbas=0&tbs=cdr:1,cd_min:1/1/ 2011,cd_max:1/1/2012&ei=UqCzW6LZC8OK5wKg97vYDA&start=10&sa=N&biw=1137&bih=474

当我在 R 中编写代码时,我可以在 Google 上搜索该搜索词和该网站,但不能搜索这些日期。

有谁知道如何抓取谷歌一般搜索的特定日期?

0 投票
0 回答
48 浏览

web-scraping - 使用 Google Search API 访问 Google Enchanced Events 结果的方法?

我正在努力使 Google 搜索特定区域中的事件自动化。当手动搜索活动时,例如“洛杉矶的音乐会”,有一种名为“活动”的迷人富结果形式,其中包含日期、活动标题、主持人等结构化数据。

我想自动搜索这些事件,但无法找出允许抓取这些事件块的 API 或站点。是否有谷歌搜索关键字或其他方法可以隔离这些事件?

0 投票
0 回答
147 浏览

html - 在 Android 和 Apple 移动谷歌搜索引擎结果中显示我的网站更新的图标的问题

我正在使用 WordPress 作为我的网站的平台。我使用了真正的网站图标生成器插件,并在除“android 和 ios 谷歌搜索引擎”之外的每个平台上为我的网站图标获得了即时结果。然而,它向我展示了旧的图标,而不是更新最近的图标。我在 4 天前更改了网站图标。

我尝试使用 realfavicongenerator.net 并创建了我的 favicon。最重要的是,我将代码包含在我的根目录中,但我仍然没有得到谷歌搜索引擎的更新结果。我什至从根目录中删除了旧的网站图标。

我希望在谷歌搜索引擎结果中更新网站图标。

0 投票
0 回答
90 浏览

dns - Google 搜索结果显示使用相同 IP 地址托管的其他域

我有一个小型经销商网络托管帐户,并且有许多其他域共享相同的 IP 地址。

问题是,当我用谷歌搜索我的域名时,我发现我的搜索结果中显示了具有相同 IP 地址的其他域。

例如,如果我的域名是 greenapples.com,搜索将显示:


  • 新鲜青苹果
  • 今天买青苹果。
  • www.greenapples.com


  • 新鲜青苹果
  • 今天买青苹果。
  • www.anotherdomainwithsameip.com <----??


当我单击“另一个域”时,它会显示我的网站,但没有我的域。

我试图用 robots.txt 阻止但没有奏效。

我将不胜感激任何帮助。

0 投票
0 回答
106 浏览

reactjs - 为什么当我使用 React-Helmet 并将规范链接设置为 HTTPS 时,谷歌仍在索引 HTTP?

Google为我的网站编入了HTTP URL,但我希望它为HTTPS编入索引。

我搜索了一个解决方案并找到了React-Helmet

在我实现 React-Helmet 之后,添加 HTTPS URL 作为规范链接。我要求谷歌重新抓取。更新了 Google 结果以包含 React-Helmet 元描述(见下文):

谷歌搜索网络结果:

批评| 文化建设者

cratic.ai

Cratic 是市场上排名第一的文化建设产品:进入组织社会动态的门户。该工具包将 Culture AI 的强大功能置于您的...

这意味着我知道 React-Helmet 正在工作。

但是,谷歌没有更新链接。Google 仍然索引到 HTTP 链接,而不是 HTTPS。这意味着无论何时有人从 Google 找到我的网站,他们都会被发送到不安全的网站,即使我已将 HTTPS 网址添加为规范链接(见下文):

我的理解是链接:rel="canonical" href="https://www.cratic.ai"将通知 Google 索引到 HTTPS 网址。但情况似乎并非如此。

你能帮我理解我做错了什么吗?

0 投票
0 回答
48 浏览

google-search - 如何在没有空格的情况下在 Google 上进行通配符搜索?前任。`google*` => 只匹配 `googled`,而不是 `google foo`

如何在 Google中搜索连接的通配符结果?

例如:

匹配:Google Account,Google Voice等。

如何跳过这些结果并包括以下结果:google1, googled, googlefoo?

另一个例子:

匹配:What can I buy for 0 dollars?而不是只有类似10 dollars甚至(虽然不太理想)的结果(0 dollars

0 投票
1 回答
211 浏览

json-ld - 谷歌搜索结构化数据中允许使用哪些字符

我想将谷歌富搜索结果与结构化数据一起使用。

我对描述标签可以包含哪些字符感到困惑。

例如,我想使用

{ description: "this is a backslash \ here" }

我知道 JSON 不允许在不转义的情况下使用反斜杠

我的问题是如果我像这样用 \u005C' 替换 \

{ description: "this is a backslash \u005C here" }

这个会在渲染页面上显示 \ 还是会显示 '\u005C'

0 投票
0 回答
46 浏览

google-custom-search - 如何在 Google 可编程站点搜索中删除某些 URL 模式

我有一堆由我的 CMS 生成的文章,我希望我的 Google 可编程站点搜索能够索引和搜索我的文章。

这是一篇文章 URL 的样子:

所以在谷歌仪表板中,在要搜索的站点下,我使用了这种模式:

现在一切正常,文章正在被索引和搜索,但有一次问题。在我的搜索结果中,这个网址www.domain.com/full-article也被编入索引并显示为结果。我无法在我的 CMS 中隐藏www.domain.com/full-article,因为这会使我的所有文章都无法编入索引。

如何在谷歌搜索仪表板中排除 URL www.domain.com/full-article的这一部分(有一个区域可以排除特定的 Url 模式)而不会对实际文章 Urls 产生负面影响?