问题标签 [google-index]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
seo - 如何从 Google 搜索索引中删除文件夹及其子页面
我正在重新设计我的网站,它位于网站目录的子文件夹中。谷歌已经从子文件夹中索引了我们的新网站,这影响了我对实时网站的搜索结果。
有什么特定的方法可以从谷歌搜索索引和谷歌搜索结果中删除子文件夹吗?
例如,我的 Live 网站是 www.xyz.com,我正在重新设计 www.xyz.com/newsite
无论如何,我可以从谷歌搜索索引和结果中删除 /newsite 吗?
node.js - 为什么将来自两个不同站点的页面编入索引?
我有一个问题,来自两个不同网站的页面被谷歌索引为一个网站。
所以,我们有两个网站;我们称他们为siteone.com 和sitetwo.com。当我进行像“site:sitetwo.com”这样的搜索时,我会得到一些 SERP 页面的结果,所有这些页面都显示为来自 www.sitetwo.com 域。
但是,有些结果实际上是来自 siteone.com 的内容。这些页面存在于 siteone.com,但不存在于 sitetwo.com。如果请求,它们会返回 404。例如,结果中可能有一个页面,例如“ http://www.sitetwo.com/foo/bar ”,但该页面不存在,也从未存在。页面“ http://www.siteone.com/foo/bar确实存在。
这些网站位于同一台服务器上,具有相同的 IP 地址。Sitetwo.com 已经上线了大约一周。
堆栈是:CentOS、NGINX、Node.js、MySQL。这些站点位于不同的目录中,运行不同的 Node 实例,虽然两个数据库都在同一个 MySQL 服务器上,但它们是独立的数据库。他们唯一共享的是服务器和IP。我已经包含了我的 nginx.conf 文件的一部分,因为这是 IMO,我最有可能搞砸的地方。
“include /etc/nginx/default.d/*.conf;”中的“\” 不是真的存在,但它影响了 StackOverflow 的格式。
html - 谷歌索引使用内容而不是描述
我有一个带有元描述的页面,但由于某种原因,谷歌索引从页面内容中获取其价值,甚至不是从文本的开头,而是从段落中间的一个句子。我已经检查了 html,但没有看到任何原因。机器人也不会影响此页面。还有什么可能的原因?忘了提我正在使用 Umbraco 4.7
seo - A way to find out which sites of my websites are indexed
Is there any way to find out which urls of my websites are indexed and which not?
(e.g. site:http://example.com/site1.html)
What i tried:
- Used google ajax api -> Problem here is that the results are totally different from the ones i'm getting from the google search
- Used google custom search api -> Same problem here: The results differ from the ones google is showing (because its actually kind of like a private search)
- Used Jsoup to crawl google -> Since its against there Terms its really hard to do -> I set a timeout between every request (between 30s-90s) and used proxies. Still i can't crawl for a long time and google blocks the ip.
What to do? :)
javascript - angular.js 如何告诉谷歌索引我的网站?
我有一个 angular.js 应用程序。我遵循了 google 的基于 ajax 的应用程序指南。我已经这样做了:
- 元标记
<base href="/">
<meta name="fragment" content="!">
- angular.js 配置
$locationProvider.html5Mode(true);
$locationProvider.hashPrefix('!');
- 我的 html 链接看起来像这样(错了吗?):
<a ng-href="/#!/login">Login</a>
- 我将站点地图提交到谷歌搜索控制台(x 个月前)
我发现我不应该使用 escaped_fragment,对吗?难道我做错了什么?它仍然没有索引。谷歌索引的只是主页。
当我将 fetch 作为谷歌工具运行时,它会正确呈现所有页面。
angularjs - 如何让 Google 索引我的 AngularJS 应用程序
我按照这个答案让我的 AngularJS 被谷歌索引。正如在答案中所讨论的,我添加$locationProvider.html5Mode(true)
到我的路由系统中。它还说,当页面被直接请求到服务器时,我应该交付页面。例如/forum
应该用论坛页面响应。问题是我没有要发送的论坛页面。我正在使用ng-route
,所以我有一个主视图 div,它在客户端更改页面时切换内容。
由于我没有任何 html 页面而不是 index.html,所以当服务器收到对页面 ( /forum
) 的请求时,我应该发回什么?
我目前的解决方案是发送重定向到/#/forum
,这样客户端确实会收到论坛页面(因为 Angular 路由系统会自动将页面重定向到论坛页面,并且 HTML5 正在将 url 更改为/forum
)。
但是这种方式,谷歌不会索引我的/forum
页面,因为当爬虫请求它收到重定向的页面时,/#/forum
爬虫会忽略#
.
处理这种情况的正确方法是什么?如何让 Google 完全索引我的 angularJS 应用程序?它索引的唯一页面是 / 页面。
indexing - 从 Google 搜索结果中删除不属于自己的网址或固定链接
我想从 Google 搜索中删除我不是所有者的旧搜索结果。当内容不再存在或已更改时,Google 会提供删除工具,但是当永久链接已更改时,我不知道该怎么做。
例如:www."dummy_domain".com/hello -> www."dummy_domain".com/goodbye
页面内容相同,但永久链接已更改,Google 仍在索引旧的永久链接
ajax - 用于单页应用程序的 Google 爬虫
我有一个网站,左侧有一个菜单(大约 5/6 个条目),页面其余部分有一个中心区域 div。使用 ajax 调用填充中心区域。当用户点击一个新的菜单条目时,div 的内容将被删除并替换为通过 ajax 获得的新内容。
现在的问题是谷歌索引。我对此有一些疑问:
如果转到主页会自动触发第一个 ajax 调用(第一个菜单项),谷歌是否能够读取第一页的内容?
如果第一个问题的答案是肯定的,我可以使用哈希表示法(例如 mysite.com#page/1 )区分页面,并让用户有机会使用相应的哈希直接访问另一个菜单条目。之后可以构建一个包含每个哈希条目的链接的站点地图吗?在那种情况下,谷歌能够阅读我网站的所有内容吗?如果是的话,你能给我一个站点地图的例子吗?
最后,如果第一个问题的答案是否定的,那么索引这样的单页应用程序的最佳方法是什么?
基本上我的内容真的很少,但对我来说,单页应用程序可以向用户展示的用户体验非常重要。
最后一个问题:我还使用 jQuery mobile 的“页面”表示法构建了移动版本。可以做谷歌索引吗?
在此先感谢,任何帮助将不胜感激。
再见!
apache - 如何处理重定向到要被谷歌索引的子域?
我想将我的子域用作主页。我的主域是空的,但内容在subdomain.example.com
. google
既不想索引我的内容,也不想索引我的域。
我的.htaccess
包含
我如何重定向google
到我的子域?