修复Google Search Console的覆盖率报告“排除的页面”

修复 Google Search Console 的覆盖率报告“排除页面”

Google Search Console 可让您通过 Google 的眼睛查看您的网站。

外贸网站建设

您会获得有关网站性能的信息以及有关页面体验、安全问题、抓取或索引的详细信息。

Google Search Console 索引覆盖率报告的排除部分提供有关您网站页面的索引状态的信息。

了解为什么您网站的某些页面会出现在 Google Search Console 中的“排除”报告中,以及如何修复它。

什么是指数覆盖率报告?

Google Search Console 覆盖率报告显示有关您网站网页的索引状态的详细信息。

您的网页可以进入以下四个存储桶之一:

  • 错误:Google 无法索引的页面。您应该查看此报告,因为 Google 认为您可能希望将这些页面编入索引。
  • 警告有效:Google 索引的页面,但您应该解决一些问题。
  • 有效:Google 索引的页面。
  • 排除:从索引中排除的页面。

 

Google Search Console 覆盖率报告

什么是排除页面?

Google 不会将错误和排除存储桶中的页面编入索引。

两者的主要区别在于:

  • Google 认为 Error 中的页面应该被编入索引,但不能因为您应该查看的错误而被编入索引。例如,通过 XML 站点地图提交的不可索引页面属于错误。
  • Google 认为 Excluded 存储桶中的页面确实应该被排除,这是您的意图。例如,未提交给 Google 的不可编入索引的页面将出现在“排除”报告中。GSC 中的排除页面Google Search Console 的屏幕截图,2022 年 5 月
    GSC 中的排除页面

然而,谷歌并不总是正确的,应该索引的页面有时会被排除。

幸运的是,Google Search Console 提供了将页面放置在特定存储桶中的原因。

这就是为什么仔细检查所有四个存储桶中的页面是一个好习惯的原因。

现在让我们深入了解已排除的存储桶。

排除页面的可能原因

您的网页在排除组中有 15 个可能的原因。让我们仔细看看每一个。

被“noindex”标签排除

这些是带有“noindex”标签的 URL。

Google 认为您实际上想从索引中排除这些页面,因为您没有在 XML 站点地图中列出它们。

例如,这些可能是登录页面、用户页面或搜索结果页面。

 

Google Search Console 被 noindex 标签排除

建议的行动:

  • 查看这些 URL 以确保您希望将它们从 Google 的索引中排除。
  • 检查这些 URL 上是否仍然/实际存在“noindex”标签。

已抓取 – 当前未编入索引 

Google 已经抓取了这些页面,但仍未将它们编入索引。

正如谷歌在其文档中所说,此存储桶中的 URL “将来可能会或可能不会被编入索引;无需重新提交此 URL 进行抓取。”

许多 SEO 专业人士注意到,如果许多正常和可索引的页面被抓取(目前没有被索引),一个网站可能会出现一些严重的质量问题。

这可能意味着 Google 已经抓取了这些页面,并且认为它们没有为索引提供足够的价值。

谷歌搜索控制台目前没有被 IIndexed 爬取Google Search Console 的屏幕截图,2022 年 5 月
谷歌搜索控制台目前没有被 IIndexed 爬取

建议的行动:

  • 在质量和 EAT 方面检查您的网站。

已发现 – 目前未编入索引 

正如 Google 文档所述,“已发现”下的页面 – 目前未编入索引“已被 Google 找到,但尚未被抓取”。

谷歌没有抓取页面以免服务器超载。此存储桶下的大量页面可能意味着您的网站存在抓取预算问题。

Google Search Console 发现当前未编入索引Google Search Console 的屏幕截图,2022 年 5 月
Google Search Console 发现当前未编入索引

建议的行动:

  • 检查服务器的运行状况。

未找到 (404)

这些是在 Google 请求时返回状态代码 404(未找到)的页面。

这些不是提交给 Google 的 URL(即,在 XML 站点地图中),而是 Google 发现了这些页面(即,通过链接到很久以前删除的旧页面的另一个网站。

GSC - 404 中的排除页面Google Search Console 的屏幕截图,2022 年 5 月
GSC - 404 中的排除页面

建议的行动:

  • 查看这些页面并决定是否实施 301 重定向到工作页面。

软404

在大多数情况下,软 404 是返回状态代码 OK (200) 的错误页面。

或者,它也可以是一个薄页,几乎不包含任何内容,并使用“抱歉”、“错误”、“未找到”等词。

Google Search Console 中的软 404Google Search Console 的屏幕截图,2022 年 5 月
Google Search Console 中的软 404

建议的行动:

  • 如果出现错误页面,请确保返回状态码 404。
  • 对于精简内容页面,添加独特的内容以帮助 Google 将此 URL 识别为独立页面。

带重定向的页面

您网站上的所有重定向页面都将转到排除存储桶,您可以在其中查看 Google 在您的网站上检测到的所有重定向页面。

Google Search Console 中带有重定向的页面Google Search Console 的屏幕截图,2022 年 5 月
Google Search Console 中带有重定向的页面

建议的行动:

  • 查看重定向页面以确保重定向是有意实施的。
  • 当您更改 URL 时,某些 WordPress 插件会自动创建重定向,因此您可能需要偶尔查看这些内容。

没有用户选择的规范的重复

Google 认为这些 URL 与您网站上的其他 URL 重复,因此不应编入索引。

您没有为这些 URL 设置规范标签,Google 根据其他信号选择了规范标签。

建议的行动:

  • 检查这些 URL 以检查 Google 为这些页面选择了哪些规范 URL。

重复,谷歌选择了与用户不同的规范

GSC 中的排除页面Google Search Console 的屏幕截图,2022 年 5 月
GSC 中的排除页面

在这种情况下,您为该页面声明了一个规范 URL,但即便如此,Google 还是选择了一个不同的 URL 作为规范。因此,Google 选择的规范会被编入索引,而用户选择的则不会。

可能的行动:

  • 检查 URL 以检查规范 Google 选择的内容。
  • 分析使 Google 选择不同规范(即外部链接)的可能信号。

重复的,提交的 URL 未被选为规范

上述状态与此状态的区别在于,在后者的情况下,您向 Google 提交了一个 URL 以供索引,而没有声明其规范地址,而 Google 认为不同的 URL 会成为更好的规范。

因此,Google 选择的规范会被编入索引,而不是提交的 URL。

建议的行动:

  • 检查 URL 以检查规范 Google 选择的内容。

具有适当规范标签的备用页面

这些只是 Google 识别为规范 URL 的页面的副本。

这些页面具有指向正确规范 URL 的规范地址。

建议的行动:

  • 在大多数情况下,不需要任何操作。

被机器人阻止.txt 

这些是 robots.txt 已阻止的页面。

在分析此存储桶时,请记住,如果 Google 在其他网站上找到对这些页面的引用,Google 仍然可以索引这些页面(并以“受损”的方式显示它们)。

建议的行动:

  • 使用 robots.txt 测试器验证这些页面是否被阻止。
  • 如果要从索引中删除页面,请添加“noindex”标签并从 robots.txt 中删除它们。

被页面删除工具阻止 

此报告列出了删除工具已请求删除的页面。

请记住,此工具只会暂时(90 天)从搜索结果中删除页面,不会将它们从索引中删除。

建议的行动:

  • 验证通过删除工具提交的页面是否应被暂时删除或具有“noindex”标签。

由于未经授权的请求而被阻止 (401)

对于这些 URL,Googlebot 由于授权请求(401 状态代码)而无法访问这些页面。

除非这些页面在未经授权的情况下可用,否则您无需执行任何操作。

谷歌只是告诉你它遇到了什么。

谷歌的 401 页面Google Search Console 的屏幕截图,2022 年 5 月
谷歌的 401 页面

建议的行动:

  • 验证这些页面是否真的需要授权。

由于访问被禁止而被阻止 (403)

此状态代码通常是某些服务器错误的结果。

当提供的凭据不正确时返回 403,并且无法授予对页面的访问权限。

正如谷歌文档所述:

“Googlebot 从不提供凭据,因此您的服务器错误地返回了此错误。这个错误应该被修复,或者该页面应该被 robots.txt 或 noindex 阻止。”

您可以从排除的页面中学到什么?

排除页面的特定存储桶中突然出现巨大的峰值可能表明存在严重的网站问题。

以下是三个可能表明您的网站存在严重问题的峰值示例:

  • 未找到 (404) 页面的巨大峰值可能表明迁移失败,其中 URL 已更改,但尚未实现重定向到新地址。这也可能发生在,例如,一个没有经验的人更改了博客文章的 slug 并因此更改了所有博客的 URL。
  • 已发现(当前未编入索引或已抓取)中的巨大峰值当前未编入索引可能表明您的网站已被黑客入侵。请务必查看示例页面,以检查这些页面是否真的是您的页面,或者是由黑客创建的(即带有中文字符的页面)。
  • 被“noindex”标签排除的巨大峰值也可能表示启动和迁移不成功。当一个新站点与临时站点的“noindex”标签一起投入生产时,通常会发生这种情况。

回顾

借助 GSC 覆盖率报告的排除部分,您可以了解很多关于您的网站以及 Googlebot 如何与其交互的信息。

无论您是新的 SEO 还是已经有几年的经验,都要养成检查 Google Search Console 的日常习惯。

这可以帮助您在各种技术 SEO 问题变成真正的灾难之前检测它们。

发表评论

您的电子邮箱地址不会被公开。

免费定制谷歌SEO方案

请输入您的资料

你也可以直接右下角客服直接跟我们联系
=

请输入您的资料

seo
你也可以直接右下角客服直接跟我们联系
=

request a quote