什么是重复内容,为什么您的网站会担心它?更好的是,您如何找到并修复它?
在本周的 Whiteboard Friday 节目中,Moz Learn 团队专家 Meghan 介绍了一些方便(和引起饥饿感)的类比来帮助您回答这些问题!
单击上面的白板图像以在新选项卡中打开高分辨率版本!
视频转录
嘿,莫兹的粉丝。欢迎来到另一版 Whiteboard Friday。我是 Meghan,我是 Moz 学习团队的一员。今天我们要谈谈重复内容。
那么我们为什么要谈论重复的内容呢?
嗯,这是一个很常见的问题,而且常常会让人有些困惑。它是什么?它是如何确定的?为什么我网站上的某些页面被标记为彼此重复?最重要的是,如果我发现这是我想在我的网站上解决的问题,我该如何解决?
什么是重复内容?
那么首先,什么是重复内容?
从本质上讲,重复内容是出现在 Internet 上多个位置的内容。但这可能不像看起来那么简单。过于相似的内容,即使不相同,也可能被视为彼此重复。
在考虑重复内容时,重要的是要记住,这不仅仅是人类访问者在访问您的网站并比较两个页面时看到的内容。这也与搜索引擎和爬虫在访问这些页面时看到的内容有关。由于他们看不到渲染的页面,他们通常会离开页面的源代码,如果该代码过于相似,爬虫可能会认为它正在查看同一页面的两个版本。
想象一下,你去一家面包店,面前有两个看起来几乎一模一样的纸杯蛋糕。他们没有任何迹象。你怎么知道你想要哪一个?当搜索引擎遇到两个过于相似的页面时,就会发生这种情况。
这种内容之间的混淆可能会导致诸如排名问题之类的问题,因为搜索引擎可能无法确定他们应该对哪个页面进行排名,或者他们可能对不正确的页面进行排名。在 Moz 工具中,我们对重复内容设置了 90% 的阈值,这意味着任何代码至少 90% 相同的页面都将被标记为彼此重复。
解决方案
既然我们已经简要介绍了重复内容是什么,那么我们该怎么做呢?有几种不同的方法可以解决重复的内容。
301 重定向
首先是实现 301 重定向的选项。此选项类似于拥有电影的 VHS 副本,这可能不再那么相关了。
因此,您要确保为人们提供在线流式传输的数字版本。在您的网站上,您可以将旧版本的页面重定向到新的更新版本。这与子域或协议更改的问题以及您不再希望人们能够访问旧内容的内容更新有关。
相对=规范
接下来是在您的页面上实施 rel=canonicals 的选项。假设您正在参加烘焙销售,并且随身携带两种类型的饼干,糖和巧克力片。你认为你的糖饼干是一流的。所以当人们问你他们应该尝试哪一个时,你会指给他们吃糖饼干,即使他们仍然可以选择尝试巧克力片。
在您的网站上,这类似于出售两种不同颜色的商品。您希望人类访问者能够看到和访问这两种颜色,但您会使用规范标签来告诉爬虫哪一个是更相关的页面来排名。
元索引
您还可以选择将页面标记为元 noindex。
例如,您可能有两个版本的您最喜欢的书。您将阅读并参考第二版,因为它是最新的和最相关的。但是您仍然希望能够在需要时阅读和访问第一版。元 noindex 标签告诉爬虫他们仍然可以爬取那个重复的页面,但他们不应该将它包含在他们的索引中。这可以帮助解决由于分页等原因导致的重复内容问题。
添加内容
但是,如果您有两页确实不相互重复怎么办?它们涉及不同的主题,应将它们视为单独的内容。好吧,在这种情况下,您可以选择向这些页面中的每一个添加更多内容,这样爬虫就不会感到困惑。
这将使它们彼此脱颖而出,就像在一个纸杯蛋糕上添加糖屑和樱桃,或者在另一个纸杯蛋糕上添加不同颜色的糖霜一样。
使用 Moz Pro 帮助识别和解决重复内容
如果您需要帮助确定您网站上的哪些页面可能被视为彼此重复,Moz Pro Site Crawl 和 On-Demand Crawl 可以提供帮助。
在这两种工具中,我们将标记哪些页面被视为彼此重复,您甚至可以将该数据导出为 CSV,以便您可以在工具之外对其进行分析。这里只是一点专业提示。在该数据的 CSV 导出中,重复内容组将告诉您哪些页面被视为彼此重复。
因此,任何具有相同重复内容组编号的页面都是同一组重复页面的一部分。这绝不是您可以解决重复内容的方法的详尽列表,但我确实希望它有助于在解决此问题时为您指明正确的方向。如果您有兴趣了解有关 google SEO 基础和策略的更多信息,请务必查看通过 Moz Academy 提供的 google SEO Essentials 认证。
感谢收看。
Speechpad.com 的视频转录