Google Sheets中的谷歌SEO预测

早在 2015 年,我发表了一篇文章,赠送了一个免费、简单的预测工具,并讨论了谷歌 SEO 预测的用例。这是一种快速、有效的方法,可以查看网站流量的变化是否是某种可以忽略的季节性因素、值得庆祝的事情,或者令人担忧的流量损失迹象。

简而言之:您可以输入一系列数据,然后将其绘制在如上图所示的图表上。

五年后,我仍然有一些人——从以前的同事到完全陌生的人——向我询问这个​​工具,而且通常情况下,我被要求提供一个可以直接在电子表格中使用的版本。

我觉得这很容易让人同情:电子表格更灵活、更易于调试、更易于扩展、更易于维护,并且是人们非常熟悉的格式。

优化这些东西时的权衡是,尽管几年前我对该工具进行了改进,但我仍然必须在 Excel/Google 表格这一著名的多变编程环境中保持可管理性。这意味着本文中共享的模板使用的模型比一些具有外部代码执行功能的工具(例如 Forecast Forge)更简单,性能稍差。

在这篇文章中,我将赠送一个免费模板,向您展示它是如何工作的以及如何使用它,然后向您展示如何构建自己的(更好的?)版本。(如果您需要复习一般何时使用预测以及置信区间等概念,请参阅上面链接的原始文章。)。

谷歌搜索引擎优化预测的类型

在我们进入电子表格之前,我想扩展一件事:不同类型的谷歌 SEO 预测。

从广义上讲,我认为您可以将 google SEO 预测分为三组:

  • “我感觉很乐观——今年增加 20%”或对现有数据进行类似的持平变化。更复杂的版本可能只会为某些页面或关键字组增加 20%。我认为很多机构在推销中使用这种预测,归根结底是借鉴经验。
  • 关键字/CTR 模型,当您估计排名变化(或一系列排名变化)时,然后根据搜索量和 CTR 数据推断流量的变化(您可以在此处看到类似的方法)。同样,更复杂的版本可能有一些排名变化的基础(例如,“如果我们在 X 组的每个关键字中与竞争对手 A 交换他们当前排名高于我们的位置怎么办?”)。
  • 基于历史数据的统计预测,当您从以前的趋势和季节性推断时,看看如果一切保持不变(您和竞争对手的营销活动水平相同等)会发生什么。

类型 2 有其优点,但如果您将 Ahrefs/SEMRush/Sistrix 之类的数据与您自己的分析进行比较,您会发现概括起来有多么困难。顺便说一句,我不认为第一种类型像看起来那么荒谬,但这不是我将在这篇文章中进一步探索的东西。无论如何,这篇文章中的模板适合第三种类型。

是什么让这成为谷歌 SEO 预测?

为什么,什么都没有。关于我对上述类型三的描述,您会注意到的一件事是它没有提及任何特定于谷歌搜索引擎优化的内容。例如,它同样适用于直接交通。也就是说,有几个原因我特别建议将其作为谷歌搜索引擎优化预测:

  • 我们在 Moz 博客上,我是一名谷歌 SEO 顾问。
  • 对于许多其他渠道,有更好的方法可用。

我提到上面的第二种类型非常具有挑战性,这是因为 google SEO 的高度不确定性以及 Search Console 和其他 google SEO 特定平台中的详细数据质量普遍较差。此外,要准确了解季节性,您需要将 Search Console 数据存储至少几年。

对于许多其他渠道,确实存在高质量、详细的历史数据,并且关系更容易预测,从而可以进行更精细的预测。例如,对于付费搜索,我上面提到的 Forecast Forge 工具会根据您的历史数据构建关键字级转换数据和每次点击成本等因素,这对于谷歌 SEO 来说是非常不切实际的。

也就是说,我们仍然可以在下面的模板中组合多种类型的预测。例如,您可以单独预测子文件夹或品牌/非品牌,而不是预测整个网站的流量,然后您可以将百分比增长应用于某些区域或构建预期的排名变化。但是,我们正在超越自己……

如何使用模板

免费模板

您需要做的第一件事是制作一个副本(在左上角的“文件”菜单下,但自动使用我包含的链接)。这意味着您可以输入自己的数据并随心所欲地玩转,如果需要,您可以随时回来获取新的副本。

然后,在第一个选项卡上,您会注意到一些单元格具有绿色或蓝色突出显示:

您应该只更改彩色单元格中的值。

E 列中的蓝色单元格基本上是为了确保在输出中正确标记所有内容。因此,例如,如果您要粘贴会话数据、点击数据或收入数据,您可以设置该标签。同样,如果您输入 2018-01 的开始月份和 36 个月的历史数据,则预测输出将从 2021 年 1 月开始。

需要注意的是,它必须是月度数据——这是我前面提到的简单性的权衡之一。您可以将长达十年的历史月度数据粘贴到 B 列中,从单元格 B2 开始,但您需要注意以下几点:

  • 模型需要至少 24 个月的数据才能很好地了解季节性。(如果您的历史数据中只有一个 1 月,而且是流量高峰,我怎么知道它是一次性的,还是一年一度的?)
  • 你需要完整的几个月。因此,如果您阅读本文时是 2021 年 3 月 25 日,那么您应该包含的最后一个月数据是 2021 年 2 月。

确保您还删除了 B 列中我的示例数据的任何剩余部分。

输出

完成此操作后,您可以转到“输出”选项卡,您将在其中看到如下内容:

C 列可能是您感兴趣的列。请记住,这里充满了公式,但您可以将值作为值复制并粘贴到另一张表中,或者只需转到文件 > 下载 > 逗号分隔值以获取原始值数据。

您会注意到,默认情况下,我只在该图中显示 15 个月的预测,我建议您也这样做。正如我上面提到的,预测的隐含假设是历史背景会延续,除非你明确地将变化的场景包括在你的模型中(稍后会详细介绍!)。这种假设在未来两三年内保持的可能性很低,所以即使我已经提供了未来更远的预测值,你也应该记住这一点。

显示的上限和下限是 95% 的置信区间——同样,如果您愿意,可以在我之前的帖子中回顾一下这意味着什么。

高级用例

您现在可能已经注意到“高级”选项卡:

虽然我说我想保持简单,但我觉得鉴于 2020 年发生的一切,许多人需要将主要的外部因素纳入他们的模型中。

在上面的示例中,我在 B 列中填写了一个变量,表示英国是否处于 COVID 锁定状态。我用“0.5”表示我们在 3 月中旬进入了封锁状态。

您可能可以针对您的业务的相关因素做出更好的选择,但是使用此选项卡需要牢记一些重要事项:

  • 如果您不想添加这些额外的变量,则可以完全保持原样。
  • 从左到右 – 如果您使用 B 列,可以将 C 列留空,但如果您使用 C,则将 B 留空就不好了。
  • 如果您使用“虚拟”变量(例如,“1”表示某项活动),您需要确保在其他单元格中填写 0,至少在您的历史数据期间。
  • 您可以输入未来值——例如,如果您预测 2021 年 3 月 COVID 锁定(你这个混蛋!),您可以在该单元格中输入一些内容,以便将其合并到预测中。
  • 如果您不输入未来值,模型将根据该数字在未来为零进行预测。因此,如果您输入“品牌 PPC 活跃”作为历史数据的虚拟变量,然后在未来期间将其留空,该模型将假设您在未来关闭了品牌 PPC。
  • 在这里为太少的历史时期添加太多数据会导致所谓的“过度拟合”——我不想详细说明这一点,这就是为什么这个选项卡被称为“高级”的原因,但尽量不要被带走。

以下是此选项卡的一些示例用例供您考虑:

  • 输入品牌 PPC 是否处于活动状态(0 或 1)
  • 输入您是否投放电视广告
  • 输入 COVID 锁定
  • 输入对您的业务有重要意义的算法更新(每次更新一列)

为什么我的估计与您的旧工具不同?其中一个是错的吗?

这个模板和我的旧工具在方法上有两个主要区别:

  • 旧工具使用 Google 的因果影响库,新模板使用普通最小二乘回归。
  • 旧工具通过使用时间段平方作为预测变量(例如,第 1 个月 = 1、第 2 个月 = 4、第 3 个月 = 9 等)并尝试将流量曲线拟合到该曲线来捕捉非线性趋势。这称为二次回归。新工具通过将每个时间段拟合为前一个时间段的倍数来捕捉非线性趋势(例如,第 1 个月 = X * 第 2 个月,其中 X 可以是任何值)。这称为 AR(1) 模型。

如果您看到两者之间的预测值存在显着差异,几乎可以肯定归结为第二个原因,虽然它增加了一点复杂性,但在绝大多数情况下,新技术更加现实和灵活。

在严重下降趋势的情况下,预测零流量或负流量的可能性也小得多,这很好。

它是如何工作的?

模板中有一个隐藏选项卡,您可以在其中查看,但简短版本是“LINEST()”电子表格公式。

我正在使用的输入是:

  • 因变量
    • 您在输入选项卡中作为 B 列输入的任何内容(如流量)
  • 自变量
    • 时间的线性流逝
    • 前期流量
    • 11 个月的虚拟变量(第 12 个月由其他 11 个变量都为 0 表示)
    • 最多三个“高级”变量

然后,该公式给出了一系列“系数”作为输出,这些“系数”可以与值相乘并相加,形成如下预测:

  • “时段 10”流量 = 截距 +(时间系数 * 10)+(上一时段系数 * 时段 9 流量)

您可以在隐藏的表格中看到我已经标记并用颜色编码了 Linest 公式的许多输出,如果您想自己尝试一下,这可能会帮助您入门。

潜在的扩展

如果您确实想自己尝试一下,这里有一些我个人认为可以进一步扩展的领域,您可能会觉得有趣:

  • 每日数据而不是每月数据,具有每周季节性(例如每周日下降)
  • 内置增长目标(例如,到 2021 年底实现 20% 的增长)

Richard Fergie,我上面多次提到过他的 Forecast Forge 工具,他也提供了一些很好的建议,可以在相当有限的额外复杂性的情况下提高预测准确性:

  • 通过获取输入的 log() 并提供输出的指数来平滑数据并避免极端情况下的负面预测(根据您的观点,平滑数据可能是也可能不是一件好事!)。
  • 前 12 个月的回归,而不是使用前 1 个月 + 季节性(这需要至少 3 年的历史数据)

随着时间的推移,我可能会或可能不会自己包含上述部分或全部内容,但如果是这样,我会确保我使用相同的链接并在电子表格中记下它,因此本文始终链接到最新的-日期版本。

如果你已经走到了这一步,你想看到什么?在评论中告诉我!

发表评论

您的电子邮箱地址不会被公开。

免费定制谷歌SEO方案

请输入您的资料

你也可以直接右下角客服直接跟我们联系
=

请输入您的资料

seo
你也可以直接右下角客服直接跟我们联系
=

request a quote