机器学习——研究计算机算法自动改进的人工智能的一个分支——似乎远远超出了你的谷歌搜索引擎优化工作的范围。MozCon 演讲者(以及全能的 google SEO 天才)Britney Muller 带着特别版的 Whiteboard Friday 来告诉你为什么这不是真的,并通过几个步骤让你开始。您可以在此处访问视频中讨论的 Colab 笔记本。
要从 Britney 和我们的其他 MozCon 2020 演示文稿中了解有关机器学习的更多信息,请查看今年的视频包。
获取我的 MozCon 2020 视频包
单击上面的白板图像以在新选项卡中打开高分辨率版本!
视频转录
嘿,莫兹的粉丝。欢迎来到本周五特别版的白板。今天,我们先来看看我在 MozCon 2020 上谈到的内容,在那里我让机器学习可供各地的谷歌 SEO 使用。
这太令人兴奋了,因为它今天触手可及,我将向您展示如何开始。
因此,首先,我在今年夏天了解到了一个叫做育雏寄生虫的奇怪概念,它很吸引人。这基本上是一种动物欺骗同一物种的另一种动物来抚养幼崽的地方。
这很有趣,我对它了解得越多,我就越意识到:哦,天哪,在编程和机器学习方面,我有点像寄生虫!我锁定并找到了这些出色的模型,它们可以完成所有工作——所有的融资——我输入我的数据和我的想法,它为我做事。
因此,我们将利用这个概念来发挥我们的优势。事实上,我已经能够教给我父亲这些模型中的大多数,而且这些模型现在也可以在一个名为 Colab 的工具中随时提供给你。让我带您了解一下它的外观。
帮助您入门的模型
所以开始,如果你想现在开始热身,只需按住“Shift”键开始练习,然后按“Enter”键。
现在就开始练习吧。这是成功的一半。你即将推出一些非常酷的模型。
好的。有哪些例子?那看起来像什么?因此,您今天可以使用的一些模型是 DeOldify,您可以在其中修复旧照片并为其着色。真的,真的很有趣。
另一种是文本生成器。我用 GTP-2 创建了一个——超级傻,就是这个借口生成器。你可以操纵它,让它为你做不同的事情。
还有一个非常非常棒的预测模型,你基本上可以在其中放入大量时间序列数据,它可以预测未来可能会发生什么。它真的,真的很强大,很有趣。
你可以总结文本,这真的很有价值。想想元描述,所有这些好东西。
您还可以自动化关键字研究分组,稍后我将在这里向您展示。
你可以做非常强大的内部链接分析,有一个笔记本。
也许最强大的事情之一是您可以提取 Google 感知的实体和类别。这是我最喜欢的 API 之一。它是通过 Google 的 NLP API 实现的。我将其放入笔记本中,您基本上将要从中提取此信息的 URL 放入,您可以比较您的 URL 与竞争对手的比较。
这真的很有价值,很有趣。
最重要的是,你不能破坏这一切!
不要被任何代码吓倒。许多经验丰富的开发人员不知道其中一些代码块中发生了什么。没关系。
使用 Colab
我们可以在这样的环境中玩耍。它托管在 Google Drive 中,因此不必担心这会破坏您计算机上的任何内容或您的数据或任何东西。所以让我们开始吧。正如我所说,这是通过一个名为 Colab 的免费工具实现的。
您知道 Google 如何使用 Excel 并制作 Google 表格吗?
他们对所谓的 Jupyter Notebooks 做了同样的事情。Jupyter 安装在您的计算机本地。它是最流行的笔记本环境之一。但它需要一些设置,并且可能有些笨拙。它与不同的版本和yada,yada混淆。谷歌将其放入云端(需要零设置),现在将其称为 Colab Notebooks。它的强大令人难以置信。
所以,再次,它是免费的。如果您想在新选项卡中打开它,您现在可以使用它。零设置。Google 还为您提供免费的 GPU 和 TPU 计算,这很棒。它有 12 小时的运行时间。
一些缺点是你可以达到极限。所以我达到了极限,现在我为 Pro 版本每月支付 9.99 美元,我没有遇到任何问题。
同样,我与此无关。我对此非常感兴趣,而且他们为您提供免费版本的事实是如此令人兴奋。我已经看到很多人开始这样做了。还需要注意的是,它可能不如 Google 的企业解决方案安全或健壮。因此,如果您正在为一家大公司做这件事,或者您对此非常认真,您可能应该查看其他一些选项。但是,如果您只是涉足并想探索并获得乐趣,那么让我们继续这个聚会吧。
使用熊猫
好的。同样,这是一个云托管的笔记本环境。所以我想在这里真正关注的一件事,因为我认为它对谷歌 SEO 最有价值,就是这个被称为“pandas”的库。
Pandas 是一个建立在 python 之上的数据分析库。只运行两行代码后,您可以从本地计算机上传 CSV 文件。这个愚蠢的例子是我真正使用 Google Search Console 数据运行的例子。
所以你在笔记本中运行它(Shift + Return)。再次,我今天与您分享这整个笔记本。因此,只需单击第一个文本单元格并开始运行 Shift + 单击即可将您带到笔记本中。它并不像看起来那么吓人。
运行上述代码后,上传您的 CSV。然后,一旦你上传它,你就要为你的数据框命名。
上传 CSV 后,您将看到说明您的 CSV 名称的输出。复制它的上传方式并将其粘贴到下一个(单元格上方)以命名它。
在这种情况下,我的只是“gsc-example.csv”。同样,上传 CSV 文件后,您将在“from.google.colab import files”代码单元下方的输出中看到名称。
现在,让我们运行一些简单的代码行,以确保您的数据正确存在。
人们做的第一个常见检查是“df.head()”。这将向您显示数据框的前五行。您也可以执行“df.tail()”,它会显示数据框的最后五行。
您甚至可以在括号中输入一个数字(例如 df.head(30))来查看前 30 行。就这么容易!
现在来了真正有趣的东西,这只是冰山一角。
所以你可以在这里运行这个非常非常酷的代码单元来创建一个可过滤的表。
这样做的强大之处在于,尤其是对于您的 Google Search Console 数据,您可以轻松地提取和探索点击率高且搜索排名低的关键字。这是我最喜欢为客户探索关键字机会的方法之一,而且再简单不过了。
所以,玩弄可过滤视图。
如果你正在做关键词研究,你正在尝试存储关键词,你正在尝试组织主题等,但你可以更轻松地使用 Pandas 组织你的关键词。
以下是如何创建一个新列来说明关键字是否为“品牌”。
因此,为了引导您完成此操作,“df[“Branded”]”创建了一个名为“Branded”的新列。
然后 “df.Query.str.contains(“moz|rand|ose”)” 使用正则表达式将带有这些关键字的任何查询标记为 Branded = True。
所以现在这使得过滤和探索变得更快了!您甚至可以通过创建完全不同的数据框表的方式来执行此操作(示例也在此笔记本中)。
您可以使用它并将关键字导出到这样的存储桶中,并且没有停滞时间。事情不会像 Excel 那样冻结。您可以使用正则表达式更轻松地解释拼写错误和各种好东西。太酷了。
结论
同样,这只是冰山一角,我的朋友们。我很高兴能在你们所有人身上播下这颗种子,这样你们就可以回来教我你们能够完成的事情。我认为我们在这个领域还有很多东西要探索。这将非常有趣!如果您从中获得乐趣,并且想继续探索 Colab 中的不同模型、不同程序,我强烈建议您下载 Colab Chrome 扩展程序。
它只是让打开笔记本变得更加容易。
您可以将您发现的笔记本的副本保存到您的驱动器中,并随心所欲地使用它。太有趣了。我希望这能激发你的灵感,我很高兴听到你们所有人的想法和创造。– 真的很感谢你的观看。
所以非常感谢你。下次再见。再见。
Speechpad.com 的视频转录
准备好了吗?
您将在 MozCon 2020 视频包中发现更多 google SEO 优点。以今年 129 美元的特别低价,这是您可以在一年中一次又一次地访问以激发和点燃您的 google SEO 策略的宝贵内容:
- 来自数字营销领域一些最聪明头脑的 21 个完整视频
- 即时下载和流式传输到您的计算机、平板电脑或移动设备
- 用于演示的可下载幻灯片
获取我的 MozCon 2020 视频包