工具篇2:如何使用尖叫青蛙Screaming Frog SEO Spider 创建XML网站地图

网站地图即sitemap,一般放置在网站的最底部。其作用有两种,一个是给用户提供快捷的网站导航,另一种是向搜索引擎提供网站所有的页面,提高收录的机会。sitemap大多以xml格式展现,市面上用来制作网站地图的工具也不少,今天主要为大家介绍如何使用尖叫青蛙Screaming Frog SEO Spider 创建网站地图。

1.搜索网站

打开尖叫青蛙Screaming Frog SEO Spider,输入网站URL,点击“start”。

尖叫青蛙正在爬取网站链接
尖叫青蛙正在爬取网站链接

2.点击“Sitemaps”—“XML Sitemap”

等尖叫青蛙进度条达到100%完成抓取后,可以在顶部菜单中的“Sitemaps”下单击“ XML Sitemap”选项。

选择xml sitemap
选择xml sitemap

3.选择需要包含的页面

默认情况下,XML站点地图中仅包含响应代码为200的页面。因此,重定向(3XX),客户端错误(4XX错误,例如断开的链接)或服务器错误(5XX)等并不会被考虑在列。当然,如果你想选择其中一些页面做到地图中也是可以的,勾选对应的选项即可。

选择sitemap需要包含的页面
选择sitemap需要包含的页面

如果你想知道哪些页面404,哪些页面301,可以返回到工具首页,点击“Responses Codes”,通过筛选查看对应状态的URL.

查看不同状态码下的URL
查看不同状态码下的URL

4.如何从XML站点地图中去掉不需要的页面

尖叫青蛙默认“200”状态的页面均写入sitemap,这时有一些重复页面会包含在内,比如:https://www.advich.com/和https://advich.com/均可以访问,状态码都是200,我们只需要挑选一个规范的版本就可以了,有什么方法呢?

a.可以在尖叫青蛙爬取之前设置好,让爬虫将它们排除在外。由于这些页面不会被抓取,因此也不会包含在Sitemap中。

b.如果已经抓取了不想包含在 Sitemap中的URL,则只需在顶部窗口窗格的“internal”中突出显示它们,右键单击并“Remove”它们,然后再创Sitemap。

移除sitemap 中不需要的url
移除sitemap 中不需要的url

c.将工具爬出来的URL导出到Excel,过滤并删除所有不需要的URL ,然后再以列表的形式上传,再生成网站地图。

5.选择最新修改日期

如果你不想在sitemap中包含页面最后修改的时间,在“Last Modified”中不要选中“Include <lastmod> tag“就可以了。

如果要在站点地图中包含的话,根据实际情况选择服务器提供的日期还是自定义日期。

选择最新修改日期
选择最新修改日期

6.设置网址优先级

优先级的设置可以向搜索引擎展示不同URL的重要程度,有效值的范围是0.0——1.0,默认值为0.5。默认情况下,首页(或抓取的起始页)设置为最高优先级“ 1”,深度的每个级别按优先级递减0.1。当然你也可以根据自己的喜好进行调整。不过,URL的优先级不会影响它们在搜索引擎中的排名,只是用来增加重要页面被爬网和建立索引的可能性。

设置网址优先级
设置网址优先级

7.选择页面的更改频率

选择“Calculate from Last Modified header“意思是如果该页面在24小时以内修改过,地图会默认设置为每日更新,否则就是每月更新。

选择“Use crawl depth settings”,可以根据优先级设置更新的频率。

选择页面的更改频率
选择页面的更改频率

8.选择要包含在站点地图中的图像

如果选中“Include Images”选项,则默认情况下将包括“Internal”和“Images”下的所有的图像。

选择要包含在站点地图中的图像
选择要包含在站点地图中的图像

9.包含Hreflang

如果已经通过属性或HTTP标头在网站上设置了hreflang,则可以选择将hreflang添加到Sitemap中。

将hreflang添加到sitemap
将hreflang添加到sitemap

10.单击“下一步”以生成网站地图

完成各种站点地图属性和选项的配置后,只需单击“下一步”即可创建XML站点地图。一个站点地图文件不能包含超过50,000个URL,并且未压缩的文件不得超过50 MB。因此,如果您的URL超过了,尖叫青蛙会自动创建其他站点地图文件。

生成网站地图
生成网站地图

以上就是用尖叫青蛙Screaming Frog SEO Spider 创建网站地图的全部过程。根据操作步骤和截图,即使不会英文也可以轻松完成sitemap的制作。如果还有不清楚的,可以在下方留言。

0 0 vote
评分
Subscribe
提醒
guest
0 评论
Inline Feedbacks
View all comments

文章目录

最新文章
0
Would love your thoughts, please comment.x
()
x
Scroll to Top

request a quote