以下是它们的工作原理以及何时使用它们。
内容
什么是规范标签?
规范标签(rel= “ canonical “)是一段HTML代码,当存在类似或重复的url时,它告诉搜索引擎哪个页面版本是主页面。这有助于确保只有主版本被索引。
下面是一个典型标签的例子:
您指定的URL是要编入索引的页面的主版本。
什么时候应该使用规范标签,为什么它们对SEO如此重要?
只要在多个url中有相同或类似的内容,就应该使用规范标记。
以下是导致这种情况发生的众多原因中的几个:
你有重复的内容在url与不尾随斜杠(例如example.com/和example.com)
你在桌面和移动版本的页面上有重复的内容(例如,example.com和m.example.com)
在url的参数化版本中有重复的内容(例如,example.com和example?tracking-code)
旁注。如果您要在其他网站上联合或重新发布内容,则是使用规范标记的另一个时机。如果你不这样做,谷歌就有可能把内容的联合或重新发布版本当作原创,并在搜索结果中将其排在你的网站前面。
例如,假设您有一个销售小部件的电子商务商店。您可能在这个URL上有一个分类页面,列出了所有蓝色小部件:example.com/widgets/blue/。但是,当访问者应用产品过滤器example.com/widgets?color=blue时,完全相同的内容可能会在这样一个丑陋的URL上访问
除非指定规范,否则URL的“错误”版本可能会被索引并出现在搜索结果中。
规范标签也有助于确保像链接这样的排名信号整合到一个页面上。这一点很重要,因为链接是一个确定的谷歌排名因素,链接和流量之间有很强的相关性。
过多的重复内容也会消耗“抓取预算”,这就是谷歌浪费资源抓取重复版本的内容,而不是您真正想要索引的新页面。当然,它最终可能会发现它不应该定期抓取页面,但它必须先抓取页面,然后才能这样做——这就浪费了抓取预算。
如何为您的网站添加规范标签
您可以通过将 手动添加到页面代码的部分,但几乎没有人这样做,因为这太麻烦了。通常通过你的网站平台更容易做到这一点。
无论你选择怎样做,一定要遵循以下黄金法则:
使用绝对url。谷歌表示不要使用相对url(例如,示例页面/),尽管它们得到了支持。这意味着你应该在规范标签中指定完整的绝对url(例如,https://example.com/sample-page/).
使用正确的域。如果您切换到SSL(您现在应该有了!),请确保您没有在规范标记中声明任何非SSL(即HTTP) url。这样做可能会导致谷歌方面的混乱和意想不到的结果。
每页只指定一个规范。如果声明了多个规范,谷歌将忽略所有声明的规范。
让我们来看看几个流行平台的流程。
在WordPress中设置规范标签
安装Yoast SEO,然后滚动到页面或帖子的“高级”部分,在那里你会看到一个指定规范的选项。
在Wix中设置规范标记
跟随他们一步一步的指导。与WordPress相比,它有点复杂,但它仍然是可能的。
在Shopify中设置规范标签
Shopify很好地处理了开箱即用的规范化。这是否意味着它总是完美的?不。但是大多数中小型商店可能不需要手动添加规范标记。如果需要的话,我建议获得开发人员的帮助,因为您需要编辑主题的代码。液体文件)直接。
在Squarespace中设置规范标签
转到页面的高级设置,您可以将规范标记注入标题中。
声明规范url的其他方法
规范标记并不是声明页面规范的唯一方法。你可以使用其他三种方法:
重定向
rel= HTTP报头中的“ canonical ”
网站地图
旁注。如果这些都没有使用,谷歌将依赖其他信号,如hreflang、内部链接和URL长度,如果它认为您有重复的内容,则为您选择一个规范。
重定向
谷歌说只有在删除重复的页面时才使用这个,因为它会将Googlebot(和访问者)重定向到不同的URL。对于由于HTTP和HTTPS页面都可访问而导致的重复内容,这是一个特别有用的选项。
进一步的阅读
301重定向解释:它们如何影响SEO
rel= HTTP报头中的“ canonical ”
对于像pdf这样的文档,没有办法在页头中放置规范标记,因为没有page
节。在这种情况下,您需要使用HTTP头来设置规范。下面是这篇博文的PDF版本:
Http /1.1 200 ok
内容类型:应用程序/ pdf
链接:< https://ahrefs.com/blog/canonical-tags/ >;rel = “规范“
您也可以在标准网页的HTTP标头中使用规范。
进一步的阅读
如何添加规范标签到HTTP头
网站地图
站点地图中应该只列出规范的url,尽管谷歌说这样做是一个弱的规范化信号。
旁注。内部和外部链接都是另一个规范化信号,正如John Mueller在这个视频中提到的。
常见的规范化错误和最佳实践
规范化可能很复杂。正因为如此,关于如何正确规范化存在很多误解和误解。
错误#1:通过robots.txt阻止规范化URL
阻止robots.txt中的URL可以防止谷歌抓取它,这意味着它无法在该页上看到任何规范标记。这反过来又阻止了它将任何“链接权益”从非规范网站转移到规范网站。
错误#2:将规范化URL设置为noindex
不要混合使用noindex和rel=canonical。它们是相互矛盾的指示。
John Mueller在Reddit上说谷歌通常会优先考虑canonical标签而不是noindex标签,但这并不是一个保证。b谷歌的官方文档说没有索引会完全从搜索中删除该页面。这可能是期望的最终结果,但是其他规范化方法应该具有相同的效果而没有潜在的缺点(例如,谷歌不能合并“链接权益”)。
错误#3:为规范化的URL设置4XX HTTP状态码
为规范化URL设置4XX HTTP状态码与使用noindex标签具有相同的效果:谷歌将无法看到规范化标签,因此无法将“链接权益”转移到规范化版本。
错误#4:将所有分页页面规范化到根页面
谷歌表示不要将分页页面规范化为系列中的第一页。
旁注。您还应该使用rel=prev/next标签进行分页。b谷歌不再使用这些,但必应仍在使用。
错误#5:不使用hreflang规范标签
Hreflang标签用于指定网页的语言和地理目标。
谷歌声明,在使用hreflang时,您应该“使用相同的语言指定一个规范页面,或者如果没有相同语言的规范,则指定最好的替代语言”。
错误6:使用多个rel=canonical标签
拥有多个rel=canonical标记可能会导致它们被谷歌忽略。在许多情况下,这是因为标签是在不同的位置插入系统的,比如CMS、主题和插件。这就是为什么许多插件都有一个覆盖选项,以确保它们是规范标记的唯一来源。
另一个可能出现问题的地方是JavaScript中添加的规范。如果在HTML响应中没有指定规范URL,然后用JavaScript添加rel=canonical标记,那么在谷歌呈现页面时应该尊重它。但是,如果您在HTML中指定了一个规范,并将首选版本与JavaScript交换,那么您将向谷歌发送混合信号。
错误#7:
中的Rel=canonicalRel=canonical应该只出现在文档的
中。页面部分中的规范标记将被忽略。这在解析文档时可能会成为问题。虽然页面的源代码可能在正确的位置有rel=canonical标记,但当页面实际上在浏览器中构造或由搜索引擎呈现时,许多不同的事情(如未关闭的标记、注入的JavaScript或
节中的如何发现和修复网站上的规范标签问题
规范化很容易犯错误,所以定期审核你的网站是否存在与规范化标签相关的问题,并尽快修复它们是值得的。
你可以用SEO研究院的网站审计来做到这一点,你可以用SEO研究院网站管理员工具(AWT)账户免费使用经过验证的网站。它会抓取你的网站超过170个SEO问题,包括那些与规范标签相关的问题。
以下是Site Audit可能发现的14个典型问题,以及如何解决它们:
1. 规范指向4XX
一个或多个页面被规范化为一个死(4XX) URL。
为什么这是个问题
搜索引擎不索引4XX页面,因为它们不起作用。因此,它们将忽略指向此类页面的任何规范标记,并经常以索引错误(非规范)的页面版本而告终。
如何修复
检查受影响的页面,并将失效的(4XX)规范链接替换为指向您希望建立索引的正常(200)页面的链接。
2. 规范指向5XX
一个或多个页面被规范化为5XX URL。
为什么这是个问题
5XX HTTP状态码表示服务器问题,导致无法访问规范页面。谷歌不太可能索引不可访问的页面,因此可能忽略规范。
如何修复
用有效的url替换任何错误的规范url。如果指定的规范看起来正确,检查服务器配置是否错误。请注意,如果爬行发生在站点停机进行维护或站点服务器过载时,则这可能是一个临时问题。
3. 要重定向的规范点
一个或多个页面被规范化为重定向的URL。
为什么这是个问题
规范应该总是指向一页最权威的版本。这与重定向url的情况不同。因此,搜索引擎可能会误解或忽略规范。
如何修复
将规范链接替换为指向页面最权威版本的直接链接(即,返回200 HTTP状态码且不重定向的链接)。
4. 规范URL没有传入的内部链接
一个或多个指定的规范url没有内部传入链接。
为什么这是个问题
没有内部链接的规范url是网站访问者无法访问的。在网站的某个地方,他们被引导到一个非规范版本的页面。
如何修复
将指向规范化页面的任何内部链接替换为指向规范化页面的直接链接。
5. 规范URL没有传入的内部链接
没有指向一个或多个声明的规范url的内部链接。
为什么这是个问题
因为浏览你网站的人没有办法到达规范的URL。内部链接也是谷歌的规范化信号。
如何修复
检查您的网站导航和链接架构,以确保所有规范页面都易于访问。在可能的情况下,您应该始终在内部直接链接到规范URL。
6. 没有规范的重复页面
存在一个或多个没有指定规范版本的重复或非常相似的页面。
为什么这是个问题
由于没有指定规范,谷歌将尝试确定最合适的版本,以便在搜索结果中显示。这可能不是您想要索引的版本。
如何修复
检查重复组。选择一个应该在搜索结果中编入索引的规范版本。将其指定为所有副本的规范版本(并向规范版本添加自引用的规范标记)。
7. Hreflang to non-canonical
一个或多个页面在其hreflang注释中指定非规范URL。
为什么这是个问题
hreflang标签中的链接应该始终指向规范页面。从hreflang注释链接到非规范版本的页面可能会混淆和误导搜索引擎。
如何修复
将受影响页面的hreflang注释中的链接替换为其规范。
8. 站点地图中的非规范页面
站点地图中列出了一个或多个非规范页面。
为什么这是个问题
谷歌指出不应该在站点地图中包含非规范的url。原因是,他们在站点地图中看到的页面是推荐的经典。您应该只列出您希望在站点地图中索引的页面。
如何修复
从站点地图中删除非规范的url。
9. 指定为规范页面的非规范页面
一个或多个页面指定一个规范化URL,该URL也被规范化到另一个页面。这将创建一个“规范链”,其中将页面a规范化到页面B,然后将页面B规范化到页面C。
为什么这可能是一个问题
规范链可能会混淆和误导搜索引擎。因此,他们可能会误解或忽略指定的规范。
如何修复
将受影响页面的规范标签中的非规范链接替换为到规范的直接链接。例如,如果将页面A规范化为页面B,然后将其规范化为页面C,则将页面A上的规范化链接替换为指向页面C的链接。
10. 打开图形URL不匹配规范
og: URL Open Graph标签和rel=canonical标签中指定的URL不匹配。
为什么这可能是一个问题
这不是谷歌SEO的问题,但一个页面的非规范版本将在社交网络上共享。
如何修复
确保og: URL中指定的URL与规范页面的URL匹配。
11. 规范从HTTPS到HTTP
一个或多个安全(HTTPS)页面指定非安全(HTTP)版本作为规范。
为什么它可能值得修复
HTTPS是一个排名因素,因此在可能的情况下将页面的安全版本指定为规范版本是有意义的。
如何修复
将HTTP页面重定向到等效的HTTPS页面。如果这是不可能的,添加rel= “ canonical “链接从页面的HTTP版本到HTTPS版本。
旁注。谷歌还将实现HSTS列为潜在的解决方案。
12. 规范从HTTP到HTTPS
一个或多个非安全(HTTP)页面指定安全(HTTPS)版本作为规范。
为什么它可能值得修复
HTTPS优先于HTTP。拥有页面的HTTP版本,然后将HTTPS版本指定为规范是不合逻辑的。这可能不会引起大问题,但如果可能的话,仍然值得修复。
如何修复
实现从HTTP到HTTPS的301重定向。您还应该将指向页面HTTP版本的任何内部链接替换为直接指向HTTPS版本的链接。
13. 规范URL更改
在一个或多个url上声明的规范自上次抓取以来发生了更改。
为什么它可能值得修复
它可能指向上次爬行后出现的错误或问题。请记住,声明的规范应该是您希望谷歌索引和排名的页面的版本。
如何修复
检查受影响的页面并确保更改是有意的。
14. 非规范页面接收自然流量
一个或多个非规范页面出现在搜索结果中并获得自然搜索流量(这不应该发生)。
为什么它可能值得修复
规范标记设置不正确,或者谷歌选择忽略指定的规范。
如何修复
检查在所有报告的页面上是否正确设置了rel=canonical标记。如果这不是问题,请使用谷歌Search Console中的URL Inspection工具来查看它们是否认为指定的规范URL是规范的。如果存在不匹配,调查为什么会出现这种情况。
了解有关规范化的更多信息
请阅读我的同事Patrick的规范化指南。他更详细地介绍了规范化信号,以及如何使用谷歌搜索控制台中的URL Inspection工具检查谷歌如何查看URL的规范化。
有问题吗?在领英上联系我。