SEO 的规范标签 - 终极指南
文章目录
如何优化重复内容
优化重复内容可能是一项真正的斗争。 特别是如果管理一个包含数千或数百万个页面的大型网站。
让我们一步一步地解决这个问题!
使用规范标签
规范标签向搜索引擎显示包含给定内容的主要版本的页面。这也是机器人应该索引的页面。
配置好内部链接
决定 URL 的规范版本了吗?如果你这样做了,请检查你网站的内部链接,并确保每个链接都指向正确的 URL 版本。
你也可以联系 Nat 进行内部链接优化。
添加从非规范 URL 到其规范版本的重定向
决定机器人是否应该抓取你的重复内容
此决定取决于重复内容的类型以及你打算如何处理它。
如果你想重定向重复的页面,请记住 Google 需要能够抓取这些 URL。否则,它将看不到重定向,也不会遵循它们。
如果你重写了副本或向内容的主版本添加了规范标签,也会出现这种情况。Google 将需要抓取该页面以再次测试其质量。
但是,如果你有重复的内容,这些内容对你的网站没有价值,并且您无法对其进行更改,该怎么办? 然后,在你的 robots.txt 文件中阻止搜索引擎访问它。
使用 noindex 标签
向不应被搜索引擎索引但应保持对用户可见的页面添加 noindex 标签。
特别是,你应该在 内部搜索结果页面中添加 noindex 标签。这是因为你的内部搜索结果可能会创建你的页面的不同变体。
即使用户生成相同或相似的 URL,机器人也不会将这些页面编入索引。可以使用 Robots Exclusion Checker 工具 检查给定页面是否使用 noindex 标签:
但是,如果你看到内部搜索页面可以回答用户意图,请随意将其保留为可索引。
你需要注意的是同时使用 canonical 和 noindex 标签,因为它们可能会向机器人发送混合信号。 在一个页面上使用这两个标签最终可能会导致机器人选择与你预期的不同的规范页面。
调整 URL 结构
URL 结构的微小差异使机器人将您的页面视为单独的 URL。当这些页面包含独特的内容时,这很好。但是拥有两个具有相同内容的不同 URL 是创建重复项的一种简单方法。
请注意以下几个方面,以避免不一致的 URL 结构:
wwws 和非 wwws
网站上可能有用户可以访问的 URL:
- 没有像 example.com 这样的 wwws,以及
- 通过包含 www 的 URL,例如 www.example.com。
无论是否添加 www,无论使用哪种协议,都要确保它是一致的。
是否发现任何 URL 不遵循所选模式?然后,将 301 重定向用于导致首选版本的非首选方式。
小写和大写字符
Google 会将 URL 视为区分大小写。因此,对于 Google,example.com/page 和 example.com/PAGE 将是两个不同的页面。
在 URL 中使用小写字符是惯例。因此,如果混合使用小写和大写,则可以创建具有相同内容的不同 URL。
选择具有首选大小写的 URL,并将不正确的版本重定向到该 URL。
尾部斜杠
机器人会将带和不带尾部斜杠的相同 URL 视为不同的页面。example.com 和 example.com/ 就是这种情况。
再次确保坚持相同的 URL 模式并在必要时重定向错误的页面。
跟踪或筛选参数
觉得筛选出产品有用吗?我当然知道!我几乎每次在网上购物时都会使用它。
可悲的是,它往往会生成具有相同或相同内容的堆积如山的 URL。 这方面的一个例子可能是
https://www.example.com/clothes/dresses?size=medium。
使用 URL 参数进行跟踪是重复内容的另一个来源。这些可能是 UTM 参数,用于跟踪来自 Twitter 或您的时事通讯的访问。下面是一个示例:
https://example.com/page?utm_source=twitter。
将规范标签从参数化 URL 添加到没有跟踪参数的页面 。
会话 ID
对于某些网站,访客请求的每个 URL 都会附加一个会话 ID。但是,从搜索引擎的角度来看,具有会话 ID 的 URL 是没有会话 ID 的页面的重复项。
应该做的是将附加会话 ID 的 URL 规范化为它们的 URL 等效项,而无需该附加信息。
仅打印 URL
在单独的 URL 中拥有页面的仅打印版本意味着同一内容有两个版本。
优化内容
有价值的页面应该进行排名并增加流量。 确保它们包含针对特定用户意图的独特、高质量内容。
以下是优化时需要考虑的一些内容方面:
改进产品页面
是否从制造商处复制通用商品描述?好吧,这可能不是电子商务网站的最佳策略。这可能会导致跨不同域的重复内容问题。
相反,请包含有关产品或服务的更多信息,例如,在常见问题解答中。
创建独特且相关的类别页面
搜索引擎喜欢解决用户意图的独特内容!浏览类别并考虑每个类别是否必要。
问自己两个问题:
- 这些类别对用户有什么帮助?
- 它们如何适应网站结构?
接下来可以做什么? 考虑删除一些页面或将它们合并为一个页面。 对类别中可用的任何筛选或排序选项执行相同的操作。
合并内容
创建补充内容
补充内容可以使重复页面更加独特和有价值。它还增加了他们获得索引和排名好的机会。考虑改善用户体验以及什么对访问者最有帮助。
为此,请浏览内容较少的页面,并考虑是否可以添加任何内容。
管理用户生成的内容
用户创建的独特、全面的内容可能对你的网站有益。 鼓励客户留下评论并将其显示在页面上。
此外,防止网站上出现稀薄或重复的用户生成内容。 例如,设置用户在网站上发布评论或广告时需要编写的字符数限制。
优化国际内容的投放
如果有相同的内容来定位不同的区域,但使用相同的语言,则机器人可能会认为这些版本是重复的。 添加 hreflang 标签以向 Google 显示您要覆盖的语言和国家/地区。
有时 Google 可能会将内容视为重复内容,即使 hreflang 属性已就位。然后,它可以将两个或多个版本折叠在一起。通常,这可能不是一个严重的问题,但它仍然会影响用户体验。
此外,请记住创建适合您目标特定国家/地区的内容。努力本地化内容,尤其是针对战略性国际市场的内容。
联合内容
在不同的网站(例如 medium.com)上重新发布内容可能是将内容展示给更广泛的受众的好方法。 如果指明其主要版本,例如在你的网站上,Google 不会将联合发布视为重复内容。 因此,请记住向原始源添加 canonical 标签。
此外,请确保其他网站包含指向原始内容的链接并指向正确的 URL。
禁用对暂存环境的访问
例如,WordPress 会自动生成标签和类别页面。此类页面可能会严重浪费爬虫的资源。它们通常可能几乎是空的,Google 通常会将它们视为几乎重复。
可能还会发现,CMS 会为不包含任何其他内容的图像创建单独的页面。
如何防止此类重复问题? 将 noindex 标签添加到不需要的页面或在 CMS 中禁用这些功能 。
删除重复内容
在以下情况下 ,将重复页面的状态代码更改为 404 或 410:
- 它们对访客或业务没有任何用途,并且
- 不打算改进它们。
两种状态代码具有相同的长期后果。但请注意,410 可以从索引中删除页面,并限制其比 404 更快的抓取速度。
优化重复内容如何影响网站
以下是管理重复内容如何帮助网站的 3 个主要方面:
增加网站的排名潜力
帮助搜索引擎决定他们应该首先索引和显示哪个页面。
允许机器人分配从反向链接到你的页面的排名信号
如果几个页面上存在相同的内容,则许多 URL 可能会收到来自其他域的链接。它可以拆分页面之间的总链接权限。
节省抓取预算并避免索引问题
应该始终希望将抓取预算花在抓取有价值的内容上。不要让搜索引擎机器人一遍又一遍地浪费一些资源来抓取相同的内容。
您可以让搜索引擎更容易看到您想要索引的页面版本。创建合理的索引策略将帮助你避免自我诱导的索引问题 。
此外,它还可以防止搜索引擎将您的整个网站视为低质量 。
后续步骤
关于重复内容的Q&A
如何找到重复的内容?
使用 Copyscape 查看页面中的哪些内容显示在 Web 上。
使用 Siteliner 查找网站上的重复内容问题。它能发现网站上的网页内容如何相互匹配。
如何使用 Google Search Console 查找重复内容问题?
访问 编制索引–网页 报告。然后,前往 未索引 图表下方的列表。该报告可以显示有关重复内容问题的以下状态,例如:
重复而不使用用户选择的规范
Google 发现了未规范化为首选版本的重复 URL。通过导航到 URL 检查工具,检查 Google 选择哪个 URL 作为规范 URL。
修复此问题并自行选择规范 URL。
重复,Google 选择的规范与用户不同
Google 忽略了指定的规范标签。然后,它选择了它认为更合适的其他规范 URL。
重复且提交的 URL 未被选为规范 URL
提交的 URL 没有规范 URL。Google 认为提交的 URL 是重复的,因此它选择了不同的规范。
再次,将规范标签添加到首选 URL。
重复内容的原因是什么?
大多数情况下,出现重复内容的原因如下:
- 糟糕的 Web 开发 ,例如,未优化的 CMS 平台,以及
- 站点上的错误实现,例如,错误的服务器配置。
我们可以在所有类型的网站上找到重复项,但大型网站更容易出现。
哪些内容类型可能会生成重复内容?
重复内容可能特别令人担忧:
博客部分
如果创建许多,例如比较文章,最终可能会得到与各种文章类别匹配的内容。因此,许多不同类别的 URL 可以指向同一篇文章。
作为内容创作者,这是我绝对会尽量避免的事情。
用户生成的内容
它适用于包含用户创建的帖子、广告、个人资料页面等的任何网站。通常,用户可能会使用复制或垃圾邮件文本,或者仅在个人资料页面上添加指向他们网站的链接。
来自其他域使用的数据库的列表
例如,这些是市场或房地产网站。因此,相同的广告或帖子可能会在多个网域中展示。
收集相关主题内容的标签
可以在新闻网站上找到它们。在某些情况下,页面可以使用许多标签并显示在站点的不同位置。
电子商务网站的哪些元素容易重复?
电子商务网站上的重复内容通常适用于以下方面:
- 几乎没有内容 的产品页面 。 此外,它还涉及在许多页面上使用制造商的产品描述。
- 带有过滤器的类别页面 ,可在多个页面上显示相同产品的列表。
如果你有一个电子商务网站,就会知道这些页面如何转化为业务收入。因此,优化页面应该是首要任务。
重复内容会导致 Google 处罚吗?
如果它是由恶意活动引起的,是可以的。
抓取内容是与重复内容相关的操纵行为的一个示例。当有人从你的页面中获取内容并在他们的网站上重新发布时,就会发生这种情况。
可以使用保护措施来保护您的内容免受此类行为的影响。 添加指向现有页面的自引用规范标签。