代码之家  ›  专栏  ›  技术社区  ›  Dimitar Christoff

mod_重写和冗余/旧URL,需要一些SEO最佳实践

  •  1
  • Dimitar Christoff  · 技术社区  · 14 年前

    看看谷歌目前对我们的网站的看法,并得出结论… 基本上,我们使用BOG标准的URL重写结构,使它们看起来对SEO友好。

    例如,产品URL的形状为 any string_([0-9]).html 诸如此类。当然,这允许我们在产品ID之前链接到我们想要的任何东西…我们已经做到了。过去,产品页面是 Product_Name_79.html 然后变成 Brand_Name_Product_Name_79.html . Apache并不关心,在这两种情况下,ID79都会被传递。然而,Google现在有两个版本的产品缓存在不同的URL下——这不是一件好事,因为它继续到达第一个URL并对其进行蜘蛛攻击。

    同样的事情也适用于我们对品牌和类别的重写规则,其中一些已被删除,一些已被修改。

    中有超过11K个URL site:domain 而我们的站点地图只有5.8公里。如何防止spider获取不再链接到的旧版本的URL(考虑到这不是一个手动过程,而且通常这样的URL是动态的)。

    如, Mens_Merrell_Trail_Running_Shoes__50-100__10____024/ 是的动态URL merrell 品牌,按商品缩小 trail running shoes 成本介于 50 and 100 size 10 性别设置为 men's .

    如果我们决定 nofollow 任何大小和金钱的过滤网址,使谷歌仍然能够通过其旧的缓存访问它们…

    禁止特定类型的URL的最佳实践是什么?由于上面的组合几乎是无限的,我不能列出一个列表,而且它肯定不能追溯到谷歌历史上为我们保留的品牌和类别。

    当使用这种滤波器时,我们要加噪声吗?我们可以把它们导出到robots.txt吗?希望谷歌不会再回来了吗?

    为了透视它,我们有2600个产品页面URL,它们现在是冗余/禁用的,您将如何处理它们?重定向到主页,品牌页面,404,什么都不做?

    谢谢你的建议

    2 回复  |  直到 7 年前
        1
  •  2
  •   Haroldo    14 年前

    我想你在找 rel="canonical" 如果你的链接真的没有链接,谷歌应该开始忽略你的链接。您可以使用如下工具检查任何传入链接: http://www.seomoz.org/linkscape .

    另外,如果您的旧URL匹配(或不匹配)一个consisent模式,您可以在Apache中为匹配旧模式或不匹配新模式的页面设置301重定向…

    希望这有帮助!

        2
  •  0
  •   Sevenatoms    7 年前

    只要确保为您更改的任何URL设置重定向。另外,我不建议使用rel=nofollow,因为它向谷歌表明你的网站不可信。