看看谷歌目前对我们的网站的看法,并得出结论…
基本上,我们使用BOG标准的URL重写结构,使它们看起来对SEO友好。
例如,产品URL的形状为
any string_([0-9]).html
诸如此类。当然,这允许我们在产品ID之前链接到我们想要的任何东西…我们已经做到了。过去,产品页面是
Product_Name_79.html
然后变成
Brand_Name_Product_Name_79.html
. Apache并不关心,在这两种情况下,ID79都会被传递。然而,Google现在有两个版本的产品缓存在不同的URL下——这不是一件好事,因为它继续到达第一个URL并对其进行蜘蛛攻击。
同样的事情也适用于我们对品牌和类别的重写规则,其中一些已被删除,一些已被修改。
中有超过11K个URL
site:domain
而我们的站点地图只有5.8公里。如何防止spider获取不再链接到的旧版本的URL(考虑到这不是一个手动过程,而且通常这样的URL是动态的)。
如,
Mens_Merrell_Trail_Running_Shoes__50-100__10____024/
是的动态URL
merrell
品牌,按商品缩小
trail running shoes
成本介于
50 and 100
和
size 10
性别设置为
men's
.
如果我们决定
nofollow
任何大小和金钱的过滤网址,使谷歌仍然能够通过其旧的缓存访问它们…
禁止特定类型的URL的最佳实践是什么?由于上面的组合几乎是无限的,我不能列出一个列表,而且它肯定不能追溯到谷歌历史上为我们保留的品牌和类别。
当使用这种滤波器时,我们要加噪声吗?我们可以把它们导出到robots.txt吗?希望谷歌不会再回来了吗?
为了透视它,我们有2600个产品页面URL,它们现在是冗余/禁用的,您将如何处理它们?重定向到主页,品牌页面,404,什么都不做?
谢谢你的建议