
一、robots文件的作用


1. robots文件是搜索引擎蜘蛛(Robot)在网站上进行爬取时遵守的一个协议。


2. 它能够告诉搜索引擎哪些页面可以被爬取,哪些不能,也就是说它允许我们对搜索引擎机器人进行权限分配。

3. 通过robots文件我们可以显式地声明要隔离出去的目录或者文件,否则会浪费大量带宽耗时把不必要的内容都加入到数据库中。

4. 此外robots文件还能够帮助你将特定页面标注为“noindex”, 这样就不会出现在Google 等搜索引擎中。


1. 首先要正确生成并放好robots文件: robots 文本应该包含User-agent字样, User-agent字样之后是*(通配)代表所有机器人; Disallow字样之后是想要隔离出去的相对URL; Allow字样之后是想要允许通行的相对URL; Sitemap 字样之后是sitemap 的url地址。

2. 对已有内容重写: 有时因为前端代理问题, 某些内容会造成重复, 这时就可使用Disallow来避免重复内容出来影响seo效果;

3. 针对版规保留版权信息: 有很多版权信念都会针对性地使用Allow/Disallow方法将版权信念隔集出去;

4. 针对404 Not Found : 404 Not Found也会造成seo问题, 这时也可使用Disallow方法将404 Not Found隔集出去;





