网站首页 美食营养 游戏数码 手工爱好 生活家居 健康养生 运动户外 职场理财 情感交际 母婴教育 时尚美容

如何禁止爬取网页中的链接

时间:2024-10-14 04:12:44

1、首先我们创建一个robots.txt

如何禁止爬取网页中的链接

2、根据Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。

如何禁止爬取网页中的链接

3、在robots.txt文档中加入Disallow: *.htm,保存文件。

如何禁止爬取网页中的链接

4、将保存的文件上传到网站的根目录。

© 2025 一点资料
信息来自网络 所有数据仅供参考
有疑问请联系站长 site.kefu@gmail.com