怎样写好网站的robots.txt文件

文章详情

做网站当然希望搜索引擎抓取我们网站的内容,但我们做SEO优化SEO优化时候并不希望所有的信息都公布于众,比如后台隐私,或者其它一些杂七杂八的信息。那么这时候我们就可以能过robots.txt文件来控制网站在搜索引擎中的展示,robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被搜索引擎robots访问的部分。


带“*”的一种写法:

User-agent: *

Disallow: /ad*

Allow: /ad/img/

Disallow: /*.php$

Disallow: /*.jsp$

Disallow: /*.css$


这种写法允许所有蜘蛛访问,但会限制以“ad”开头的目录及文件,并限制抓取.php文件、.jsp文件和.css文件。其中Disallow: /ad*会连同附件目录(即你上传的图片、软件等)一起限制抓取,如果想让搜索引擎抓取img目录中的内容,需要将写上第三行“Allow: /ad/img/“。


较合理的一种写法:

User-agent: *

Disallow: /admin

Disallow: /content/plugins

Disallow: /content/themes

Disallow: /includes

Disallow: /?s=

Sitemap:https://www.sucai51.cn/


采用这种写法允许所有搜索引擎抓取,并逐一列举需要限制的目录,同时限制抓取网站的搜索结果,最后一行代码是你网站的Sitemap路径,大多数搜索引擎都会识别它。

如果对自己写的robots.txt不放心,建议你使用Google管理员工具中的“工具->测试robots.txt”来对你的robots.txt进行测试,确保你的修改正确。

收藏:0
来源:网站建设网

版权:所有文章为演示数据,版权归原作者所有,仅提供演示效果!

转载请注明出处:https://wzjianshe.com/wzjs/5803.html

相关推荐
迅睿CMS网站表单留言提交之后通知会员作者自己
知识点:表单提交之后的钩子、自定义通知设置 1、先创建自定义通知脚本,文件位置:dayrui/My/Config/Notice.php 代码如下:
2024-11-10
15
迅睿CMS将独立模块首页改为网站首页
在使用迅睿cms建站时,有时会遇到此类需求,想要将其他独立模块的首页用作网站的主页,访问域名时,首页展现的是该独立模块的首页内容。笔者这里以demo模块为例,做一个说明。大多数情况下,迅睿cms的默认首页模板解析的是:index.html,demo独立模块首页模板解...
2024-11-10
67
迅睿CMS如何让网站的前端控制器禁止访问
让网站的前端控制器禁止访问,只保留后台控制器的访问开发思路:在cms运行后钩子中判断如果来自前端页面就禁止往下执行/config/hooks.php\Phpcmf\Hooks::on('cms_init', function() { if (IS_AD...
2024-11-10
99
迅睿CMS外部网站如何调用CMS数据
在外部网站或者静态html页面上调用迅睿cms数据方法1、在迅睿cms中开启开发者模式,index.php开启2、然后访问迅睿cms首页,并查看源代码,如下图:3、按照上图红线地址,创建一个模板/template/pc/default/home/api/waibu....
2024-11-10
56
发表评论