网站优化请联系客服报价!
当前位置:八吉SEO > SEO技巧 > 正文

说说我对搜索引擎原理的理解

08-28 SEO技巧

《百度搜索引擎优化指南2.0》、《百度搜索引擎网页质量白皮书》这两篇资料认真阅读后,配合树屿老师课上所说内容,我总结了一些自己 的理解和看法,现在来分享一下,希望让同学们来比较给一下建议  一.抓取(收录):以百度平台为例,我们经常听说“百度蜘蛛(Baiduspider)”这个词,这就是百度的抓取程序,我们也俗称“爬虫”,百度就是通过这样的程序来抓取我们网站的内容,当然,每个搜索平台都有属于自己的抓取程序。
    主要原理:通过网站的超连接来里面的内容;

说说我对搜索引擎原理的理解



  二. 抓取方式
    1.深度抓取,意思就是层层递进法,从页面1到页面2,再从页面3到页面4,是一个纵向抓取式,基本大多数的企业网站都是这种深度抓取法,其特点就是抓取时间慢一些,大概是1-2天才能抓取并收录。
    2.另外一种就是广度抓取法,简单来就是横向式抓取,只有权重高的网站才有广度抓取,特点就是一次性抓取,速度快。
    
   三.不利于抓取的内容:就是搜索平台不能很容易地识别或者不能辩别的内容
    1.JavaScript的程序语言,,难识别不适合;
    2.图片,就单单一张图片会增加搜索平台的识别难度,所以图片最好还是要Alt属性;
    3.Flash(视频),搜索引擎一般都识别不了视频的内容,所以一般在视频的周围来添加一些有关视频内容的标题或者文字说明来有助识别;
    4.iframe程序框架,难识别不适合;
    5.嵌套table,其实说的就是程序所生成的表格列表,难识别不适合;
    6.需要登录信息或者设置权限的页面


  四.过滤:搜索引擎会过滤低质量的内容页面
    1.抄别人内容的,没有任何价值或者对用户没有产生帮助的内容;
    2.偏离主题,完全不对主题的;
    3.内容过于简单的,全广告性质的;


  五.存储索引库:就是搜索引擎确定你的网站内容是对用户产生价值或者能帮助客户解决问题的,搜索引擎就会把你的内容收录并放到一个专门为有价值、好信息所建立的数据库(等同于评分高的表现)

版权保护: 本文由 八吉SEO 原创,转载请保留链接: http://shseo.8ji.cn/html/530.html