搜索引擎机器人
作者:佚名 | 原创 来源:优化网 | 时间:2010年9月3日| 点击:0次 | 【评论】

   新站点不需要“提交”到搜寻引擎才能登记上市。一个来自于以建立好的、其他站点的简单链接就会让搜寻引擎拜访新站点,并且开始‘爬’过该站内容。它可能得花几天甚或几周从这样一个已建立站点取得链接,并使所有主要搜索引擎开始拜访并索引新站点。

   一旦搜索引擎发现了新站点,它一般将拜访和开始索引该站,直到所有标准的 <a href> 超连结被链结的页索引到为止。只能透过Flash或JavaScript才能拜访的链结可能不会被蜘蛛机器人找到。

   当搜索引擎的蜘蛛机器人爬过一个站点时会取决相当数量的不同因子,并且该站的许多页可能不会被索引到除非它们网页级别、连结、或流量增加到一个程度。从站点的根目录到该页的距离,以及其它比重考量,也许也是决定是否该页得到检索的因素。Cho et al.(Cho et al. 1998) [6] 描述了哪些页会被拜访、哪些会收入搜寻引擎索引的决定标准。

   网站员可透过在网域根目录里标准robots.txt档案指示蜘蛛机器人不索引某些文件或目录。标准的实现要求是搜索引擎在拜访这个网域时参考这个文件,虽然搜索引擎的蜘蛛机器人当它拜访某站点网页时将保留这个文件的快取拷贝,并且更新速度没像网站员那么快。网站发展人员可能使用这个特性防止某些页,譬如购物车或其它动态、特定使用者的内容出现在搜索引擎结果中,并且防止机器人进入死循环和其它机器人陷阱。

   对于某些有偿提交的查寻引擎(像雅虎),支付象征性费用提交也许会节省一些时间,虽然雅虎有偿提交方案不保证提交人/公司包括在他们的查寻结果中。

【全文完】

此稿件DOC下载:搜索引擎机器人.doc

 

0 (0)
0 (0)



声明:优化网·网站内容中凡注明“来源:XXX(非优化网·网站优化专家)”的作品,均由优化网·会员原创或转载自其它媒体,转载目的在于传递更多信息,其中涉及的网站优化,百度关键词优化,谷歌优化等技术细节并不代表本优化网·赞同支持其观点,并不对其真实性负责。对于署名“优化网·网站优化专家”的作品系本站版权所有,任何人转载请署名来源,否则优化网·将追究其相关法律责任。

优化网·网站优化专家 7x24小时咨询服务热线:13281838323 信息产业部备案号:黑ICP备09098469号 Email:Web.Seo@qq.com
地址:广州番禺文化路红光大厦4楼102座 邮编:511400 传真:13281838323