■ 全文搜索引擎
在搜索引擎分类部门我们提到过全文搜索引擎从网站提守信息竖立网页数据库的概念。搜索引擎的自动信息汇集功能分两种。一种是按期搜索,即每隔一段时刻(好比Google日常是28天),搜索引擎自动派出“蜘蛛”法式,对必然IP地址局限内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址插手自己的数据库。
另一种是提交网站搜索,即网站拥有者自动向搜索引擎提交网址,它在必然时刻内(2天到数月不等)定向向你的网站派出“蜘蛛”法式,扫描你的网站并将有关信息存入数据库,以备用户盘问。因为近年来搜索引擎索引划定礼貌发生了很年夜转变,自动提交网址并不担保你的网站能进入搜索引擎数据库,是以此刻最好的设施是多获得一些外部链接,让搜索引擎有更多机遇找到你并自动将你的网站收录。
当用户以要害词查找信息时,搜索引擎会在数据库中进行搜寻,若是找到与用户要求内容合适的网站,便接纳出格的算法——凡是凭据网页中要害词的成家水平,泛起的位置/频次,链接质量等——策画出各网页的相关度及排名等第,然后凭据联系关系度高卑,按挨次将这些网页链接返回给用户。
■ 目录索引
与全文搜索引擎对比,目录索引有许多分歧之处。
首先,搜索引擎属于自动网站检索,而目录索引则完全依靠手工垄断。用户提交网站后,目录编纂人员会亲身浏览你的网站,然后凭据一套自定的评判尺度甚至编纂人员的主不雅观印象,决意是否接纳你的网站。
其次,搜索引擎收录网站时,只要网站目录搜索,如Google就借用Open Directory目录供给分类盘问。而象 Yahoo! 这些老牌目录索引则经过过程与Google等搜索引擎合作扩年夜搜索局限。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中成家的网站,如国内搜狐、新浪、网易等;而其余一些则默认的是网页搜索,如Yahoo。