论坛风格切换切换到宽版
  • 9234阅读
  • 0回复

搜索引擎相关基本概念 [复制链接]

上一主题 下一主题
离线北京SEO
 
只看楼主 倒序阅读 0楼 发表于: 2008-07-03
1.1 WEB搜索引擎的定义

WEB搜索引擎(WEB Search Engines)是一个对Internet上的信息资源进行搜集整理,然后供用户查询的系统。网络服务商开发搜索引擎网络信息资源管理供用户在Internet上查找所需信息的检索工具。它包括信息搜集、信息整理和用户查询三个部分。

互联网络规模的发展壮大,网络信息数量的爆炸性增长,催生了网络信息检索工具的升级换代。根据CNNIC的数据,截至2005年6月30日,中国互联网用户数量已经突破1亿,达到了1.03亿。主要应用在网络广告,电子商务,网络游戏,搜索引擎,即时通讯,移动增值,虚拟增值等方面。其中,搜索引擎是已经成为网络服务商和互联网用户等多方关注的热点。据艾瑞研究显示:2006年搜索引擎市场规模将达到16亿。2007年市场规模将达33亿多元!

1994年,第一个Web搜索引擎,webcrawler出现,到目前为止,已经发展到第三代搜索引擎。第一代搜索引擎:以雅虎为代表的目录分类搜索引擎;第二代搜索引擎:以google,百度为代表的关键词搜索引擎;“所谓的三代搜索引擎”: 以中国搜索,搜狗为代表的搜索引擎,此类搜索引擎是对整个网页做一种分析和数据挖掘,不仅要找到更多的结果,而且要更加智能化、人性化、更加精确,能够理解用户需要什么结果、然后进行聚合和整理。

1.2 WEB搜索引擎的工作原理

WEB搜索引擎的基本原理是通过网络机器人定期在web网页上爬行,然后发现新的网页,把它们取回来放到本地的数据库中,用户的查询请求可以通过查询本地的数据库来得到。主要包括3个过程。

⑴.搜集互联网资源信息

搜索引擎通过使用网页搜索软件机器人或蜘蛛程序定期或不定期地在网上漫游收集信息并对收集到的网页信息进行自动标引。不同的搜索引擎完成这些工作的更新速度和综合性方面是不同的。

⑵.提取和组织信息,建立索引库

搜索引擎根据收集回的信息进行分类和标引,并建立索引数据库。这是建立搜索引擎的核心步骤。不同的搜索引擎在搜索结果的数量和质量上有明显的差异,有的索引软件建立的索引是对WEB页中每一个单词进行标引;有的则是从文章中按某些分类或特征对信息进行抽取;有些还以网站的热门程度来决定是否将该网站收录在索引中。其次。不同的搜索引擎其标引的范围也不一样,有的只标引WWW,有的除标引WWW之外,还包括FTP和USENET。这种标引方式的差异决定着相同的检索请求在不同的搜索引擎中的结果。一般来说。标引的索引词越多,检索的全面性越高,而查准率就相对较底。

⑶.提供信息检索服务

检索程序根据用户输入的查询关键词,在索引中快速检出相关文档,进行文档与查询内容的相关度比较,对检出的结果进行排序,并将查询结果返回给用户。搜索引擎数据库建立以后,每个搜索引擎都必须提供一个良好的信息查询界面,并具有帮助功能。
评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
SEO Research
快速回复
限100 字节
 
上一个 下一个