请告诉我们搜索引擎的历史。
分析:
搜索引擎的发展历史
1990阿奇是加拿大麦吉尔大学计算机学院的师生开发的。那时候万维网还没有出现,人们通过FTP共享交流资源。Archie可以定期收集和分析FTP服务器上的文件名信息,并提供对每个FTP主机中文件的搜索。用户必须输入确切的文件名进行搜索,Archie告诉用户哪个FTP服务器可以下载文件。阿奇收集的信息资源虽然不是网页(HTML文件),但其工作原理和搜索引擎一样:自动收集信息资源,建立索引,提供检索服务。所以阿奇是公认的现代搜索引擎鼻祖。
机器人这个词对程序员来说有着特殊的含义。电脑机器人是指能以人类达不到的速度重复执行一项任务的自动化程序。因为专门用来检索信息的机器人程序像蜘蛛一样在网络上爬行,所以搜索引擎的机器人程序被称为蜘蛛程序。
马修·格雷在1993年开发了万维网漫游者,这是第一个利用HTML页面之间的链接关系来探测万维网规模的“机器人”程序。起初,它只是用来统计互联网上的服务器数量,后来它也能够捕捉网址(URL)。
1994年4月,斯坦福大学的两位博士生,美籍华人杨致远和大卫·费罗共同创立了雅虎。随着访问量和链接数的增加,雅虎目录开始支持简单的数据库搜索。因为雅虎!的数据是人工输入的,所以不能真正归类为搜索引擎。事实上,它只是一个可搜索的目录。雅虎于2002年2月23日收购inktomi,2003年7月24日收购包括Fast和Altavista在内的Overture,2003年6月30日雅虎全资收购3721公司。
1994年初,华盛顿大学的学生布莱恩·平克顿(Brian Pinkerton)开始了他的小项目网络爬虫(WebCrawler)。1994年4月20日,WebCrawler只包含来自6000台服务器的内容。WebCrawler是互联网上第一个支持搜索文档所有单词的全文搜索引擎。在它之前,用户只能通过URL和摘要进行搜索,这些通常来自人工注释或自动提取文本前100个单词的程序。
1994年7月,卡内基梅隆大学的Michael Mauldin将John Leavitt的spider程序连接到其索引程序,并创建了Lycos。除了相关性排名,Lycos还提供前缀匹配和字符相似性限制。Lycos率先在搜索结果中使用网页自动摘要,其最大的优势是远远超过其他搜索引擎的数据量。
1994结尾,Infoseek正式出现。其友好的界面和大量的附加功能使其成为Lycos等搜索引擎的重要代表。
1995年,出现了一种新形式的搜索引擎——元搜索引擎综述。用户只需要提交一次搜索请求,由元搜索引擎负责转换处理,提交给预先选择的多个独立搜索引擎,各个独立搜索引擎返回的查询结果全部收集处理后再返回给用户。第一个元搜索引擎是华盛顿大学的硕士生埃里克·塞尔伯格和柳文欢·埃齐奥尼的Metacrawler。
1995 65438+2月,DEC正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎,也是第一个实现高级搜索语法(如and、OR、NOT等)的搜索引擎。).用户可以使用AltaVista搜索新闻组的内容并从互联网上获取文章,他们还可以在图片名称、标题、Java小程序和ActiveX对象中搜索单词。AltaVista还声称是第一个支持用户向web索引数据库提交或删除URL的搜索引擎,并且它可以在24小时内启动。AltaVista最有趣的新功能之一是搜索所有带有URL链接的网站。在面向用户的界面上,AltaVista也做了很多创新。它将“提示”放在搜索框区域,帮助用户更好地表达他们的搜索风格。这些提示经常更新,以至于用户搜索几次后,会看到很多自己可能永远不知道的有趣功能。这一系列功能逐渐被其他搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到自己想要的东西。
1995年9月26日,加州大学伯克利分校助理教授埃里克·布鲁尔(Eric Brewer)和博士生保罗·高蒂尔(Paul Gauthier)创办了Inktomi。1996年5月20日,Inktomi公司成立,一个强大的HotBot出现在世人面前。它声称每天可以抓取超过65438+1亿页的索引,因此有远超其他搜索引擎的新内容。HotBot还使用cookie来存储用户的个人搜索偏好。
1997年8月,北极光搜索引擎正式出现。它曾经是数据库最大的搜索引擎之一。它没有停止字。它有极好的时事新闻,一个由超过7100个出版物组成的特殊收藏,以及一个很好的高级搜索语法。它是第一个支持搜索结果简单自动分类的。
1998 10之前,Google只是斯坦福大学的一个小项目,BackRub。1995年,博士生拉里·佩奇开始研究搜索引擎设计,并于9月15日注册了谷歌的域名,1997。1997年底,在谢尔盖·布林、斯科特·哈桑、艾伦·斯特伦伯格的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的转型。谷歌把1998年9月27日当做自己的生日。Google在Pagerank的基础上判断网页的重要性,大大增强了搜索结果的相关性。谷歌的极客文化和不作恶为谷歌赢得了很高的声誉和品牌口碑。2006年4月,谷歌公布了自己的中文名字“Google”,这是谷歌在非英语国家给出的第一个名字。
Fast(Alltheweb)公司成立于1997,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast的目标是做全球最大最快的搜索引擎,这几年已经接近了。Fast(Alltheweb)可以按ODP自动分类网页,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图片搜索、视频、MP3和FTP搜索,具有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收购)。
1996年8月,搜狐公司成立,做中文网站分类目录,一度有“出门找地图,上网找搜狐”的美誉。随着互联网网站的迅速增加,这种人工编辑的分类目录已经不再适用。2004年8月,搜狐成为独立域名搜索网站“搜狗”,自称“第三代搜索引擎”。
Openfind成立于1998 65438+10月,其技术源于台湾中正大学吴生教授领导的GAIS实验室。起初,Openfind只是一个中文搜索引擎。在巅峰时期,它为三个著名的门户网站提供中文搜索引擎:新浪、奇摩和雅虎。但2000年后,市场逐渐被百度和谷歌瓜分。2002年6月,Openfind基于GAIS30项目重新发布了Openfind搜索引擎的测试版,推出了PolyRankTM,并宣布已经积累了35亿网页,开始进军英文搜索领域。
5438年6月+2000年10月,两位北大校友,超链接分析的专利发明人、Infoseek前高级工程师李彦宏和他的朋友徐勇(加州伯克利博士后)在北京中关村创立了百度公司。百度搜索引擎测试版于2001年8月发布(百度只为搜狐、新浪、Tom等其他门户网站提供搜索引擎),百度搜索引擎于2001年10月22日正式发布,专注中文搜索。百度搜索引擎的其他功能还包括:百度快照、网页预览/所有网页预览、相关搜索词、错别字纠正提示、mp3搜索和Flash搜索。2002年3月Blitzen项目启动后,技术升级明显加快。后来又推出了贴吧、知道、地图、国学、百科等一系列产品,深受网友好评。2005年8月5日,在纳斯达克上市,发行价27.00美元,代码BIDU。开盘价66.00美元,收于122.54美元,涨幅353.85%,创下近5年来美股上市新股的最高涨幅纪录。
2003年2月23日,65438,原慧聪搜索正式独立运营,中国搜索成立。2004年2月,中国发布了桌面搜索引擎互联网猪1.0。2006年3月,中搜更名为互联网猪IG(Inter Gateway)。
2005年6月,新浪正式推出自主研发的搜索引擎“爱文”。