搜索引擎历史

先简单描述一下:《搜索引擎发展史》搜索引擎的历史在1990之前，没有人能搜索到互联网。

所有搜索引擎的始祖是蒙特利尔麦吉尔大学的艾伦·恩塔奇、彼得·多伊奇和比尔·惠兰在1990年发明的阿奇·常见问题。虽然那个时候万维网还没有出现，但是网络中的文件传输已经相当频繁了。由于大量文件分散在各个分散的FTP主机中，查询起来非常不方便，于是Alan Emtage等人想到开发一个可以通过文件名查找文件的系统，于是Archie应运而生。

Archie是第一个在互联网上自动索引匿名FTP网站文件的程序，但它不是一个真正的搜索引擎。Archie是一个可搜索的FTP文件名列表。用户必须输入准确的文件名搜索，然后Archie会告诉用户哪个FTP地址可以下载文件。

受Archie受欢迎程度的启发，内华达系统计算服务大学在1993开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来的另一个地鼠搜索工具。

机器人这个词对程序员来说有着特殊的含义。计算机机器人是指能够以人类无法达到的速度重复执行一项任务的自动程序。

因为专门用于检索信息的机器人程序像蜘蛛一样在网络上爬行，所以搜索引擎的机器人程序被称为蜘蛛FAQ程序。世界上第一个蜘蛛程序，麻省理工学院马修·格雷分校的万维网漫游者，被用来跟踪互联网发展的规模。

起初，它只是用来统计互联网上的服务器数量。后来，它被开发用来捕捉网址。对应漫游者，1993 10年6月，Martijn Koster创建了阿里Web (Martijn Koster公告阿里Web的可用性)，相当于HTTP版的Archie。

ALIWEB不使用互联网搜索机器人。如果网站管理员希望自己的网页被收录到ALIWEB中，需要提交自己的每个网页的介绍和索引信息，类似于后来众所周知的Yahoo。随着互联网的快速发展，检索所有新的网页变得越来越困难。因此，基于Wanderer，一些程序员改进了传统蜘蛛程序的工作原理。

这个想法是，由于所有的网页可能有链接到其他网站，这是有可能的搜索整个互联网，通过跟踪所有网页上的所有链接从一个网站。到了1993年底，一些基于这个原理的搜索引擎开始陆续出现。三个最著名的是:苏格兰的JumpStation，科罗拉多大学的Oliver McBryan的万维网蠕虫(McBryan的第一个指令)和美国国家航空航天局的基于知识库的软件工程(RBSE) Spider。

JumpStation和WWW Worm只是按照搜索工具在数据库中找到匹配信息的顺序对搜索结果进行排序，根本不存在信息相关性。RBSE是第一个对Html文件的文本进行索引的搜索引擎，也是第一个将关键词串匹配度的概念引入搜索结果排名的引擎。

Excite的历史可以追溯到2月1993。六个斯坦福大学学生的想法是分析单词关系，以便更有效地搜索互联网上的大量信息。到了1993中期，这个项目已经是一个完全投入的项目了，Architext，他们还发布了一个版本的搜索软件，供站长们在自己的网站上使用，这个软件后来被称为Excite for Web Servers。

(注:Excite后来以概念搜索出名。2002年5月，被Infospace收购的Excite停止了搜索引擎，转而使用元搜索引擎dog pile)1994 65438+10月，第一个可搜索可浏览的目录Einet Galaxy推出。除了网站搜索，还支持Gopher和Tel搜索。

1994年4月，斯坦福大学的两位博士生杨致远(杨致远)和大卫·费罗***，共同创立了雅虎(1996的雅虎)。随着访问量和链接数的增加，雅虎目录开始支持简单的数据库搜索。

因为雅虎！的数据是人工输入的，所以不能真正归类为搜索引擎。事实上，它只是一个可搜索的目录。漫游者只抓取URL，但是URL信息的内容太少，单靠URL很难解释很多信息，搜索效率很低。

雅虎！由于网站收录的网站都附有简要信息，搜索效率明显提高。(注:雅虎未来将使用Altavista、Inktomi和Google提供搜索引擎服务；2002年6月9日，10，雅虎放弃其网站目录的默认搜索，改为谷歌的默认搜索结果，成为真正的搜索引擎。

1994年初，布赖恩·平克顿，华盛顿大学计算机系的学生，开始了他的小型项目网络爬虫(布赖恩·平克顿宣布网络爬虫的可用性)。1994年4月20日，WebCrawler只包含来自6000台服务器的内容。

WebCrawler是互联网上第一个支持搜索文档所有单词的全文搜索引擎。在它之前，用户只能通过URL和摘要进行搜索，这些通常来自人工注释或自动提取文本前100个单词的程序。(注:webcrawler后来被AOL和excite收购，现在使用Excite这样的元搜索引擎dog pile)Lycos(卡耐基梅隆大学机器翻译公告中心Lycos)是搜索引擎历史上的又一次重要进步。

卡内基梅隆大学的Michael Mauldin将John Leavitt的蜘蛛程序与其索引程序连接起来，并创建了Lycos。7月20日1994，数据量5.4万。

二、简述:《搜索引擎发展史》在1990之前，没有人能搜索到互联网。

受Archie受欢迎程度的启发，内华达系统计算服务大学在1993开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来的另一个地鼠搜索工具。

拓展信息搜索引擎的功能。搜索引擎是网站建设中“方便用户使用网站”的必备功能，也是“研究网站用户行为的有效工具”。高效的站内检索可以帮助用户快速准确地找到目标信息，从而更有效地促进产品/服务的销售。而且，通过对网站访问者搜索行为的深入分析，对于进一步制定更有效的网络营销策略具有重要价值。

1.从网络营销环境来看，搜索引擎营销环境的发展对网络营销起着决定性的推动作用；2.从效果营销的角度来看，很多公司利用搜索引擎营销可以应用网络营销；3.就完整的电子商务概念的组成部分而言，网络营销是最重要的组成部分，是向最终客户传递信息的重要环节。百度百科-搜索引擎。

第三，请说说搜索引擎的历史。搜索引擎发展史1990，加拿大麦吉尔大学计算机学院师生开发Archie。

那时候万维网还没有出现，人们使用FTP来享受通信资源。Archie可以定期收集和分析FTP服务器上的文件名信息，并提供对每个FTP主机中文件的搜索。

用户必须输入确切的文件名进行搜索，Archie告诉用户哪个FTP服务器可以下载文件。阿奇收集的信息资源虽然不是网页(HTML文件)，但其工作原理和搜索引擎一样:自动收集信息资源，建立索引，提供检索服务。

所以阿奇是公认的现代搜索引擎鼻祖。机器人这个词对程序员来说有着特殊的含义。

计算机机器人是指能够以人类无法达到的速度重复执行一项任务的自动程序。因为专门用来检索信息的机器人程序像蜘蛛一样在网络上爬行，所以搜索引擎的机器人程序被称为蜘蛛程序。

马修·格雷在1993年开发了万维网漫游者，这是第一个利用HTML页面之间的链接关系来探测万维网规模的“机器人”程序。起初，它只是用来统计互联网上的服务器数量，后来它也能够捕捉网址(URL)。

1994年4月，两位斯坦福大学的博士生杨致远(杨致远)和大卫·费罗***共同创立了雅虎。随着访问量和链接数的增加，雅虎目录开始支持简单的数据库搜索。

因为雅虎！的数据是人工输入的，所以不能真正归类为搜索引擎。事实上，它只是一个可搜索的目录。雅虎于2002年2月23日收购Inktomi，2003年7月23日收购Overture，包括Fast和Altavista在内的2003年，雅虎于2003年6月23日全资收购3721公司。

1994年初，华盛顿大学的学生布莱恩·平克顿(Brian Pinkerton)开始了他的小项目网络爬虫(WebCrawler)。1994年4月20日，WebCrawler只包含来自6000台服务器的内容。

WebCrawler是互联网上第一个支持搜索文档所有单词的全文搜索引擎。在它之前，用户只能通过URL和摘要进行搜索，这些通常来自人工注释或自动提取文本前100个单词的程序。1994年7月，卡内基梅隆大学的Michael Mauldin将John Leavitt的spider程序连接到其索引程序，并创建了Lycos。

除了相关性排名，Lycos还提供前缀匹配和字符相似性限制。Lycos率先在搜索结果中使用网页自动摘要，其最大的优势是远远超过其他搜索引擎的数据量。1994结尾，Infoseek正式出现。

其友好的界面和大量的附加功能使其成为Lycos等搜索引擎的重要代表。1995年，出现了一种新形式的搜索引擎——元搜索引擎综述。

用户只需要提交一次搜索请求，由元搜索引擎负责转换处理，提交给预先选择的多个独立搜索引擎，各个独立搜索引擎返回的查询结果全部收集处理后再返回给用户。第一个元搜索引擎是华盛顿大学的硕士生埃里克·塞尔伯格和柳文欢·埃齐奥尼的Metacrawler。

1995 65438+2月，DEC正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎，也是第一个实现高级搜索语法(如and、OR、NOT等)的搜索引擎。).

用户可以使用AltaVista搜索新闻组的内容并从互联网上获取文章，他们还可以在图片名称、标题、Java小程序和ActiveX对象中搜索单词。AltaVista还声称是第一个支持用户向web索引数据库提交或删除URL的搜索引擎，并且它可以在24小时内启动。

AltaVista最有趣的新功能之一是搜索所有带有URL链接的网站。在面向用户的界面上，AltaVista也做了很多创新。

它将“提示”放在搜索框区域，帮助用户更好地表达他们的搜索风格。这些提示经常更新，以至于用户搜索几次后，会看到很多自己可能永远不知道的有趣功能。这一系列功能逐渐被其他搜索引擎广泛采用。

1997年，AltaVista发布了一个图形演示系统LiveTopics，帮助用户从成千上万的搜索结果中找到自己想要的东西。1995年9月26日，加州大学伯克利分校助理教授埃里克·布鲁尔(Eric Brewer)和博士生保罗·高蒂尔(Paul Gauthier)创办了Inktomi。1996年5月20日，Inktomi公司成立，一个强大的HotBot出现在世人面前。

它声称每天可以抓取超过65438+1亿页的索引，因此有远超其他搜索引擎的新内容。HotBot还使用cookie来存储用户的个人搜索偏好。

1997年8月，北极光搜索引擎正式出现。它曾经是数据库最大的搜索引擎之一。它没有停止，优秀的当前新闻，由超过7，100个出版物组成的特殊集合，以及良好的高级搜索语法。它是第一个支持搜索结果简单自动分类的。

1998 10之前，Google只是斯坦福大学的一个小项目，BackRub。1995年，博士生拉里·佩奇开始研究搜索引擎设计，并于9月15日注册了谷歌的域名，1997。1997年底，在谢尔盖·布林、斯科特·哈桑、艾伦·斯特伦伯格的参与下，BachRub开始提供Demo。

1999年2月，Google完成了从Alpha版到Beta版的转型。谷歌把1998年9月27日当做自己的生日。

Google在Pagerank的基础上判断网页的重要性，大大增强了搜索结果的相关性。谷歌的极客文章。

四、搜索引擎的发展1990:互联网上第一个搜索引擎Archie的出现是为了搜索FTP服务器上的文件。

1993:6月，第一个网络搜索引擎——环球网Wandere出现，仅用于收集网址。10月，第二个网络搜索引擎ALIWEB出现。开始索引标题标签和其他信息。

1994:1年6月，最重要的搜索引擎之一Infoseek成立。(百度创始人李彦宏是其核心工程师之一)

4月，雅虎Yahoo！创造。同月，首款全文搜索引擎WebCrawler上线。

6月，Lycos成立。迅速成为最受欢迎的搜索引擎之一。

1995:四月，雅虎！正式成立。

65438+2月，Infoseek成为网景浏览器的默认搜索引擎。同月，Alta Vista成立，并迅速成为最受欢迎的搜索引擎，当时被称为Google Glloge。

1996:四月，雅虎！列表。

1997:4月，Ask Jeeves上线，这是唯一一个仍然存在并拥有一定市场份额的早期搜索引擎。

1998:9月，谷歌正式成立。

1999:6月，曾经风靡一时的搜索引擎Infoseek消失了。

2000年:65438+10月18:百度成立。

7月，雅虎Yahoo！使用谷歌搜索数据。

2001年:10月，百度作为搜索引擎正式上线。

2002年:3月，Google谷歌广告推出PPC，即点击付费。

2003年:7月，雅虎！这将需要除谷歌之外的几乎所有主流搜索技术。2004年:8月，谷歌上市。

2005年:8月，百度上市。

2006年:9月，MSN在线品牌全部改为Live，做了大量推广，Google依然占据最大位置。

2007年:3月，谷歌Google开始提供类似于网站联盟的转化付费广告形式。

2009年:6月，微软Live Search更名为Bing。

7月29日，雅虎！自己一手培养的谷歌，在搜索引擎战场上彻底溃败。

2010:八月，雅虎！雅虎开始使用必应搜索数据。

2011:2月，谷歌推出熊猫更新，旨在减少搜索结果中的低质量页面。对seo优化性能影响深远。

2010年8月，根据NetMarketShare的统计，谷歌在全球搜索引擎市场份额中占据. 73，在全球占据绝对领先地位，而百度由于中国搜索用户数量庞大，搜索量排名第三。但是国外很少有人用百度。

5.互联网在搜索引擎发展史上的历史是怎样的:搜索引擎发展史(本文转自:新浪科技@科技时报)在1990之前，没有人能搜索到互联网。

所有搜索引擎的始祖是蒙特利尔麦吉尔大学的艾伦·恩塔奇、彼得·多伊奇和比尔·惠兰在1990年发明的阿奇·常见问题。那时候万维网还没有出现。

Archie是第一个在互联网上自动索引匿名FTP网站文件的程序，但它不是一个真正的搜索引擎。Archie是一个可搜索的FTP文件名列表。用户必须输入确切的文件名进行搜索，然后阿奇会告诉你的网游联盟新浪电通个性*** sDIY海纳百川候车亭媒体轻松填写一份调查问卷并中奖告诉用户哪个FTP地址可以下载文件。

受Archie受欢迎程度的启发，内华达系统计算服务大学在1993开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来的另一个地鼠搜索工具。

ALIWEB不使用互联网搜索机器人。如果网站管理员希望自己的网页被收录到ALIWEB中，需要提交自己的每个网页的介绍和索引信息，类似于后来众所周知的Yahoo。1993年底，一些基于这个原理的搜索引擎开始陆续出现。三个最著名的是:苏格兰的JumpStation，科罗拉多大学的Oliver McBryan的万维网蠕虫(McBryan的第一个指令)和美国国家航空航天局的基于知识库的软件工程(RBSE) Spider。

1993年2月，六个斯坦福大学学生的想法是分析单词之间的关系，以便更有效地搜索互联网上的大量信息。这太令人兴奋了。

后来以概念搜索出名。2002年5月，被Infospace收购的Excite停止了自己的搜索引擎，转而使用元搜索引擎dog pile 1994 65438+10月，第一个可搜索可浏览的目录EINet Galaxy(Tradewave Galaxy)推出。除了网站搜索，还支持Gopher和Tel搜索。

1994年4月，两位斯坦福大学的博士生杨致远(杨致远)和大卫·费罗***，创立了雅虎。随着访问量和链接数的增加，雅虎目录开始支持简单的数据库搜索。

因为雅虎！的数据是人工输入的，所以不能真正归类为搜索引擎。事实上，它只是一个可搜索的目录。搜索效率明显提高。

(雅虎先后使用Altavista、Inktomi和Google提供搜索引擎服务)1994年初，华盛顿大学的CS学生Brian Pinkerton开始了他的小项目WebCrawler (Brian Pinkerton宣布WebCrawler的可用性)。1994年4月20日，WebCrawler仅包含来自6000台服务器的内容。

WebCrawler是互联网上第一个支持搜索文档所有单词的全文搜索引擎。在它之前，用户只能通过URL和摘要进行搜索，这些通常来自人工注释或自动提取文本前100个单词的程序。(后来webcrawler相继被AOL和excite收购，现在使用Excite这样的元搜索引擎Dogpile。)Lycos(卡内基梅隆大学机器翻译中心公告Lycos)是搜索引擎历史上的又一个重要进步。

卡内基梅隆大学的Michael Mauldin将John Leavitt的蜘蛛程序与其索引程序连接起来，并创建了Lycos。7月20日，1994，数据量54000的Lycos正式发布。

除了相关性排名，Lycos还提供前缀匹配和字符相似性限制。Lycos率先在搜索结果中使用网页自动摘要，最大的优势是远远超过其他搜索引擎的数据量:65438+8月0994-39.4万篇文档；1995 1月- 1.5万文档；1996 11月-超过6000万文档。(注:1999年4月，Lycos停止了自己的蜘蛛，转而由Fast提供搜索引擎服务)Infoseek(Steve Kirsch Announcements免费演示Infoseek搜索引擎)是另一个重要的搜索引擎。虽然该公司声称成立于1994年6月，但其搜索引擎直到年底才与公众见面。

起初，Infoseek只是一个默默无闻的搜索引擎，紧随雅虎之后。而Lycos，没有什么独特的创新。但它的发展历程和随后的口碑证明，一开始第一个上台并不总是重要的。

Infoseek友好的用户界面和大量的附加服务(如ups跟踪、新闻、目录等)使它越来越出名。6月1995+2月65438与网景公司的战略协议使其成为一个强大的搜索引擎:当用户点击网景浏览器上的搜索按钮时，Infoseek的搜索服务就会弹出，而雅虎！提供这项服务。

(注:Infoseek后来因其相关性而出名。2001年2月，Infoseek停止了自己的搜索引擎，开始使用Overture搜索结果。)1995，一种新的搜索引擎形式出现了——元搜索引擎综述。用户只需要提交一次搜索请求，元搜索引擎负责转换处理后提交给多个预先选择的独立搜索引擎，这些搜索引擎会相互独立地进行搜索。