有人能给我们提供搜狐、百度、雅虎的发展历史吗?

百度发展历史,百度发展历程

搜索引擎发展史在1990之前,没有人能搜索到互联网。

所有搜索引擎的始祖是蒙特利尔麦吉尔大学的艾伦·恩塔奇、彼得·多伊奇和比尔·惠兰在1990年发明的阿奇·常见问题。虽然那个时候万维网还没有出现,但是网络中的文件传输已经相当频繁了。由于大量文件分散在各个分散的FTP主机中,查询起来非常不方便,于是Alan Emtage等人想到开发一个可以通过文件名查找文件的系统,于是Archie应运而生。Archie是第一个在互联网上自动索引匿名FTP网站文件的程序,但它不是一个真正的搜索引擎。Archie是一个可搜索的FTP文件名列表。用户必须输入准确的文件名搜索,然后Archie会告诉用户哪个FTP地址可以* * *文件。

受Archie受欢迎程度的启发,内华达系统计算服务大学在1993开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来的另一个地鼠搜索工具。

机器人这个词对程序员来说有着特殊的含义。电脑机器人是指能以人类达不到的速度重复执行一项任务的自动化程序。因为专门用于检索信息的机器人程序像蜘蛛一样在网络上爬行,所以搜索引擎的机器人程序被称为蜘蛛FAQ程序。世界上第一个蜘蛛程序,麻省理工学院马修·格雷分校的万维网漫游者,被用来跟踪互联网发展的规模。起初,它只是用来统计互联网上的服务器数量。后来,它被开发用来捕捉网址。

对应漫游者,1993 10年6月,Martijn Koster创建了阿里Web (Martijn Koster公告阿里Web的可用性),相当于HTTP版的Archie。ALIWEB不使用互联网搜索机器人。如果网站管理员希望自己的网页被收录到ALIWEB中,需要提交自己的每个网页的介绍和索引信息,类似于后来众所周知的Yahoo。

随着互联网的快速发展,检索所有新的网页变得越来越困难。因此,基于Wanderer,一些程序员改进了传统蜘蛛程序的工作原理。这个想法是,由于所有的网页可能有链接到其他网站,这是有可能的搜索整个互联网,通过跟踪所有网页上的所有链接从一个网站。到了1993年底,一些基于这个原理的搜索引擎开始陆续出现。三个最著名的是:苏格兰的JumpStation,科罗拉多大学的Oliver McBryan的万维网蠕虫(McBryan的第一个指令)和美国国家航空航天局的基于知识库的软件工程(RBSE) Spider。JumpStation和WWW Worm只是按照搜索工具在数据库中找到匹配信息的顺序对搜索结果进行排序,根本不存在信息相关性。RBSE是第一个对Html文件的文本进行索引的搜索引擎,也是第一个将关键词串匹配度的概念引入搜索结果排名的引擎。

Excite的历史可以追溯到2月1993。六个斯坦福大学学生的想法是分析单词关系,以便更有效地搜索互联网上的大量信息。到了1993中期,是一个完全投入的项目Architext,他们还发布了一个版本的搜索软件,供站长们在自己的网站上使用,后来被称为Excite for Web Servers。(注:Excite后来因概念搜索而出名。2002年5月,被Infospace收购的Excite停止了自己的搜索引擎,转而使用元搜索引擎Dogpile。)

1994 1月,第一个可搜索可浏览的目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,还支持Gopher和Telnet搜索。

1994年4月,斯坦福大学的两位博士生杨致远(杨致远)和大卫·费罗***,共同创立了雅虎(1996的雅虎)。随着访问量和链接数的增加,雅虎目录开始支持简单的数据库搜索。因为雅虎!的数据是人工输入的,所以不能真正归类为搜索引擎。事实上,它只是一个可搜索的目录。漫游者只抓取URL,但是URL信息的内容太少,单靠URL很难解释很多信息,搜索效率很低。雅虎!由于网站收录的网站都附有简要信息,搜索效率明显提高。(注:雅虎未来将使用Altavista、Inktomi和Google提供搜索引擎服务。)

1994年初,华盛顿大学计算机系学生布莱恩·平克顿开始了他的小项目“布莱恩·平克顿宣布网络爬虫的可用性”。1994年4月20日,WebCrawler只包含来自6000台服务器的内容。WebCrawler是互联网上第一个支持搜索文档所有单词的全文搜索引擎。在它之前,用户只能通过URL和摘要进行搜索,这些通常来自人工注释或自动提取文本前100个单词的程序。(后来webcrawler相继被AOL和excite收购,现在使用Excite这样的元搜索引擎Dogpile。)

Lycos(卡内基梅隆大学机器翻译中心Lycos)是搜索引擎历史上的另一个重要进步。卡内基梅隆大学的Michael Mauldin将John Leavitt的蜘蛛程序与其索引程序连接起来,并创建了Lycos。7月20日,1994,数据量54000的Lycos正式发布。除了相关性排名,Lycos还提供前缀匹配和字符相似性限制。Lycos率先在搜索结果中使用网页自动摘要,最大的优势是远远超过其他搜索引擎的数据量:65438+8月0994-39.4万篇文档;1995 1月-1.5万文档;1996 11月-超过6000万文档。(注:1999年4月,Lycos停止了自己的蜘蛛,转而由Fast提供搜索引擎服务。)

Infoseek是另一个重要的搜索引擎。虽然该公司声称1994 1成立,但其搜索引擎直到年底才与公众见面。起初,Infoseek只是一个默默无闻的搜索引擎,紧随雅虎之后。而Lycos,没有什么独特的创新。但它的发展历程和随后的口碑证明,一开始第一个上台并不总是重要的。Infoseek友好的用户界面和大量的附加服务(如ups跟踪、新闻、目录等)使它越来越出名。6月1995+2月65438与网景公司的战略协议使其成为一个强大的搜索引擎:当用户点击网景浏览器上的搜索按钮时,Infoseek的搜索服务就会弹出,而Yahoo!提供这项服务。(注:Infoseek后来因其相关性而出名。2001年2月,Infoseek停止了自己的搜索引擎,开始使用Overture搜索结果。)

1995,一种新形式的搜索引擎出现?元搜索引擎综述。用户只需提交一次搜索请求,元搜索引擎负责转换处理后提交给多个预选的独立搜索引擎,独立搜索引擎返回的所有查询结果都经过收集处理后返回给用户。第一个元搜索引擎是华盛顿大学的硕士生埃里克·塞尔伯格和柳文欢·埃齐奥尼的Metacrawler。元搜索引擎在概念上听起来不错,但是搜索效果总是不尽如人意,所以从来没有元搜索引擎有过强势地位。

DEC的altavista(部分网友从2001夏天开始需要通过p-roxy访问,qbseach搜索AltaVista没有p-roxy可用,只能显示搜索结果首页)是后来者,直到1995 (AltaVista公测新闻稿)才出现。但大量的创新功能使其迅速达到了当时搜索引擎的巅峰。Altavista最突出的优势是速度(搜索引擎9238:搞笑,altavista是为了展示DEC Alpha芯片强大的计算能力)。

Altavista的其他新功能永远改变了搜索引擎的定义。

AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法(如and、OR、NOT等)的搜索引擎。).用户可以使用AltaVista搜索新闻组并从互联网上获取文章,他们还可以在图片名称、标题、Java小程序和ActiveX对象中搜索单词。AltaVista还声称是第一个支持用户向web索引数据库提交或删除URL的搜索引擎,并且它可以在24小时内启动。AltaVista最有趣的新功能之一是搜索所有带有URL链接的网站。在面向用户的界面上,AltaVista也做了很多创新。它将“提示”放在搜索框区域,帮助用户更好地表达他们的搜索风格。这些提示经常更新,以至于用户搜索几次后,会看到很多自己可能永远不知道的有趣功能。这一系列功能逐渐被其他搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到自己想要的东西。

然后是HotBot。1995年9月26日,加州伯克利的CS助教Eric Brewer和博士生Paul Gauthier创办了Inktomi(UC Berkeley announcements Inktomi)。1996年5月20日,Inktomi公司成立,一个强大的HotBot出现在世人面前。它声称每天可以抓取超过65438+1亿页的索引,因此有远超其他搜索引擎的新内容。HotBot还使用cookie来存储用户的个人搜索偏好。(Hotbot是随后几年最受欢迎的搜索引擎之一,被Lycos收购)

Northernlight公司于1995年9月在马萨诸塞州剑桥成立,1995。8月,1997,Northernlight搜索引擎正式出现。它曾经是数据库最大的搜索引擎之一。它没有停止字。它有极好的时事新闻,一个由超过7100个出版物组成的特殊收藏,以及一个很好的高级搜索语法。它是第一个支持搜索结果简单自动分类的。(2002年6月5438+10月65438+6月6日,北极光搜索引擎关闭,随后被divine收购。但在Nlresearch中,选择了“仅万维网”,仍可使用Northernlight搜索引擎。)

在1998 10之前,Google只是斯坦福大学的一个小项目。1995年,博士生拉里·佩奇开始研究搜索引擎设计,并于9月15日注册了google.com的域名,1997。1997年底,在谢尔盖·布林、斯科特·哈桑、艾伦·斯特伦伯格的参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的转型。谷歌把1998年9月27日当做自己的生日。

Google在整合搜索、多语言支持、用户界面等功能上的创新,如Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、map stock字典搜索等,又一次像Altavista一样永远改变了搜索引擎的定义。

在2000年年中之前,谷歌因其搜索准确性而备受推崇,但由于其数据库没有其他搜索引擎大,缺乏先进的搜索语法,使用价值不是很高,推广也不快。直到2000年年中数据库升级,才被雅虎选为搜索引擎。

Fast(Alltheweb)公司成立于1997,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast的目标是做全球最大最快的搜索引擎,这几年已经接近了。Fast(Alltheweb)可以按ODP自动分类网页,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图片搜索、视频、MP3和FTP搜索,具有极其强大的高级搜索功能。

Teoma源于1998罗格斯大学的一个项目。Apostolos Gerasoulis教授带领华裔教授杨韬等人在新泽西皮斯卡塔韦创建了Teoma,于2001年春季首次亮相,2001年9月被Ask Jeeves收购,2002年4月再次发行。Teoma的数据库仍然很小,但它有两个辉煌的功能:支持Refine类似于自动分类;同时,还提供了专业链接目录资源。

Wisenut由韩裔尹汝杰创立。2001春季发布测试版,2006 54 38+0 9月5日发布正式版。2002年4月,它被分类目录提供商looksmart收购。Wisenut还有两个高明的功能:WiseGuide包含相似的自动分类和相关的搜索词;预览搜索结果。

Gigablast由前Infoseek工程师Matt Wells创立。2002年3月显示pre-Beta版,2002年7月21日发布Beta版。Gigablast的数据库目前还很小,但也提供网页快照。一个特殊的功能是实时索引网页,你的网页一提交就能被搜索到(注:垃圾邮件发送者的肉包子功能暂时关闭)。

Openfind成立于1998 65438+10月,其技术源于台湾中正大学吴生教授领导的GAIS实验室。起初,Openfind只是一个中文搜索引擎。曾经是最好的中文搜索引擎。巅峰时期为新浪、奇摩、雅虎三大著名门户网站提供中文搜索引擎,但2000年后市场逐渐被百度、谷歌瓜分。2002年6月,Openfind基于GAIS30项目重新发布了Openfind搜索引擎的测试版,推出了PolyRankTM,并宣布已经积累了35亿网页,开始进军英文搜索领域。此后,技术升级明显加快。

北大天网是九五国家重点科技项目“中英文中文编码与分布式信息发现”的研究成果。由北京大学计算机系网络与分布式系统研究室开发,于6月29日在CERNET上正式提供服务,1997。2000年初,新的天网搜索引擎研究组成立,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万。利用教育网的优势,拥有强大的ftp搜索功能。

百度5438年6月+2000年10月,Hyperchain Analysis的专利发明人、原Infoseek高级工程师李彦宏和他的朋友徐勇(加州伯克利博士)在北京中关村创立了百度公司。Baidu.com搜索引擎测试版于2001年8月发布(百度仅提供搜狐、新浪、Tom等其他门户的搜索引擎),百度搜索引擎于2001 10年10月22日正式发布。百度虽然只提供中文搜索,但目前包含了9000多万个中文网页,可能是最大的中文数据库。百度搜索引擎的其他功能还包括:网页快照、网页预览/所有网页预览、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索和信息快车搜索。2002年3月Blitzen项目启动后,技术升级明显加快。

百度:中国版谷歌神话还能走多远?

8月5日,中国搜索引擎公司百度在纳斯达克上市,发行价为27美元。盘中一度突破150美元,最终收于122.54美元,涨幅353.85%。百度的出色表现使其成为在美国上市的外国公司中上市首日表现最好的股票。

百度上市首日表现强劲主要有两个原因:

首先是谷歌的示范效应。投资者经常将百度与谷歌相提并论,认为该公司是中国版的谷歌。有分析认为,百度如此受追捧,是因为它结合了中国和搜索。

全球最大的搜索服务提供商谷歌的上市价格也不到100美元,但自上市一年以来,其股价已超过300美元,表明搜索市场潜力巨大。随着互联网在中国的迅速普及,网民数量迅速扩大,中国市场的广阔性得到了外国投资者的普遍青睐。

其次,中国概念股的魅力。中国已经是世界上最大的计算机市场,并且拥有世界上第二多的互联网用户。中国网民数量已超过6543.8亿。百度在这个市场占有很大份额。再加上人民币升值,国外投资者普遍看好中国和搜索市场,所以百度会受到投资者的青睐。

回顾百度的发展历史,公司和盛大类似,也是抓住了互联网行业快速发展的机遇,找到了适合自己快速发展的道路。

百度于1999年底创立于美国硅谷。其创始人、百度公司总裁李彦宏是信息检索技术资深专家,超链接分析专利唯一持有人。

百度成立之初,选择了与其他专业搜索引擎略有不同的商业模式:即与门户网站合作,百度对搜索访问量进行分成。这种付费模式在当时相当受门户网站欢迎,包括新浪、网易在内的各大门户网站都采用了百度提供的服务。

但是这种模式很快显示出它的局限性。门户网站数量有限,决定了需求有限。2001年初,李彦宏借用了Overtu r e的“付费排名”搜索引擎商业模式。客户通过购买关键词和竞价来决定自己在搜索结果中的排名,并通过上下文内容分析技术在其他顶级搜索引擎上同时投放广告,与这些合作伙伴分享利益。从2002年到2003年,竞价排名迅速成为百度收入的主要来源。2004年,百度80%的收入来自竞价排名。

目前,百度是中国访问量第二、全球第六的网站。数据显示,中国互联网用户48%的搜索请求是通过百度完成的,因此百度被誉为全球最大的中文搜索引擎。根据艾瑞咨询的数据,2004年中国搜索引擎行业市场规模为654.38+0.25亿元,其中搜索引擎运营商收入为6.35亿元,渠道代理商收入为6.2亿元,百度占据了中国搜索引擎运营商28%的市场份额。独特商业模式的成功使百度迅速成为中文搜索引擎的领导者。

由于中文的复杂性,百度的搜索技术非常复杂,该公司开发了专门的语言处理技术来处理类似的搜索结果。截至目前,百度已经链接了6.9亿个页面,8000万张图片,10万个媒体文件。还包括新闻、贴吧等内容。

担心市盈率对于百度来说,上市首日的优异表现是一个好的开始。但“好的开始是成功的一半”,海外资本市场并不顺利。从新浪、网易等先行者身上可以发现,他们的股价表现是有很多先例的。以网易为例,2001达到了0.51美元的最低价。资本残酷的逐利本性决定了一家公司一旦达不到华尔街的预期,股价暴跌是极其正常的。

百度上市首日的优异表现和股价的快速上涨,已经让市盈率迅速脱离了市场平均水平。这成为未来股价表现的隐忧。一旦公司增长跟不上市场预期,可能会导致股价水平快速下跌。

百度2004年利润1200万元,收入1.11亿元。2003年亏损890万元。2005年一季度利润暴涨140%,达到250万元。根据百度在招股书中公布的财务数据,百度股票发行价市盈率达到540倍,周五收盘价市盈率达到2450.8倍,相当惊人。作为对比数据,谷歌8月6日的市盈率为85.66倍。纳斯达克上市的其他兄弟网络概念股市盈率基本在30-50倍之间。即使百度仍然保持原来200%以上的业绩增长,其目前的股价仍然被高估。

另外,百度在搜索领域也不是无敌的。谷歌窥探中国市场已久,众所周知它盯上了百度。目前谷歌持有百度2.6%的股份,进入中国市场会选择合并或独立发展。后续发展将影响百度的市场表现。虽然中文搜索的复杂性和本土文化的适应性使得外资很难占领中国市场,但其资本实力和品牌优势不容小觑。

至于百度的重要利润来源,“竞价排名”也受到了质疑。这种以竞价排名来决定搜索排名的商业模式,不利于搜索引擎的公正性和客观性。信息干扰的出现会降低网民对搜索的依赖。百度目前的MP3、图片和* * *搜索等服务也面临版权的法律纠纷。虽然不足以影响百度的大局,但还是给百度其他商业模式的推广带来了一定的阻碍。