所谓阿拉丁平台,是指著名搜索引擎公司百度所推出的一个通用开放平台,它将接口开放给独特信息数据的拥有者,从而解决现有搜索引擎无法抓取和检索的暗网信息。
中文名阿拉丁平台
概 述百度搜索的开放数据分享平台
功 能指定关键词、位置、样式、频率等
技术实现站长自主提交,百度统一处理
简介
百度"雪藏"多年之久的"阿拉丁计划"终于浮出水面。12月18日,在百度上海研发中心的揭牌仪式上,百度CEO李彦宏携刚刚履新的百度CTO李一男一同出席,并向外界首次透露了正在推进的"阿拉丁计划"。"百度有2000名核心工程师,现在有超过1000名的技术力量投入了"阿拉丁平台"的研发。"李一男表示,"上海研发中心成立后,还会有更多的工程师加入到这一搜索"暗网"的团队中。"阿拉丁平台是在百度宣布推出"有啊"、进军C2C电子商务业务之后,又一次引发业内大震动的举措。业内人士评论说,百度"阿拉丁平台计划"实际上是搜索引擎行业的一次前瞻性研究和探索,将对未来搜索引擎和互联网的格局产生重要影响和变革。
2009年4月22日下午,百度“阿拉丁平台”测试低调上线。[1]
技术实现
原来,在无边无际的信息宇宙中,很多人类信息并没有被Web化,而且即使一些信息Web化了,也没有纳入到搜索引擎的检索体系。所以,目前能被搜索引擎检索到的信息只占人类所有信息中非常小的一部分,更多的信息都存在于Hidden Web,也就是“暗网”之中。
特色功能
在经过必要的申请、审核后,可以通过开放平台实现的特色功能有:
1.指定关键词,更精确、更直接的影响目标用户;
2.指定排序位置,更统一、更全面的展现内容;
3.指定样式,更丰富、更恰当的适应资源本身,不局限于文字;
4.指定更新频率,与百度搜索结果保持及时同步。
平台前景
业内专家分析,正是在这种急欲建立起更为庞大和牢不可破信息帝国雄心的指引下,李彦宏才他的团队将潜心多年的“阿拉丁平台”研发计划向外界和盘托出。而且,这项宏大的计划一旦实施,或将彻底改变搜索引擎产业——“百度不仅将借此继续领跑搜索引擎行业,还将对搜索引擎和互联网产业的未来发展格局产生深远影响”。而无疑,在整个过程中,普通的互联网用户是最大的受益者。
未来展望
用“神灯”照亮“暗网”
“如果把百度搜索引擎比做一个探照灯,在无边无际的信息宇宙中扫射,那么,那些探照灯扫射不到的区域,都是我们定义的所谓Hidden Web。目前能被搜索引擎检索到的信息只占所有信息中非常小的一部分,大部分信息存在于‘暗网’之中。”百度CTO李一男解释称,这些“暗网”之所以存在,一方面是很多人类信息并没有Web化;另一方面即使一些信息Web化了,也没有纳入到搜索引擎的检索体系。
那么能不能挖掘出更多存在于“暗网”之中的有价值的信息,让更多人从中受益呢?这正是百度新的研发计划——“阿拉丁平台”的诞生初衷。
“我们希望未来的搜索引擎,能像阿拉丁神灯那样,在瞬间满足用户所有的搜索需求。”李一男这样解释百度的“阿拉丁平台”,他指出,百度提出构筑“阿拉丁”平台的意义,就是为更多的“暗网”信息web化提供便利条件,同时使这些web化的信息能精准地被用户通过搜索引擎进行检索。
在“阿拉丁计划”的支持下,搜索引擎技术可以超越现有web内容的限制,对包括“暗网”在内的所有信息进行更深一步的分析、融合、处理,确保为用户提供零成本、无障碍、无时差的精准搜索结果。
勾勒搜索引擎未来
此番百度首次对外披露的“阿拉丁平台”计划,其实早已经历了数年时间的酝酿。而早在两三年前,该计划便已经在千余名百度核心技术工程师的参与下秘密启动。
对此,李一男并未否认。他告诉记者,实际上,“阿拉丁平台”是百度对现有搜索引擎体系的一个补充和延伸,早在百度两三年前推出贴吧、知道、国学等产品的时候,这一平台就开始系统化、有步骤的建立,并将成果逐步应用在百度搜索引擎体系中。
据介绍,目前百度“阿拉丁平台”的具体执行策略,在后台方面,百度主要考虑的是如何使更多暗网信息web化,如百度知道——将人脑中的信息web化,并便于搜索引擎的检索;百度图书搜索、法律搜索、百度国学——为图书馆、国学文库这样的内部数据库信息提供web化条件,并便于百度索引。
而在前台方面,百度则主要考虑如何将搜索结果以信息融合的方式展现给用户。比如搜索“荣誉”,则需要既呈现关于“荣誉”的视频,也有关于“荣誉”的百科知识,更有各种关于“荣誉”的普通网页内容。
相关推荐
最新文章