博客首页|TW首页| 同事录|业界社区

最近正值《变形金刚4》热映,笔者用百度搜索“变形金刚”,发现结果页瞬间变成一个 “擎天柱”,并最终演化成一句文字:“变形金刚三十周年,百度搜索为你而变”。显然,这是一款为广大“刚丝”定制的另类创意,只不过,掀开技术之上的“人文关怀”面纱,百度搜索近年真的在上演“变形记”吗?

上个月,一则Google支持西部教育的新闻引发“重返中国”的猜想,在知乎上,更是出现一个热门话题,“百度和 Google 的搜索技术是一个量级吗?”作为一名Google粉,我一直在思考一个问题:如果Google重返中国,还能够击倒百度吗?

不一样的进化理念

在Google退出中国之后,笔者被迫逐步减少了Google的使用,既有稳定性的原因,也有搜索体验潜移默化的影响。但在我看来,即使Google重返中国,不只没有机会击倒百度,追赶百度恐怕都是难以完成的任务了——因为百度中文搜索进化了4年,Google却止步不前。

除了文头提到的“变形金刚’之外,在前几天我用手机百度搜索“越位”结果则直接是关于越位解释的示意动画。用单个CASE来对比百度和Google并无意义,因为CASE无法穷举,搜索又主要在做长尾需求与长尾内容的对接。但不妨对比回溯一下Google百度近年来的进化理念。

从百度历史看,一次具备里程碑意义的创新始于09年的框计算和阿拉丁计划。“所见即所得”,是框计算的核心理念,如今已经成为搜索引擎的标配,在最早却也是Google效仿的对象,也正是自09年以来,百度在一站式生活搜索方面,开始超越Google。

2013年,自百度发布寓意着下一代搜索引擎的“知心搜索”之后,阿拉丁被再次升级,同时,更加强调“即搜即得”,它通过对大数据的挖掘,从数以亿万级的知识库数据中挖掘出各种知识碎片、形成答案,直接将高质量搜索结果在大搜索中进行聚合和展现优化,以知识图谱的方式把答案直接呈现给用户,还可以和用户实现智能交互,有问必答。比如,在搜索框中输入母婴相关关键词,如“怀孕”,左侧搜索页面即会显示“怀孕”相关的百度百科内容,会为用户推荐相关“怀孕手册”,聚合展示孕妇在备孕、孕早期、孕中期、孕晚期、分娩、月子个阶段注意事项,同时,在搜索页面右侧将显示相关信息如“育儿指南时间线”,这被百度在内部称为“母婴知心”。

类似基于用户体验的知心搜索,涵盖了人物、小说、影视、音乐等等十余种,这种搜索结果页,有图片、地图、表单、贴吧、知道、百科等内容的直达,左侧智能交互,右侧推荐更丰富。而在商业层面,百度靠传统搜索推广这“一招鲜”已吃了十几年,但是,在引领下一代搜索引擎进程中,百度也引入中间页的新理念来自我颠覆,尤其在最近一两年,在去哪儿的典型案例之外,医疗、教育、游戏等每个大行业的垂直搜索中间页都在暗自发力。相对的,这种整合垂直搜索领域,建立最庞大生态链的信号,在Google,乃至任何一家中文搜索引擎,都不可见。

纵向比搜索同样的结果今日的结果页与5年前、10年前都相差甚远;横着比,与Google搜索对比一组关键词会发现百度结果丰满、好用很多。这是为什么我说Google重返中国已无法超越百度的原因,其搜索体验甚至都赶不上搜狗。

百度和Google技术谁最强?

近日的热门话题“百度和 Google 的搜索技术是一个量级吗?”,这是一个不算专业的问题,因为技术发展并不是线性的,往往是理念改变引发革命性的进步。

其实,回到搜索引擎的技术原点,Google今日引以为荣的网页评级机制pagerank技术,直到2001年才被授予美国专利,比李彦宏的1996年申请的超链分析专利技术晚了5年。

于是,当下来讨论技术问题更是饶有趣味,不少非专业的回答大多是一边倒认为Google更牛逼,最典型的说法便是,Google有无人驾驶汽车、Google Glass、Android,有甩开Hidoop几条街的Caffeine、Pregel、Dremel,还有GFS文件系统和全球数据库Spanner,百度却只有搜索。

这很可能是关于搜索引擎技术非常大的误区,我个人感觉,Google的创新能力毋庸置疑,但在搜索引擎技术和用户体验上,最近4-5年并没有明显进步。

对于今天的Google究竟是什么,将走向何方?近日Google CEO拉里-佩奇的公开信中似乎也曝出“回归搜索”端倪——他强调搜索和信息是Google的核心,也坦言“从许多方面来看,目前距离创造我梦想中的搜索引擎还有十分遥远的距离。”

相对的,百度搜索引擎技术近年来的创新是否有干货呢?

过去,在底层架构上,外界容易视Google比百度先进,不过,近几年却不能忽略百度在基础架构上的默默创新。年初,百度被曝光正在秘密研发“极速搜索”,它可以通过大数据计算能力,比普通搜索节省80%时间,打开瞬间最快只用0.04秒,其实,这项技术的意义并不止于用户感知,背后蕴含的实际是架构的重构、优化,在性价比、响应速度等各方面都在加分。

如今,在对于搜索引擎技术发展走势上的判断,Google和百度似乎也走到了分水岭。个人认为,“自然语言人机对话+智能化逻辑思考”,也就是,让搜索更能理解你的问题,给你更准确的答案,是百度正在践行的方向。7月7日,在37届信息检索领域世界顶尖学术会议SIGIR会议上 ,百度副总裁王海峰做了题为 “Chinese Search Engine - Baidu’s Practice”报告,这场演讲引起了广泛关注,很多人问及关于深度问答、知识抽取、智能交互等这些技术百度是如何实现、如何应用的,即使是Google,也尚且未将这类前沿技术大规模应用于搜索产品,外界惊讶于百度在搜索引擎产品中的应用,并已提升了用户体验。

曾经有一个颇为争议的案例,在百度搜索“谢霆锋儿子的母亲的前夫的父亲”是不是人工干预的。因为百度可以直接显示”谢贤“,但Google不行。Googl e也提出知识图谱概念,但是,凭借对中文的理解以及百度拥有的自主知识库,对知道、贴吧和百科现成的SNS知识可以有机整合,通过逻辑思考,a推出b,b推出c,c推出d的结论,将答案d直接回答给你。但Google就做不到,他只能给你答案b,c之后的结论就只能由你自己去寻找了。

当然,搜索“谢霆锋儿子的母亲的前夫的父亲”是个极端案例,不过,以知识库为基础的逻辑推理等会让搜索越发智能。比如,最近汤唯结婚消息一出,百度搜索结果右侧出现了一组“那些年汤唯爱过的男人们”智能推荐,有意思的是,连“16岁花季相识短暂初恋”等人物关系都能标注出来。另外,值得关注的是,百度在知识库上探索的样式已经比Google更宽广,比如,搜索“北京的景点”,左侧结果页有多种类型的景点推荐,包括亲子、情侣和家庭游,乃至毕业旅行的景点推荐,右侧推荐中,包括北京度假热卖排行榜,以及相关地名。其他基于知识库的创新例子也并不鲜见,搜索“不掉毛的狗”、“开黄花的树”,用户都能发现今日的搜索已大不同,而这种长尾效应必将体现在百度搜索流量增长乃至营收拉升上。

从2010年初百度成立了自然语言处理部至今,词法分析、语法分析、语义分析、机器翻译、query理解等一大批技术已经处于世界领先水平,并在深度问答、情感分析、智能交互、知识挖掘与推理等前沿方向上迅速进步。6月底,在全球自然语言处理顶级学术会议ACL上,6位百度人赴美参加。2013年初,王海峰更是出任ACL五十年历史上第一位华人主席。无疑,如今的百度已经走在NLP最前沿。再看,对技术的投入上,百度与Google更是大相径庭。自2008年左右,当Google将研发重点投向其他领域的时,百度仍将资金和人才聚焦在如何让搜索更智能。

未来,用户对这些技术的感知将愈发明显,好比之前不断走红的:百度翻译实物拍照卖萌又高级黑,人脸识别“明星脸”,百度语音助手的拍花识花……

除此之外,去年,在离苹果总部不远的加州库比蒂诺,百度发布了专注于深度学习研究的前沿实验室。在全球范围内,目前除斯坦福大学等高校研究机构外,唯有百度、IBM、Google、微软四家企业设立了Deep Learning专门研究机构。而且,在跻身深度学习研究的第一阵营之后,今年,百度更是将“Google大脑”的负责人、人工智能行业的资深科学家吴恩达挖至新建立的美国研发中心,主抓“百度大脑”项目,这势必将为百度在技术和人才上保持领先埋下伏笔。

最后,再次声明笔者是Google粉丝,但我不得不承认的是,百度在中文搜索技术上已经甩开Google一大截,就算Google重返中国,也已不再是百度的对手,时间不等人。


上一篇: 大数据预测4个特征,11个典型行业
下一篇:粉丝营销:激进派微博,保守派微信,顺势而为的贴吧

1条评论

  1. 连翻墙google都不会的人,在这侃搜索技术哪家强,只能说你懂个卵

发表评论