一群“计算机学霸”的个人奋斗与历史进程。
采写 | 新经济沸点 郭娟
一位“学霸”怎么和其他学霸一起创业?王小川提供了一个可能的样本。
王小川,搜狗CEO,生于1978年。小学阶段,王小川对计算机表现出浓厚的兴趣。当时正值1980年代,“科学是第一生产力”和“计算机要从娃娃抓起”的口号振聋发聩,整个社会推崇科技创新的氛围开始形成。
1990年,王小川考进成都七中。这所中学日后走出李飞飞、周涛、任宇昕、庄莉、陈科屹和陈睿等一批在中国和世界的互联网和人工智能领域叫得出名号的人物。
据一位校友回忆,“成都七中也分‘阶层’,最好的是理科实验班”。王小川于1990年考进成都七中“综合数学实验班”,而且是第一名。
七中注重素质教育,兴趣社团很多。除此以外,七中比较知名的是在各种学科赛事中取得好成绩。1996年,王小川参加了“国际信息学奥林匹克比赛”,在来自56个国家和地区的222名选手中,王小川以第二名的成绩获金牌,那年他18岁。
“国际信息学奥赛”集训的带队老师是清华大学的吴文虎教授。从1984年开始,他便开始参与中国计算机科学的普及活动。“国际信息学奥赛”中,吴文虎教授从命题、考试到选人出国比赛全程深度参与,他事后回忆,“孩子们那么棒,参加完以后我就喜欢了。”
1996年,王小川被点招入清华大学计算机系学习。2000年成为清华保送研究生。2010年又从清华大学经济管理学院的EMBA毕业。2018年9月,已经是上市公司CEO的王小川又回到了清华,开始了他的博士生涯。
很多学霸毕业后去搞学术研究,在象牙塔里过完余生。但王小川的轨迹从1999年开始发生分化,那一年,大三的他去刚刚创立的校园网“ChinaRen”兼职,2000年,ChinaRen被搜狐收购,他转到搜狐兼职,2003年研究生毕业时就进了搜狐。
“当时的搜狐更偏重于媒体定位,编辑部工作的状态,小川有很强的、在搜狐建立一股技术驱动力量的意愿”,搜狗CTO杨洪涛向PingWest品玩回忆。
张朝阳很尊重这个想法,也想和百度在搜索引擎上竞争一把。从2003年起,搜狐启动了技术条线,成立搜狐研发中心,25岁的王小川出任负责人。
梦之队的初始
搜狐技术研发线的演进和发展,更像王小川在搜狐的一次内部创业。
从团队来看,王小川带领的“搜狐研发中心”开始只有十几人,“6个正式员工,剩下的都是清华大学找来的在校生兼职。”杨洪涛回忆。2003年,他在同班同学林凡(也是王小川团队早期成员,脉脉创始人)的推荐下加入搜狐,此前,他在清华的BBS里也和这位师兄聊得很熟。
从北京中关村搜狐媒体大厦到五道口搜狐网络大厦,相隔1.9公里,虽然两座大楼都有“搜狐”这个词,却相互独立运营——而这种独立性可以追溯到2003年,王小川出任研发中心负责人开始。“搜狐研发中心”最先和搜狐一起在长安街沿线的某写字楼办公,为了方便团队里的兼职学生骑车上下班,王小川便“自作主张”把办公地点搬到联想桥附近。
这十几个人要做一个叫“搜索引擎”的产品,技术挑战性极大。
彼时,中国市场上,1999年从硅谷回国的李彦宏已经创业做起了百度,并与同从美国归来的张朝阳走了一条不同的路:搜狐对标“雅虎”,百度要做Google。
但搜狐研发中心并不要做雅虎。
杨洪涛回忆,团队从第一行代码开始写,“参照Google最早的page rank底层排序算法的论文”,一点点摸索,2004年8月推出成熟产品。“搜狗”这个名字由张朝阳敲定,据说,与电影《大腕》有点关系,因为里面有句台词“别人搜狐,我们搜狗”成为当年金句,“搜狐”之后“搜狗”,灵感来自于此。
2017年11月,搜狗在纽交所IPO,王小川接受采访时总结:“搜狗的搜索引擎在移动端取得17.8%的市场份额,输入法有超过5亿用户。”“我们重新定义了输入法,在搜索上取得一定的市场份额。”这应该是多年后,王小川对搜索产品比较“中肯”的评价。
其实,对于搜狗来说,启动做搜索是一件比较危险的事,王小川在一次接受采访时表示,“无知者无畏”,因为百度从1999年就入手中文搜索,而2003年搜狐才启动搜索业务,最让王小川团队感到压力的是百度于2005年8月在美国IPO后,在资本加持下,百度取得“指数级”发展,“我们那会儿就发现了这事有天花板,只有想办法从别的方面去追赶,也才有了后来的输入法产品”,杨洪涛向PingWest品玩回忆。
走自己的路
中国搜引擎市场在2005年突然热闹起来,百度赴纳斯达克IPO、Google入华、搜狗搜索入局,“一家独大”变为“三足鼎立”,而百度先入为主,在市场份额上一直领先。
“如果你做的事和百度一模一样,当然没有追赶的可能,我们有一个懵懵懂懂的想法,就是要和它不一样。”杨洪涛说道。
这时,有一个资深用户开始向搜狗搜索团队提建议,他叫马占凯,因为他提的建议集中在用户体验层面,例如色彩、字号、字体、界面设计等,而此时,因为搜狗搜索团队主力都是从清华大学计算机系过来,有很浓厚的“工程师基因”,还差“产品基因”,所以马占凯是以“产品经理”的身份被招进搜狗的。
后来,杨洪涛他们很快发现,马占凯除了给搜索产品提建议,还有很强的意识:“中国市场上还差一个给力的中文输入法,应该由搜索引擎去完成”。据称,他此前就给百度发过邮件,最后还是不了了之。
马占凯在日后被称为“搜狗输入法之父”。
2005年本科毕业的马占凯没有计算机背景,他是在敲字时发现,当时所有的拼音输入法在输入词语时,需要一个字一个字去选择,而他会跳出输入法,去搜索引擎里找词粘贴过来。
他曾经做过一个猜测:搜索引擎有一个人工整理的巨大词库。后来他又了解到搜索引擎的原理:当用户输入关键词,达到一定数量,这个关键词就被收入搜索引擎词库。换言之,用搜索引擎来生成一个常用词的词库,花费极小。这让马占凯隐隐觉得,让搜索引擎来做输入法大有可为。
“搜索本身积累了网上海量的语料,假如网上有一个高频热词,你敲音就能匹配它,这是输入法的词库和语言模型,输入引擎的这个工作,是技术挑战或者是叫做技术积累才能做出来的。”杨洪涛向PingWest品玩分析。
在当时的背景下,2006年推出的搜狗输入法为第一款为互联网而生的输入法——它通过搜索引擎技术,将互联网变成了一个巨大的“活”词库。网民不仅仅只是词库的使用者,同时也是词库的生产者。这是一“破局”的方法,让搜狗输入法得以后来居上。
输入法的确一改搜狗在竞争中的被动地位,当时的百度还醉心于搜索引擎产品,让搜狗在竞争上赢得一个窗口期,而Google中国团队也意识到输入法的重要性,于2007年4月4日推出了中文输入法产品。
但是2007年4月9日,Google在官方博客上向搜狗公开道歉,原因是在做输入法这个产品时,Google中国盗用了搜狗词库,遭到当时舆论的口诛笔伐。“一个巨头向我们这样的创业公司道歉,反而让搜狗的声量迅速提升”,杨洪涛到今天回忆起这段往事时,还是免不了有些兴奋。
王小川也在日后总结:“第一,搜索让我们积累了大量的词库,使得我们做输入法时,可以将这些积累用到了产品中。第二是做这个产品的能力,给了我们一个机缘去认真对待输入法这样一个产品。”
从搜索梦之队到人工智能梦之队
搜狗输入法取得成功后,“独立”成为一件呼声很高的事,也得到了搜狐内部的认同。2010年,搜狗从搜狐集团独立出来,王小川也从“体系内创业者”变为“独立创业者”,此后,搜狗面临着移动互联网和人工智能两波浪潮的“洗礼”。
这时的中文搜索引擎市场,由于Google的退出,让百度一路高歌猛进,他于2011年曾经在市值上超越腾讯。那时的腾讯正处于“调整期”,2011年前后,的确是属于百度的“黄金时代”。
此时的“搜狗拼音输入法”开始出现在更多的手机上。2009年,搜狗发布第一个Android版本,将PC端的优势移植到移动端。极光大数据显示,截至2018年6月,搜狗输入法App市场占有率已达到70%。
“人工智能”在中国成为热词是2016年,但搜狗的布局始于2011年。王小川在接受采访时表示:“搜索公司本身是AI公司,有能力处理大数据,有很高的计算力,应用最前沿的算法,深度学习到来之后我们第一时间就可以把这样的技术转化为我们的生产力。”
而这一点,也是走过“黄金时代”的百度在试错O2O后,开始明确All in AI的关键。
王砚峰是搜狗公司语音交互技术中心总经理,他告诉PingWest品玩:“在输入法上,语音输入一定是未来形态。”他同样是清华毕业于清华,2008年硕士研究生毕业后来到搜狗,一路成长,至今已经10多年了。
2011年,搜狗组建语音识别团队,王砚峰参与其中。因为有搜索和输入法的“底子”,让它现在的整体定位更倾向于“让表达与获取信息更简单”,包括输入过程中的语义理解,词库智能推荐等,便是由王砚峰的团队在背后耕作。
此后,搜狗还推出“明医”——医疗方面的专业搜索,以及“搜狗翻译”——让中文用户可以获得更多的跨语言信息。一方面是为了与百度产生差异化竞争,另一方面体现了“让表达与获取信息更简单”的理念。
“中国网民获取得更多的是娱乐信息,专业信息很匮乏”,王砚峰解释。而在网上,医疗信息的搜索又是一种“刚需”,因此,搜狗明医在知识树的构建上,整合了国家权威机构、卫计委、卫监委,三甲医院的名医资源。
搜索和输入法的产品体验更好也与深度学习平台相关,王砚峰告诉记者,在搜狗做研究并不是为了出Paper(论文),而是更好地做产品,“在深度学习这件事上,我们觉得只要有Google一家就好,在这个过程中,反倒是怎么利用Google的能力来反哺搜狗自己的能力。”
2017年上半年,Google发布了一个Transformer翻译技术架构,搜狗为国内第一家完成更新,这个技术上线后,让搜狗翻译错误率降低了10%~20%。
一个学霸带领一群学霸,做出搜索引擎、输入法,继而布局AI、挑战既有格局。从成都七中到清华大学,从全国学科竞赛到“国际信息学奥赛”冠军,这是王小川的人生起点,而他一路”开挂“的历程,正是中国计算机基础教育从无到有,中国计算机科学发展进步,以及中国互联网和人工智能走向世界的全过程。
这决定了王小川的“人才眼界”。搜狗CTO杨洪涛2003年清华大学计算机系毕业后一年加入团队,和王小川一起扛过很多难关。王砚峰也毕业于清华计算机系,一直在搜狗工作,从基础的研发人员一路成长。
搜狗核心人才团队以清华大学为主线,有这样全国计算机学科第一的学校输出学术背景浓厚、高素质的人才,搜狗才在异常复杂的竞争中实践着王小川“和一群人奋斗着是幸福的”人生愿景。
而这也是这个时代的主线。
(本文由新经济沸点郭娟原创,未经授权,不得转载。本文首发PingWest品玩)
原创文章,作者:天骄,未经授权,请勿转载。新经济沸点优质内容同步到虎嗅、钛媒体、36KR、21财经、亿邦动力、创业邦、和讯网、新浪看点、微博、搜狐、网易、一点资讯、百度百家、今日头条等平台。