■本期关注
谷歌大脑高级研究员刘小兵
■人物风采
刘小兵(1983 年生),2009年毕业于北京大学计算机专业,先后在腾讯、雅虎、360等IT行业巨头工作,2014年加入全球顶尖研究团队——谷歌大脑,专注于深度学习研究和应用,对谷歌神经网络翻译系统、TensorFlow机器学习开源平台贡献卓著。在此三年间,他发表了两项专利技术和若干篇关于人工智能的论文。
2012年的美国,谷歌大脑(Google Brain)通过深度学习技术,成功让16000台电脑学习1000万张图片后,在YouTube视频中认出了猫。对于大众而言,这大概是第一次获知谷歌大脑这个有点儿神秘的研究机构的存在。同一年的中国,在机器学习领域浸染多年的刘小兵,开始告别懵懵懂懂觉得“深度学习是未来”的简单笼统,从此坚信深度神经网络是通往人工智能(AI)的一把钥匙。两年之后,他拿到了谷歌大脑这个被世人仰望的研究机构的通行证。
“做最先进的技术让我有成就感”
采访的时候,刘小兵一直说自己是个没有故事的人。但历经九轮最挑剔严苛的面试,加入到谷歌大脑这个全球顶尖的研究团队,本身就是一个值得一说的故事。
刘小兵是如何被谷歌大脑背后的“大脑”Jeff Dean选中的呢?这要从他职业生涯的开端说起。2009年,从北京大学计算机系研究生毕业的刘小兵加入了腾讯公司。那个时候,人工智能、深度学习这些词汇对公众来说还有点陌生,从研究生就开始机器学习的刘小兵为腾讯写出了命名为“奥林匹克”的广告算法系统,一直到现在腾讯还在用他写出的这套系统。后来,刘小兵离开腾讯加入雅虎公司,在被借调到美国总部工作的时候与谷歌大脑的负责人Jeff Dean有过交流,其多年专注于机器学习的技术背景和工作能力得到了Jeff Dean的肯定。在刘小兵回国加入360公司不久,就收到了这家一流技术团队的面试邀请,随后一路过关斩将成为正式成员。
谷歌大脑是个怎样神奇的存在呢?谷歌大脑是2011年从Google X孵化出来的一个深度学习的研究项目,目前谷歌大脑的负责人Jeff Dean、当时还在斯坦福任教的前百度首席科学家吴恩达和谷歌的另一位研究员Greg Corrado是这个项目最初的三位成员。他们在业余时间把深度学习带到了人工智能问题的解决中,并在短时间里就创造出了惊人的效益,所以短短一年的时间,谷歌大脑就从Google X独立出来了。随后,谷歌开始在全球招兵买马充实谷歌大脑的研究队伍,比如2013年收购Geoffrey Hinton创立的DNNResearch公司,2014年收购DeepMind……刘小兵也是在2014年收到了谷歌大脑的工作邀请,彼时这个团队大概只有30个人。
“作为谷歌最核心的部门,谷歌大脑输出了强大的算法和TensorFlow这种能力,而且不断地向各部门证明,加上人工智能的技术会给产品带来很大飞跃,比如最近YouTube的播放量通过采用谷歌大脑最先进的推荐技术大概有了20倍的提升。”刘小兵说。
刘小兵详细解释了深度学习这项AI技术的原理与应用。“深度学习是机器学习的一种技术,特指深度神经网络,模拟人类大脑结构的神经连接。基本就是给机器一堆数据,让机器从这些海量的数据里自动学习规则,最后输出成你想要完成的任务。放到实际问题中,比如说图像识别,给一张猫的图片,我们一眼就能看出它是猫,但机器看到的是一堆像素。图像识别中有一个概念叫做深度卷积网络,基本含义就是把一张图片传到网络中,网络中有很多层状结构,每一层都会学会图片中的不同信息,比如第一层是颜色,第二层是形状,第三层是花纹……经过多次学习,机器就能得出结论,这张图片是一只猫还是一只狗。具体到应用来说,比如自动驾驶,就是做这样一个网络,让你能够识别图片里是行人、路灯还是对面的车来了。”
谷歌大脑不做产品,但那些我们耳熟能详的谷歌明星产品的诞生都离不开这个团队的努力。而对于刘小兵个人来说,他在谷歌翻译系统和TensorFlow平台开发中的贡献最为卓著。
TensorFlow是专门给深度学习做的一个基础平台,也就是第一代大型深度学习系统DistBelief的前身,用于各种感知和语言理解任务的机器学习。2015年谷歌将TensorFlow作为开源软件发布,普遍应用于各种领域,是目前全球最火并占据绝对统治地位的机器学习开源平台。而且已经进入很多大学的课堂,比如斯坦福、伯克利,也受到一些顶级研究机构的青睐,比如OpenAI、DeepMind,还有很多中国的公司也都在使用。据刘小兵介绍,TensorFlow目前在GitHub上有超过一百万的下载量。
谷歌翻译作为应用最为广泛的翻译系统,在谷歌大脑团队深度学习技术的帮助下也已取得前所未有的突破,于2016年推出了神经网络翻译,不仅大大提高了翻译质量,还可以实现103种语言之间的两两翻译。而更进一步的发展就是实时翻译,谷歌刚刚发布的Pixel无线耳机支持40种语言实时翻译,这项只有在科幻小说中才看到过的技术,无疑将从根本上改变我们与世界的沟通方式。在刘小兵看来,机器翻译的质量会越来越好,未来两三年内同声传译这个行业用机器学习的方法就可以被代替。
谈起在谷歌大脑工作的感受,刘小兵坦言和很多牛人在一起工作会发现自己成长得非常快,同时自己做的技术在全球是最先进的,而且做的事情是会影响某个方向的,也让他觉得很有成就感。
值得一提的是,刘小兵在谷歌大脑的三年间已经发表了两项专利和4篇论文。
“AI的未来更值得期待”
自认“入门较晚”的刘小兵并不是那种少年天才型的人,但他在专业领域的每一步都走得相当扎实。
从高中时觉得玩计算机是很酷的事情,到大学时开始学习编程并逐渐热爱这个行业,再到研究生时正式接触机器学习并将其当做终身事业……刘小兵走出了一个“好学生”的标杆。他大抵就是那种不知青春期为何物的好学生,觉得自己做过的最“出格”的事情是大学时为了争取举办一个有稍许争议的座谈会,去校长办公室坐了好几个小时。而这偶尔“出格”的理由也不是开这个座谈会本身会给他带来什么,只是简单地觉得“通知都发出去了,再说不开了不太好”。
求学时,他的心思不在清风霁月,也不在庙堂江湖,他对自己的评价是“动手能力比较强”,当实验室里的研究已经不能满足他的求知欲的时候,他给自己找了份在百度实习的工作。虽只是学生,实力却得到了前辈们的认可,未毕业时百度公司就对他发出了工作邀请。
作为一名在机器学习领域深耕了11年的老将,刘小兵认为自己一直在做一件影响深远的事情。虽然人工智能早已渗透到我们生活中的方方面面,比如电商推荐广告、金融反欺诈、个人征信系统等等,都是人工智能应用得最成熟的领域。但在刘小兵看来,人工智能的未来更加值得期待。比如当下正火的自动驾驶,还比如在医疗方面的应用。
“一个医生每天能够看的病人是有限的,如果机器把所有的历史病历学过之后能看的比医生还要好,就能够大幅提高看病的效率。机器会根据患者的历史病历做一些辅助诊断,不断检测你的血压、糖尿病的数据,如果你的血压突然变高了,会根据你的历史病历做出一些判断和预防。”刘小兵透露,谷歌大脑目前目前有专门的团队,叫做MedicalBrain,专注于用深度学习技术改变医疗行业的研究。
近年来,全球都在人工智能技术上砸入重金。有数据显示,2016年全球对人工智能的投资金额为42.5亿美元,近五年的年均增长率达到50.11%。人工智能领域的全球风投也从2012年的5.89亿美元猛增至2016年的50多亿美元。如此狂热的投入一度让专家们心生忧虑,人工智能威胁论也因此喧嚣尘上。
但刘小兵认为,现在担心人工智能的威胁还为时尚早。“我比较认同吴恩达的一个观点,现在担心人工智能控制世界,等同于担心火星上人口过剩。目前人工智能的发展还是人类在控制的,还远没有发展到自动进化出意识。”
但毋庸置疑的是,人工智能正在描绘一个巨大的未来市场,将催生数个千亿美元甚至万亿美元规模的产业。以金融行业为例,据高盛公司估计,到2025年,人工智能可通过节省成本和带来新的盈利机会创造大约每年340亿至430亿美元的价值。
而刘小兵,正是在这些千亿美元甚至万亿美元产业上行走的人之一。他说,人工智能是值得他奋斗终生的事业。