与谷歌科学家杰夫·迪恩(Jeff Dean)的对话让我开始觉得数学与统计学是相当有趣的东西。
我们的对话主题是“机器学习”,这源于杰夫·迪恩和他的团队著名的“猫脸”实验。谷歌用1.6万块电脑处理器构建了全球最大的电子模拟神经网络,并向这个人工神经网络展示来自YouTube上随机选取的1000万段视频。结果,在没有外界指令的环境下,这个人工神经网络竟然自主学会了识别猫的面孔。
要知道,杰夫·迪恩从未告诉过这个人工神经网络“猫”是什么概念,甚至未曾向它提供过一张标记为猫的图像。“这好像是新生儿在成长中自然习得的过程,它拥有自我意识,它是自己从未标记的YouTube静态图片中发现了猫是什么样子的,”杰夫·迪恩说,“例如把孩子放在车里,让他从车窗观察外面的世界,他会看到各种各样的机动车和自行车,并没有人去告诉他这些物体是什么,他是通过自己的观察来去总结同类的事物。”
这就是机器学习的与众不同之处,它产生了“自我学习”。
在人工智能的浩瀚海洋当中,机器学习俨然是最热门的话题。如果你认可计算机科学之父艾伦·图灵(Alan Turing)在1950年为人工智能下的定义:若一个人无法判别和他聊天的是另一个人还是一台电脑,那么这台电脑就实现了人工智能;那么机器学习的新意在于,让机器像人类大脑一样思考。
“机器学习是关于计算机基于数据构建模型并运用模型来模拟人类智能活动的一门学科。”机器学习专家、华为公司诺亚方舟实验室首席科学家李航博士曾为机器学习下过科普定义。这个对于外行人来讲仍略显晦涩的科技概念,实际上已经植入到我们日常生活的诸多细节,例如语音识别、垃圾邮件拦截、无人驾驶汽车、甚至淘宝网的商品流行推荐。
拿去年iPhone推出的语音助理服务Siri举例,那是一位多么温柔体贴的个人助理。她为手机使用者提供天气预报、餐饮建议、唤醒问询等生活服务,像《生活大爆炸》(The Big Bang Theory)里那样与她谈情说爱也没问题。在每天成百上千条问题的轰炸下,她正日渐娴熟,不仅不会所答非所问,甚至还会判断你是不是喝醉了酒,是否需要帮忙叫辆出租车。
一些机器学习系统的表现甚至已经赶超人类。比如瑞士卢加诺大学Swiss AI实验室设计出一套系统,在交通标志识别的比赛中战胜了人类专家。
更高调的展示是在2012年的10月底,在由微软亚洲研究院和南开大学、天津大学举办的一次学术会议上,微软首席科学家理查德·F·拉希德(Richard F. Rashid)在礼堂里发表演说,电脑程序对他的讲话内容进行了识别,还用英语把这些内容实时显示在了他上方的大屏幕上。
之后,他在讲完每句话之后稍作停顿,电脑就把这些话翻译成了中文,同时还附上与他嗓音非常类似的中文配音。要知道拉希德从来都没说过也并不会说中文,这个展示赢得全场雷动般的掌声。
国际媒体并没有放弃这个热点,《纽约时报》发表头版文章,使用“真的很棒!”等字眼表达对机器学习前景的看好;紧接着,《纽约客》(New Yorker)也发表文章回应,“这让我们向真正的智能时代迈进”。
但杰夫·迪恩对我说,他的实验是机器学习的另一个层面,与上述这些例子所使用的技术处于两个维度。“把它叫做‘深度学习’更为恰当,这是机器学习的一个分支。”李航表示,这也是实现机器学习的一种途径与方式。这个过程大致是电脑模拟人类大脑的神经元,再由很多电脑搭建起与人脑的神经连结相似的神经网络,这就宛如一个小规模的新生大脑,这个“大脑”便可以像人脑一样感知、识别、记忆甚至思考。
尽管几家大型学术组织都正在对机器学习展开研究,“但谷歌希望让这项技术不限定于某一个具体的领域,而是能够使之规模更大,建立一个比较大的模型,从而让电脑系统能够去从原始的数据上获得更大限度的理解。”杰夫·迪恩说。这些人工大脑是否能够通过图灵的测试,尚未可知,但成果并非寥寥。杰夫·迪恩和谷歌语音识别团队尝试性地展开合作,用800个机器进行了为期5天的训练,很快就把识别错误率削减了25%,这个成就相当于研究语音识别20年所取得的成果。目前,这项技术已应用到语音识别技术中,让语音识别更加准确,这在Android 4.1版本的操作系统“Jelly Bean”中有所体现。
这是一项非常昂贵的科研项目,这些人工神经元造价不菲,且需要大量的数据。因为数据量越大,能够参与到机器学习网络中电脑的数量就会越多,在训练时,这个“人工大脑”的学习能力才会更强。“我们正在积极扩展系统,以训练更大规模的模型。”杰夫·迪恩说,“虽然现在还没有公认的方式将人工神经网络和生物大脑进行对比,但为了让你大概地感觉到所谓的‘更大规模’,还是可以与人脑做一个很粗略的比较——普通成人大脑大约有100万亿个连接。因此,在这一领域,还是有非常大的发展空间。”
确实,动物的学习是感受化的,而机器的学习是纯逻辑化的。与拥有800亿个神经元细胞、100万亿个链接的人脑相比,“人工大脑”恐怕还是笨拙得多。因此,当我在对人工智能是否会发展壮大以至于入侵人类的个性生活展开联想的时候,杰夫·迪恩仅仅是一笑了之,“要知道,目前我们所说的机器学习还只限于认知类,只能处理一些认知类的简单工作,”这位相当严谨的科学家解释道,而人们真正想要的,是获取期望中的与输入相匹配的、自动化的输出,例如“今天中午到哪家餐馆去吃饭”、“如何协调朋友和工作之间的关系”这些话题,是目前机器学习所不能达到的。
(感谢北京大学计算机系博士生候选人姚俊杰对本文提供的协助)
文章来源:《经济参考报》