250多年以来,驱动经济增长的根本动力是技术创新,其中最重要的创新即经济学家所谓的通用技术,包括蒸汽机、电力和内燃机等。在这些技术之后,补充性创新和机会大量涌现。举例来说,内燃机问世后,汽车、卡车、飞机、链锯、剪草机,以及大型零售商、购物中心、交叉配货仓库、新供应链,甚至包括郊区的概念都相继出现。沃尔玛、UPS和优步等多元化公司利用该技术,创建新的商业盈利模式。
我们这个时代最重要的通用技术是人工智能,特别是机器学习技术(ML)——机器不需要人类对所担负任务作出明确指令,有能力自主提升表现。过去几年中,机器学习的效率和普及程度显著提高。我们现在可以开发能够自主完成任务的系统了。
为什么这件事意义重大呢?原因有两个。首先,人类所知胜于其所能言:我们无法准确说明很多任务的操作过程,从人脸识别到亚洲传统策略游戏围棋。在开发ML之前,我们还不能清楚解释自身所具备的知识,所以多项任务都不能实现自动化。但现在我们有能力了。
其次,ML系统往往是出色的学生,在多种活动中都有超越人类表现,比如侦查欺诈交易和监测疾病。“优秀”的数字ML系统在经济的层层面面中都得到应用,未来影响不可小觑。
人工智能(AI)将在商业领域中产生巨大影响,在极大程度上扩大早前多个通用技术的应用规模。虽然现在全球数千家公司已经在应用人工智能,但绝大多数重要机会尚未发掘。人工智能的影响在接下来的10年中不断放大,制造、零售、交通、金融、医疗、法律、广告、保险、娱乐、教育及几乎所有其他行业都会改革核心流程和商业模式,从而搭上机器学习的顺风车。现在,瓶颈出现在管理、执行和商业想象力方面。
然而AI像很多新技术一样,也让人们产生多种不切实际的期望。我们看到不少商业计划书随随便便提到机器学习、神经网络和其他技术,但和这些技术的实际能力并没有多大关联。比如,仅仅称一个约会网站“受AI驱动”,该网站不会因此变得更有效(但可能获得筹款)。本文求真务实,旨在描述AI的真正潜力、实际应用和阻碍其应用的障碍。
如今的AI能做什么?
达特茅斯大学数学教授约翰·麦卡锡(John McCarthy)于1955年首次使用“人工智能”一词,次年他就该话题组织了一次意义深远的会议。自此以后,关于人工智能的大胆假设和宣言层出不穷,可能部分原因是这个名字让人们浮想联翩。经济学家赫伯特·西蒙(Herbert Simon)1957年预测,计算机将在未来10年内打败人类国际象棋棋手,但实际上计算机用了40年时间。认知科学家马文·明斯基(Marvin Minsky)1967年说:“‘人工智能’的创建问题将在下一代基本得到解决。”西蒙和明斯基都是才智超群的人,但他们的预言大错特错。所以,这些对未来重大突破的大胆假设遭到质疑,也在情理之中。
我们先来看一下AI现在做的事及其进步速度。最大的进步出现在以下两大领域:感知和认知。前一类别中出现的一些重大实践进展与说话有关。虽然语音识别仍有很大改善空间,但数百万人都在使用该功能,相关应用比如Siri、Alexa和谷歌助手。你正在读的文字最开始是口述给计算机,然后计算机提供足够准确的速记稿,比打字速度更快。斯坦福计算机科学家刘哲明(James Landay)及同事发现,语音识别现在比手机打字平均大约快3倍。误差率也从之前的8.5%下降到4.9%。令人震惊的是,这一显著改进在过去10年中都没有出现,仅仅在2016年夏才有突破。
图像识别也有显著提升。你可能已经注意到,Facebook和其他应用软件如今能认出你所上传照片中很多朋友的脸,并提示你标出他们的名字。你的智能手机上运行的应用软件几乎可以识别出野外所有的鸟类。图像识别甚至取代了公司总部的身份证件。自动驾驶汽车使用的视觉系统等类似软件,此前识别行人时每30帧错误一次(这些系统中的相机每秒大概记录30帧),现在误差率骤降,低于每3000万帧一次。大型数据库ImageNet识别数百万张普通、模糊或离奇的图像,最优系统的误差率在2010年为30%多,2016年时降到了约4%。(见边栏《小狗还是松饼》)
近几年来,基于大型或“深度”神经网络的新方法得到应用后,人工智能改进速度再次加快。尽管视觉系统的ML能力依然问题重重,但人类的表现也不稳定。他们也不能迅速识别小狗脸,甚至有时还会在没有图像的地方看到小狗的可爱小脸,这真是尴尬。
第二类重大突破是认知和问题解决能力的提升。机器已经打败了最优秀的人类扑克牌和围棋选手,虽然专家曾预言这一成就起码还要再等上10年才能实现。谷歌的DeepMind团队利用ML系统,在人类专家对系统的优化基础之上,将数据中心的冷却效率进一步提高15%以上。网络安全公司Deep Instinct和PayPal分别利用智能代理检测恶意代码和防止洗钱。搭载IBM技术的系统将新加坡某保险公司的索赔流程自动化。数据科学平台公司Lumidatum创建的系统还可以提供及时意见,改善客户支持服务。多家公司都利用ML决定执行华尔街的哪项交易,更多信贷决策都会借助于ML。亚马逊用ML优化库存,提高给客户产品推荐的准确率。Infinite Analytics开发的ML系统能够预测用户是否愿意点击某个广告,从而帮助某全球消费性包装品公司提高线上广告投放精准度。该公司开发的另一ML系统,帮助某快消品公司改善巴西在线零售商网站的客户搜索和发现流程。前一个系统将广告ROI提高了3倍,后者将公司年收入提高了1.25亿美元。
机器学习系统不仅正在取代多个应用软件中的传统算法,还在很多人类曾经最擅长的任务中有更优秀的表现。虽然这些系统还远远谈不上完美,但在ImageNet数据库中5%的误差率已经和人类的表现持平,甚至更优异。即使在喧闹环境中,语音识别现也能和人类有近乎持平的表现。系统到达这一水平后,就会为工作场所和经济改革开启无数新的可能性。一旦基于AI的系统在某项任务中超越人类,就有很大可能迅速得到大规模应用。比如制造无人机的Aptonomy和制造机器人的Sanbot正使用升级后的视觉系统,将多数安保工作自动化。软件公司Affectiva正用这些系统识别焦点小组中快乐、惊讶和生气等情绪。深度学习初创公司Enlitic使用视觉系统扫描医学图像,辅助癌症诊断。
以上都是AI系统的杰出成就,但其应用领域依然有限。比如,这些系统在ImageNet数据库上表现出色,能识别出上百万张图像,但并不代表它们“在自然环境下”也能有同样优秀的表现,因为照明条件、角度、图片清晰度和背景可能非常不同。此外,我们赞叹这些能够理解中文演讲,并将之翻译成英文的系统,但并不期望这类系统知道某个特定汉字的意义,更不用提在北京哪里吃饭了。我们会很自然地认为,在某项任务中表现良好的人也会在相关任务中展现同等实力。但ML系统只得到特定任务的培训,还不能举一反三。人们错误地以为,计算机能够不断扩展自己相对狭隘的知识面——这可能是他们现在困惑不已的原因,也是他们夸大AI进步程度的根本原因。现在的机器还远远不能在多个领域中表现出通才。
已有0人发表了评论
哈佛网友评论