EnglishRSSApp/Android客户端iPad客户端Kindle版手机版天猫旗舰店

洞察在前,算法在后——人工智能vs人的智能

作者:曾鸣 2016-08-24 14:52:13 0

最近有一则消息很微妙:谷歌的围棋算法模型AlphaGo战胜韩国顶尖围棋手后,再一次登上围棋手世界排名第一的王座。这让原本不少人对算法的误解进一步加深了——看上去算法无所不能,而且在计算机的掌控之下自我进化,非人力所能及,再发展下去,算法统治人类也不再是科幻了。

正因为有这样的误区存在,《哈佛商业评论》中文版2016年8月刊《你要管理你的算法》这篇文章的价值就尤其凸显,它细致而具体地阐述了人对算法干预的具体场景,从一个侧面诠释了人在未来数据智能发展中的关键作用。

算法从来不是独立的

毫无疑问,“管理”算法是人的智能对人工智能发挥作用的一种重要形式,不过,或许更重要的还有“创造”。

在《智能商业》一文中我们特别提到,算法的目的是让传统商业升级成智能商业,而“智能”的关键就是算法和产品、数据的“三位一体”。从这个意义上说,算法从来不是独立的,把数据智能和特定用户需求无缝融合在一起,创造全新的用户体验,这才是算法的本质。从算法发展的实践中看也是如此,人的创造力贯穿数据、产品、理论等各个方面,才使算法发挥出价值。

在数据层面

给算法使用哪些数据,基于数据建立怎样的机器学习模型,怎么形成数据的反馈闭环,都是人主导的最基础的创造性工作。比如在收集搜索相关性的反馈数据时,算法工程师和数据科学家不仅分析曝光、点击和跳失等用户行为,同时也常常通过采集注意力、停留时间以及脑电波反应等方式,进一步综合全面地评估用户反馈。

而算法从模型到实时大规模计算部署,更是算法工程师、数据科学家和工程师集成的智力创新过程——如何让算法模型在大规模分布计算集群中进行高效的计算。

这其中的任何一个小小的创新都会带来巨量的价值。例如最近DeepMind用机器学习的方式对计算机集群的智能提效。这些创造性的过程靠算法自己就不可能完成。

例如要测量一个贷款者的信用度时,通常算法使用贷款者的经营数据(财务报表)和以往还款情况数据(信用记录),这和传统银行的做法并没有什么本质区别,但蚂蚁金服的算法模型则使用了贷款者在玩网络游戏中的行为数据作为多一个维度,他喜欢冒险吗,容易逃跑吗,这些数据某种程度上更直观地反映了贷款者的性格特征,而更丰富的数据维度也让算法对贷款者的信用度具备了更精准的认知。

大数据的“大”核心不在数据之多,真正重要的是异质数据的联结,也就是能够为模型带来信息增益的数据。而哪些异质数据,联结起来会产出哪些效果,找到和创造机制去联接这些数据,这需要的就是人的创造力和洞察力。少了它们,算法的效能就只能局限在一个狭簇的范围里。

在产品层面

人的智能主导算法工作和进化方向。同样的例子在产品层面也屡见不鲜。推荐算法已经应用在很多互联网产品中,但也闹了不少笑话。搜索了一次红内裤结果,就满屏的红内裤推荐,看了一次美女图,结果新闻客户端上天天推荐美女图,这对用户带来的价值有多少呢?

推荐算法的价值是给用户找到“意料之外情理之中”的信息。一个买家下单了最小号的婴儿纸尿裤,这可能说明他有了下一代,3个月后给他推荐中号纸尿裤就是对的。另一个读者点开了亚马逊雨林旅行攻略的文章,他可能正在谋划一次探险,给他推荐《野外生存必读》就是对的。

这种思维方式就是“联想”,对人类来说很简单,对机器来说太复杂。机器只会重复性思维,要把人的复杂的、创造性的联想思维告诉机器,算法才会实现这个思维。当然,可能一位算法工程师会说,只要数据足够大,我就可以让机器联想,但反过来这也恰恰说明,将人的创造力加诸算法将带来怎样的效率提升。

创造性地利用算法

智能商业当然依赖计算机领域的突破。AlphaGo 就是算法本身的突破,而怎么创造性地用好这些新算法,才是下一步的大挑战。这和社会科学理论的突破也有很大关系,例如打车软件在高峰低谷时段的动态定价模型,就是建立在经济学关于供需均衡的理论基础上的。

更典型的例子则是淘宝。淘宝本质上不是一个统一的在线大市场,而是很多个相互区隔又相互影响的双边市场的集合。那么,怎样将这些不同的市场区隔出来,怎样根据不同市场的特质界定“优质”的商品,怎样制定适合不同市场的不同机制使优质商品能浮现出来,在我们人类自己想明白这些问题之前,在社会科学就“市场区隔”这个主题实现理论突破之前,算法是无法自动给我们一个答案的。

本质上,这些都是人的创造力对算法产生的决定性作用,洞察在前,算法在后。很多人以为在数据智能时代已经不需要社会科学理论了,不需要因果关系了,不需要人的洞察力了,智能的机器都搞定了,这其实是极大的误区。算法无法超越设定者的框架,即便深度学习(Deep Learning)可以给我们更多在相关性层面上的发现,它也无法超出其本身的局限。

真正超越性的力量仍然在人类本身:人对事物本质的洞察,对因果的思考,对理论的提炼,以及将这些创见落实到数据维度、算法结构和产品模型的能力。每一次人类在这些方面取得的创造性成果,都带动数据智能发生一次关键性突破。

人的智能(创造力)和人工(机器)智能是相互促进的——算法的每一个环节都体现了人的创造性,而算法又使人更专注于创造。200多年前,工业革命使机械取代了人的劳动力,让更多人可以从繁重的体力劳动中解脱出来,进行知识的探索,从而带来了伟大的知识经济时代。今天,当算法把人从简单脑力劳动中解放出来时,我们可以预见更伟大的知识创造。

这就是为什么我们说数据时代真正是创造的时代,正如佩德罗·多明格斯(Pedro Dominguez)在《主算法》(The Master Algorithm)这部书中所写的:“未来的竞争并非人对着机器,是人对着有机器的人。”而人工智能如果带来毁灭性的后果,很大程度上也将源于人的误用,而不是机器自身的演化。一如核武器。(时青靖 | 编辑)

曾鸣是阿里巴巴集团总参谋长,曾任教于长江商学院和INSEAD.

本文有删节,原文参见《哈佛商业评论》2016年8月《人工智能与人的智能》。

关键词:
相关阅读

已有0人发表了评论

哈佛网友评论