2018年3月,特朗普总统发推文称,亚马逊“向国家和当地政府交的税几乎为零”,这导致公司股票月度表现降至两年内最低。特朗普所说并不属实,亚马逊股价逐渐回升——但该事件充分说明了一个令人不安的问题:公司极其容易受到社交媒体散播的虚假信息影响。当然,主流媒体主要关注假新闻是否影响到2016年的美国总统选举。但真相是,没有人能在这类伤害中明哲保身。假新闻的传播会危害到民主、经济、商业,甚至国家安全。我们必须齐心协力,了解并控制其传播。
过去三年间,我和索罗什·沃索菲(Soroush Vosoughi)以及德布·罗伊(Deb Roy)研究了假新闻的网络传播机制。我之所以用“假新闻”(false news)的标签,是因为“虚假新闻”(fake news)的含义已经极端化了:政客用这个词形容不支持自己立场的新闻。我们近期研究收集的数据覆盖了推特(Twitter)自2006年推出到2017年的历史。我们收集了这一时期内在整个推特中散播的12.6万个推特瀑流。我们验证了传播内容是否真实,并对比了真实和假新闻在网络上的传播力度。3月9日,《科学》杂志将我们的研究成果作为封面文章刊登。
我们的发现令人惊讶,更令人不安。在每个信息类别中,假新闻都比真相传播得更远、更快、更彻底和广泛,有时会高出一个数量级,而且虚假政治新闻比其他类信息传播得更远、更快、更彻底和广泛。
了解这一现象的重要性不言自明。此外,该问题十有八九会在好转之前进一步恶化,因为篡改视频和音频的技术正在进步,扭曲的事实显得不仅可信,而且很难被察觉。但好消息也有:研究人员、AI专家和社交媒体平台自身越来越重视这个问题,正在深入研究问题的本质和可能的解决方案。
我将在本文中探讨制止谣言传播的方法。成功制止谣言必须用到参与者教育、改变激励机制、升级技术工具和适度政府监控这四个环环相扣的方法,还要回答以下五个问题:
●我们如何教育人们发现并抵制谣言?
●我们如何打消人们散播谣言的积极性,鼓励善意沟通和传播真相?
●如何用技术工具,特别是算法来制止虚假信息的传播?
●监管机构如何有效参与,同时保证不破坏社交媒体创造的经济和社会价值?
●最重要的可能是,谁来认定哪些消息是真,哪些是假?
在阐述解决方案前,先认真思考一下,为什么我们要关注这一问题。
为何假新闻如此危险
人类自有历史记载以来,或者说自知道如何说话沟通以来,就在说谎和散播谣言。但今时今日情况大不一样了。社交媒体提高了信息传播的速度和广度,在短期内能产生极大威力。推特成立于2006年,在全球范围内有3.36亿活跃用户,而Facebook成立于2004年,有21.9亿个用户。这些平台成为了很多人的主要信息来源。但目前为止,由于平台故意不去审核所传播内容的质量,所以不论面对网络上的真相还是谣言,我们都没有防御措施。
容易在社交媒体平台上肆意传播的虚假信息不仅可恶,还很危险,且造成严重损失。显然,假新闻威胁到美国选举和民主的公正性。我们对罗伯特·穆勒(Robert Mueller)的“通俄门”调查尚记忆犹新,就胆战心惊地看到剑桥分析公司(Cambridge Analytica)前CEO亚历山大·尼克斯(Alexander Nix)在秘密录像中,透露了他的公司如何编造假新闻并在网络上宣传,进而影响全球选举。假新闻对美国总统选举和欧洲、非洲的选举造成多大影响,陪审团尚未得出结论。但多数专家都同意:网络谣言的散播严重干扰了民主进程。
如果执法部门和急救人员在恐怖袭击中试图用社交媒体收集信息,就有可能因假新闻错误配置自己的资源。举例来说,波士顿发生马拉松爆炸案后,麻省理工学院的校园,也就是我和沃索菲、德布的“研究基地”,接受恐怖主义调查并遭到封锁,当时虚假信息肆意传播。我们得到的信息过少,也不知道校园里哪个地方比较安全。我们试图用推特获得最新消息(比任何电视广播更新速度都快),发现除了真实的突发新闻外,还有不少谣言在网上传播并干扰执法人员。如果袭击者知道执法部门依靠社会媒体获取信息,就可以将计就计,主动出击,阻挠警方执法。社交媒体变成情报来源时,伪造信息就是种武器。
虚假信息危害到我们的经济、投资和公司价值。2014年,一条假推文称,巴拉克·奥巴马(Barack Obama)在某次爆炸中受伤,造成美国股市市值当天就蒸发了1300亿美元。现代投资基金基于社交媒体上蔓延的情绪,进行算法交易。当假新闻渗透到社会媒体中,自动交易工具会消化并根据这些信息进行交易。没人准确评估过根据假新闻进行交易的算法造成了多少损失,但类似的逸闻说明,社交媒体对经济的影响非常大。
虚假信息可能破坏企业经营的任何方面,比如扰乱投资,减少回报,造成需求预测、库存模型和规划失误。企业的声誉也会遭遇重创,进而波及市场估值。特朗普总统针对亚马逊的推文只是对企业造成伤害的谣言之一。事实检查网站Snopes定期更新的“最热门前50”谣言榜,包括2008年的美联航申请破产的传闻、2017年星巴克会向无证工人发放星冰乐的报道,以及2017年百事可乐CEO卢英德(Indra Nooyi)让新任美国总统的支持者“去别处购物”的传闻。和对算法交易一样,我们也没有十足的把握,预估虚假信息对单个企业造成的损失。但此类事件的频繁发生,说明该问题不仅存在,还愈演愈烈。
为何假新闻会四处传播?
为何假新闻传播如此之快,影响如此之广?我们研究中的一些发现挑战了貌似最合理的解释。比如,你可能认为社交媒体上的大人物幕后操纵了假新闻的传播,但我们的数据却显示,事实恰恰相反。传播假新闻的人和传播真实新闻的人相比,“触角”要少得多——他们追随者较少、关注的人较少、活跃度较低、身份验证不频繁、使用推特的时间较短。这些都说明,这两类人群之间的差异并非假新闻传播更远更快的原因,或者说对这一问题没有丝毫影响。
你可能还会以为(受报纸新闻和国会证词影响),机器人程序是传播虚假信息的始作俑者。但我们的数据显示,机器人对真假新闻传播速度的影响几乎一样——这说明假新闻传播更快,是因为人类更倾向传播谣言。
人们易受到谣言影响的原因,最好用所谓的“新奇假说”(novelty hypothesis)概念来解释。根据该理论,新奇的事物会彰显知情人的地位,所以能吸引人们的注意力并刺激分享。我们的研究中,假新闻的确比真相更新奇,人们也更倾向分享新奇的信息——“新奇”可以理解成“不同于推特用户往常所见”。谣言还能引发更大轰动和反感,而真相激起更强烈的期待、欢乐和信任。人们也许就是更倾向分享意料之外的淫秽新闻。
对抗假新闻
对抗网络谣言,一般采取的方法是从消费者的角度出发思考问题。举例来说,需求侧策略可能是,为消费者提供关于新闻或推文质量的信息,给他们引导。供给侧策略也许是,从源头处解决问题,如打消社交媒体和内容供应商刊登和传播假新闻的积极性。两种策略不仅互补,而且同等重要。算法在执行策略中无疑也极为关键。此外,政府必须清楚如何扮演好监督者(而非破坏者)的角色。
保护和教育消费者。假设我们可以通过贴标签,评估和沟通社交媒体上信息和新闻的准确性。我们已经在食品上实验过了。多数国家的包装食品一般都会贴有标签。我们知道食品含多少卡路里,含有几克糖、蛋白质和反式脂肪。我们甚至还知道食品是否有机、散养,或来自加工小麦或花生的工厂。(过去这一信息往往不常见,但在消费者的坚持下,加上政府制定并开始执行相关规章制度,这类信息已经随处可见。)
但我们在阅读新闻,特别是网络新闻时,得到的信息反而更少了。我们不知道源头在散播真实还是虚假的信息,不知道报道是真还是假。我们甚至不知道新闻如何制作出来的——发布者是从三个不同信息源还是一个信息源验证真伪。我们也不知道有多少记者参与报道、进行了多少次采访或调查时间有多长。
这是值得探索的方向,但也提出几个难以回答的问题:
我们知道如何正确辨别假新闻吗?我们在研究中使用推特瀑流,请六个事实检查组织评估了瀑流的真实性。接下来我们请麻省理工学院和韦尔斯利学院的学生独立审查,这些事实检查组织在瀑流选择方面的偏差。
显然,这一过程很难规模化推广。因此,创建能高效预测内容真实性的算法就显得至关重要了。索罗什·沃索菲的麻省理工学院博士论文在德布·罗伊的指导和我的指导下完成。他在文中开发了当时最先进的算法之一,用于自动实时发现和预测推特上散播的谣言真实性。他的分类系统利用语义和语法特征识别谣言,准确率高达91%;通过分析谣言的语言风格、谣言散播人的特点和传播力度,对谣言真实性的实时预测准确率达到75%。我看到该领域已经有更新的研究,而且前景广阔。但要找到业界一致认同的假新闻识别方法,我们面前还有很长的一段路。
谁鉴别真假?这个问题很关键,但答案并不明确。我们应该让Facebook和推特等平台担起这份责任吗?还是依靠本研究使用的这类事实检查组织?我们应该建立类似于独立委员会的组织吗?但似乎很难保证事实检查公司和委员会不会被政治化。在找到合理答案前,我们还需要进行更多思考和研究。
Facebook为应对在这一问题上面临的压力,最近宣布将在网站的新闻贴下面增添一个“关于文章”的按键。点击按键,读者会看到更多信息,包括同一话题的相关文章、同一家发布者近期刊登的报道,以及该发布者维基百科页面的链接。这可能是向正确方向迈出的一小步,我们明显还需要付出更多努力。
正确的标签能真正减慢假新闻传播的速度吗?关于标签有效性的科学证据现在还不明确。有些研究显示,标记假新闻可遏制虚假信息的传播。其他研究表明,标签实际上加速了传播。该领域鲜有已经发表的论文或经过同行评审的研究。所以我们需要通过实验确定,如何利用标签在最大程度上限制谣言的传播。比如,相比发布者维基百科页面的链接,“真实性分数”会更有效吗?
改变针对内容生产者、广告商和社交媒体公司的激励机制。社交媒体广告生态系统依赖于内容的传播。内容得到的注意力越多,创造的价值和广告收入就越大。所以当前数字广告商业模式在某种程度上,刺激了假新闻的传播——如上所述,谣言比真实信息传播得更远、更快、更彻底和广泛。2016年美国总统选举期间,马其顿地区制造的假新闻更多受经济因素影响,而非政治刺激。信息制造者仅仅认为,他们可以从假报道中赚取更多广告收入。
当然,刺激谣言散播的经济因素不仅只在短期内有效,还非常短视。从长期来看,假新闻的传播会破坏平台的声誉,危害到广告商,并损害诚实内容生产者的信誉——多数利益相关者都非常清楚这一事实。
在思考供应商想要(或应该)如何改革方面,我们尚处在非常早期的阶段。不过我看到了两大可能性。
1. 改革生态系统的商业模式。比较激进的方式是,用订阅模式取代Facebook和其他社会媒体公司的广告驱动型商业模式——原因在于,将点击率和参与度排在第一位,会刺激耸人听闻、挑起争端和虚假捏造新闻的生产。这种观点认为,如果用户只是按月交订阅费,激励因素就会从用户的最大利益出发,重新排列。
Facebook已经嗅到这一可能性。谢丽尔·桑德伯格(SherylSandberg)在《今日秀》中提出了将Facebook转变成“免费增值”(freemium)模式的想法,也就是说,用户可以付费关掉广告,也可能取消数据收集功能。从经济层面上讲,这的确可行:毕竟免费增值模式已非常普及。流媒体音乐服务商Pandora允许你免费听音乐,但会附加广告;要想关掉广告,你就要付费。《纽约时报》允许你每月免费阅读十篇文章;超过这个篇数,你就要付费。
但这现实吗?Facebook和其他大型公司创造了价值巨大的经济部门。如果监管机构不向这些公司施加重压(我会在下文阐述),很难想象它们会放弃自己曾经创造的赚钱机器。
即便我们可以魔棒一挥,彻底改革社交媒体平台公司的基础商业结构,但这样做明智吗?很多生产多元化、非主流内容的长尾出版商没有广告收入的话,就不能生存,因为只有更大的玩家才有足够大的规模,让订阅模式有效运转。消费者不会给多项服务付费,一般会在每个内容类别(新闻、体育、评论)中选一项付费服务。因此,内容制作的市场可能会缩水,资源集中到几个大型公司手中。信息多样性缺失,会对社会造成极大的损害。
这一改革不仅会伤害到出版商及其消费者。社交媒体的数字营销生态系统养活了其他很多公司,而且对海量工作和输出信息(来自不同品牌、广告商、交易桌面、需求侧平台、广告交易平台、广告网络和供给侧平台)负责。
另一需要权衡的事项是,向订阅模式过渡可能加速不平等。根据2017年皮尤研究中心(PEW)的调查,近70%的成年美国人“至少会通过社交媒体了解一些新闻”,而使用推特的人中,70%的人称他们用推特获取新闻。除了新闻外,Facebook的用户还可获得关系和人际网络方面的信息——这些对找工作和管理商业机会都至关重要。向订阅模式过渡几乎肯定会限制无力付费的人群获得信息的渠道。
向订阅模式转型还可能拉大“隐私差距”(privacy gap,我将之定义为社会中隐私的不平等分配)。只有更富裕的用户才能支付每月9.99美元的Facebook订阅费用或其他款项。如果我们认为隐私非常珍贵,保护个人数据很重要,那么该如何看待富裕群体可支付免于监控的费用,而穷人必须交换隐私,才能获得信息和工作的社会现象呢?
底线:社交媒体生态系统不可能发生剧变,至少在美国如此。在我看来,这也不应该发生:严厉管制有可能破坏这些公司为消费者和股东创造的价值,造成许多意料之外的负面后果。但我们还有一种较保守,但更实际的方案。
2. 对系统只调整,不改革。平台公司能够减小假新闻的传播力度。平台可以选择其他合作伙伴,共同教育和保护消费者——尽最大力量发现和标记谣言,希望用户分享假新闻前会三思。
这种干预要求对社交媒体生态系统当下使用的算法做出多种调整,同时各利益相关人都必须参与合作。新闻推送算法决定用户在新闻推送中看到的内容;趋势算法发现最有吸引力的内容(不论好坏),并提升曝光度和流行度;广告商、政治竞选和海外人士利用广告定向投放模型和应用程序编程接口(API)向特定受众群发送内容,比如那些最容易被某一话题的假新闻吸引的人。如果有正确率较高的真实性评分系统,这些算法就可以在适当调整后遏制网络谣言的散播。
另一重要方法和信息设计及测试有关。针对网络新闻展现方式的信息设计会产生心理学效应,影响到我们阅读、回应和分享内容的方式。若在信息设计中将假新闻纳入考虑范围,对遏制其传播会起到很大作用。
监管
政府对社交媒体巨头的监管问题是近期新闻中的大热点。马克·扎克伯格(Mark Zuckerberg)2018年3月和4月到美国国会作证,5月到欧洲议会作证。欧盟在5月出台《通用数据保护条例》(GDPR),该监管体系严格保护消费者隐私,适用范围非常广。至于说对数据隐私和反垄断的正确处理方式最终是怎样的,并不在本文的讨论范围内。
有些美国立法者非常肯定,Facebook必须受到监管,因为公司体量太大,无法自我监管,但其他立法者似乎不理解监管对社会和经济的影响有何差别。很多影响都非常微妙。问“我们应该监管吗”毫无意义。更好的问题是“监管如何保留社交媒体的正面影响,同时遏制其负面影响”。
还有一个问题是,社交媒体公司应为流经自身渠道的信息担负多大责任?美国1996年颁布的《通信规范法案》(CDA)规定,像Facebook这种信息传播的载体不应为用户发布的网络内容负责。这被视为保护言论自由的举措,对网络自由也极为有利。但《规范法》现在遭到了质疑,因为后续很多实例中,言论自由的弊明显大于利。比如最近美国参议院以97:2的压倒性票数,通过了《禁止促成性交易法案》,迫使Facebook为平台上的性交易广告承担责任。
CDA还迫使平台为自身对外界的影响承担责任。平台的利用方式极其关键,因为言论监管可能造成负面的连锁效应。立法者也会在未来遇到类似的挑战,所以对监管的利弊要权衡再三。
该问题的复杂性在网络政治言论监管的例子中可见一斑。马里兰州不久前通过法案,规定社交媒体平台追踪所有政治广告和被定位的用户,禁止在马里兰州的竞选中使用外币,并赋权选举委员会调查对在线广告和选民压制的投诉。Facebook和推特都为《诚实广告法案》(将类似规定上升至联邦层面)背书,而且已经实施其中多数条款。但有些人担心,马里兰州的法律违反了宪法第一修正案。此外,监管机构当然会让政治官员审查政治言论,但这些人都有偏见和私心。
对个人数据收集的监管同样很复杂。我们很容易忘记有多少行业和社会服务依赖这种收集。举例来说,我们的整个信用评级系统都在收集、使用并向广告商销售精准数据,供其定位。消费者在获取信用卡、抵押贷款、医疗、社会服务、教育和旅行过程中私人数据都会被收集。是限制数据收集,保护隐私,还是任由这类限制拉低上述重要服务的质量——监管机构必须权衡其中利弊。
不论是限制数据收集,要求广告商在获得用户同意后发送广告,还是用API实现数据移植——两种选择都会产生意料之外的结果。举例来说,一个有力论点是,数据保护和竞争相互矛盾。数据可移植性可能会促进竞争:初创公司可获取在位企业的社会数据,进而带动同样的网络效应。我们需要知道,如何同时确保数据保护和竞争。否则,强化一个方面,就会削弱另一方面。
即便数据可移植性可以保证高度安全,也不一定会优化竞争。比如允许消费者将自身社交网络数据从一个平台转移到另一个平台,会导致平台之间的竞争;但消费者也可能选择在知情的前提下,将数据分享给自己信任的企业,而非不认识的初创公司。Facebook等公司已经建立了数据垄断,所以现在统一强制实行隐私保护措施只会限制Facebook的竞争对手,巩固其市场霸权。对数据收集和使用的限制措施应该结合反垄断行动吗?我们所有人都应密切观察GDPR的执行,因为该法案在实行隐私保护的同时,还支持数据可移植性,这可能预示了美国的未来。
作为研究人员,我尤其担心所谓的“透明悖论”(transparency paradox)的意外后果:如今Facebook背负巨大压力,公司要更多说明有关定位营销的运作原理、新闻推送算法原理、趋势算法原理、外部敌对势力在网络上做政治宣传和散播谣言的原理。但与此同时,Facebook也面临封锁自身数据、增强安保、保护用户隐私的压力。一直以来,公司都努力协助学者评估社交媒体对选举的影响;比如,Facebook与哈佛的盖瑞·金(Gary King)和斯坦福的内特·珀斯利(Nate Persily)合作开发的项目,就为产学研合作提供了新模型,而且是可喜的一步。但公司极有可能对剑桥分析公司事件反应过度,给自身的数据分享添加很多不必要的限制条件,而这可能影响到公司亟须开展的研究。
面前的挑战
遏制假新闻的疯狂传播并非易事。第一个(可能也是最困难的)挑战是,几乎每个解决方案都要求对真假做出定义。在创建给我们提供信息的标签和遏制谣言散播的算法时,我们必须决定真实与虚假之间的界限,以及谁有权做这些决定。这是个棘手问题。
其次,谣言并非静止不动的目标。我们在研究对抗谣言的设计方案时,那些热衷散播谣言的媒介也会改进。我们将自己研究过的一些最真假难辨的谎言归为一类,称之为“混合谎言”(mixed)。混合谎言中既有部分真实的信息,也有部分虚假信息。这类谎言将假相包裹在真相内,让人难以觉察到,也让消费者很难忽略这些假信息。如果有关部门严格监管谣言,那么这些有意混合真假的新闻就会越来越猖獗。
第三,我们现在看到的还不算什么。我们当今要对付的谣言和不久的未来即将看到的假新闻相比,还远远不够复杂和阴险。美国舆论普遍认为,俄罗斯2016年用政治类文字信息配上伪造图片,企图操纵美国总统选举。但未来的假新闻会以合成媒体的形式出现——假音频和视频听上去和看起来都很真实,比如伪造政治家做出结束自己职业生涯行为的假视频。从长期来看,这种视频比政治家称结束自己职业生涯的真实行为是假新闻,杀伤力更大,而这种事已经发生过了。商业级媒体合成器的发展会改变我们对真实的认知和评定真相的标准。最臭名昭著的媒体合成器之一deepfakes尝试将软件“民主化”,更便于登录和使用,但这并不是什么好迹象。发现、标记和遏制合成媒体内容的传播将是新一波伪造新闻迫近之际,最重要的挑战。
最后,我们必须停止对社交平台社会影响的独立调查。现在人们对“微定位广告”(microtargeted ads)的反应也许已经充分说明了,他们将会对政治操控持何种态度。他们的回应并非微不足道,但影响也不算大:基础转化率在0.01%到0.1%之间。考虑到这一数字如此之低,那么举报人克里斯托弗·怀利(Christopher Wylie)称剑桥分析能实现5%到7%的转化率,这真的可能吗?我们无从得知——但如果我们想要有效解决现在全球信息生态系统面前的挑战,就必须知道该问题的答案以及更多信息。
谣言的肆意传播可能导致“现实的终结”,这一概念是由《大西洋月刊》特约撰稿人富兰克林·弗尔(Franklin Foer)提出的。在我们生活的世界中,外国政府散播谣言,操控选举并破坏民主;政客将反对意见标记为假新闻,为自己辩护;新技术制造了令人信服,却又眼花缭乱的假象和虚拟现实。如果这些趋势成功分割了我们集体意识中的现实,那我们就深陷困境了。平台、科学家和监管机构都必须在我们不得不为现实全力而战前,联合起来保护并强化真相。
-----------------------------
实事求是地说,为何“真相”如此重要?
就事实及成因达成共识,是所有人类集体活动的关键所在,不论线上还是线下。科学家构建知识的方式是,收集证据,支持(或否定)提出的假说。律师会以排除合理怀疑为基础进行辩论。股票基金经理通过分析已知公司业绩,决定买入还是卖出股票。这些领域中都有证据和报告的标准。公司内部或商业伙伴网络对共识的需求最大。管理者每天都做出商业战略的执行决定。根据几乎所有决策理论,这些决定的成功取决于,采取的行动是否符合实际情况。如果特斯拉基于假的需求预测提高产量,那么公司就会陷入泥潭。如果Theranos这种建立在谎言上的公司在市场上出售,大型投资就会被浪费,价值也会遭到重创。
当然,对真相的理解在上述行业中都会演进。科学发现必须可以复制,才能证明其可靠性——而在复制过程中,新发现不是被进一步完善,就是被推翻。法庭上的证据会随着法医学和上级法院裁决的改变而改变。公司高管曾认为,经验和直觉是他们做重大决策时最重要的工具,但现在循证决策背后的数据和分析学普遍取代了直觉。
尽管前路迷雾重重,但我们很难避开这一现实:我们需要真相,确保自己能在这个现实世界中做出合理的判断,以及在我们合作和协作时能够达成共识。
已有0人发表了评论
哈佛网友评论