非结构化面试、性格测试、私人推荐等方法效果欠佳,因此招聘管理者急于找到新工具。招聘领域的新潮流,是用算法来寻找和评估候选人。这个潮流既带来希望又引人担忧。根据我的统计,超过100家服务商正设计这类工具,并尝试向雇主提供相关服务。但很遗憾,数据科学在招聘方面的应用尚处在非常初级的阶段,因此并不是企业想要的万灵药。
推销这类新工具的服务商承诺能减少招聘中的社会偏见,算法也的确有助于发现此前因教育或社会资质不足而被刷掉的优质候选人。但这类工具识别并侧重的一些变量,也可能引来麻烦。
大部分数据科学家对真实招聘情境所知甚少,因此他们的工具常常起反作用。例如,太多工具只是简单考察“最佳员工”的特质,然后寻找具有相同特质的候选人。这些特质大多易于评估,如面部表情、语言使用、社交媒体言论等,却未能捕捉到高绩效员工和低绩效员工的真正差别,因此效用有限。此外,翻看社交媒体信息和网站访问记录,也引起了隐私方面的严肃考量。这些信息的确可以合法获取,但发布这些信息的个人并不希望它被用于招聘目的,也没有授权任何机构这样做。再者,上大学时发的一条帖子,多年后还要被招聘算法算进去,这公平吗?
机器学习招聘方法的另一个问题在于,很少有企业收集算法进行准确预测所需的足量员工数据,如招聘人数、绩效评估等。理论上,服务商可以从多家企业收集数据,从而克服这一限制,但每家企业都有其独特环境,来源混杂的数据可能无法支持针对特定企业的准确预测。
另外,所有基于数据分析的筛选方法都存在一个问题,即它们都是基于已有数据进行的历史分析。算法对候选人过往经验尤其依赖,因为编写算法需要海量历史数据,相当于一家大企业多年的员工表现数据。亚马逊的例子表明,过去可能与你想了解的未来非常不同。该公司发现,自2014年以来研发的招聘算法对女性候选人打分偏低,甚至对具备女性相关特质(如参与过女性研究)的候选人打分都偏低。原因在于,在以往亚马逊的最佳员工中,男性占比过高,而算法也将目标锁定为与他们相似的人。由于无法解决这个问题,亚马逊于2017年停用该算法,但很多其他公司仍采用类似算法。
数据科学家面临的深层挑战在于,预测类似机械装置何时失效等客观问题的方法,并不适用于预测招聘。招聘会对企业产生重大影响,不仅因为它受到相关法律约束,更因为它关乎公平性的基本观念。筛选标准与良好工作表现具备相关性,是它能够用于招聘流程的必要条件,但并非充分条件。
例如数据科学家发现,通勤距离这个变量具有预测性价值。数据显示,通勤距离较长的员工离职率较高。但是,通勤距离由住所位置决定,因此与房价、收入、族裔都相关。根据住所位置筛选申请者,很可能对少数族裔等受保护群体产生负面影响。
如果企业使用了会产生负面影响的筛选标准,且无法证明其他筛选标准的预测能力更差,那么企业就违反了法律;而在机器学习算法中,要证明这点的难度极高。不仅如此,为保证合法性,企业还必须证明作为筛选标准的因素与员工良好表现存在因果关系。通勤时间这个因素也许符合要求,但企业无法证明面部表情、社交媒体言论等筛选标准的合理性。
归根结底,问题在于企业对算法的使用存在偏差:在编写过程中只使用最佳员工而非所有员工的数据;只纳入容易统计的指标;过于相信服务商关于算法在其他企业有效的说法,而不去观察本企业员工的表现。天下没有免费的午餐,不仅如此,便宜饭最好都别吃。