法国福利算法存在偏见参数


法国福利算法为单亲父母和残疾人等弱势群体分配了更高的风险评分。

法国自 2010 年起采用一种算法,对数百万福利金领取者进行评分,并根据其所谓的欺诈风险进行排序。
那些被标记为高风险的人将面临特别调查,欺诈控制人员可以突击入户,仔细检查银行记录。
分析发现,该模型系统地给单亲父母、经济困难者和残疾受益人等弱势群体打出较高的分数。
反对人士认为,这是对受保护特征和导致人们需要福利的特征的歧视。

资料来源讨论了由于无法获得数据而导致的全面分析模型的局限性,并检查了其性能,发现 35% 的被标记家庭不得不偿还福利金,17% 的家庭实际上被机构拖欠了钱款。

CNAF公开的三个风险评分模型是使用逻辑回归(一种相对简单的机器学习算法)构建的。与其他监督机器学习算法类似,逻辑回归梳理数据集,以了解哪些特征最能预测目标(例如错误或笔记错误)。

这三个模型都是用 SAS 编写的,SAS 是一种专门用于统计分析的编程语言。为了计算风险得分,代码首先加载了一些变量。然后为变量的每个可能值(如有子女或无子女)分配一个介于 -0.81 和 +0.89 之间的系数(即权重)。系数相加得出介于 -12.89 和 9.83 之间的原始分数。最后,将原始分值通过 squasher 函数运算,得出介于 0 和 1 之间的概率风险分值,其中 1 代表最高的欺诈风险。原始分值为 0 相当于风险分值为 0.5。

为了 "压低 "原始得分,逻辑回归模型使用了西格函数。这意味着原始分数与风险分数之间不是线性关系。相反,风险分值在中心陡然上升至 1,然后在接近 1 时趋于平稳。