Le biais de l’IA désigne une discrimination systématique et injuste dans les résultats des systèmes d’IA qui désavantage certains groupes en fonction de caractéristiques telles que l’origine ethnique, le genre, l’âge ou le statut socioéconomique. Le biais peut s’introduire dans les systèmes d’IA à plusieurs étapes : par des données d’entraînement biaisées, une conception algorithmique défaillante, une sélection biaisée des variables ou une supervision humaine empreinte de préjugés.
Les types de biais de l’IA comprennent : le biais historique (les données d’entraînement reflètent des biais sociétaux passés), le biais de représentation (la sous-représentation de certains groupes dans les données d’entraînement), le biais de mesure (des variables de substitution corrélées à des caractéristiques protégées), le biais d’agrégation (des modèles qui ne tiennent pas compte des différences entre sous-groupes), le biais d’évaluation (des indicateurs de test qui favorisent certains groupes) et le biais de déploiement (l’utilisation d’un modèle dans des contextes pour lesquels il n’a pas été conçu).
Parmi les exemples concrets figurent des outils de recrutement par IA qui pénalisaient les CV des femmes, des systèmes de reconnaissance faciale présentant des taux d’erreur plus élevés pour les teints de peau plus foncés, des algorithmes de santé qui sous-estimaient les besoins des patients noirs et des modèles d’évaluation du crédit qui discriminaient en fonction des codes postaux.
Les stratégies d’atténuation comprennent des données d’entraînement diversifiées et représentatives, des outils d’audit des biais et des indicateurs d’équité, des tests réguliers sur l’ensemble des groupes démographiques, une supervision humaine des décisions de l’IA, une documentation transparente des limites des modèles et la conformité réglementaire aux lois anti-discrimination.