La clasificación de datos es el proceso sistemático de organizar los datos en categorías en función de su sensibilidad, su valor y los requisitos regulatorios. En el contexto de la gobernanza de la IA, la clasificación de datos determina qué información puede utilizarse de forma segura con las herramientas de IA y cuál debe restringirse.
Los niveles de clasificación habituales incluyen: Público (de libre acceso, seguro para cualquier herramienta de IA), Interno (información empresarial, solo herramientas de IA corporativas aprobadas), Confidencial (datos sensibles que podrían causar daño si se exponen, excluidos de las herramientas de IA externas) y Restringido (datos altamente sensibles con protección legal o regulatoria, prohibidos en todas las herramientas de IA).
Para la gobernanza de la IA en concreto, la clasificación de datos es fundamental porque: las herramientas de IA pueden conservar los datos introducidos y aprender de ellos, las solicitudes y los archivos cargados pueden exponer información clasificada, las salidas generadas por IA heredan la clasificación de sus entradas y los marcos regulatorios exigen controles de protección de datos para el procesamiento por IA.
La implementación requiere políticas claras que asocien los tipos de datos a los niveles de clasificación, formación de los empleados en los procedimientos de clasificación, controles técnicos (DLP, controles de acceso) que apliquen las reglas de clasificación, auditorías periódicas de la exactitud de la clasificación y herramientas de clasificación automatizadas para grandes volúmenes de datos.