El robo de modelos de IA (también llamado extracción de modelos o model stealing) se refiere a los ataques en los que los adversarios intentan replicar la funcionalidad de un modelo de IA propietario sin acceso autorizado a su arquitectura, sus pesos o sus datos de entrenamiento. Esto plantea importantes riesgos de propiedad intelectual y competencia para las organizaciones que invierten fuertemente en el desarrollo de modelos de IA.
Las técnicas de robo de modelos incluyen: la extracción basada en API (consultar sistemáticamente la API de un modelo y utilizar los pares de entrada-salida para entrenar un modelo sustituto funcionalmente equivalente), los ataques de canal lateral (aprovechar los patrones de temporización, consumo de energía o acceso a la memoria para deducir detalles del modelo), las amenazas internas (empleados o contratistas que exfiltran los pesos, el código o los datos de entrenamiento del modelo), el compromiso de la cadena de suministro (interceptar modelos durante su transferencia entre sistemas) y la ingeniería inversa (analizar los artefactos de un modelo implementado para reconstruir su arquitectura y sus parámetros).
El impacto del robo de modelos incluye: la pérdida de ventaja competitiva (competidores que obtienen capacidades de IA equivalentes sin inversión en I+D), la infracción de la propiedad intelectual (el uso no autorizado de innovaciones propietarias), la exposición a riesgos de seguridad (los modelos robados pueden analizarse para encontrar vulnerabilidades), los riesgos de cumplimiento (los modelos robados pueden implementarse sin una gobernanza adecuada) y las pérdidas financieras (que socavan el valor empresarial de las inversiones en IA).
Las estrategias de defensa incluyen: la limitación de velocidad de las API y la supervisión de las consultas (detectar los intentos de extracción sistemáticos), la privacidad diferencial en las salidas del modelo (añadir ruido para reducir la fidelidad de la extracción), la marca de agua de modelos (incorporar una prueba de propiedad), los controles de acceso y el registro (restringir y supervisar el acceso al modelo), las protecciones legales (patentes, secretos comerciales, acuerdos de licencia) y las técnicas de ofuscación de modelos (dificultar la extracción sin afectar al uso legítimo).