Una guía completa para detectar, clasificar, contener y recuperarse de incidentes de seguridad de IA. Cubre fugas de datos, prompt injection, compromiso de agentes de IA y mucho más.
Un incidente de seguridad de IA es cualquier evento en el que herramientas, modelos o agentes de IA están implicados en una violación de datos, una infracción de la política o un compromiso de seguridad, ya sea por un ataque intencionado, un uso indebido accidental o un fallo del sistema.
A diferencia de los incidentes de seguridad tradicionales, los incidentes de IA introducen dimensiones únicas: el atacante puede ser un empleado sin intención maliciosa; el vector de la violación puede ser un prompt en lenguaje natural; el impacto puede incluir el envenenamiento de los datos de entrenamiento o la manipulación del modelo, difíciles de detectar y revertir.
Este manual cubre cuatro tipos principales de incidentes de IA. Cada uno requiere un proceso de respuesta que va más allá de la respuesta a incidentes tradicional para abordar las necesidades específicas de la IA en cuanto a pruebas, contención y remediación.
Datos sensibles (PII, registros financieros, propiedad intelectual, credenciales) enviados a una herramienta o modelo de IA sin autorización.
Instrucciones maliciosas incrustadas en la entrada del usuario o en el contenido recuperado que manipulan un sistema de IA para que adopte un comportamiento inseguro.
Un agente de IA autónomo realiza acciones fuera de su alcance autorizado, accediendo a sistemas, enviando comunicaciones o modificando datos.
Un modelo de IA afinado o alojado produce, a gran escala, salidas sistemáticamente dañinas, sesgadas o manipuladas de forma adversaria.
Asigne un nivel de gravedad de inmediato al detectarlo. Esto determina la escalada, el plazo de respuesta y las obligaciones de notificación.
Ejemplos: Exfiltración de PII a gran escala, agente de IA con acceso al sistema, prompt injection en producción de cara al cliente
Escalada: RSSI + director general + jurídico notificados en un plazo de 1 hora
Ejemplos: Propiedad intelectual confidencial enviada a una IA externa, prompt injection con acceso limitado a los datos, acción no autorizada de un agente de IA sin violación de datos
Escalada: Responsable de seguridad + RSSI notificados
Ejemplos: Uso de una herramienta de Shadow AI con datos internos, intento fallido de prompt injection, infracción de la política sin exposición de datos
Escalada: Líder del equipo de seguridad notificado
Ejemplos: Uso de una herramienta de IA no autorizada con datos públicos, posible phishing usando contenido generado por IA
Escalada: Registrado y asignado a un analista
La rapidez es crucial. El objetivo es detener la hemorragia, evitar una mayor exposición de datos o más acciones del agente antes de conocer el alcance total del incidente.
Trabaje cada categoría de forma metódica. Documente sus hallazgos en un registro de incidentes seguro. Todas las pruebas deben preservarse en su forma original.
Use estas plantillas como puntos de partida. Adáptelas a su organización, al tipo de incidente y a la audiencia. Todas las comunicaciones externas deben ser revisadas por Jurídico antes de enviarlas.
Asunto: [INCIDENTE DE SEGURIDAD] Incidente de IA, [Nivel de gravedad], [Fecha]
Equipo:
Hemos identificado un incidente de seguridad de IA que requiere atención inmediata. Trate esta comunicación como confidencial.
Resumen del incidente: [Breve descripción, qué ocurrió, qué herramienta/sistema de IA está implicado]
Gravedad: [P1/P2/P3/P4]
Hora de detección: [Fecha y hora]
Datos implicados: [Tipo de datos, volumen estimado, nivel de clasificación]
Estado actual: [Contención en curso / Contenido / En investigación]
Acciones inmediatas requeridas:
- [Acción 1 requerida de este equipo]
- [Acción 2]
Responsable del incidente: [Nombre]
Próxima actualización: [Hora]
Puente/canal del incidente: [Enlace o número]
No reenvíe este mensaje ni lo comente fuera de esta lista de distribución.
Asunto: Aviso importante sobre su información, [Nombre de la empresa]
Estimado/a [Nombre del cliente/de la persona]:
Le escribimos para informarle de un incidente de seguridad que puede haber afectado a su información personal.
Qué ocurrió: [Descripción en lenguaje claro. Evite la jerga técnica. No mencione herramientas de IA específicas salvo que sea legalmente obligatorio.]
Qué información estuvo implicada: [Enumere los tipos de datos concretos: nombre, correo electrónico, teléfono, etc.]
Qué hemos hecho: [Medidas ya adoptadas para contener y abordar el incidente]
Qué puede hacer usted:
- [Acción recomendada 1, p. ej. vigilar sus cuentas]
- [Acción recomendada 2, p. ej. cambiar su contraseña]
Para más información: Póngase en contacto con nuestro equipo de privacidad en [correo electrónico] o [teléfono].
Lamentamos sinceramente este incidente y cualquier preocupación que pueda causar.
[Firma, Nombre, Cargo, Empresa]
Plazos de notificación regulatoria
NDB de Australia: notifique a la OAIC y a las personas afectadas tan pronto como sea posible (normalmente en un plazo de 30 días desde que se tiene conocimiento). RGPD de la UE: notifique a la autoridad de control en un plazo de 72 horas. EE. UU.: se aplican plazos específicos de cada estado. Recurra siempre a Jurídico antes de enviar notificaciones regulatorias.
Corrija la causa raíz, no solo el síntoma. La remediación debe cerrar la brecha de control que permitió que ocurriera el incidente.
Corregir la vulnerabilidad
Aborde la brecha técnica, actualice las políticas de las herramientas de IA, corrija el filtro de prompt injection, restrinja los permisos del agente.
Actualizar las reglas de DLP y supervisión
Despliegue nuevas reglas de detección dirigidas al vector de ataque observado. Pruebe las reglas con datos sintéticos antes de habilitarlas en producción.
Reentrenar al personal afectado
Reentrenamiento específico sobre clasificación de datos y política de uso de IA. Documente la finalización en el registro del incidente.
Restaurar las operaciones
Reactive las herramientas o los agentes de IA con controles reforzados. Defina una ventana de supervisión reforzada (30 a 90 días).
Solicitar la eliminación de datos al proveedor
Para los servicios de IA externos, envíe solicitudes de eliminación de datos. Obtenga confirmación por escrito cuando sea posible.
Realícela en un plazo de 5 días hábiles tras la resolución. Documente todos los hallazgos en un informe posterior al incidente (PIR).
Consejo: Almacene los PIR en un formato que se pueda buscar. Con el tiempo, su biblioteca de PIR se convierte en el insumo más valioso para mejorar el programa de seguridad de IA, mostrando patrones entre incidentes que las revisiones individuales pasan por alto.
Estos tres escenarios cubren los incidentes de seguridad de IA más comunes en entornos empresariales. Cada uno incluye señales de detección, acciones de contención y pasos de remediación.
Escenario
Un agente de atención al cliente pega en ChatGPT una hoja de cálculo con 500 nombres de clientes, direcciones de correo electrónico y números de teléfono para redactar una campaña de correo masivo. La herramienta no está en la lista aprobada y los datos están clasificados como confidenciales.
Señales de detección
Acciones de contención
Remediación
Nota regulatoria
En el marco del esquema australiano Notifiable Data Breaches, esto puede ser notificable si es probable que cause un daño grave. Recurra a Jurídico en un plazo de 30 días desde que se tiene conocimiento.
La mejor respuesta a incidentes es la que nunca necesita ejecutar. Aona AI detecta el uso de Shadow AI, aplica las políticas de protección de datos y ofrece supervisión en tiempo real en cada herramienta de IA de su organización. Se despliega en menos de 5 minutos. No requiere agentes.