What is an AI security incident?

An AI security incident is any event where AI tools or systems are involved in a data breach, policy violation, or security compromise. This includes employees submitting sensitive data to AI tools like ChatGPT, prompt injection attacks on customer-facing AI bots, AI agents executing unauthorized actions, or model compromise that results in harmful or misleading outputs.

How is AI incident response different from traditional incident response?

AI incident response requires additional classification dimensions specific to AI: prompt injection vs data leakage vs model manipulation vs unauthorized agentic action. Evidence collection must include prompt/response logs, model version data, and AI tool access records. Containment often requires revoking AI API keys and disabling agent permissions rather than network isolation. Post-incident review must address both the technical control gap and the human behaviour or prompt engineering flaw.

What are the most common AI security incidents in 2026?

The most common AI security incidents in 2026 are: (1) Shadow AI data leakage, employees submitting PII, financial data, or IP to unapproved AI tools; (2) Prompt injection attacks on customer-facing AI chatbots; (3) AI agent unauthorized actions, autonomous agents accessing systems or exfiltrating data beyond their intended scope; (4) AI-generated phishing and social engineering used against employees.

When must an AI data breach be reported to regulators?

Reporting obligations vary by jurisdiction. In Australia, the Notifiable Data Breaches (NDB) scheme requires notification to the OAIC and affected individuals when a data breach involving personal information is likely to result in serious harm. In the EU, GDPR requires notification within 72 hours of becoming aware of a breach. In the US, state breach notification laws apply. For AI incidents specifically, if personal data was submitted to a third-party AI service without authorisation, this may constitute a notifiable breach.

Prueba gratuita de 90 días para descubrir riesgos de IA generativa -90 días de prueba de riesgos de IA generativa -Empezar ahora

Solicitar una demo

Plantilla gratuita

Manual de respuesta a
incidentes de IA

Una guía completa para detectar, clasificar, contener y recuperarse de incidentes de seguridad de IA. Cubre fugas de datos, prompt injection, compromiso de agentes de IA y mucho más.

Descargar el manual (.docx)Solicitar una demo

0 fases

marco de respuesta

0 niveles

clasificación de gravedad

escenarios específicos de IA

elementos de la lista de verificación

¿Qué es un incidente de seguridad de IA?

Un incidente de seguridad de IA es cualquier evento en el que herramientas, modelos o agentes de IA están implicados en una violación de datos, una infracción de la política o un compromiso de seguridad, ya sea por un ataque intencionado, un uso indebido accidental o un fallo del sistema.

A diferencia de los incidentes de seguridad tradicionales, los incidentes de IA introducen dimensiones únicas: el atacante puede ser un empleado sin intención maliciosa; el vector de la violación puede ser un prompt en lenguaje natural; el impacto puede incluir el envenenamiento de los datos de entrenamiento o la manipulación del modelo, difíciles de detectar y revertir.

Este manual cubre cuatro tipos principales de incidentes de IA. Cada uno requiere un proceso de respuesta que va más allá de la respuesta a incidentes tradicional para abordar las necesidades específicas de la IA en cuanto a pruebas, contención y remediación.

Fuga de datos

Datos sensibles (PII, registros financieros, propiedad intelectual, credenciales) enviados a una herramienta o modelo de IA sin autorización.

▸Alerta DLP en una subida o un pegado a una herramienta de IA

▸Informe de un usuario sobre un envío de datos accidental

▸Tráfico de API anómalo hacia un servicio de IA

▸Registro de auditoría de la herramienta de IA que muestra contenido sensible en el prompt

Prompt injection

Instrucciones maliciosas incrustadas en la entrada del usuario o en el contenido recuperado que manipulan un sistema de IA para que adopte un comportamiento inseguro.

▸La salida de la IA contiene instrucciones para ignorar las políticas

▸El bot de IA revela su prompt de sistema o datos internos

▸Llamadas a herramientas o acciones inesperadas del agente de IA

▸IA reportada por un usuario que se comporta de forma contraria a las directrices

Acción no autorizada de un agente de IA

Un agente de IA autónomo realiza acciones fuera de su alcance autorizado, accediendo a sistemas, enviando comunicaciones o modificando datos.

▸Llamadas a la API inesperadas desde las credenciales del agente de IA

▸Correos electrónicos o mensajes enviados por la IA sin aprobación

▸Consultas o escrituras en la base de datos que no figuran en la especificación del agente

▸Acceso a sistemas fuera del límite de permisos del agente

Compromiso / manipulación del modelo

Un modelo de IA afinado o alojado produce, a gran escala, salidas sistemáticamente dañinas, sesgadas o manipuladas de forma adversaria.

▸Anomalías sistemáticas en las salidas en todas las solicitudes de los usuarios

▸El modelo produce salidas incoherentes con su entrenamiento

▸Quejas de usuarios sobre respuestas dañinas o sesgadas

▸Divulgación de una vulnerabilidad del modelo por parte de un investigador de seguridad

Paso 1: clasificar el incidente

Asigne un nivel de gravedad de inmediato al detectarlo. Esto determina la escalada, el plazo de respuesta y las obligaciones de notificación.

CriticalP1, CríticoRespuesta: Inmediato, 15 min

Ejemplos: Exfiltración de PII a gran escala, agente de IA con acceso al sistema, prompt injection en producción de cara al cliente

Escalada: RSSI + director general + jurídico notificados en un plazo de 1 hora

HighP2, AltoRespuesta: 2 horas

Ejemplos: Propiedad intelectual confidencial enviada a una IA externa, prompt injection con acceso limitado a los datos, acción no autorizada de un agente de IA sin violación de datos

Escalada: Responsable de seguridad + RSSI notificados

MediumP3, MedioRespuesta: 24 horas

Ejemplos: Uso de una herramienta de Shadow AI con datos internos, intento fallido de prompt injection, infracción de la política sin exposición de datos

Escalada: Líder del equipo de seguridad notificado

LowP4, BajoRespuesta: 5 días hábiles

Ejemplos: Uso de una herramienta de IA no autorizada con datos públicos, posible phishing usando contenido generado por IA

Escalada: Registrado y asignado a un analista

Paso 2: contención

La rapidez es crucial. El objetivo es detener la hemorragia, evitar una mayor exposición de datos o más acciones del agente antes de conocer el alcance total del incidente.

Aislar la herramienta o el agente de IA

Revocar las claves de API y los tokens de acceso del servicio de IA afectado
Desactivar la herramienta o el agente de IA a nivel de red o de aplicación
Bloquear la cuenta del usuario si la acción es de origen humano
Para los agentes de IA: detener todos los procesos en ejecución y revocar los permisos

Preservar las pruebas

Exportar los registros de prompts/respuestas del servicio de IA (antes de la revocación si es posible)
Capturar capturas de pantalla o grabaciones de los indicadores del incidente
Preservar los registros de tráfico de red que muestren la salida de datos
Documentar las marcas de tiempo y las cuentas de usuario afectadas
NO modificar ni eliminar los registros, tratarlos como posibles pruebas legales

Evaluar y limitar la exposición de los datos

Identificar qué datos se enviaron o se consultaron
Clasificar la sensibilidad de los datos (PII, financieros, propiedad intelectual confidencial, credenciales)
Determinar si los datos fueron conservados por el proveedor de IA externo
Revisar la política de conservación de datos del proveedor de IA y las opciones de eliminación
Evaluar si es posible una exfiltración posterior desde el servicio de IA

Notificar a las partes interesadas clave

Alertar al líder del equipo de seguridad y al RSSI según el nivel de gravedad
Notificar a Jurídico y Cumplimiento si hay datos personales implicados
Informar al responsable de la unidad de negocio afectada
NO notificar al usuario afectado hasta que el alcance de la investigación sea claro (posible amenaza interna)

Paso 3: lista de verificación de investigación

Trabaje cada categoría de forma metódica. Documente sus hallazgos en un registro de incidentes seguro. Todas las pruebas deben preservarse en su forma original.

Cronología y alcance

¿Cuándo ocurrió el incidente por primera vez? ¿Cuándo se detectó?
¿Cuántos usuarios / sesiones están implicados?
¿Qué herramientas, modelos o agentes de IA están implicados?
¿Qué ventana de tiempo debe cubrirse en la revisión de registros?

Impacto en los datos

¿Qué tipos de datos estuvieron implicados? (PII, financieros, credenciales, propiedad intelectual)
¿Cuántos registros o personas afectadas?
¿Los datos fueron almacenados o procesados por un proveedor de IA externo?
¿Los datos han aparecido en algún lugar posterior (dark web, competidores)?
¿La exposición desencadena una obligación de notificación regulatoria?

Causa raíz

¿Cuál fue el vector de ataque inicial o el punto de fallo?
¿Fue una brecha de política, un fallo de un control técnico o un error del usuario?
¿La herramienta de IA estaba aprobada o era una herramienta de Shadow AI?
Para el prompt injection: ¿cuáles fueron la carga útil y el vector de la inyección?
Para los agentes de IA: ¿qué límite de permiso o de alcance se superó?

Recopilación de pruebas

Registros de prompts y respuestas de la herramienta/API de IA
Registros de actividad del usuario (SSO, navegador, endpoint)
Registros de salida de red para la ventana de tiempo pertinente
Registros de acciones del agente de IA (llamadas a herramientas, llamadas a la API, mensajes enviados)
Resultados del análisis de clasificación de datos sobre el contenido enviado
Confirmación del proveedor sobre la conservación / eliminación de los datos

Paso 4: plantillas de comunicación

Use estas plantillas como puntos de partida. Adáptelas a su organización, al tipo de incidente y a la audiencia. Todas las comunicaciones externas deben ser revisadas por Jurídico antes de enviarlas.

Notificación a las partes interesadas internas

Usar en un plazo de 1 hora para P1/P2

Asunto: [INCIDENTE DE SEGURIDAD] Incidente de IA, [Nivel de gravedad], [Fecha]

Equipo:

Hemos identificado un incidente de seguridad de IA que requiere atención inmediata. Trate esta comunicación como confidencial.

Resumen del incidente: [Breve descripción, qué ocurrió, qué herramienta/sistema de IA está implicado]

Gravedad: [P1/P2/P3/P4]

Hora de detección: [Fecha y hora]

Datos implicados: [Tipo de datos, volumen estimado, nivel de clasificación]

Estado actual: [Contención en curso / Contenido / En investigación]

Acciones inmediatas requeridas:

- [Acción 1 requerida de este equipo]

- [Acción 2]

Responsable del incidente: [Nombre]

Próxima actualización: [Hora]

Puente/canal del incidente: [Enlace o número]

No reenvíe este mensaje ni lo comente fuera de esta lista de distribución.

Notificación externa / a clientes

Se requiere revisión jurídica antes de enviar

Asunto: Aviso importante sobre su información, [Nombre de la empresa]

Estimado/a [Nombre del cliente/de la persona]:

Le escribimos para informarle de un incidente de seguridad que puede haber afectado a su información personal.

Qué ocurrió: [Descripción en lenguaje claro. Evite la jerga técnica. No mencione herramientas de IA específicas salvo que sea legalmente obligatorio.]

Qué información estuvo implicada: [Enumere los tipos de datos concretos: nombre, correo electrónico, teléfono, etc.]

Qué hemos hecho: [Medidas ya adoptadas para contener y abordar el incidente]

Qué puede hacer usted:

- [Acción recomendada 1, p. ej. vigilar sus cuentas]

- [Acción recomendada 2, p. ej. cambiar su contraseña]

Para más información: Póngase en contacto con nuestro equipo de privacidad en [correo electrónico] o [teléfono].

Lamentamos sinceramente este incidente y cualquier preocupación que pueda causar.

[Firma, Nombre, Cargo, Empresa]

Plazos de notificación regulatoria

NDB de Australia: notifique a la OAIC y a las personas afectadas tan pronto como sea posible (normalmente en un plazo de 30 días desde que se tiene conocimiento). RGPD de la UE: notifique a la autoridad de control en un plazo de 72 horas. EE. UU.: se aplican plazos específicos de cada estado. Recurra siempre a Jurídico antes de enviar notificaciones regulatorias.

Paso 5: remediación

Corrija la causa raíz, no solo el síntoma. La remediación debe cerrar la brecha de control que permitió que ocurriera el incidente.

Corregir la vulnerabilidad

Aborde la brecha técnica, actualice las políticas de las herramientas de IA, corrija el filtro de prompt injection, restrinja los permisos del agente.

Actualizar las reglas de DLP y supervisión

Despliegue nuevas reglas de detección dirigidas al vector de ataque observado. Pruebe las reglas con datos sintéticos antes de habilitarlas en producción.

Reentrenar al personal afectado

Reentrenamiento específico sobre clasificación de datos y política de uso de IA. Documente la finalización en el registro del incidente.

Restaurar las operaciones

Reactive las herramientas o los agentes de IA con controles reforzados. Defina una ventana de supervisión reforzada (30 a 90 días).

Solicitar la eliminación de datos al proveedor

Para los servicios de IA externos, envíe solicitudes de eliminación de datos. Obtenga confirmación por escrito cuando sea posible.

Paso 6: revisión posterior al incidente

Realícela en un plazo de 5 días hábiles tras la resolución. Documente todos los hallazgos en un informe posterior al incidente (PIR).

Orden del día del PIR

Reconstrucción de la cronología, desde el evento inicial hasta la detección y la resolución
Análisis de la causa raíz, ¿por qué ocurrió este incidente?
Análisis de la brecha de detección, ¿por qué no se detectó antes?
Eficacia de la respuesta, ¿funcionó el manual? ¿Qué nos ralentizó?
Evaluación del impacto, recuento final de la exposición de datos, obligaciones regulatorias
Mejoras de los controles, ¿qué habría evitado o limitado esto?
Actualizaciones del manual, revise este documento con las lecciones aprendidas
Elementos de acción, responsable + fecha límite para cada mejora

Consejo: Almacene los PIR en un formato que se pueda buscar. Con el tiempo, su biblioteca de PIR se convierte en el insumo más valioso para mejorar el programa de seguridad de IA, mostrando patrones entre incidentes que las revisiones individuales pasan por alto.

Escenarios de incidentes específicos de IA

Estos tres escenarios cubren los incidentes de seguridad de IA más comunes en entornos empresariales. Cada uno incluye señales de detección, acciones de contención y pasos de remediación.

Escenario

Un agente de atención al cliente pega en ChatGPT una hoja de cálculo con 500 nombres de clientes, direcciones de correo electrónico y números de teléfono para redactar una campaña de correo masivo. La herramienta no está en la lista aprobada y los datos están clasificados como confidenciales.

Señales de detección

▸Alerta DLP: PII masiva detectada al pegar desde el portapapeles en una herramienta de IA externa
▸Alerta de Shadow AI de Aona: una herramienta no aprobada accede a datos de la empresa
▸Detección por la extensión del navegador de una subida de contenido sensible

Acciones de contención

Bloquear el acceso del usuario a ChatGPT mediante una regla de proxy web / cortafuegos
Solicitar la eliminación de datos a OpenAI a través de su formulario de solicitud de privacidad
Revocar el acceso del usuario a la espera de la investigación
Evaluar la obligación de notificación NDB / RGPD con Jurídico

Remediación

Reentrenar al empleado afectado en la política de clasificación de datos
Habilitar una regla DLP para bloquear el pegado de PII en herramientas de IA no aprobadas
Proporcionar una alternativa aprobada (p. ej. ChatGPT empresarial con controles DLP)
Añadir al informe de riesgos mensual y revisar incidentes similares de los últimos 90 días

Nota regulatoria

En el marco del esquema australiano Notifiable Data Breaches, esto puede ser notificable si es probable que cause un daño grave. Recurra a Jurídico en un plazo de 30 días desde que se tiene conocimiento.

Recursos relacionados

Plataforma de seguridad de IA →Gobernanza de la IA →Todas las plantillas →Plan de respuesta a incidentes de Shadow AI →Lista de verificación de auditoría de seguridad de IA →

FAQ

Preguntas frecuentes

Un incidente de seguridad de IA es cualquier evento en el que herramientas o sistemas de IA están implicados en una violación de datos, una infracción de la política o un compromiso de seguridad. Esto incluye empleados que envían datos sensibles a herramientas de IA como ChatGPT, ataques de prompt injection en bots de IA, agentes de IA que ejecutan acciones no autorizadas, o una manipulación del modelo que da lugar a salidas dañinas.

Empezar

Detenga los incidentes de IA antes de que ocurran

La mejor respuesta a incidentes es la que nunca necesita ejecutar. Aona AI detecta el uso de Shadow AI, aplica las políticas de protección de datos y ofrece supervisión en tiempo real en cada herramienta de IA de su organización. Se despliega en menos de 5 minutos. No requiere agentes.

Solicitar una demo Ver la plataforma de seguridad de IA →

Manual de respuesta aincidentes de IA