90 días de prueba de riesgos de IA generativa -Empezar ahora
Solicitar una demo
Plantilla gratuita

Manual de respuesta aincidentes de IA

Una guía completa para detectar, clasificar, contener y recuperarse de incidentes de seguridad de IA. Cubre fugas de datos, prompt injection, compromiso de agentes de IA y mucho más.

0 fases
marco de respuesta
0 niveles
clasificación de gravedad
0
escenarios específicos de IA
0+
elementos de la lista de verificación

¿Qué es un incidente de seguridad de IA?

Un incidente de seguridad de IA es cualquier evento en el que herramientas, modelos o agentes de IA están implicados en una violación de datos, una infracción de la política o un compromiso de seguridad, ya sea por un ataque intencionado, un uso indebido accidental o un fallo del sistema.

A diferencia de los incidentes de seguridad tradicionales, los incidentes de IA introducen dimensiones únicas: el atacante puede ser un empleado sin intención maliciosa; el vector de la violación puede ser un prompt en lenguaje natural; el impacto puede incluir el envenenamiento de los datos de entrenamiento o la manipulación del modelo, difíciles de detectar y revertir.

Este manual cubre cuatro tipos principales de incidentes de IA. Cada uno requiere un proceso de respuesta que va más allá de la respuesta a incidentes tradicional para abordar las necesidades específicas de la IA en cuanto a pruebas, contención y remediación.

Fuga de datos

Datos sensibles (PII, registros financieros, propiedad intelectual, credenciales) enviados a una herramienta o modelo de IA sin autorización.

Alerta DLP en una subida o un pegado a una herramienta de IA
Informe de un usuario sobre un envío de datos accidental
Tráfico de API anómalo hacia un servicio de IA
Registro de auditoría de la herramienta de IA que muestra contenido sensible en el prompt

Prompt injection

Instrucciones maliciosas incrustadas en la entrada del usuario o en el contenido recuperado que manipulan un sistema de IA para que adopte un comportamiento inseguro.

La salida de la IA contiene instrucciones para ignorar las políticas
El bot de IA revela su prompt de sistema o datos internos
Llamadas a herramientas o acciones inesperadas del agente de IA
IA reportada por un usuario que se comporta de forma contraria a las directrices

Acción no autorizada de un agente de IA

Un agente de IA autónomo realiza acciones fuera de su alcance autorizado, accediendo a sistemas, enviando comunicaciones o modificando datos.

Llamadas a la API inesperadas desde las credenciales del agente de IA
Correos electrónicos o mensajes enviados por la IA sin aprobación
Consultas o escrituras en la base de datos que no figuran en la especificación del agente
Acceso a sistemas fuera del límite de permisos del agente

Compromiso / manipulación del modelo

Un modelo de IA afinado o alojado produce, a gran escala, salidas sistemáticamente dañinas, sesgadas o manipuladas de forma adversaria.

Anomalías sistemáticas en las salidas en todas las solicitudes de los usuarios
El modelo produce salidas incoherentes con su entrenamiento
Quejas de usuarios sobre respuestas dañinas o sesgadas
Divulgación de una vulnerabilidad del modelo por parte de un investigador de seguridad

Paso 1: clasificar el incidente

Asigne un nivel de gravedad de inmediato al detectarlo. Esto determina la escalada, el plazo de respuesta y las obligaciones de notificación.

CriticalP1, CríticoRespuesta: Inmediato, 15 min

Ejemplos: Exfiltración de PII a gran escala, agente de IA con acceso al sistema, prompt injection en producción de cara al cliente

Escalada: RSSI + director general + jurídico notificados en un plazo de 1 hora

HighP2, AltoRespuesta: 2 horas

Ejemplos: Propiedad intelectual confidencial enviada a una IA externa, prompt injection con acceso limitado a los datos, acción no autorizada de un agente de IA sin violación de datos

Escalada: Responsable de seguridad + RSSI notificados

MediumP3, MedioRespuesta: 24 horas

Ejemplos: Uso de una herramienta de Shadow AI con datos internos, intento fallido de prompt injection, infracción de la política sin exposición de datos

Escalada: Líder del equipo de seguridad notificado

LowP4, BajoRespuesta: 5 días hábiles

Ejemplos: Uso de una herramienta de IA no autorizada con datos públicos, posible phishing usando contenido generado por IA

Escalada: Registrado y asignado a un analista

Paso 2: contención

La rapidez es crucial. El objetivo es detener la hemorragia, evitar una mayor exposición de datos o más acciones del agente antes de conocer el alcance total del incidente.

01

Aislar la herramienta o el agente de IA

  • Revocar las claves de API y los tokens de acceso del servicio de IA afectado
  • Desactivar la herramienta o el agente de IA a nivel de red o de aplicación
  • Bloquear la cuenta del usuario si la acción es de origen humano
  • Para los agentes de IA: detener todos los procesos en ejecución y revocar los permisos
02

Preservar las pruebas

  • Exportar los registros de prompts/respuestas del servicio de IA (antes de la revocación si es posible)
  • Capturar capturas de pantalla o grabaciones de los indicadores del incidente
  • Preservar los registros de tráfico de red que muestren la salida de datos
  • Documentar las marcas de tiempo y las cuentas de usuario afectadas
  • NO modificar ni eliminar los registros, tratarlos como posibles pruebas legales
03

Evaluar y limitar la exposición de los datos

  • Identificar qué datos se enviaron o se consultaron
  • Clasificar la sensibilidad de los datos (PII, financieros, propiedad intelectual confidencial, credenciales)
  • Determinar si los datos fueron conservados por el proveedor de IA externo
  • Revisar la política de conservación de datos del proveedor de IA y las opciones de eliminación
  • Evaluar si es posible una exfiltración posterior desde el servicio de IA
04

Notificar a las partes interesadas clave

  • Alertar al líder del equipo de seguridad y al RSSI según el nivel de gravedad
  • Notificar a Jurídico y Cumplimiento si hay datos personales implicados
  • Informar al responsable de la unidad de negocio afectada
  • NO notificar al usuario afectado hasta que el alcance de la investigación sea claro (posible amenaza interna)

Paso 3: lista de verificación de investigación

Trabaje cada categoría de forma metódica. Documente sus hallazgos en un registro de incidentes seguro. Todas las pruebas deben preservarse en su forma original.

Cronología y alcance

  • ¿Cuándo ocurrió el incidente por primera vez? ¿Cuándo se detectó?
  • ¿Cuántos usuarios / sesiones están implicados?
  • ¿Qué herramientas, modelos o agentes de IA están implicados?
  • ¿Qué ventana de tiempo debe cubrirse en la revisión de registros?

Impacto en los datos

  • ¿Qué tipos de datos estuvieron implicados? (PII, financieros, credenciales, propiedad intelectual)
  • ¿Cuántos registros o personas afectadas?
  • ¿Los datos fueron almacenados o procesados por un proveedor de IA externo?
  • ¿Los datos han aparecido en algún lugar posterior (dark web, competidores)?
  • ¿La exposición desencadena una obligación de notificación regulatoria?

Causa raíz

  • ¿Cuál fue el vector de ataque inicial o el punto de fallo?
  • ¿Fue una brecha de política, un fallo de un control técnico o un error del usuario?
  • ¿La herramienta de IA estaba aprobada o era una herramienta de Shadow AI?
  • Para el prompt injection: ¿cuáles fueron la carga útil y el vector de la inyección?
  • Para los agentes de IA: ¿qué límite de permiso o de alcance se superó?

Recopilación de pruebas

  • Registros de prompts y respuestas de la herramienta/API de IA
  • Registros de actividad del usuario (SSO, navegador, endpoint)
  • Registros de salida de red para la ventana de tiempo pertinente
  • Registros de acciones del agente de IA (llamadas a herramientas, llamadas a la API, mensajes enviados)
  • Resultados del análisis de clasificación de datos sobre el contenido enviado
  • Confirmación del proveedor sobre la conservación / eliminación de los datos

Paso 4: plantillas de comunicación

Use estas plantillas como puntos de partida. Adáptelas a su organización, al tipo de incidente y a la audiencia. Todas las comunicaciones externas deben ser revisadas por Jurídico antes de enviarlas.

Notificación a las partes interesadas internas

Usar en un plazo de 1 hora para P1/P2

Asunto: [INCIDENTE DE SEGURIDAD] Incidente de IA, [Nivel de gravedad], [Fecha]


Equipo:


Hemos identificado un incidente de seguridad de IA que requiere atención inmediata. Trate esta comunicación como confidencial.


Resumen del incidente: [Breve descripción, qué ocurrió, qué herramienta/sistema de IA está implicado]

Gravedad: [P1/P2/P3/P4]

Hora de detección: [Fecha y hora]

Datos implicados: [Tipo de datos, volumen estimado, nivel de clasificación]

Estado actual: [Contención en curso / Contenido / En investigación]


Acciones inmediatas requeridas:

- [Acción 1 requerida de este equipo]

- [Acción 2]


Responsable del incidente: [Nombre]

Próxima actualización: [Hora]

Puente/canal del incidente: [Enlace o número]


No reenvíe este mensaje ni lo comente fuera de esta lista de distribución.

Notificación externa / a clientes

Se requiere revisión jurídica antes de enviar

Asunto: Aviso importante sobre su información, [Nombre de la empresa]


Estimado/a [Nombre del cliente/de la persona]:


Le escribimos para informarle de un incidente de seguridad que puede haber afectado a su información personal.


Qué ocurrió: [Descripción en lenguaje claro. Evite la jerga técnica. No mencione herramientas de IA específicas salvo que sea legalmente obligatorio.]


Qué información estuvo implicada: [Enumere los tipos de datos concretos: nombre, correo electrónico, teléfono, etc.]


Qué hemos hecho: [Medidas ya adoptadas para contener y abordar el incidente]


Qué puede hacer usted:

- [Acción recomendada 1, p. ej. vigilar sus cuentas]

- [Acción recomendada 2, p. ej. cambiar su contraseña]


Para más información: Póngase en contacto con nuestro equipo de privacidad en [correo electrónico] o [teléfono].


Lamentamos sinceramente este incidente y cualquier preocupación que pueda causar.


[Firma, Nombre, Cargo, Empresa]

Plazos de notificación regulatoria

NDB de Australia: notifique a la OAIC y a las personas afectadas tan pronto como sea posible (normalmente en un plazo de 30 días desde que se tiene conocimiento). RGPD de la UE: notifique a la autoridad de control en un plazo de 72 horas. EE. UU.: se aplican plazos específicos de cada estado. Recurra siempre a Jurídico antes de enviar notificaciones regulatorias.

Paso 5: remediación

Corrija la causa raíz, no solo el síntoma. La remediación debe cerrar la brecha de control que permitió que ocurriera el incidente.

01

Corregir la vulnerabilidad

Aborde la brecha técnica, actualice las políticas de las herramientas de IA, corrija el filtro de prompt injection, restrinja los permisos del agente.

02

Actualizar las reglas de DLP y supervisión

Despliegue nuevas reglas de detección dirigidas al vector de ataque observado. Pruebe las reglas con datos sintéticos antes de habilitarlas en producción.

03

Reentrenar al personal afectado

Reentrenamiento específico sobre clasificación de datos y política de uso de IA. Documente la finalización en el registro del incidente.

04

Restaurar las operaciones

Reactive las herramientas o los agentes de IA con controles reforzados. Defina una ventana de supervisión reforzada (30 a 90 días).

05

Solicitar la eliminación de datos al proveedor

Para los servicios de IA externos, envíe solicitudes de eliminación de datos. Obtenga confirmación por escrito cuando sea posible.

Paso 6: revisión posterior al incidente

Realícela en un plazo de 5 días hábiles tras la resolución. Documente todos los hallazgos en un informe posterior al incidente (PIR).

Orden del día del PIR

  • Reconstrucción de la cronología, desde el evento inicial hasta la detección y la resolución
  • Análisis de la causa raíz, ¿por qué ocurrió este incidente?
  • Análisis de la brecha de detección, ¿por qué no se detectó antes?
  • Eficacia de la respuesta, ¿funcionó el manual? ¿Qué nos ralentizó?
  • Evaluación del impacto, recuento final de la exposición de datos, obligaciones regulatorias
  • Mejoras de los controles, ¿qué habría evitado o limitado esto?
  • Actualizaciones del manual, revise este documento con las lecciones aprendidas
  • Elementos de acción, responsable + fecha límite para cada mejora

Consejo: Almacene los PIR en un formato que se pueda buscar. Con el tiempo, su biblioteca de PIR se convierte en el insumo más valioso para mejorar el programa de seguridad de IA, mostrando patrones entre incidentes que las revisiones individuales pasan por alto.

Escenarios de incidentes específicos de IA

Estos tres escenarios cubren los incidentes de seguridad de IA más comunes en entornos empresariales. Cada uno incluye señales de detección, acciones de contención y pasos de remediación.

Escenario

Un agente de atención al cliente pega en ChatGPT una hoja de cálculo con 500 nombres de clientes, direcciones de correo electrónico y números de teléfono para redactar una campaña de correo masivo. La herramienta no está en la lista aprobada y los datos están clasificados como confidenciales.

Señales de detección

  • Alerta DLP: PII masiva detectada al pegar desde el portapapeles en una herramienta de IA externa
  • Alerta de Shadow AI de Aona: una herramienta no aprobada accede a datos de la empresa
  • Detección por la extensión del navegador de una subida de contenido sensible

Acciones de contención

  • Bloquear el acceso del usuario a ChatGPT mediante una regla de proxy web / cortafuegos
  • Solicitar la eliminación de datos a OpenAI a través de su formulario de solicitud de privacidad
  • Revocar el acceso del usuario a la espera de la investigación
  • Evaluar la obligación de notificación NDB / RGPD con Jurídico

Remediación

  • Reentrenar al empleado afectado en la política de clasificación de datos
  • Habilitar una regla DLP para bloquear el pegado de PII en herramientas de IA no aprobadas
  • Proporcionar una alternativa aprobada (p. ej. ChatGPT empresarial con controles DLP)
  • Añadir al informe de riesgos mensual y revisar incidentes similares de los últimos 90 días

Nota regulatoria

En el marco del esquema australiano Notifiable Data Breaches, esto puede ser notificable si es probable que cause un daño grave. Recurra a Jurídico en un plazo de 30 días desde que se tiene conocimiento.

FAQ

Preguntas frecuentes

Un incidente de seguridad de IA es cualquier evento en el que herramientas o sistemas de IA están implicados en una violación de datos, una infracción de la política o un compromiso de seguridad. Esto incluye empleados que envían datos sensibles a herramientas de IA como ChatGPT, ataques de prompt injection en bots de IA, agentes de IA que ejecutan acciones no autorizadas, o una manipulación del modelo que da lugar a salidas dañinas.
Empezar

Detenga los incidentes de IA antes de que ocurran

La mejor respuesta a incidentes es la que nunca necesita ejecutar. Aona AI detecta el uso de Shadow AI, aplica las políticas de protección de datos y ofrece supervisión en tiempo real en cada herramienta de IA de su organización. Se despliega en menos de 5 minutos. No requiere agentes.