Está basado en la explicación oficial de OpenAI sobre prompt injections, incluyendo la idea central del ataque, la cadena básica de compromiso, las defensas por capas y las buenas prácticas para el usuario. La página de OpenAI está fechada el 7 de noviembre de 2025 y describe la prompt injection como un ataque en el que un tercero inserta instrucciones maliciosas en contenido externo para desviar la conducta del agente, además de destacar mitigaciones como entrenamiento de seguridad, monitorización, sandboxing, confirmaciones en acciones sensibles y reducción del acceso a datos.

