IA en cumplimiento: los modelos más recientes muestran avances tangibles en precisión, consistencia y ética aplicada
Lima, Perú, 22 de octubre de 2025.— La inteligencia artificial deja atrás la etapa de fascinación teórica y entra en la madurez operacional. El EQS Benchmark Report: AI Performance in Compliance & Ethics, elaborado junto con la asociación alemana BCM, evaluó seis modelos líderes de IA —entre ellos Gemini 2.5 Pro y GPT-5— en 120 escenarios reales de cumplimiento, desde evaluaciones de riesgo hasta la revisión de terceros.
Los resultados revelan un avance sin precedentes: precisión superior al 95 % en tareas estructuradas y un progreso notable frente a 2024. Sin embargo, el informe advierte que el verdadero desafío surge cuando aumenta la ambigüedad y se pone a prueba el juicio ético de la máquina.
Table of Contents
Los modelos de 2025 marcan la diferencia
El estudio muestra una evolución acelerada. Gemini 2.5 Pro obtuvo el puntaje más alto con un 86,7 %, seguida muy de cerca por GPT-5, con 86,5 %. Ambos modelos demostraron rendimiento sobresaliente en análisis, toma de decisiones y generación de contenido abierto. Detrás, o3 de OpenAI (83,3 %) y Claude Opus 4.1 de Anthropic (81,5 %) reflejan la velocidad del ciclo de innovación. Las versiones previas, GPT-4o (72,9 %) y Mistral Large 2 (70,1 %), completan la curva evolutiva.
La IA puede ofrecer al cumplimiento nuevos niveles de conocimiento, pero nuestra responsabilidad es mantener sus límites éticos y legales claros», enfatizó la Dra. Gisa Ortwein, presidenta del BCM.
Precisión alta, pero vulnerabilidad ante la ambigüedad
En contextos con reglas claras, los modelos alcanzaron un promedio de 90,8 % en toma de decisiones y 91,8 % en clasificación de datos. Sin embargo, el rendimiento disminuyó al enfrentar escenarios abiertos. En análisis de datos complejos, Gemini 2.5 Pro logró 88 %, frente al 62 % de GPT-5. En redacción de informes y resúmenes, GPT-5 lideró con 67,4 %, evaluado por jueces humanos.
La fortaleza de estas herramientas radica en actuar como multiplicadores de capacidades, no como sustitutos del juicio experto», explicó Moritz Homann, Director de Innovación de Producto e IA en EQS Group.
Fiabilidad, diseño del prompt y responsabilidad compartida
El informe resalta una consistencia del 95 % y una tasa mínima de alucinaciones (0,71 %). Esto evidencia que, con prompts precisos y contexto adecuado, la IA puede entregar resultados estables y verificables. La clave —señala EQS— radica en la redacción del prompt y en la selección del modelo según la tarea.
La forma en que implementemos la IA hoy definirá su papel en el cumplimiento de mañana», concluyó Homann. «Los equipos de cumplimiento deben usarla directamente, no solo regularla, para formular mejores preguntas, diseñar salvaguardas efectivas y generar confianza.»
El informe completo EQS AI Benchmark Report puede descargarse en www.eqs.com/compliance-wpapers/ai-performance-compliance-ethics-eqs.
Tu Opinión Importa
¿Crees que la IA podrá garantizar integridad y ética en decisiones empresariales críticas o siempre necesitará supervisión humana? Déjanos tu comentario con los hashtags #superfan y #itusersawards2024-25.
Apoya al Periodismo Independiente

¿Te sirvió en algo este contenido?, ayúdanos a combatir la Desinformación, dona desde S/ 1.00 a nuestro PLIN 943-438-457


