Microsoft MDASH: ciberseguridad impulsada por IA

Microsoft presenta MDASH, un sistema multiagente de IA que detecta, valida y demuestra vulnerabilidades con mayor precisión y a escala empresarial.

Microsoft ha presentado un nuevo sistema de seguridad basado en inteligencia artificial capaz de descubrir, validar y demostrar vulnerabilidades de forma automatizada. La solución, denominada provisionalmente MDASH, coordina más de 100 agentes especializados y diferentes modelos de IA para analizar código a una escala difícil de alcanzar mediante los métodos tradicionales.

Los primeros resultados muestran el potencial de este enfoque: el sistema ha ayudado a los investigadores de Microsoft a identificar 16 nuevas vulnerabilidades en componentes de red y autenticación de Windows, entre ellas cuatro vulnerabilidades críticas que podían permitir la ejecución remota de código.

Más allá de los hallazgos concretos, MDASH refleja un cambio relevante en la evolución de la ciberseguridad: la detección de vulnerabilidades mediante IA comienza a pasar del ámbito experimental a convertirse en una capacidad defensiva aplicable en entornos empresariales.

¿Qué es MDASH?

MDASH —nombre en clave de Microsoft Security Multi-Model Agentic Scanning Harness— es un sistema de análisis de seguridad desarrollado por el equipo de Autonomous Code Security de Microsoft.

Su objetivo es automatizar gran parte del proceso que siguen los investigadores de seguridad para localizar vulnerabilidades en el código, evaluar si pueden explotarse y generar las evidencias necesarias para confirmar su existencia.

La principal diferencia frente a otras aproximaciones es que MDASH no depende de un único modelo de inteligencia artificial ni de un solo agente. En su lugar, funciona como un sistema coordinado en el que intervienen:

Más de 100 agentes especializados.
Modelos avanzados de razonamiento.
Modelos optimizados para tareas de gran volumen.
Agentes independientes que cuestionan y validan los resultados.
Herramientas específicas para reproducir los errores detectados.

Cada agente desempeña una función concreta dentro del proceso. Algunos buscan comportamientos potencialmente vulnerables; otros intentan refutar los hallazgos; y un tercer grupo construye pruebas que permitan demostrar que el problema existe realmente.

La idea central es sencilla: el modelo de IA es solo uno de los componentes; el verdadero valor reside en el sistema que lo coordina.

Resultados que superan los principales benchmarks de la industria

Microsoft ha evaluado MDASH mediante diferentes pruebas, tanto privadas como públicas.

En una primera prueba se utilizó StorageDrive, un controlador privado que contiene 21 vulnerabilidades introducidas deliberadamente. Al tratarse de un código que nunca había sido publicado, Microsoft podía descartar que los modelos hubieran aprendido previamente las respuestas.

MDASH identificó correctamente:

Las 21 vulnerabilidades existentes.
El 100 % de los fallos introducidos.
Cero falsos positivos durante la prueba.

Las vulnerabilidades incluían errores complejos como problemas de uso de memoria después de su liberación, fallos en la gestión de números enteros, validaciones incorrectas y errores relacionados con bloqueos y concurrencia.

El sistema también fue evaluado sobre vulnerabilidades confirmadas durante los últimos cinco años por el Microsoft Security Response Center. En estas pruebas alcanzó:

Un 96 % de cobertura en casos relacionados con clfs.sys.
Un 100 % de cobertura en casos de tcpip.sys.

Además, MDASH obtuvo una puntuación del 88,45 % en CyberGym, un benchmark público compuesto por 1.507 vulnerabilidades reales. Este resultado situó al sistema en la primera posición de la clasificación, aproximadamente cinco puntos por encima de la siguiente propuesta.

Un proceso completo: desde el análisis hasta la demostración

MDASH organiza el análisis de seguridad mediante una cadena estructurada de etapas.

1. Preparación del código

El sistema ingiere el repositorio, genera índices adaptados a los lenguajes utilizados e identifica la superficie de ataque. También analiza cambios históricos para comprender cómo ha evolucionado el código y cuáles pueden ser sus puntos más sensibles.

2. Búsqueda de vulnerabilidades

Diferentes agentes auditores recorren las rutas de código seleccionadas y generan posibles hallazgos acompañados de hipótesis y evidencias.

El sistema no se limita a buscar patrones conocidos. Debe razonar sobre elementos complejos como las convenciones del kernel, las relaciones entre procesos, los límites de confianza, las reglas de bloqueo o los estados internos de los componentes.

3. Debate y validación

Una segunda cohorte de agentes analiza cada resultado. Algunos argumentan a favor de la existencia de la vulnerabilidad y otros intentan refutarla.

Este mecanismo de debate reduce el riesgo de que una observación imprecisa llegue a los equipos de seguridad como un hallazgo válido. Cuando un agente detecta un posible fallo y los agentes validadores no consiguen descartarlo, aumenta la credibilidad del resultado.

4. Eliminación de duplicados

Los hallazgos semánticamente equivalentes se agrupan para evitar que un mismo problema genere múltiples alertas.

Esta fase es especialmente importante en entornos empresariales, donde una herramienta que produce demasiado ruido puede incrementar considerablemente la carga de los equipos de seguridad y desarrollo.

5. Generación de pruebas

Cuando el tipo de vulnerabilidad lo permite, MDASH construye y ejecuta entradas capaces de activar el fallo.

De esta forma, el sistema no se limita a señalar que una parte del código parece vulnerable, sino que intenta demostrar dinámicamente que se cumplen las condiciones necesarias para provocar el error.

¿Por qué se utilizan varios modelos de IA?

Microsoft parte de una premisa: ningún modelo es el mejor en todas las tareas.

Un modelo avanzado puede resultar más adecuado para analizar una ruta compleja de ejecución, mientras que un modelo más pequeño puede evaluar miles de hipótesis con un coste inferior. Otro modelo independiente puede actuar como contrapunto y cuestionar las conclusiones del primero.

MDASH combina estos perfiles en función de cada fase del proceso. Incluso el desacuerdo entre modelos se utiliza como una señal adicional para valorar los hallazgos.

Este diseño también permite incorporar nuevos modelos sin reconstruir todo el sistema. Cuando aparece una tecnología más avanzada, Microsoft puede compararla con los modelos existentes y modificar la configuración de la plataforma.

Los componentes desarrollados previamente —contexto del proyecto, extensiones, agentes especializados y criterios de validación— continúan siendo válidos.

Esta independencia respecto a un modelo concreto es una de las características estratégicas de la arquitectura.

El conocimiento especializado sigue siendo imprescindible

Los modelos fundacionales no siempre disponen del contexto necesario para comprender las reglas internas de sistemas tan complejos como Windows, Hyper-V o Azure.

Por este motivo, MDASH admite extensiones desarrolladas por expertos que incorporan conocimiento específico sobre aspectos como:

Convenciones de llamada del kernel.
Reglas de los paquetes de solicitud de entrada y salida.
Invariantes de bloqueo.
Límites de confianza entre procesos.
Máquinas de estado y formatos de archivos.
Bases de datos personalizadas de análisis de código.
Herramientas como CodeQL.

Esta combinación de inteligencia artificial, automatización y conocimiento experto permite analizar código propietario que no forma parte de los datos públicos con los que se entrenan habitualmente los modelos.

Menos alertas y más vulnerabilidades demostradas

Uno de los principales problemas de las herramientas de seguridad tradicionales es la cantidad de falsos positivos que pueden generar.

Una alerta sin suficiente contexto no elimina una vulnerabilidad. En muchos casos, simplemente traslada el trabajo al equipo que debe revisarla.

MDASH intenta resolver este problema mediante su proceso de debate, deduplicación y generación de pruebas. El objetivo no es producir una larga lista de posibles defectos, sino entregar hallazgos con evidencias suficientes para que los equipos puedan priorizarlos y corregirlos.

Esta distinción es fundamental en organizaciones con grandes bases de código y procesos formales de desarrollo seguro. En estos entornos, cada hallazgo tiene un responsable, un proceso de evaluación y una ventana concreta para publicar la corrección.

De la investigación a la seguridad empresarial

El desarrollo de MDASH ha contado con la colaboración de varios equipos especializados de Microsoft:

Autonomous Code Security.
Microsoft Offensive Research & Security Engineering.
Microsoft Windows Attack Research and Protection.

Algunos de sus integrantes proceden además de Team Atlanta, el equipo ganador del DARPA AI Cyber Challenge, una competición centrada en el desarrollo de sistemas autónomos capaces de encontrar y corregir vulnerabilidades reales.

Actualmente, MDASH ya está siendo utilizado por equipos de ingeniería de seguridad de Microsoft y está siendo probado por un grupo reducido de clientes mediante una versión preliminar privada.

Aunque todavía se encuentra en una fase limitada, los resultados indican que la detección de vulnerabilidades con IA puede integrarse en procesos reales de ingeniería de software y operar sobre bases de código empresariales de gran tamaño.

¿Qué implica este avance para las empresas?

La principal conclusión no es que un determinado modelo de IA sea capaz de encontrar vulnerabilidades. Lo relevante es que una arquitectura compuesta por múltiples modelos, agentes, herramientas de análisis y mecanismos de validación puede convertir esa capacidad en un proceso repetible.

Para las organizaciones, este enfoque puede aportar beneficios en diferentes áreas:

Análisis continuo del código durante el ciclo de desarrollo.
Detección más temprana de vulnerabilidades complejas.
Reducción de falsos positivos.
Priorización de hallazgos en función de su explotabilidad.
Automatización parcial de las pruebas de seguridad.
Escalabilidad en repositorios de gran tamaño.
Incorporación del conocimiento interno de cada organización.

También cambia la pregunta que las empresas deberían plantearse al evaluar una solución de seguridad basada en IA.

Más que preguntar qué modelo utiliza, conviene analizar qué hace el sistema con ese modelo, cómo valida sus conclusiones y qué elementos de la solución seguirán siendo útiles cuando aparezca la siguiente generación de modelos.

El sistema alrededor de la IA marca la diferencia

MDASH demuestra que la detección de vulnerabilidades mediante inteligencia artificial está evolucionando hacia sistemas capaces de coordinar tareas complejas de análisis, validación y prueba.

Un único agente puede identificar patrones o generar hipótesis. Sin embargo, localizar vulnerabilidades que atraviesan varios archivos, analizar su accesibilidad, evaluar su impacto y demostrar que pueden activarse requiere una composición de agentes, herramientas y conocimiento especializado.

Por tanto, la ventaja competitiva no parece estar únicamente en utilizar el modelo más potente, sino en construir una arquitectura que permita emplear diferentes modelos de manera coordinada, controlada y verificable.

Con MDASH, Microsoft avanza hacia una nueva generación de ingeniería de seguridad en la que la IA no sustituye a los especialistas, sino que amplía su capacidad para analizar código, contrastar hipótesis y actuar a una escala hasta ahora difícil de alcanzar.

¿Quieres saber más sobre las soluciones de inteligencia artificial generativa de Microsoft? Yo te asesoro. ¿Por qué no me preguntas cómo puedo ayudarte?

Información basada en la publicación «Defense at AI speed: Microsoft’s new multi-model agentic security system tops leading industry benchmark» y su presentación en sociedad en Microsoft Build 2026 – Behind the scenes at Build.

Resume o comparte este contenido a través de:

ChatGPT Perplexity WhatsApp LinkedIn X Grok Google AI

Microsoft MDASH: ciberseguridad impulsada por IA

¿Qué es MDASH?

Resultados que superan los principales benchmarks de la industria