Cyber Verification Program: cómo Anthropic está dosificando el acceso a la IA defensiva

5/21/20268 min read

Cyber Verification Program: cómo Anthropic está dosificando el acceso a la IA defensiva

Cuando el modelo más potente en ciberseguridad viene con un portero en la puerta, los equipos legítimos necesitan saber cómo llamar correctamente.

El problema que nadie quería admitir en voz alta

Hay una tensión estructural que los grandes laboratorios de IA llevan meses ignorando en sus comunicados de prensa: los mismos modelos que hacen el trabajo de un investigador de seguridad senior también pueden hacer el trabajo de un atacante avanzado. Anthropic, al menos, ha decidido nombrarlo.

Con el lanzamiento de Claude Opus 4.7, la compañía introdujo lo que denomina real-time cyber safeguards: un sistema de bloqueo integrado directamente en el modelo —no como filtro añadido, sino como comportamiento nativo— diseñado para detectar y detener peticiones asociadas a usos de ciberseguridad prohibidos o de alto riesgo. El resultado práctico es que Opus 4.7 puede rechazar, sin previo aviso, tareas perfectamente legítimas para un equipo de red team, un investigador de vulnerabilidades o un proveedor de herramientas de seguridad ofensiva.

El Cyber Verification Program (CVP) es la respuesta institucional a ese problema. No es un bypass, ni una puerta trasera, ni un acuerdo de NDA acelerado. Es un programa de acreditación formal, gratuito y basado en criterios de uso declarado, que permite a profesionales verificados seguir realizando trabajo dual-use sin que los guardrails les interrumpan constantemente.

Para cualquier equipo de seguridad que trabaje con Claude —o que esté evaluando hacerlo— entender cómo funciona el CVP es hoy una necesidad operativa, no una curiosidad técnica.

Qué es el Cyber Verification Program: propósito, mecánica y qué desbloquea realmente

Anthropic divide las actividades de ciberseguridad bloqueadas en dos categorías con lógicas distintas.

La primera cubre usos prohibidos: desarrollo de ransomware, exfiltración masiva de datos, herramientas diseñadas para atacar infraestructuras críticas. Estas actividades permanecen bloqueadas con independencia del nivel de verificación del usuario, sin excepciones. El CVP no las toca.

La segunda categoría es la que importa para los profesionales legítimos: actividades dual-use de alto riesgo. Esto incluye explotación de vulnerabilidades, desarrollo de tooling ofensivo con aplicación defensiva, simulación de técnicas de ataque para pruebas de penetración, y análisis de código potencialmente malicioso. Por defecto, también están bloqueadas. El CVP existe específicamente para levantar esos bloqueos cuando el contexto de uso es verificable y legítimo.

La mecánica de acceso es directa. Si accedes a Claude a través de las plataformas propias de Anthropic —Claude.ai, Claude Code o la API de Anthropic— el proceso comienza localizando el Organization ID en la configuración de cuenta y cumplimentando el formulario de caso de uso en claude.com/form/cyber-use-case. La solicitud debe presentarla un administrador autorizado de la organización. El plazo declarado de revisión es de dos días hábiles.

Hay excepciones relevantes en el perímetro de elegibilidad. Las cuentas con Zero Data Retention (ZDR) gestionadas directamente por ventas no son elegibles a través del proceso estándar: requieren contacto directo con el representante de Anthropic. Y los accesos a través de Amazon Bedrock y Google Vertex AI quedan, a fecha de hoy, completamente fuera del programa, lo que representa un obstáculo no menor para equipos que han construido pipelines sobre esas plataformas.

Para propietarios de plataformas que ofrecen Claude como motor de sus productos —vendors de seguridad, integradores, ISVs— existe un canal separado a través de un formulario específico de interés para plataformas. No todos los proveedores third-party participan aún en el CVP, y la cobertura varía.

Quién es candidato y qué obligaciones asume

El CVP está concebido para profesionales con casos de uso defensivos verificables. En la práctica, los perfiles más alineados son equipos de red team internos o consultores externos con mandato documentado, investigadores de vulnerabilidades que trabajan dentro de programas de divulgación responsable (bug bounties, coordinated disclosure con vendors), y proveedores de herramientas de seguridad ofensiva —pentest frameworks, DAST, fuzzing— con base de clientes empresarial real.

La elegibilidad formal no está codificada en una lista cerrada de criterios publicados, lo que introduce un elemento de discrecionalidad en el proceso de revisión que, en mi opinión, es el talón de Aquiles del programa en su forma actual. Anthropic reconoce expresamente que espera rechazar solicitudes elegibles de forma incorrecta y que usuarios aprobados pueden seguir experimentando bloqueos en trabajo legítimo. Es una honestidad inusual en comunicación corporativa, pero no resuelve el problema operativo de un equipo que tiene una ventana de trabajo activa.

En cuanto a obligaciones, el CVP no impone un acuerdo contractual diferenciado del marco habitual de uso. Lo que sí establece es que la aprobación está vinculada a un Organization ID específico: si los bloqueos se producen en un workspace distinto —por ejemplo, el personal de un empleado en lugar del organizacional— la verificación no se extiende automáticamente. La gestión de accesos requiere disciplina administrativa básica.

Las actividades genuinamente prohibidas permanecen fuera del alcance independientemente del estatus CVP. El programa no es un acceso sin restricciones: es la eliminación de fricción para trabajo dual-use legítimo dentro de los límites del uso aceptable de Anthropic.

CVP vs. Trusted Access for Cyber de OpenAI: dos filosofías distintas

OpenAI respondió al anuncio de Claude Mythos Preview con el lanzamiento de GPT-5.4-Cyber y la expansión de su programa Trusted Access for Cyber a miles de defensores verificados y cientos de equipos de seguridad. La comparación entre ambas iniciativas revela diferencias de filosofía que van más allá de los detalles de implementación.

El Trusted Access for Cyber de OpenAI adopta un posicionamiento de democratización con verificación objetiva: acceso amplio, basado en señales de confianza e identidad, con el argumento explícito de que no es ni práctico ni apropiado decidir centralmente quién tiene derecho a defenderse. La verificación individual se procesa a través de chatgpt.com/cyber con un proceso de verificación de identidad; los equipos enterprise pasan por su account representative. GPT-5.4-Cyber añade capacidades específicas como reverse engineering binario y acceso a Codex Security para escaneo automatizado de código.

El CVP de Anthropic opera desde una lógica de gating controlado con expansión gradual: el acceso está acotado por Organization ID, requiere validación manual del caso de uso, y el perímetro de cobertura —plataformas elegibles, categorías desbloqueables— sigue evolucionando. La propia documentación oficial indica que el programa está en desarrollo activo y que los criterios y coberturas se irán refinando.

Ninguna de las dos aproximaciones es objetivamente superior, pero sí tienen consecuencias prácticas diferentes según el perfil del usuario. Para un equipo grande con infraestructura enterprise establecida y un mandato claro de seguridad, el proceso CVP de Anthropic es manejable y ofrece acceso a un modelo que en benchmarks de explotación de vulnerabilidades (CyberGym) supera a GPT-5.4 en más de seis puntos porcentuales. Para un investigador independiente o una startup de seguridad con acceso variable a administradores de organización, el Trusted Access for Cyber de OpenAI presenta menos fricción de entrada.

La diferencia más relevante para un CISO evaluando procurement es esta: OpenAI apuesta por el volumen de defensores verificados como palanca de impacto ecosistémico; Anthropic apuesta por la profundidad del control sobre quién accede a qué capacidades. Son apuestas de riesgo distintas con distintos perfiles de exposición.

Cómo preparar una solicitud sólida

La calidad de la solicitud CVP es determinante en un proceso con revisión manual y criterios parcialmente discrecionales. Estos son los elementos que una solicitud robusta debe incluir o tener documentados antes de enviar el formulario.

Claridad del mandato organizacional. La solicitud debe poder articular con precisión qué tipo de trabajo de seguridad realiza la organización, bajo qué autorización —contractual, interna, mediante bug bounty— y cuál es el alcance previsto del uso de Claude en ese contexto. Cuanto más específico sea el caso de uso declarado, menor es la probabilidad de rechazo por ambigüedad.

Documentación del acceso previo a la plataforma. El Organization ID correcto es obligatorio. Errores en este punto no solo retrasan el proceso: en algunos casos pueden vincularse a la organización incorrecta y generar aprobaciones que no cubren el entorno de trabajo real.

Comprensión de los límites del programa. Solicitar CVP para actividades en la categoría de uso prohibido es inútil y puede perjudicar futuras solicitudes. Antes de presentar, verificar que el caso de uso cae explícitamente en la categoría dual-use de alto riesgo, no en la categoría de uso prohibido.

Canal de acceso correcto. Si el acceso a Claude se produce a través de un third-party vendor, el canal no es el formulario directo de Anthropic sino el propio vendor. No todos los vendors participan en el CVP. Confirmar la elegibilidad de la plataforma antes de iniciar el proceso ahorra fricciones innecesarias.

Lo que no se debe hacer: presentar una solicitud genérica sin especificar el caso de uso real, asumir que la aprobación cubre workspaces adicionales sin verificarlo, o intentar utilizar el CVP para actividades explícitamente prohibidas bajo la política de uso de Anthropic. El programa tiene un mecanismo de apelación para rechazos incorrectos, pero no está diseñado para negociar los límites del uso aceptable.

Capability gating: la nueva normalidad del sector que nadie estaba pidiendo, pero que ya está aquí

El Cyber Verification Program no es una anomalía de Anthropic. Es la manifestación más articulada hasta la fecha de una tendencia que está consolidándose en la industria: los modelos más capaces en dominios de alto riesgo no serán de acceso universal, y el acceso estará condicionado a verificación, contexto declarado y responsabilidad trazable.

Esto tiene consecuencias que van más allá de llenar un formulario. Para los equipos de seguridad, significa que el acceso a las mejores herramientas de IA defensiva pasará a ser un activo gestionable —con proceso de solicitud, renovación implícita y posible revocación— de la misma forma en que hoy se gestionan licencias de herramientas comerciales. Para los CISOs, significa que el procurement de IA en seguridad empieza a parecerse más al procurement de cualquier otra capacidad regulada: con due diligence, con política de uso documentada y con accountability sobre cómo se despliega.

El capability gating también actúa como señal de mercado. Cuando Anthropic reserva su modelo más avanzado —Mythos— para un consorcio restringido bajo Project Glasswing, y ofrece CVP para Opus 4.7, está comunicando algo sobre cómo concibe la relación entre capacidad y acceso. No es un modelo de negocio convencional. Es una apuesta sobre qué tipo de fricción de acceso es tolerable socialmente cuando las capacidades en juego incluyen la identificación automatizada de zero-days en sistemas críticos.

Si esa apuesta es la correcta —y hay argumentos razonables en ambas direcciones— lo determinarán los próximos doce a dieciocho meses, cuando los programas de acceso verificado de los grandes laboratorios tengan suficiente historia operativa como para evaluar su impacto real en el equilibrio ofensivo-defensivo. Lo que ya es seguro es que los equipos que entiendan y naveguen estos programas con eficacia tendrán acceso a capacidades que sus competidores no tendrán. Eso, en ciberseguridad, siempre ha importado.

¿Tu equipo trabaja con Claude en entornos de seguridad o está evaluando hacerlo? Comparte este artículo con quien gestione el procurement de IA en tu organización. Visita el blog para acceder a más análisis sobre IA aplicada a ciberseguridad, sin hype y con criterio operativo.

ETIQUETAS: Cyber Verification Program Anthropic, CVP ciberseguridad IA, Claude Opus 4.7 red team, guardrails IA ofensiva, Trusted Access for Cyber OpenAI, acceso verificado IA, AI security professionals, CISO inteligencia artificial, vulnerability research IA, capability gating

Accede a recursos y guías sobre IA y ciberseguridad gratis:

Contacto

Número de teléfono

Email

contacto@isaacruizromero.es

+34 640 81 78 31

Cyber Verification Program: cómo Anthropic está dosificando el acceso a la IA defensiva

Cyber Verification Program: cómo Anthropic está dosificando el acceso a la IA defensiva

Cuando el modelo más potente en ciberseguridad viene con un portero en la puerta, los equipos legítimos necesitan saber cómo llamar correctamente.

El problema que nadie quería admitir en voz alta

Qué es el Cyber Verification Program: propósito, mecánica y qué desbloquea realmente

Quién es candidato y qué obligaciones asume

CVP vs. Trusted Access for Cyber de OpenAI: dos filosofías distintas

Cómo preparar una solicitud sólida

Capability gating: la nueva normalidad del sector que nadie estaba pidiendo, pero que ya está aquí

Accede a recursos y guías sobre IA y ciberseguridad gratis:

Contacto

Instagram:

Linkedln: