Claude Opus 4.8: qué cambia de verdad cuando programas en serio

Anthropic acaba de lanzar Claude Opus 4.8.

El precio se mantiene, llegan algunas novedades para Claude Code y el mensaje parece bastante claro: mejorar la fiabilidad al programar, aguantar mejor tareas largas y hacer que los agentes sean más útiles en flujos de trabajo complejos.

No diría que es una revolución.

Pero, como desarrollador, sí hay varios puntos que me parecen interesantes.

La fiabilidad empieza a ser el tema importante

Lo que más me llama la atención es esto: según Anthropic, Opus 4.8 tiene unas 4 veces menos probabilidades de dejar pasar un bug en el código que acaba de generar.

Y hay otro punto que me parece incluso más relevante: el modelo parece reconocer mejor cuándo no está seguro, en lugar de decirte con total confianza que todo está bien.

Cuando trabajas a diario con código generado por IA, esto se nota.

Prefiero mil veces un modelo que me diga “esto habría que revisarlo” a uno que se equivoca, pero lo hace con una seguridad impecable.

El control del esfuerzo

Otra novedad interesante es el ajuste del esfuerzo.

Junto al selector del modelo, ahora puedes indicar cuánto quieres que Claude profundice en una tarea. Por defecto, Opus 4.8 trabaja en modo high, pero se puede subir a extra o max para tareas más complejas.

La idea es bastante práctica: no todas las tareas necesitan el mismo nivel de razonamiento.

Para corregir un detalle pequeño, no hace falta gastar más de la cuenta.

Para una refactorización delicada, una migración técnica o un agente que va a trabajar durante bastante tiempo sobre una base de código, sí puede tener sentido pedirle más profundidad.

Eso sí, conviene no confundir las cosas: este ajuste no sustituye la elección del modelo adecuado. Lo que hace es modificar cómo trabaja Opus dentro de una tarea concreta.

Los dynamic workflows en Claude Code

En Claude Code, Anthropic también presenta los dynamic workflows en preview.

La idea es ambiciosa: Claude puede dividir un trabajo grande, lanzar varios agentes en paralelo, revisar los resultados y devolver una respuesta consolidada.

El ejemplo que dan es bastante claro: una migración sobre una base de código completa, con cientos de miles de líneas, desde el inicio hasta el merge, usando la suite de tests como red de seguridad.

Sobre el papel, es justo el tipo de funcionalidad que puede cambiar la forma de plantear grandes refactorizaciones.

Para ilustrar esta parte, Anthropic también ha publicado un vídeo interesante sobre tareas largas con Opus 4.8 y Claude Code:

Ahora bien, como siempre, habrá que verlo sobre proyectos reales.

Con dependencias raras.

Con decisiones técnicas heredadas.

Con tests incompletos.

Y con esas pequeñas sorpresas que solo aparecen cuando tocas una aplicación que lleva años en producción.

¿Y cómo encaja esto en Symfony, Laravel o PrestaShop?

Aquí es donde más me interesa.

En proyectos web reales no trabajamos sobre ejemplos limpios. Trabajamos con legacy, módulos, servicios, controladores, jobs, integraciones externas y arquitecturas que muchas veces han pasado por varias manos.

En ese contexto, este tipo de mejoras pueden tener bastante sentido.

Algunos casos donde lo veo útil:

analizar una parte grande de una base de código sin tener que trocearlo todo a mano;
preparar una migración técnica con más claridad;
detectar zonas de riesgo antes de tocar código sensible;
pedir una revisión más prudente de una refactorización;
mantener un agente trabajando sobre una tarea larga sin repetirle el contexto constantemente.

La ventana de 1M de tokens, que ya venía de versiones anteriores, sigue siendo interesante para este tipo de escenarios. Pero mantengo cierta cautela: tener mucho contexto no significa automáticamente entender mejor un proyecto.

Sobre el papel, suena potente.

En la práctica, hay que medirlo.

Sobre el precio

El precio estándar no cambia: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.

El prompt caching puede reducir bastante los costes cuando se reutiliza mucho contexto, y el fast mode pasa a ser mucho más barato que antes para los casos donde la velocidad pesa más que la profundidad.

Opus 4.8 está disponible en Claude Pro, Max, Team, Enterprise, a través de la API de Claude, y también en AWS, Google Cloud y Microsoft Foundry.

Mi conclusión por ahora

No veo Claude Opus 4.8 como una ruptura.

Lo veo más bien como una actualización de madurez.

Menos confianza mal colocada.

Más control.

Más capacidad para aguantar tareas largas.

Y, potencialmente, una herramienta más útil para trabajar con código real, no solo con ejemplos pequeños y bien preparados para una demo.

👋 Soy Jatniel Guzmán, desarrollador PHP senior freelance.

Ayudo a startups, pymes, agencias y grandes cuentas a diseñar, evolucionar y optimizar sus aplicaciones web, API REST y plataformas e-commerce.

Symfony, Laravel, PrestaShop, migración PHP, modernización de código legacy, rendimiento y mantenibilidad: intervengo allí donde hace falta que lo existente sea más fiable, más claro y más duradero.

Web: https://jatniel.dev
LinkedIn: https://www.linkedin.com/in/jatniel/
GitHub: https://github.com/jatniel
Malt: https://www.malt.fr/profile/jatniel