El 30 de junio de 2026 Anthropic lanzó Claude Sonnet 5 y reemplazó a Sonnet 4.6 como modelo por defecto en los planes Free y Pro. La novedad no es un benchmark: es que el modelo está pensado explícitamente para bajar el costo de correr agentes que trabajan solos, el gasto que más asusta a una empresa antes de automatizar.
Claude Sonnet 5 es el nuevo modelo de gama media de Anthropic, lanzado el 30 de junio de 2026 en reemplazo de Sonnet 4.6. Llega con un precio introductorio de USD 2 por millón de tokens de entrada y USD 10 por millón de salida (vigente hasta el 31 de agosto de 2026), la mitad de rango que ocupa un modelo de frontera. Está optimizado para correr agentes autónomos: tareas de varios pasos donde el modelo se llama a sí mismo muchas veces y cada llamada suma costo.
Para una empresa, esto significa que casos de uso que antes no cerraban en números —un agente de soporte que corre todo el día, un analista de documentos por lote— ahora pueden ser rentables. La regla práctica: usá Sonnet 5 como caballo de batalla de tus agentes y reservá Opus 4.8 o Fable 5 para los pasos que de verdad exigen el máximo razonamiento.
¿Qué es Claude Sonnet 5 y qué cambia respecto de Sonnet 4.6?
Sonnet 5 es la nueva generación del modelo de gama media de Anthropic —el equilibrio entre capacidad y costo dentro de la familia Claude—. Desde el 30 de junio de 2026 es el modelo por defecto en Free y Pro, y reemplaza a Sonnet 4.6 en todos los planes (Anthropic). Mantiene la ventana de contexto de 1 millón de tokens del tier Sonnet, suficiente para analizar cientos de páginas en una sola llamada.
El ángulo con el que la prensa cubrió el lanzamiento lo dice todo: TechCrunch lo tituló directamente como “una forma más barata de correr agentes” (TechCrunch, 30 de junio de 2026). No es casual. El costo de un agente no se parece al de un chatbot: un agente planifica, se llama a sí mismo, consulta herramientas y revisa su salida, y cada uno de esos pasos consume tokens. Bajar el precio por token del modelo que corre esos pasos cambia la ecuación de rentabilidad de cuajo.
¿Cuánto cuesta Claude Sonnet 5 y por qué abarata los agentes?
El precio introductorio es de USD 2 por millón de tokens de entrada y USD 10 por millón de tokens de salida, vigente hasta el 31 de agosto de 2026 (Anthropic, 30 de junio de 2026). Para dimensionarlo: Fable 5, el modelo de frontera de Anthropic, cuesta USD 10 de entrada y USD 50 de salida por millón —cinco veces más—. Ahí está la propuesta: Sonnet 5 hace la mayor parte del trabajo agéntico a una fracción del costo del modelo tope.
La pregunta útil no es “cuánto cuesta un token” sino “cuánto me sale un agente por mes”. Estas son estimaciones ilustrativas al precio introductorio de Sonnet 5, para dar orden de magnitud (los volúmenes reales dependen de tu caso):
| Agente (caso de uso) | Volumen mensual aprox. | Costo estimado con Sonnet 5 |
|---|---|---|
| Soporte que gestiona consultas de principio a fin | 1.000 conversaciones (~5M in + 1M out) | ~USD 20/mes |
| Análisis de documentos por lote con informe | 500 documentos (~10M in + 1,5M out) | ~USD 35/mes |
| Investigación que cruza fuentes y produce reportes | 100 reportes (~5M in + 0,8M out) | ~USD 18/mes |
El punto no es el número exacto, sino el orden de magnitud: un agente que resuelve un proceso completo cuesta decenas de dólares al mes, no miles. El gasto que hace descarrilar un proyecto de IA casi nunca es el modelo —es la implementación mal medida—. Lo cubro en la trampa del tokenmaxxing.
¿Qué modelo de Claude conviene usar para automatizar sin gastar de más?
La respuesta no es “el más potente”: es el más barato que resuelve bien la tarea. La familia Claude está pensada para combinarse, no para elegir uno solo. Un buen diseño de agente rutea cada paso al modelo que corresponde.
| Modelo | Cuándo usarlo en un agente |
|---|---|
| Haiku 4.5 | Pasos de alto volumen y baja dificultad: clasificar, extraer, rutear. El más económico de la familia. |
| Sonnet 5 | El caballo de batalla: la mayoría de los pasos de un agente (planificar, redactar, consultar herramientas) con buen razonamiento a bajo costo. |
| Opus 4.8 | Los pasos que exigen razonamiento profundo o decisiones críticas, donde un error sale caro. |
| Fable 5 | El tope de capacidad, para tareas de máxima complejidad sostenida. Disponible en LATAM desde el 30/6/2026. |
Con Sonnet 5 más barato, el patrón que mejor rinde es Sonnet 5 por defecto, escalando a Opus 4.8 o Fable 5 solo cuando el paso lo justifica. Ese ruteo por modelo es, en la práctica, la diferencia entre un agente que cierra en números y uno que quema presupuesto. El detalle de precios de cada plan lo cubro en Claude Pro vs Team vs Enterprise.
¿A quién le toca directo un cambio de modelo por defecto?
A cualquier equipo que ya trabaja con Claude. Un caso concreto de la región: TRANSPA S.A., empresa de transporte de energía eléctrica de alta tensión en la Patagonia, ya tiene a parte de su equipo capacitado en Claude Enterprise trabajando con Haiku, Sonnet y Opus según la tarea. Un cambio en el modelo Sonnet por defecto los toca directo: las mismas automatizaciones corren ahora sobre Sonnet 5, con mejor razonamiento y a menor costo por token, sin cambiar nada del flujo.
Esa es la ventaja de haber montado la operación sobre la familia Claude y no sobre un modelo puntual: cuando Anthropic mejora un tier, el equipo hereda la mejora sin migrar. Lo que hay que revisar es qué pasos conviene re-rutear ahora que Sonnet subió de capacidad y bajó de precio.
¿Cómo aprovecho Sonnet 5 en mi empresa, en concreto?
- 1. Identificá un proceso repetitivo y medible: soporte de primer nivel, análisis de documentos, generación de reportes.
- 2. Diseñá el agente con ruteo por modelo: Sonnet 5 para el grueso, Haiku 4.5 para clasificación masiva, Opus 4.8 o Fable 5 solo en los pasos críticos.
- 3. Medí una línea de base: cuánto cuesta y cuánto tarda hoy ese proceso sin IA.
- 4. Aprovechá la ventana de precio: el valor introductorio rige hasta el 31 de agosto de 2026 —es un buen momento para pilotear con costos bajos.
- 5. Escalá cuando el primero rinde, no antes.
Si querés ver cómo se arma un agente paso a paso, lo detallo en cómo crear tu primer agente con Claude, Gemini o GPTs.
El modelo bajó de precio; la rentabilidad la define el diseño.
Sonnet 5 no importa por ser nuevo, sino porque mueve el punto en el que un agente deja de ser un experimento caro y pasa a ser un proceso que cierra en números. Pero un modelo más barato no salva una implementación sin criterio: el retorno sigue dependiendo de elegir el proceso correcto, medir desde el día uno y rutear cada paso al modelo justo. La potencia y el precio habilitan; la estrategia decide.
Si querés evaluar qué proceso de tu empresa conviene automatizar primero con agentes, agendá una implementación de IA o conversémoslo en una consultoría.
Última actualización: 1 de julio de 2026 · Análisis basado en el anuncio de Claude Sonnet 5 (Anthropic, 30 de junio de 2026), la cobertura de TechCrunch y experiencia directa con implementaciones de Claude y agentes en empresas de la región. Precios y disponibilidad sujetos a cambios; el valor introductorio rige hasta el 31 de agosto de 2026. Diego Ceredi, Preferred Services Partner del Claude Partner Network (Anthropic) y consultor certificado por Anthropic (Claude) y Google (Gemini).