Claude Fable 5: review con benchmark real (Junio 2026)

Claude Fable 5 es la nueva línea "Mythos" de Anthropic, lanzada en junio de 2026. Lo corrimos por 103 tests reales con LLM-as-Judge Phi-4 local: obtiene score global 6.75, calidad de pilar sólida, pero un costo de $10.00 / $50.00 por millón de tokens. ¿Vale la pena? La respuesta corta: solo si tu caso justifica pagar el premium de Anthropic.

Última actualización: 2026-07-02 · datos abiertos en GitHub

¿Qué mide este benchmark?

No es un benchmark académico: es un benchmark aplicado para emprendedores hispanohablantes. Medimos qué modelo conviene poner en producción para casos reales, con lo que los benchmarks oficiales no cubren — costo en provider real, velocidad, español neutro y agentes multi-turno.

Contamos con 145 modelos catalogados, 98 testeados y 10,000+ tests reales evaluados por un LLM-as-Judge local (Phi-4, de Microsoft — sin conflicto de interés), en 4 pilares:

Coding — generar código, JSON estructurado y debugging en tareas reales (plugins WordPress, scripts, templates de N8N).
Contenido — blogs, copy y textos largos en español neutro (no traducción del inglés).
Razonamiento — matemáticas, lógica formal y planificación multi-paso.
Agentes — multi-turno largo, tool calling y flujos tipo N8N / Hermes.

El score global v3.0 es una función ponderada: calidad 70% + costo 15% + velocidad 7,5% + latencia 7,5%. Tool calling se reporta como badge de capacidad, no entra en el score. Mide valor para producción, no solo capacidad bruta. Metodología y tests completos.

Fable 5 vs alternativas directas

Score ponderado v3.0: calidad 70% + costo 15% + velocidad 7,5% + latencia 7,5%.

#	Modelo	Score	$ in/out per M	License	Provider
1	Claude Fable 5 (suscripción)	6.75	$10.00 / $50.00	Propietaria	claude_code (60 tok/s)
2	DeepSeek R1 (reasoning)	8.33	$0.70 / $2.50	MIT	openrouter (22 tok/s)
3	MiniMax M3 (directo / sub)	7.92	$0.30 / $1.20	Propietaria	minimax_direct (26 tok/s)
4	Claude Opus 4.8 (suscripción)	7.88	$5.00 / $25.00	Propietaria	claude_code (62 tok/s)
5	Claude Sonnet 4.6 (suscripción)	7.80	$3.00 / $15.00	Propietaria	claude_code (51 tok/s)

El score global castiga fuerte a Fable 5 por costo. En calidad pura es competitivo, pero no lidera. Ajustá pesos en la calculadora para tu presupuesto real.

¿Qué es Claude Fable 5?

Fable 5 es un modelo de Anthropic orientado a contenido, agentes multi-turno y razonamiento. No es el flagship de la familia (Opus 4.8 sigue arriba en casi todo), sino una apuesta intermedia con velocidad similar a Opus (~60 tok/s) y un precio que lo acerca más a Opus que a Sonnet.

Score global: 6.75 — fuera del top 10 por costo.
Calidad por pilar: Contenido 7.16, Agentes 7.06, Coding 6.67, Razonamiento 7.28.
Costo: $10.00 input / $50.00 output por millón.
Velocidad: ~60 tok/s en suscripción Anthropic.
Licencia: Propietaria (suscripción Claude / Anthropic API).

Veredicto: ¿cuándo conviene Fable 5?

No conviene como modelo único. Por el mismo ecosistema, Sonnet 4.6 entrega mejor score global (7.80) a la mitad de costo, y Opus 4.8 es más fuerte en todos los pilares (7.88) por $5/$25. Fable 5 queda en una zona incómoda: más caro que Sonnet, peor que Opus.

Sí tiene sentido si ya pagás suscripción Claude Pro/Max y querés un modelo con tono más creativo/narrativo para contenido largo o brainstorming, sin salir del stack Anthropic. Pero para producción con volumen, MiniMax M3 (7.92, $0.30/$1.20) o DeepSeek R1 (8.33, $0.70/$2.50) entregan mucho más valor por dólar.

Fable 5 por tipo de trabajo

Coding: 6.67/10. Por debajo de Sonnet 4.6 (7.30/10) y muy por debajo de modelos open-source baratos como Devstral Small. No lo elegiría para code-generation en producción.
Contenido: 7.16/10. Bueno, pero Opus 4.8 (7.58/10) y Sonnet 4.6 (7.49/10) rinden similar o mejor por menos.
Razonamiento: 7.28/10. Sólido, pero DeepSeek R1 lidera este grupo (7.59/10).
Agentes: 7.06/10. Competitivo, aunque Sonnet 4.6 (7.45/10) lo supera.

Comparaciones detalladas

Si querés ver el enfrentamiento pilar por pilar, tenemos comparaciones automáticas generadas a partir de los mismos datos:

Preguntas frecuentes

¿Claude Fable 5 es mejor que Opus 4.8?

No. En nuestro benchmark Opus 4.8 tiene score global 7.88 contra 6.75 de Fable 5, y gana en todos los pilares por menos costo ($5/$25 vs $10/$50).

¿Vale la pena pagar por Claude Fable 5?

Solo si ya estás en el ecosistema Anthropic y preferís su tono para contenido creativo. Para producción con volumen, MiniMax M3 y DeepSeek R1 ofrecen mejor relación calidad/precio.

¿Fable 5 es bueno para programar?

No es su fuerte: 6.67/10 en Coding, por debajo de Sonnet 4.6, Opus 4.8 y modelos open-source especializados como Devstral Small o Qwen3-Coder.

¿Qué significa 'Mythos' en Claude Fable 5?

Es la marca interna/línea de lanzamiento de Anthropic para esta variante de junio 2026, posicionada entre Sonnet y Opus en precio pero no en rendimiento.

Probá la calculadora con tu caso real

Filtrá por presupuesto mensual, calidad mínima, velocidad requerida y tipo de tarea. En 30 segundos encontrás el mejor para vos.

Ir a la calculadora →

Ver también: Fable 5 vs Opus 4.8 · Fable 5 vs Sonnet 4.6 · alternativas a Claude · modelos baratos