Claude Fable 5: review con benchmark real (Junio 2026)
Claude Fable 5 es la nueva línea "Mythos" de Anthropic, lanzada en junio de 2026. Lo corrimos por 103 tests reales con LLM-as-Judge Phi-4 local: obtiene score global 6.75, calidad de pilar sólida, pero un costo de $10.00 / $50.00 por millón de tokens. ¿Vale la pena? La respuesta corta: solo si tu caso justifica pagar el premium de Anthropic.
¿Qué mide este benchmark?
No es un benchmark académico: es un benchmark aplicado para emprendedores hispanohablantes. Medimos qué modelo conviene poner en producción para casos reales, con lo que los benchmarks oficiales no cubren — costo en provider real, velocidad, español neutro y agentes multi-turno.
Contamos con 145 modelos catalogados, 98 testeados y 10,000+ tests reales evaluados por un LLM-as-Judge local (Phi-4, de Microsoft — sin conflicto de interés), en 4 pilares:
- Coding — generar código, JSON estructurado y debugging en tareas reales (plugins WordPress, scripts, templates de N8N).
- Contenido — blogs, copy y textos largos en español neutro (no traducción del inglés).
- Razonamiento — matemáticas, lógica formal y planificación multi-paso.
- Agentes — multi-turno largo, tool calling y flujos tipo N8N / Hermes.
El score global v3.0 es una función ponderada: calidad 70% + costo 15% + velocidad 7,5% + latencia 7,5%. Tool calling se reporta como badge de capacidad, no entra en el score. Mide valor para producción, no solo capacidad bruta. Metodología y tests completos.
Fable 5 vs alternativas directas
| # | Modelo | Score | $ in/out per M | License | Provider |
|---|---|---|---|---|---|
| 1 | Claude Fable 5 (suscripción) | 6.75 | $10.00 / $50.00 | Propietaria | claude_code (60 tok/s) |
| 2 | DeepSeek R1 (reasoning) | 8.33 | $0.70 / $2.50 | MIT | openrouter (22 tok/s) |
| 3 | MiniMax M3 (directo / sub) | 7.92 | $0.30 / $1.20 | Propietaria | minimax_direct (26 tok/s) |
| 4 | Claude Opus 4.8 (suscripción) | 7.88 | $5.00 / $25.00 | Propietaria | claude_code (62 tok/s) |
| 5 | Claude Sonnet 4.6 (suscripción) | 7.80 | $3.00 / $15.00 | Propietaria | claude_code (51 tok/s) |
¿Qué es Claude Fable 5?
Fable 5 es un modelo de Anthropic orientado a contenido, agentes multi-turno y razonamiento. No es el flagship de la familia (Opus 4.8 sigue arriba en casi todo), sino una apuesta intermedia con velocidad similar a Opus (~60 tok/s) y un precio que lo acerca más a Opus que a Sonnet.
- Score global: 6.75 — fuera del top 10 por costo.
- Calidad por pilar: Contenido 7.16, Agentes 7.06, Coding 6.67, Razonamiento 7.28.
- Costo: $10.00 input / $50.00 output por millón.
- Velocidad: ~60 tok/s en suscripción Anthropic.
- Licencia: Propietaria (suscripción Claude / Anthropic API).
Veredicto: ¿cuándo conviene Fable 5?
No conviene como modelo único. Por el mismo ecosistema, Sonnet 4.6 entrega mejor score global (7.80) a la mitad de costo, y Opus 4.8 es más fuerte en todos los pilares (7.88) por $5/$25. Fable 5 queda en una zona incómoda: más caro que Sonnet, peor que Opus.
Sí tiene sentido si ya pagás suscripción Claude Pro/Max y querés un modelo con tono más creativo/narrativo para contenido largo o brainstorming, sin salir del stack Anthropic. Pero para producción con volumen, MiniMax M3 (7.92, $0.30/$1.20) o DeepSeek R1 (8.33, $0.70/$2.50) entregan mucho más valor por dólar.
Fable 5 por tipo de trabajo
- Coding: 6.67/10. Por debajo de Sonnet 4.6 (7.30/10) y muy por debajo de modelos open-source baratos como Devstral Small. No lo elegiría para code-generation en producción.
- Contenido: 7.16/10. Bueno, pero Opus 4.8 (7.58/10) y Sonnet 4.6 (7.49/10) rinden similar o mejor por menos.
- Razonamiento: 7.28/10. Sólido, pero DeepSeek R1 lidera este grupo (7.59/10).
- Agentes: 7.06/10. Competitivo, aunque Sonnet 4.6 (7.45/10) lo supera.
Comparaciones detalladas
Si querés ver el enfrentamiento pilar por pilar, tenemos comparaciones automáticas generadas a partir de los mismos datos:
Preguntas frecuentes
¿Claude Fable 5 es mejor que Opus 4.8?
No. En nuestro benchmark Opus 4.8 tiene score global 7.88 contra 6.75 de Fable 5, y gana en todos los pilares por menos costo ($5/$25 vs $10/$50).
¿Vale la pena pagar por Claude Fable 5?
Solo si ya estás en el ecosistema Anthropic y preferís su tono para contenido creativo. Para producción con volumen, MiniMax M3 y DeepSeek R1 ofrecen mejor relación calidad/precio.
¿Fable 5 es bueno para programar?
No es su fuerte: 6.67/10 en Coding, por debajo de Sonnet 4.6, Opus 4.8 y modelos open-source especializados como Devstral Small o Qwen3-Coder.
¿Qué significa 'Mythos' en Claude Fable 5?
Es la marca interna/línea de lanzamiento de Anthropic para esta variante de junio 2026, posicionada entre Sonnet y Opus en precio pero no en rendimiento.
Probá la calculadora con tu caso real
Filtrá por presupuesto mensual, calidad mínima, velocidad requerida y tipo de tarea. En 30 segundos encontrás el mejor para vos.
Ir a la calculadora →