He pasado algunas horas probando Grok 3, la nueva versión de la IA de xAI. Quería ver sus capacidades reales y sobre todo cómo se comporta, qué tipo de resultados da, frente a ChatGPT, Claude, Le Chat, DeepSeek...
- Destaca en problemas matemáticos. Le hice completar el reto AIME'24, del cual acertó 6 de los 15 problemas, por los 9 aciertos de o3-mini-high de OpenAI. Además, Grok 3 tardó algo menos de cinco minutos, pero o3-mini-high tardó casi seis.