Hicimos una revisión amplia de cómo se ejecutan los agentes, para que el trabajo del día a día se sienta más rápido y más fiable.
Los mensajes en vivo ahora aparecen más rápido, las respuestas largas de los modelos más lentos ya no se cortan, y cuando un modelo está ocupado el sistema pasa con fluidez a la siguiente mejor opción.
Lo que puedes hacer ahora
- Ve las respuestas en vivo aparecer en aproximadamente medio segundo.
- Obtén respuestas completas de modelos que se detienen a pensar, sin que se descarten.
- Sigue trabajando cuando un modelo está ocupado, ya que los agentes cambian automáticamente a tus opciones de respaldo.
- Recibe un mensaje claro cuando se alcanza un límite de uso en lugar de un bloqueo silencioso.
- Ve totales de coste y uso que coinciden con lo que realmente se utilizó.
Por qué importa
La fiabilidad es lo que hace que la IA se sienta como un compañero de equipo con el que puedes contar. Los pequeños bloqueos, las respuestas descartadas y los errores poco claros erosionan esa confianza rápidamente.
Estos cambios atacan las asperezas que aparecen en el uso real y cotidiano, para que los agentes se mantengan ágiles y predecibles bajo carga.
Flujos de trabajo de ejemplo
- Chat en vivo: Un equipo ve las respuestas llegar notablemente más rápido.
- Tareas pesadas: Un análisis largo termina de forma limpia en lugar de cortarse a mitad de una idea.
- Carga pico: El trabajo continúa en un modelo de respaldo cuando la primera opción está ocupada.
- Presupuestos: Las cifras de uso y coste se mantienen precisas en el trabajo de varios pasos.
Lo que viene
Seguiremos reforzando el motor para que los agentes se mantengan rápidos y fiables a medida que crecen las cargas de trabajo.