Nous avons mené une large revue de la façon dont les agents fonctionnent, pour que le travail au quotidien soit plus rapide et plus fiable.
Les messages en direct apparaissent désormais plus vite, les longues réponses des modèles plus lents ne sont plus coupées, et lorsqu’un modèle est occupé, le système bascule en douceur vers la meilleure option suivante.
Ce que vous pouvez faire maintenant
- Voyez les réponses en direct apparaître en environ une demi-seconde.
- Obtenez des réponses complètes des modèles qui marquent une pause pour réfléchir, sans qu’elles soient interrompues.
- Continuez à travailler lorsqu’un modèle est occupé, les agents basculant automatiquement vers vos options de secours.
- Recevez un message clair lorsqu’une limite d’utilisation est atteinte, au lieu d’un blocage silencieux.
- Consultez des totaux de coût et d’usage qui correspondent à ce qui a réellement été consommé.
Pourquoi c’est important
La fiabilité est ce qui fait de l’IA un coéquipier sur lequel on peut compter. Les petits blocages, les réponses coupées et les erreurs floues érodent vite cette confiance.
Ces changements ciblent les aspérités qui apparaissent dans l’usage réel et quotidien, afin que les agents restent réactifs et prévisibles sous charge.
Exemples de flux de travail
- Conversation en direct : une équipe voit les réponses arriver en flux nettement plus rapidement.
- Tâches lourdes : une longue analyse se termine proprement au lieu de s’interrompre en plein raisonnement.
- Charge de pointe : le travail se poursuit sur un modèle de secours lorsque le premier choix est occupé.
- Budgets : les chiffres d’usage et de coût restent exacts tout au long d’un travail en plusieurs étapes.
Ce qui arrive
Nous continuerons de renforcer le moteur pour que les agents restent rapides et fiables à mesure que les charges de travail augmentent.