Selon Beating, Cognition a lancé Devin Fusion, une architecture d'agent IA hybride conçue pour équilibrer les performances des modèles de pointe avec des coûts nettement inférieurs. Le système utilise deux mécanismes principaux : une conception « Sidekick » où des modèles économiques plus petits gèrent l'exploration du code, les tests et les tâches de validation aux côtés d'un modèle de pointe plus grand qui conserve la planification, la clarification des exigences et l'autorité de révision finale, chacun maintenant des contextes mis en cache séparés pour éviter une invalidation coûteuse du cache ; et un routage dynamique qui ajuste les modèles pendant les sessions en fonction de l'évolution des tâches et de la compression du contexte, permettant des mises à niveau de modèles à « coût zéro ».
Les tests sur le benchmark FrontierCode montrent que Devin Fusion réduit les coûts de développement de 35 % en moyenne pour les modèles de niveau GPT-5.5 et Opus 4.8 tout en maintenant des performances de pointe, ou jusqu'à 41 % lorsqu'il est utilisé avec Fable 5. En développement interne, 88 % des pull requests fusionnées ont été entièrement pilotées par le routage automatique de Fusion, bien que les performances diminuent considérablement sur les tâches nécessitant une intention de développement complexe et un jugement subjectif.