Según Beating, Cognition ha lanzado Devin Fusion, una arquitectura de agente de IA híbrida diseñada para equilibrar el rendimiento de modelos frontera con costos significativamente más bajos. El sistema emplea dos mecanismos centrales: un diseño de "Sidekick" donde modelos económicos más pequeños manejan tareas de exploración de código, pruebas y validación junto a un modelo frontera más grande que retiene la autoridad de planificación, aclaración de requisitos y revisión final, manteniendo cada uno contextos cacheados separados para evitar una invalidación costosa de caché; y enrutamiento dinámico que ajusta los modelos durante las sesiones según la evolución de la tarea y la compresión del contexto, logrando actualizaciones de modelo de "costo cero".
Las pruebas en el benchmark FrontierCode muestran que Devin Fusion reduce los costos de desarrollo en un promedio del 35% para modelos de nivel GPT-5.5 y Opus 4.8, manteniendo el rendimiento frontera, o hasta un 41% cuando se usa con Fable 5. En desarrollo interno, el 88% de las solicitudes de fusión (pull requests) fusionadas fueron impulsadas completamente por el enrutamiento automático de Fusion, aunque el rendimiento cae significativamente en tareas que requieren intención de desarrollo compleja y juicio subjetivo.