Theo Beating, Cognition đã ra mắt Devin Fusion, một kiến trúc tác nhân AI lai được thiết kế để cân bằng hiệu suất mô hình tiên tiến với chi phí thấp hơn đáng kể. Hệ thống sử dụng hai cơ chế cốt lõi: thiết kế "Sidekick", nơi các mô hình nhỏ hơn, tiết kiệm chi phí đảm nhận các tác vụ khám phá mã, kiểm thử và xác thực cùng với một mô hình tiên tiến lớn hơn giữ quyền lập kế hoạch, làm rõ yêu cầu và đánh giá cuối cùng, mỗi mô hình duy trì bộ nhớ đệm riêng biệt để tránh việc vô hiệu hóa bộ nhớ đệm tốn kém; và định tuyến động điều chỉnh các mô hình trong suốt phiên làm việc dựa trên sự phát triển của tác vụ và nén ngữ cảnh, đạt được nâng cấp mô hình "không tốn chi phí".
Kiểm thử trên benchmark FrontierCode cho thấy Devin Fusion giảm chi phí phát triển trung bình 35% cho các mô hình cấp GPT-5.5 và Opus 4.8 trong khi vẫn duy trì hiệu suất tiên tiến, hoặc lên tới 41% khi sử dụng với Fable 5. Trong phát triển nội bộ, 88% các pull request đã được hợp nhất hoàn toàn do định tuyến tự động của Fusion, mặc dù hiệu suất giảm đáng kể ở các tác vụ yêu cầu ý định phát triển phức tạp và đánh giá chủ quan.