Según CNBC, líderes de la IA, incluido el CEO de Cognition, Scott Wu, y el CPO de Cisco, Jeetu Patel, revelaron esta semana que el enrutamiento de modelos, una solución que asigna tareas a los modelos de IA adecuados según la complejidad, se está convirtiendo en una disciplina clave de costos en la América corporativa.
Actualmente, aproximadamente el 95% del uso empresarial de IA recurre por defecto a los costosos modelos “frontier” incluso para tareas rutinarias, según el CEO de Glean, Arvind Jain. El enrutamiento de modelos podría lograr entre 5 y 10 veces mejor eficiencia en costos en el trabajo repetitivo mediante alternativas más baratas. El análisis de costos de Cisco subraya la presión: con un uso de tokens de 200 dólares por empleado por semana, la empresa enfrenta aproximadamente 900 millones de dólares en gasto anual de IA para sus 90.000 empleados. Si las empresas con frecuencia envían tareas fáciles y de alto volumen a modelos más baratos o de código abierto, OpenAI y Anthropic recibirían pagos solo por trabajos complejos, lo que podría reconfigurar los modelos de precios sobre los que ambas compañías han construido sus valoraciones.