Menurut evaluasi Vending-Bench 2 terbaru dari Andon Labs, GLM 5.2 menempati peringkat kedua dalam uji simulasi bisnis jangka panjang. Tolok ukur tersebut mensimulasikan operasi 365 hari dari sebuah perusahaan mesin penjual otomatis, dengan model-model yang mengambil keputusan harian mengenai inventaris dan harga berdasarkan data keuangan untuk menilai konsistensi pengambilan keputusan dalam tugas-tugas yang diperpanjang.
Versi GLM menunjukkan pertumbuhan linier yang konsisten, dengan rata-rata peningkatan laba bulanan hampir 1.000 dolar AS (GLM 5 mencetak rata-rata 4.432 dolar AS, GLM 5.1 mencapai 5.634 dolar AS). Sebaliknya, Kimi K2.7 Code berkinerja lebih rendah dibandingkan K2.6, sementara Minimax M3 meningkat signifikan dibandingkan M2.5 tetapi tetap berada jauh di bawah seri Kimi dan GLM dalam profitabilitas keseluruhan.