La planification de codage de Volcano Engine révélée avec une facturation à double couche : facturation prétendue par nombre de fois, mais en réalité également calculée en fonction de la consommation de tokens pour déduire des crédits

BlockBeatNews

Selon le suivi de 1M AI News, le mode de facturation du plan Coding Plan d’Ark (proposé par Volcano Engine) a été repéré par des utilisateurs comme comportant des mécanismes de fonctionnement cachés qui n’auraient pas été suffisamment divulgués. Un développeur a signalé sur V2EX que la vitesse de consommation du quota était bien plus rapide que celle des offres comparables sur d’autres plateformes. Après avoir contacté le service client, il a reçu la réponse suivante : « Si les Tokens consommés par un appel unique au modèle sont bien supérieurs à ceux consommés en moyenne par un appel, alors le nombre de fois estimé pouvant être appelé sur la période sera bien inférieur à 6 000. »

À titre d’exemple, le forfait Pro (200 yuans/mois) annonce 6 000 requêtes toutes les 5 heures, 45 000 requêtes par semaine et 90 000 requêtes par mois. Toutefois, la facturation réelle ne déduit pas “une fois par appel”. Elle est calculée en convertissant la consommation de tokens d’un appel unique en plusieurs déductions. La formule de conversion mesurée par l’utilisateur est la suivante : usage = max(round(use_token/token_limit), 1). Les multiplicateurs cachés varient selon les modèles : DeepSeek-V3.2 est d’environ 2 fois, Doubao-Seed-2.0-Code d’environ 4 fois, et Doubao-Seed-2.0-Pro d’environ 6 fois. Autrement dit, un seul appel à Doubao-Seed-2.0-Pro peut être comptabilisé comme 6 consommations de quota.

L’utilisateur cite un exemple : un seul appel lui consomme 510 000 tokens. Sur d’autres plateformes, comme Alibaba QianLian, cela n’est compté que pour une fois, alors que chez Volcano Engine, cela peut être converti en environ 20 fois. Lors de l’exécution de tâches complexes par des agents de programmation IA, il est courant qu’un seul appel consomme des dizaines ou des centaines de milliers de tokens. Ce mode de facturation ferait donc s’épuiser rapidement le quota du forfait.

Les forfaits Coding Plan en Chine sont actuellement, dans l’ensemble, facturés en fonction du nombre d’appels. Sur des plateformes comme Alibaba QianLian et Xiaomi MiMo, un seul appel est facturé comme une fois, sans conversion basée sur les tokens. Cette facturation « annoncée au nombre de fois, mais convertie selon les tokens » en double étage, propre à Volcano Engine, est relativement rare dans l’industrie. De plus, elle n’est pas indiquée de manière bien visible sur la page du forfait : les utilisateurs ne peuvent découvrir ce mécanisme qu’après avoir contacté le service client en cas de consommation anormale. L’outil de programmation IA Trae, appartenant à ByteDance, a également récemment fait l’objet de retours d’utilisateurs selon lesquels il serait passé d’une facturation strictement au nombre d’appels à une méthode similaire consistant à compter les appels via une conversion basée sur les tokens.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire