PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Globy Introduit un Écosystème Blockchain pour les Paiements Mondiaux
L'équipe derrière Globy vise à développer un réseau blockchain conçu spécifiquement pour les paiements numériques et la gestion d'actifs. Contrairement à de nombreuses plateformes blockchain qui se concentrent principalement sur la finance décentralisée ou les NFT, Globy se positionne comme une infrastructure de transactions mondiale.
Le projet prévoit de
CoinfomaniaIl y a 6m
La communauté TRON a lancé une discussion sur une proposition de nouvelles fonctionnalités pour la v4.8.1, visant à ajuster le comportement d'exécution de l'instruction SELFDESTRUCT.
La communauté TRON discute actuellement d'une proposition de nouvelles fonctionnalités pour la version v4.8.1, prévoyant d'ajuster le comportement d'exécution et les coûts de l'instruction SELFDESTRUCT pour améliorer la compatibilité avec l'EIP-6780 d'Ethereum. La proposition suggère que cette instruction ne supprime le contrat que sous certaines conditions et ajuste la consommation d'énergie à 5000. Actuellement, la proposition est toujours en phase de discussion au sein de la communauté.
GateNewsIl y a 14m
Gate lance la plateforme de routage des modèles IA GateRouter, supportant l'appel API unifié de 25+ grands modèles populaires
GateRouter a été lancé le 13 mars, offrant aux développeurs une plateforme unifiée pour l'appel de grands modèles, prenant en charge plus de 25 modèles principaux. Les utilisateurs peuvent accéder via une seule API, le système associant intelligemment les modèles afin de réduire les coûts d'inférence en IA. Les développeurs peuvent se connecter rapidement et gérer leurs API, avec un mode de paiement à l'usage prévu pour l'avenir.
GateNewsIl y a 17m
Vitalik a rédigé une proposition pour vous apprendre à utiliser secrètement les grands modèles d'IA
Vitalik a récemment proposé avec la Fondation Ethereum un projet intitulé "ZK API Usage Credits", visant à utiliser des preuves à connaissance zéro pour permettre des appels anonymes aux modèles d'IA, protégeant ainsi la vie privée des utilisateurs. Bien que cette proposition soit remise en question, elle reflète une augmentation des demandes de confidentialité. Il estime qu'Ethereum peut servir de couche de données inaltérable, répondant aux besoins urgents de confidentialité et de vérification à l'ère de l'IA.
PANewsIl y a 49m
Synthetix publie sa feuille de route 2026, tous les revenus de trading utilisés pour le rachat de SNX et sUSD
Synthetix a publié le 13 mars son plan de feuille de route pour 2026, visant à s'établir comme lieu de trading de contrats perpétuels sur le réseau principal Ethereum. Cela inclut le rachat de SNX et sUSD, le lancement de fonctionnalités multi-collatérales et de marchés de matières premières, et la transformation progressive de sUSD en stablecoin décentralisé. De plus, Synthetix organisera des compétitions de trading et optimisera les fonctionnalités de commande.
GateNewsIl y a 1h
Proposition de gouvernance Sky approuvée, le montant de rachat quotidien réduit de 300 000 USDS à 37 600 USDS
Le vote de gouvernance du protocole Sky a été approuvé, décidant de réduire le quota de revenus du protocole destiné aux rachats de SKY de 300 000 USDS par jour à 37 600 USDS, et plusieurs mises à jour ont été apportées au contenu d'Atlas Edit, notamment la suppression d'expositions spécifiques, l'ajout d'une liste de blocage et la correction des descriptions pertinentes.
GateNewsIl y a 1h