Auteur : Deep Web Tencent News
Alors qu’OpenClaw devient la star du domaine de l’IA grâce à sa passion pour l’élevage de crevettes et aux controverses autour de la “chasse aux crevettes”, les principaux fabricants de smartphones, qui travaillent depuis longtemps sur l’IA côté terminal, ne peuvent plus contenir leur enthousiasme et se lancent également dans le déploiement et la “domptation” de leur propre Claw.
Le 6 mars, l’agent mobile de Xiaomi — Xiaomi miclaw — a lancé une phase de test fermé via un code d’invitation, devenant ainsi le premier fabricant de smartphones en Chine à tester en interne “le homard”. Par la suite, Huawei, Honor, OPPO ont également annoncé leur propre test de Claw.
Parmi eux, Huawei a annoncé que le nouveau mode OpenClaw de Xiao Yi a été ajouté, suivi du lancement de la version bêta Xiao Yi Claw ; Honor a lancé le “Horizon Homard Honor”, supportant l’élevage de crevettes sur PC et tablette, avec une future compatibilité avec d’autres appareils de l’écosystème ; le directeur de la conception de ColorOS chez OPPO, Chen Xi, a montré sur les réseaux sociaux certaines fonctionnalités de Xiao Bu Claw, en déclarant que “Xiao Bu Claw doit encore résoudre des problèmes de sécurité”.
En résumé, la phase de lancement des “élevages de crevettes” par les fabricants de smartphones est actuellement limitée à des tests internes, sans date précise pour un déploiement à grande échelle.
Par exemple, Xiaomi miclaw est actuellement testé en version fermée uniquement sur la série Xiaomi 17, Xiaomi 15S Pro et la série Redmi K90. En recevant un code d’invitation, il suffit de mettre à jour le système pour utiliser l’application Xiaomi miclaw. “Pendant la phase de test, il n’y a pas de plan de facturation.” a déclaré Lu Weibing, partenaire et président de Xiaomi Group.
Concernant le déploiement de la version mobile du “homard” par les fabricants, certains professionnels du secteur révèlent que “OpenClaw est une sorte de cadre open source, comprenant un écosystème de compétences et de plugins tiers, et pouvant également faire appel à divers grands modèles. Pour un utilisateur ordinaire, déployer OpenClaw est très difficile, mais pour les fabricants de smartphones, cela ne pose pas de difficulté technique. Les vrais défis sont l’obtention des permissions, la sécurité des données utilisateur et la conformité légale.”
“Les principaux fabricants de smartphones doivent faire face à des centaines de millions d’utilisateurs ordinaires. Toute nouvelle fonctionnalité IA doit être soigneusement vérifiée, pour garantir une expérience mature, sûre et stable avant son déploiement.” a confié un employé d’une entreprise de téléphonie.
Les grands fabricants de modèles d’IA sont très enthousiastes à l’idée de déployer “le homard”, ce qui peut se comprendre comme une activité de “monétisation de la puissance de calcul”, consistant à faire appel plus fréquemment au modèle pour exécuter des tâches complexes, consommant ainsi plus de tokens et augmentant directement les revenus issus des API.
Cependant, cette logique est difficile à appliquer dans l’industrie mobile. Après avoir dépensé plusieurs milliers d’euros, voire plus de dix mille, pour acheter un smartphone, peu d’utilisateurs sont disposés à payer en plus pour chaque tâche spécifique. Étant donné qu’il est impossible de tirer profit directement de la “vente de tâches”, pourquoi les principaux fabricants de smartphones sont-ils toujours prêts à supporter le coût de puissance de calcul et de tokens pour leur version mobile exclusive de “Claw” en phase de test ?
L’une des raisons est qu’OpenClaw, dans sa progression vers un “agent personnel intelligent”, s’approche de plus en plus de l’idéal du “super assistant”.
Contrairement aux assistants vocaux passifs du passé, OpenClaw ressemble davantage à un “employé numérique” en ligne 24/7, permettant pour la première fois aux utilisateurs ordinaires de ressentir concrètement la possibilité que l’IA remplace la main-d’œuvre humaine.
D’un point de vue logique, la valeur centrale d’OpenClaw réside dans sa forte “autonomie”. Il dépasse les limites d’une simple fenêtre de chat : en lui configurant des Skills (compétences) appropriés et en lui octroyant suffisamment de tokens, OpenClaw peut mémoriser les habitudes et tâches de l’utilisateur, planifier ses étapes, appeler des outils et manipuler des logiciels, jusqu’à fournir le résultat final.
Cependant, pour que cette “autonomie” déployée dans le cloud soit véritablement maîtrisée sur un smartphone, une simple superposition d’applications ne suffit pas. Il faut une reconstruction en profondeur du système d’exploitation, de bas en haut.
Concrètement, que ce soit Xiao Yi Claw chez Huawei ou Xiaomi miclaw, ils ont tous choisi d’intégrer leur solution en tant qu’“application système”. En substance, cette approche consiste à regrouper les fonctionnalités logicielles, permissions système, voire capacités inter- appareils, en un ensemble de Skills appelables par l’agent, puis à les relier de manière organique via un moteur d’inférence-exécution développé en interne.
Prenons l’exemple de Xiaomi miclaw : il intègre plus de 50 outils système et services écologiques, formant une boucle fermée “perception-inférence-exécution”. Lorsqu’une commande utilisateur est reçue, le moteur décompose automatiquement les étapes, associe les outils, détermine les paramètres, et ajuste en boucle jusqu’à ce que la tâche soit complètement réalisée.
Chez Huawei, Xiao Yi Claw est directement construit sur la base du système HarmonyOS. “Xiao Yi Claw dispose de permissions système (pas besoin d’apps tierces pour sauter d’une fonction à une autre), d’une collaboration multi-scénarios (smartphones, PC, voitures, domotique connectés sans couture), et d’une isolation sécuritaire des données (traitement local de la vie privée utilisateur)”, a révélé une source interne.
Cependant, déployer “le homard” sur smartphone ne se limite pas à la technique ou à l’écosystème. Il faut également gérer de manière appropriée les données sensibles dans un cadre conforme, briser les barrières entre applications et plateformes, voire reconstruire la répartition des bénéfices dans l’industrie.
“Pour déployer le homard sur un smartphone utilisé par l’utilisateur, la priorité est de garantir la sécurité des informations.” a souligné un employé d’une entreprise de téléphonie.
Cette préoccupation pour la sécurité n’est pas infondée. En raison de la configuration de sécurité par défaut d’OpenClaw, vulnérable aux attaques, des risques tels que l’injection de prompts, les erreurs d’opération ou la contamination de plugins fonctionnels ont déjà été signalés.
Face à ces risques de sécurité, la gouvernance de la sécurité devient une ligne rouge incontournable pour la déploiement massif du “homard” par les fabricants de smartphones.
Prenons l’exemple de Xiaomi miclaw : pour éviter que l’agent n’exécute de manière non autorisée des opérations à haut risque comme des paiements, miclaw a directement “castré” tous les outils liés aux transferts ou commandes financières dans le code. Cela signifie qu’aucune transaction financière ne peut être déclenchée sans une confirmation explicite de l’utilisateur via empreinte ou mot de passe, verrouillant ainsi le risque de débits automatiques.
L’approche d’OpenClaw, qui se rapproche de l’idéal du “super assistant”, n’est qu’une facette de la compétition entre fabricants pour “élever le homard”. Plus profondément, la bataille consiste à faire en sorte que, lorsque les utilisateurs s’habituent à une interaction où ils “parlent simplement pour faire faire”, l’ancien ordre du web mobile basé sur les applications, contrôlé par les magasins d’applications des fabricants, commence à s’effriter.
Comme l’a dit Jensen Huang, fondateur de Nvidia : “Mac et Windows sont les systèmes d’exploitation des PC, tandis qu’OpenClaw est le système d’exploitation de l’IA personnelle.”
À l’époque du PC, celui qui contrôlait le système d’exploitation contrôlait l’écosystème. Dans l’ère de l’IA, cette règle reste valable, mais la bataille d’entrée s’est déplacée vers les agents intelligents.
Imaginez si les utilisateurs s’habituent à tout résoudre via des agents tiers (comme des pages web ou des applications indépendantes similaires à OpenClaw), le smartphone pourrait devenir un simple “support matériel”.
Face à la multiplication des déploiements de “homards” par les géants du web, cette crainte chez les fabricants de smartphones est évidente.
Au moment où ces derniers annoncent leur propre version mobile du “homard”, des géants comme Baidu et Alibaba ont déjà lancé rapidement des tests gratuits.
Le 12 mars, Baidu a lancé sur Android l’application “Red Finger Operator”, permettant aux utilisateurs d’expérimenter directement un assistant IA mobile pour des tâches comme réserver un taxi ou commander de la nourriture. Le lendemain, Alibaba Cloud a lancé sa propre version de “homard” pour mobile — JVS Claw — qui mise sur la simplicité d’utilisation : en donnant une simple commande en langage naturel, l’utilisateur peut manipuler des applications, gérer des fichiers ou exécuter des tâches complexes dans un espace cloud sécurisé.
Selon Guo Tianxiang, responsable de recherche chez IDC Chine, “l’application pratique de ‘l’élevage de homards’ sur mobile est encore limitée. Le principal obstacle est l’autorisation API pour appeler des applications tierces. Si l’on force l’appel, on risque de rencontrer des problèmes comme ceux rencontrés avec le téléphone Doubao, qui a été désactivé par ces applications tierces.”
Fort de l’expérience du “téléphone Doubao”, Huawei, Xiaomi et d’autres fabricants privilégient la validation dans leur propre écosystème fermé.
Par exemple, Xiaomi miclaw se concentre actuellement sur la vérification de la capacité des grands modèles à exécuter des tâches dans l’écosystème “tout-en-un” (voiture, maison, etc.), tandis que Xiao Yi Claw privilégie la collaboration entre appareils Huawei, comme smartphones et tablettes.
Cependant, faire fonctionner “le homard” dans un écosystème relativement fermé permet d’éviter certains risques, mais limite aussi la liberté de l’agent, car les besoins fréquents des utilisateurs se trouvent souvent dans des applications tierces populaires comme WeChat ou TikTok.
Pour équilibrer sécurité et fonctionnalités, les fabricants n’ont pas totalement abandonné la collaboration inter-application, mais explorent une voie plus prudente et contrôlée.
Concernant la coopération avec des applications tierces, une source proche de Xiaomi indique que la collaboration entre Xiaomi miclaw et ces applications se fait principalement via deux méthodes standard : d’une part, via l’intent (SendIntentTool) pour lancer des applications ou déclencher des actions spécifiques ; d’autre part, via l’adaptation des SDK AppTool (basé sur AIDL), permettant des appels de fonctionnalités plus approfondis et une coordination des tâches, avec la possibilité pour des applications tierces d’envoyer des notifications pour déclencher des tâches dans Xiaomi miclaw.
Déployer son propre “homard” au niveau du système est une étape clé dans l’évolution du smartphone vers un “smartphone IA”. Cependant, pour les fabricants cherchant à tirer rapidement parti de la vague IA, le principal défi pour créer un agent super intelligent est le coût.
Le déploiement local de “le homard” n’est pas une simple mise à jour logicielle : il nécessite une mise à niveau des composants matériels clés comme le processeur et la mémoire. La fréquence élevée de raisonnement et la réponse en temps réel des grands modèles exigent une puissance NPU plus élevée sur le SoC, ce qui augmente considérablement les exigences en mémoire vive et en stockage.
“Faire fonctionner de grands modèles sur mobile est limité par la capacité de stockage, la consommation d’énergie, etc. Plus le modèle a de paramètres, plus il est difficile à faire tourner sur un téléphone. Un modèle de 1 milliard de paramètres occupe environ 1 Go de RAM, 7 milliards en occuperaient 4 Go, et 13 milliards environ 7 Go.” a indiqué un directeur d’un centre de solutions IA d’un grand fabricant.
Actuellement, le prix des puces de stockage étant en hausse, chaque augmentation de la mémoire RAM réduit la marge bénéficiaire globale de l’appareil.
Plus difficile encore que l’investissement matériel initial, c’est le coût d’utilisation continu généré par l’activation du “homard” mobile. Sur PC, chaque tâche consomme des tokens et des ressources de calcul réels. La nouvelle selon laquelle “on ne peut pas payer 20 000 yuans par mois pour faire tourner un homard” illustre bien cette “anxiété de coût”.
“Avant d’utiliser ‘le homard’, il faut bien réfléchir à ce qu’on veut en faire.” explique Feng Nian, fondateur d’une agence MCN. “Dans la production vidéo, la différence de consommation de tokens entre montage et génération est énorme, mais beaucoup de débutants ne comprennent pas ce que le homard peut réellement faire.”
Feng Nian a fait un calcul basé sur ses opérations : “Nous utilisons un Mac mini 4 pour le montage, avec OpenClaw pour aider. Concrètement, ‘le homard’ génère des scripts pour des vidéos de découverte de boutiques en combinant des tendances locales. Certains plans sont tournés en vrai, d’autres générés par IA (comme Seedance2.0 ou Sora2). Le homard contrôle le montage sur Mac mini et utilise l’API Sora2 pour générer des vidéos. Certaines étapes sont faites par des humains pour économiser, d’autres par IA pour plus d’efficacité. En une journée, on peut produire environ 12 vidéos originales ou montages, avec un coût en tokens d’environ 15 yuans.”
“Le vrai défi est de trouver un équilibre entre le coût en tokens et le salaire des monteurs débutants.” ajoute Feng Nian. “Il faut décider quelles tâches confier au ‘homard’ et lesquelles laisser à l’humain. Actuellement, beaucoup d’entreprises se contentent de faire du ‘show off’ sans réelle productivité.”
Une consommation de 15 yuans en tokens par jour peut sembler faible, mais face à la vaste base d’utilisateurs des fabricants de smartphones, cela devient un enjeu énorme. Si des centaines de millions d’utilisateurs s’habituent à un modèle “achat de matériel, service gratuit”, la question de la capacité à supporter à long terme les coûts de calcul et de tokens reste ouverte.
“Les fabricants pourraient à l’avenir adopter un modèle ‘acheter un téléphone, recevoir du calcul gratuit’.” prévoit un professionnel. “Par exemple, offrir un quota de tokens gratuits à l’achat, pour des tâches simples comme rédiger un rapport ou réserver un billet. Pour des opérations plus coûteuses comme la génération vidéo, ils pourraient facturer selon la complexité ou faire payer l’utilisateur pour le dépassement du quota.”