Alpha Arena révèle les défauts du trading IA : les modèles occidentaux perdent 80 % de leur capital en une semaine
Le marché est le test ultime pour l’IA.
Rédigé par : Juan Galt
Traduction : AididiaoJP, Foresight News
L’IA peut-elle trader des cryptomonnaies ? Jay Azhang, ingénieur informatique et professionnel de la finance basé à New York, teste cette question à travers Alpha Arena. Ce projet met en compétition les modèles de langage les plus puissants, chacun disposant d’un capital de 10 000 dollars, pour voir lequel peut générer le plus de gains dans le trading de cryptomonnaies. Ces modèles incluent Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 et Qwen3 Max.
Vous vous dites peut-être : « Waouh, quelle idée géniale ! » Et il est surprenant de constater qu’au moment de la rédaction de cet article, trois des cinq IA sont en perte, tandis que Qwen3 et Deepseek, deux modèles open source chinois, sont en tête.

En effet, les IA propriétaires les plus puissantes de l’Occident, fermées et exploitées par des géants comme Google et OpenAI, ont déjà perdu plus de 8 000 dollars en un peu plus d’une semaine, soit 80 % de leur capital de trading crypto, tandis que leurs homologues open source de l’Est sont en situation de profit.
La transaction la plus réussie à ce jour ? Qwen3 reste profitable et continue de générer des gains, simplement en prenant une position longue sur bitcoin avec un effet de levier de 20x. Grok 4, sans surprise, a passé la majeure partie de la compétition en position longue sur dogecoin avec un levier de 10x, partageant un temps la première place avec Deepseek, mais se retrouve maintenant proche d’une perte de 20 %. Peut-être qu’Elon Musk devrait poster un meme dogecoin pour aider Grok à sortir de l’impasse.

Pendant ce temps, Gemini de Google adopte une position résolument baissière, shortant tous les actifs crypto disponibles, une position qui reflète leur politique générale sur les cryptomonnaies au cours des 15 dernières années.
Finalement, il a enchaîné une semaine complète de toutes les erreurs de trading possibles, ce qui demande un certain talent, surtout quand Qwen3 se contente d’être long sur bitcoin. Si c’est le meilleur niveau que l’IA propriétaire peut offrir, alors peut-être qu’OpenAI devrait rester fermé pour éviter de nous faire perdre de l’argent.
Un nouveau benchmark pour l’IA
L’idée de faire s’affronter des modèles d’IA dans l’arène du trading crypto offre des perspectives très profondes. Premièrement, l’IA ne peut pas obtenir les réponses aux tests de trading crypto lors de la pré-formation, car ils sont imprévisibles, ce qui n’est pas le cas pour d’autres benchmarks. En d’autres termes, de nombreux modèles d’IA reçoivent certaines réponses aux tests lors de leur entraînement, ce qui explique leurs bonnes performances lors des évaluations. Mais certaines études montrent que de légères modifications de ces tests entraînent de grands changements dans les résultats des benchmarks IA.
Cette controverse soulève une question : quel est le test ultime de l’intelligence ? Selon Elon Musk, créateur de Grok 4 et amateur d’Iron Man, la capacité à prédire l’avenir est la mesure ultime de l’intelligence.

Et il faut l’admettre, il n’y a rien de plus incertain que le prix à court terme des cryptomonnaies. Comme le dit Azhang, « Notre objectif avec Alpha Arena est de rapprocher les benchmarks de la réalité, et le marché est parfait pour cela. Il est dynamique, compétitif, ouvert et toujours imprévisible. Il met l’IA au défi d’une manière que les benchmarks statiques ne peuvent pas. Le marché est le test ultime pour l’IA. »
Cette vision du marché est profondément enracinée dans les principes libertariens à l’origine de bitcoin. Des économistes comme Murray Rothbard et Milton Friedman ont souligné il y a plus d’un siècle que le marché est fondamentalement imprévisible pour un gouvernement central, et que seules les personnes qui prennent des risques réels peuvent prendre des décisions économiques rationnelles.
En d’autres termes, le marché est la chose la plus difficile à prévoir, car il dépend des opinions et décisions individuelles de personnes intelligentes du monde entier, ce qui en fait le meilleur test pour l’intelligence.
Azhang mentionne dans la description de son projet que demander à l’IA de trader ne vise pas seulement le profit, mais aussi le rendement ajusté au risque. Cette dimension du risque est cruciale, car une seule mauvaise transaction peut effacer tous les gains précédents, comme on l’a vu avec l’effondrement du portefeuille de Grok 4.
Un autre problème se pose : ces modèles apprennent-ils de leur expérience de trading crypto ? Techniquement, ce n’est pas facile à réaliser, car le pré-entraînement des modèles d’IA est très coûteux. Ils peuvent être ajustés avec leur propre historique de trading ou celui d’autres, et peuvent même garder en mémoire à court terme ou dans la fenêtre de contexte leurs transactions récentes, mais cela ne les mène que jusqu’à un certain point. Le véritable modèle d’IA de trading devra probablement apprendre réellement de sa propre expérience, une technologie récemment annoncée dans le monde académique, mais qui est encore loin d’être un produit. Le MIT les appelle des modèles d’IA auto-adaptatifs.
Comment savoir si ce n’est pas juste de la chance ?
Une autre analyse de ce projet et de ses résultats à ce jour est qu’il pourrait être indiscernable d’une « marche aléatoire ». Une marche aléatoire consiste à lancer un dé pour chaque décision. À quoi cela ressemblerait-il sur un graphique ? Il existe en fait un simulateur pour répondre à cette question ; en réalité, cela ne serait pas très différent.

La question de la chance sur les marchés a également été décrite en détail par des intellectuels comme Nassim Taleb dans son ouvrage « Antifragile ». Il y explique que, d’un point de vue statistique, il est tout à fait normal et possible qu’un trader, comme Qwen3, ait une semaine entière de chance ! Ce qui peut donner l’impression d’une capacité de raisonnement supérieure. Taleb va plus loin, affirmant qu’il y a tellement de traders à Wall Street qu’il est facile pour l’un d’entre eux d’avoir 20 ans de chance consécutive, de se forger une réputation quasi divine, et que tout le monde le considère comme un génie, jusqu’à ce que la chance tourne.
Ainsi, pour qu’Alpha Arena produise des données réellement utiles, il doit fonctionner sur une longue période, avec des modèles et des résultats reproduits de façon indépendante, tout en impliquant un risque de capital réel, avant de pouvoir être distingué d’une marche aléatoire.
Finalement, jusqu’à présent, il est intéressant de voir des modèles open source et rentables comme DeepSeek surpasser leurs homologues propriétaires. Alpha Arena a été une excellente source de divertissement, ayant connu un succès viral sur X.com la semaine dernière. Nul ne sait ce que l’avenir lui réserve ; nous devrons voir si le pari de son créateur — donner 50 000 dollars à cinq chatbots pour parier sur les cryptomonnaies — finira par porter ses fruits.
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer
ZEC multiplié par 6 en un mois, qu'est-ce qui a déclenché cette frénésie ?
La réduction de moitié, la narration axée sur la confidentialité, ainsi que le soutien d'institutions et d'investisseurs de renom, ont conjointement permis à ZEC de dépasser son sommet de 2021.

x402 peut-il briser la malédiction du concept crypto « le sommet est atteint dès la spéculation » ?
Contrairement aux concepts cryptographiques typiques, x402 a attiré l'attention de nombreux géants technologiques du Web2, et ces entreprises ont déjà commencé à adopter concrètement ce protocole.

Le drapeau haussier de Cardano (ADA) indique un mouvement de 141 % vers 1,63 $

Quand la marée se retire : qui nage nu ? Discussion sur le destin des acquisitions de Clanker et Padre
D'où provient l'accumulation de valeur ? Si la valeur s'accumule auprès d'entités actionnariales, pourquoi acheter des tokens ? Tous les tokens ne sont-ils que des memecoins ?

