Bitget App
Trading inteligente
Comprar criptoMercadosTradingFuturosRendaWeb3CentralMais
Trading
Spot
Compre e venda criptomoedas
Margem
Amplie seu capital e a eficiência de seus fundos
Onchain
Opere Onchain sem tem que ir on-chain
Converter e bloquear o trade
Converta criptomoedas com um clique e sem taxas
Explorar
Launchhub
Comece a ganhar com vantagens desde o início
Copiar
Copie traders de elite com um clique
Robôs
Robô de trading com IA simples, rápido e confiável
Trading
Futuros USDT
Futuros liquidados em USDT
Futuros USDC
Futuros liquidados em USDC
Futuros Coin-M
Futuros liquidados em criptomoedas
Explorar
Guia de futuros
Uma jornada no trading de futuros
Promoções de futuros
Aproveite recompensas generosas!
Renda Bitget
Uma série de produtos para aumentar seus ativos
Renda Simples
Deposite e retire a qualquer momento para obter retornos flexíveis com risco zero
Renda On-chain
Ganhe lucros diariamente sem arriscar o investimento inicial
Renda estruturada
Inovação financeira robusta para navegar pelas oscilações do mercado
VIP e Gestão de Patrimônio
Serviços premium para uma Gestão de Patrimônio inteligente
Empréstimos
Empréstimo flexível com alta segurança de fundos
Alpha Arena revela falhas no trading de IA: modelos ocidentais perdem 80% do capital em uma semana

Alpha Arena revela falhas no trading de IA: modelos ocidentais perdem 80% do capital em uma semana

ForesightNews 速递ForesightNews 速递2025/10/27 09:54
Mostrar original
Por:ForesightNews 速递
O mercado é o teste supremo para a IA.


Autor: Juan Galt

Tradução: AididiaoJP, Foresight News


A IA consegue negociar criptomoedas? Jay Azhang, engenheiro de computação e profissional do setor financeiro de Nova York, está testando essa questão através do Alpha Arena. O projeto coloca os mais poderosos modelos de linguagem de grande porte para competir entre si, cada um com um capital de 10 mil dólares, para ver qual consegue lucrar mais negociando criptomoedas. Entre os modelos estão Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 e Qwen3 Max.


Agora você deve estar pensando: "Uau, que ideia genial!" E pode se surpreender ao saber que, no momento em que este artigo foi escrito, três dos cinco AIs estavam em situação de prejuízo, enquanto Qwen3 e Deepseek, dois modelos open source chineses, lideravam.


Alpha Arena revela falhas no trading de IA: modelos ocidentais perdem 80% do capital em uma semana image 0


É isso mesmo: as IAs mais poderosas do Ocidente, fechadas, operadas por gigantes como Google e OpenAI, perderam mais de 8.000 dólares em pouco mais de uma semana, o que representa 80% de seu capital de negociação em criptomoedas, enquanto suas contrapartes open source do Oriente estão lucrando.


A negociação de maior sucesso até agora? Qwen3 manteve-se lucrativo e consistentemente rentável apenas com uma simples posição long de 20x em bitcoin. Grok 4, sem surpresa, passou a maior parte do tempo da competição em uma posição long de 10x em dogecoin, tendo liderado junto com Deepseek em determinado momento, mas agora está perto de um prejuízo de 20%. Talvez Elon Musk devesse postar um meme de dogecoin para ajudar Grok a sair dessa situação.


Alpha Arena revela falhas no trading de IA: modelos ocidentais perdem 80% do capital em uma semana image 1


Enquanto isso, o Gemini do Google está implacavelmente pessimista, vendendo a descoberto todos os criptoativos negociáveis, uma posição que ecoa sua política geral sobre criptomoedas nos últimos 15 anos.


No final, ele conseguiu cometer todos os erros possíveis durante uma semana inteira, o que também exige certa habilidade, especialmente considerando que Qwen3 simplesmente ficou long em bitcoin. Se esse é o melhor nível que uma IA fechada pode oferecer, talvez a OpenAI devesse continuar fechada para evitar que soframos perdas.


O novo benchmark da IA


A ideia de colocar modelos de IA para competir entre si na arena de negociação de criptomoedas traz insights muito profundos. Primeiro, a IA não pode obter as respostas para os testes de negociação de criptomoedas durante o pré-treinamento, pois são imprevisíveis — um problema enfrentado por outros benchmarks. Em outras palavras, muitos modelos de IA recebem algumas respostas dos testes durante o treinamento, então naturalmente se saem bem nos testes. Mas algumas pesquisas mostram que pequenas alterações nesses testes podem causar grandes mudanças nos resultados dos benchmarks de IA.


Essa controvérsia levanta uma questão: qual é o teste supremo de inteligência? Segundo Elon Musk, criador do Grok 4 e entusiasta do Homem de Ferro, prever o futuro é a medida definitiva de inteligência.


Alpha Arena revela falhas no trading de IA: modelos ocidentais perdem 80% do capital em uma semana image 2


E temos que admitir: não há futuro mais incerto do que o preço de curto prazo das criptomoedas. Nas palavras de Azhang: "Nosso objetivo com o Alpha Arena é tornar o benchmark mais próximo do mundo real, e o mercado é perfeito para isso. Eles são dinâmicos, competitivos, abertos e sempre imprevisíveis. Eles desafiam a IA de uma forma que benchmarks estáticos não conseguem. O mercado é o teste supremo para a IA."


Essa visão sobre o mercado está profundamente enraizada nos princípios libertários que deram origem ao bitcoin. Economistas como Murray Rothbard e Milton Friedman apontaram, há mais de cem anos, que o mercado é fundamentalmente imprevisível para governos centrais, e que apenas indivíduos que assumem riscos reais podem tomar decisões econômicas racionais.


Em outras palavras, o mercado é a coisa mais difícil de prever porque depende das opiniões e decisões pessoais de indivíduos inteligentes em todo o mundo, sendo assim o melhor teste para a inteligência.


Azhang menciona em sua descrição do projeto que instruir a IA a negociar não é apenas sobre lucro, mas também sobre retorno ajustado ao risco. Esse aspecto do risco é crucial, pois uma única negociação ruim pode apagar todos os retornos anteriores, como visto no colapso da carteira do Grok 4.


Existe ainda outra questão: esses modelos realmente aprendem com suas experiências negociando criptomoedas? Isso não é tecnicamente fácil, pois o pré-treinamento de modelos de IA é extremamente caro. Eles podem ser ajustados com seu próprio histórico de negociações ou com o histórico de outros, e talvez até mantenham as negociações recentes na memória de curto prazo ou na janela de contexto, mas isso só os leva até certo ponto. O modelo de IA de negociação ideal pode ter que realmente aprender com sua própria experiência — uma tecnologia recentemente anunciada no meio acadêmico, mas que ainda está longe de se tornar um produto. O MIT os chama de modelos de IA auto-adaptativos.


Como sabemos que isso não é apenas sorte?


Outra análise sobre o projeto e seus resultados até agora é que pode ser indistinguível de um "passeio aleatório". Um passeio aleatório é como jogar um dado para cada decisão. Como isso seria em um gráfico? Na verdade, existe um simulador que você pode usar para responder a essa pergunta; visualmente, não parece muito diferente.


Alpha Arena revela falhas no trading de IA: modelos ocidentais perdem 80% do capital em uma semana image 3


A questão da sorte no mercado também foi descrita em detalhes por intelectuais como Nassim Taleb em seu livro "Antifrágil". Ele argumenta que, do ponto de vista estatístico, é perfeitamente normal e possível que um trader — como o Qwen3 — tenha sorte durante uma semana inteira! Isso pode fazer parecer que ele tem habilidades de raciocínio superiores. Taleb vai além: ele acredita que há tantos traders em Wall Street que é fácil para um deles ter sorte por 20 anos seguidos, construir uma reputação lendária e ser considerado um gênio por todos ao redor — até que a sorte acabe.


Portanto, para que o Alpha Arena gere dados valiosos, ele realmente precisa funcionar por um longo tempo, e seus padrões e resultados precisam ser replicados de forma independente, envolvendo riscos de capital real, antes que possa ser considerado diferente de um passeio aleatório.


No fim das contas, até agora, é interessante ver modelos open source e de baixo custo como o DeepSeek superando seus concorrentes fechados. O Alpha Arena tem sido uma ótima fonte de entretenimento até agora, já que se tornou viral no X.com na semana passada. Ninguém sabe para onde vai; teremos que ver se a aposta de seu criador — dar 50 mil dólares em criptomoedas para cinco chatbots apostarem — vai valer a pena no final.

0

Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.

PoolX: bloqueie e ganhe!
Até 10% de APR - Quanto mais você bloquear, mais poderá ganhar.
Bloquear agora!

Talvez também goste

25 pontos-base não são suficientes? O mercado aposta que o Federal Reserve continuará cortando as taxas de juros; será que Powell vai ceder desta vez?

Diante de divisões internas e forte pressão política, como Jerome Powell, presidente do Federal Reserve, sinalizará o caminho futuro das políticas? Isso pode ser o fator crucial para determinar a direção do mercado.

Jin102025/10/27 14:24

Perspectiva de 70 mil transações on-chain sobre o airdrop da Meteora: 4 endereços de baleias receberam 28,5%, enquanto mais de 60 mil investidores de varejo dividiram apenas 7%.

Airdrops também incluíram endereços controversos, envolvendo pessoas relacionadas a escândalos de negociações internas e grandes detentores com comportamentos anormais, o que agravou ainda mais a crise de confiança da comunidade e expôs o projeto ao risco de ações coletivas.

深潮2025/10/27 13:43
Perspectiva de 70 mil transações on-chain sobre o airdrop da Meteora: 4 endereços de baleias receberam 28,5%, enquanto mais de 60 mil investidores de varejo dividiram apenas 7%.

A história da Fundação x402: do impulso ao protocolo x402 à chave de ouro para pagamentos com IA

Como a Fundação x402 transforma uma linha de código na chave de ouro para pagamentos com IA?

深潮2025/10/27 13:43
A história da Fundação x402: do impulso ao protocolo x402 à chave de ouro para pagamentos com IA

O retorno do grande sábio: como o "Sun Wukong" de Justin Sun está criando uma lenda tardia, mas de sucesso, nos contratos?

A ascensão de Sun Wukong representa mais uma jogada estratégica precisa de Justin Sun no setor de contratos descentralizados e simboliza o ressurgimento da narrativa dos DEXs chineses.

深潮2025/10/27 13:42
O retorno do grande sábio: como o "Sun Wukong" de Justin Sun está criando uma lenda tardia, mas de sucesso, nos contratos?