Bitget App
Trade smarter
Comprar criptomoedasMercadosTradingFuturosEarnCentroMais
Mistral revela o Mistral 3: Modelos de código aberto de última geração para IA empresarial e de ponta.

Mistral revela o Mistral 3: Modelos de código aberto de última geração para IA empresarial e de ponta.

MPOSTMPOST2025/12/04 04:39
By:MPOST

Em Breve A Mistral acaba de lançar o Mistral 3, uma nova família de 10 modelos de baixo peso, projetados para funcionar em tudo, desde nuvem para o consumidor até laptops, drones e robôs.

Inicialização de IA Mistral A empresa apresentou o Mistral 3, a mais recente geração de seus modelos, que inclui três modelos compactos e densos de alto desempenho com 14 bilhões, 8 bilhões e 3 bilhões de parâmetros, além do Mistral Large 3, seu modelo mais avançado até o momento — um sistema esparso de mistura de especialistas treinado com 41 bilhões de parâmetros ativos e 675 bilhões de parâmetros totais. Todos os modelos estão disponíveis sob a licença Apache 2.0, oferecendo aos desenvolvedores acesso de código aberto em múltiplos formatos compactados para dar suporte a aplicações de IA distribuídas.

Os modelos Ministral são projetados para oferecer uma excelente relação custo-benefício, enquanto o Mistral Large 3 se posiciona entre os principais modelos de código aberto com ajuste fino de instruções. Treinado do zero em 3,000 GPUs NVIDIA H200, o Mistral Large 3 marca o primeiro lançamento da empresa com uma combinação de especialistas desde a série Mixtral e representa um avanço significativo no pré-treinamento. Após o pós-treinamento, ele se equipara aos melhores modelos de código aberto com ajuste fino de instruções em prompts gerais e demonstra compreensão avançada de imagens, bem como capacidades superiores de conversação multilíngue.

O Mistral Large 3 estreou em 2º lugar na categoria de modelos OSS sem raciocínio e em 6º lugar no ranking geral do LMArena. Ambas as versões, base e otimizada para instruções, são lançadas sob a licença Apache 2.0, oferecendo uma plataforma robusta para personalização por empresas e desenvolvedores, com uma versão com raciocínio planejada para lançamento futuro.

A Mistral firma parceria com a NVIDIA, vLLM e Red Hat para aprimorar a acessibilidade e o desempenho do Mistral 3.

O Mistral Large 3 tornou-se altamente acessível à comunidade de código aberto por meio de colaborações com a vLLM e a Red Hat. Um checkpoint no formato NVFP4, otimizado com o llm-compressor, permite a execução eficiente em sistemas Blackwell NVL72 ou em um único nó 8×A100 ou 8×H100 usando o vLLM.

O desenvolvimento de modelos avançados de IA de código aberto depende de uma extensa otimização de hardware e software, alcançada em parceria com a NVIDIA. Todos os modelos Mistral 3, incluindo o Large 3 e o Ministral 3, foram treinados em GPUs NVIDIA Hopper, utilizando memória HBM3e de alta largura de banda para cargas de trabalho de grande escala. A abordagem de co-design da NVIDIA integra hardware, software e modelos para permitir inferência eficiente usando TensorRT-LLM e SGLang em toda a família Mistral 3, suportando execução de baixa precisão.

Para a arquitetura esparsa de mistura de especialistas do Large 3, a NVIDIA implementou os kernels de atenção Blackwell e MoE, adicionou o serviço desagregado de pré-preenchimento/decodificação e colaborou na decodificação especulativa, permitindo que os desenvolvedores lidem com cargas de trabalho de contexto longo e alto desempenho em sistemas GB200 NVL72 e além. Os modelos do Mistral também são otimizados para implantação em DGX Spark, PCs e laptops RTX e dispositivos Jetson, proporcionando uma experiência consistente e de alto desempenho desde data centers até aplicações de borda. O Mistral agradece à vLLM, Red Hat e NVIDIA pelo apoio e colaboração.

Ministral 3: Desempenho avançado de IA para implantações locais e na borda.

A série Ministral 3 foi projetada para implantações locais e de borda, oferecida em três tamanhos: 3B, 8B e 14B. Cada tamanho está disponível nas versões básica, instrutiva e de raciocínio, todas com capacidade de compreensão de imagens e licenciadas sob a licença Apache 2.0. Combinada com recursos multimodais e multilíngues nativos, a família Ministral 3 oferece soluções versáteis para aplicações corporativas e de desenvolvimento.

A série oferece uma relação custo-benefício excepcional entre os modelos de código aberto, com variantes de instrução que igualam ou superam modelos comparáveis, gerando um número significativamente menor de tokens. Para cenários em que a precisão é fundamental, as variantes de raciocínio podem realizar cálculos mais complexos para alcançar a maior precisão possível dentro de sua classe de peso, como 85% no AIME '25 com o modelo 14B.

Atualmente, o Mistral 3 está acessível através do Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face (Large 3 e Mistral), Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI e Together AI, com disponibilidade prevista para NVIDIA NIM e AWS SageMaker em breve.

Mistral A Ministral continua sendo uma das principais contribuintes para o ecossistema de modelos de IA e iniciativas de código aberto na Europa, embora seu modelo principal mais recente ainda esteja atrás dos principais concorrentes do setor em termos de desempenho, velocidade e custo. As variantes menores da Ministral podem oferecer uma alternativa mais prática, proporcionando opções flexíveis para diversos casos de uso e implantação em diferentes dispositivos.

0
0

Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.

PoolX: Bloqueie e ganhe
Pelo menos 12% de APR. Quanto mais bloquear, mais pode ganhar.
Bloquear agora!

You may also like

Além do BTC: confira 4 criptomoedas para investir ainda em 2025

Alternativas no mercado apresentam chances de valorização e representam importantes projetos no longo prazo.

CryptoNews2025/12/06 03:51
Além do BTC: confira 4 criptomoedas para investir ainda em 2025

Lamborghini lança carteira de BTC em parceria com a Ledger

A montadora italiana estreia no setor de custódia digital ao lançar um dispositivo físico para guardar ativos.

CryptoNews2025/12/06 03:51
Lamborghini lança carteira de BTC em parceria com a Ledger

MetaMask lança mercados de previsão integrados à carteira, com tecnologia Polymarket, permitindo negociação com recompensas.

Em Breve A MetaMask lançou os Mercados de Previsão, com tecnologia Polymarket, permitindo a negociação de resultados de eventos reais diretamente na carteira, com acúmulo de pontos de recompensa.

MPOST2025/12/05 21:33
MetaMask lança mercados de previsão integrados à carteira, com tecnologia Polymarket, permitindo negociação com recompensas.

A Anthropic lança 'Interviewer', explorando as perspectivas do público sobre IA.

Em Breve A Anthropic lançou o 'Interviewer', uma ferramenta que permite pesquisas em larga escala sobre as perspectivas de profissionais em relação à IA, revelando ganhos de produtividade, preocupações específicas de cada função e oportunidades para orientar a integração responsável da IA.

MPOST2025/12/05 21:33
A Anthropic lança 'Interviewer', explorando as perspectivas do público sobre IA.
© 2025 Bitget