O modelo DeepSeek-V3.2-Exp foi oficialmente lançado e tornado open source
De acordo com ChainCatcher, o modelo DeepSeek-V3.2-Exp foi oficialmente lançado e tornado open source hoje. O modelo introduz uma arquitetura de Attention esparsa, que pode reduzir efetivamente o consumo de recursos computacionais e aumentar a eficiência de inferência do modelo. Atualmente, o modelo já está disponível na plataforma MaaS (Model as a Service) de grandes modelos da Huawei Cloud. Para o modelo DeepSeek-V3.2-Exp, a Huawei Cloud continua utilizando a solução de paralelismo EP em larga escala, implementando uma estratégia de paralelismo de contexto afinada para sequências longas baseada na estrutura de Attention esparsa, equilibrando tanto a latência quanto o desempenho de throughput do modelo.
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez também goste
FalconX lança plataforma eletrônica de negociação de opções cripto OTC, com suporte para BTC, ETH, SOL e HYPE

Strategy investe US$ 22,1 milhões para adquirir mais 196 BTC
Populares
MaisPreços de criptomoedas
Mais








