O modelo DeepSeek-V3.2-Exp foi oficialmente lançado e tornou-se open source
De acordo com ChainCatcher, o modelo DeepSeek-V3.2-Exp foi oficialmente lançado e tornado open source hoje. O modelo introduz uma arquitetura de Attention esparsa, que pode reduzir efetivamente o consumo de recursos computacionais e melhorar a eficiência da inferência do modelo. Atualmente, o modelo já está disponível na plataforma MaaS (Model as a Service) de grandes modelos da Huawei Cloud. Para o modelo DeepSeek-V3.2-Exp, a Huawei Cloud continua utilizando a solução de paralelismo EP em larga escala, implementando uma estratégia de paralelismo de contexto afinada para sequências longas com base na estrutura de Attention esparsa, equilibrando tanto a latência quanto o desempenho de throughput do modelo.
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez também goste
Williams do Federal Reserve: a política monetária continuará restritiva
Bitget lançou o contrato perpétuo FF denominado em USDT, com alavancagem de 1 a 75 vezes.
Populares
MaisPreços de criptomoedas
Mais








