Il modello DeepSeek-V3.2-Exp è stato ufficialmente rilasciato e reso open source.
Secondo ChainCatcher, il modello DeepSeek-V3.2-Exp è stato ufficialmente rilasciato e reso open source oggi. Il modello introduce un'architettura di Attention sparsa, che può ridurre efficacemente il consumo di risorse computazionali e migliorare l'efficienza dell'inferenza del modello. Attualmente, il modello è stato ufficialmente lanciato sulla piattaforma Huawei Cloud MaaS (Model as a Service). Per quanto riguarda il modello DeepSeek-V3.2-Exp, Huawei Cloud continua ad adottare la soluzione di parallelismo EP su larga scala, implementando una strategia di parallelismo contestuale adatta a sequenze lunghe basata sulla struttura di Attention sparsa, bilanciando al contempo la latenza e le prestazioni di throughput del modello.
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.
Ti potrebbe interessare anche

Jefferson: Il bilancio della Federal Reserve continuerà a ridursi in modo ordinato
Dati del mercato delle previsioni: la probabilità di shutdown del governo degli Stati Uniti sale all'86%
In tendenza
AltroPrezzi delle criptovalute
Altro








