Model DeepSeek-V3.2-Exp resmi dirilis dan open source
ChainCatcher melaporkan bahwa model DeepSeek-V3.2-Exp secara resmi dirilis dan open source hari ini. Model ini mengadopsi arsitektur Attention Sparse, yang secara efektif dapat mengurangi konsumsi sumber daya komputasi dan meningkatkan efisiensi inferensi model. Saat ini, model tersebut telah resmi tersedia di platform layanan model besar Huawei Cloud MaaS. Untuk model DeepSeek-V3.2-Exp, Huawei Cloud masih menggunakan solusi paralel EP besar untuk deployment, menggabungkan strategi paralel konteks yang ramah terhadap urutan panjang berdasarkan struktur Attention Sparse, sekaligus mempertimbangkan latensi model dan kinerja throughput.
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Naval: Bitcoin adalah "asuransi" terhadap mata uang fiat
Ambrus Studio mendapatkan komitmen investasi sebesar 15 juta dolar AS
Berita trending
LainnyaHarga kripto
Lainnya








