تم إصدار نموذج DeepSeek-V3.2-Exp رسميًا وأصبح مفتوح المصدر
أفاد ChainCatcher أنه تم اليوم إطلاق نموذج DeepSeek-V3.2-Exp رسميًا وإتاحته كمصدر مفتوح. أدخل النموذج بنية Attention متفرقة، وهي بنية قادرة على تقليل استهلاك موارد الحوسبة بشكل فعال وتعزيز كفاءة استدلال النموذج. حاليًا، تم إدراج هذا النموذج رسميًا على منصة خدمات النماذج الكبيرة من Huawei Cloud (MaaS). بالنسبة لنموذج DeepSeek-V3.2-Exp، اعتمدت Huawei Cloud مرة أخرى خطة النشر المتوازي الكبيرة (EP)، حيث تم دمج بنية Attention المتفرقة لتحقيق استراتيجية التوازي السياقي المتوافقة مع التسلسلات الطويلة، مع مراعاة كل من زمن استجابة النموذج وأداء الإنتاجية.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
ويليامز من الاحتياطي الفيدرالي: ستستمر السياسة النقدية في الحفاظ على موقفها المتشدد
Trending news
المزيدأسعار العملات المشفرة
المزيد








