Alibaba yanada samaraliroq Qwen3-Next sun’iy intellekt modelini taqdim etdi
Jinse Finance xabariga ko‘ra, Alibaba kompaniyasiga qarashli Tongyi Qianwen yangi avlod asosiy model arxitekturasi Qwen3-Next’ni taqdim etdi va ushbu arxitekturaga asoslangan Qwen3-Next-80B-A3B seriyali modelini ochiq manba sifatida chiqardi. Ushbu arxitektura Qwen3’ning MoE model arxitekturasi bilan solishtirganda quyidagi asosiy yaxshilanishlarni amalga oshirdi: aralash e’tibor mexanizmi, yuqori siyraklikdagi MoE tuzilmasi, trening barqarorligini oshiruvchi bir qator optimallashtirishlar hamda inferens samaradorligini oshiruvchi ko‘p tokenli bashorat mexanizmi. Qwen3-Next model arxitekturasiga asoslanib, Alibaba Qwen3-Next-80B-A3B-Base modelini tayyorladi, bu model 80 milliard parametrga ega bo‘lib, faqat 3 milliard parametri faollashtiriladi. Ushbu Base modeli Qwen3-32B zich modeliga yaqin yoki undan biroz yaxshi natijalarga erishgan, lekin uning trening xarajati (GPU soatlari) Qwen3-32B’ning o‘ndan biriga ham yetmaydi, 32k va undan yuqori kontekstda esa inferens tezligi Qwen3-32B’dan o‘n baravar yuqori, bu esa trening va inferensda nihoyatda yuqori samaradorlikni ta’minlaydi.
Mas'uliyatni rad etish: Ushbu maqolaning mazmuni faqat muallifning fikrini aks ettiradi va platformani hech qanday sifatda ifodalamaydi. Ushbu maqola investitsiya qarorlarini qabul qilish uchun ma'lumotnoma sifatida xizmat qilish uchun mo'ljallanmagan.
