阿里巴巴推出更高效的Qwen3-Next人工智能模型
顯示原文
Jinse Finance報導,阿里巴巴旗下通義千問發布了下一代基礎模型架構Qwen3-Next,並開源了基於該架構的Qwen3-Next-80B-A3B系列模型。該架構相比Qwen3的MoE模型結構,進行了以下核心改進:混合注意力機制、高稀疏度MoE結構、一系列訓練穩定友好的優化,以及提升推理效率的多token預測機制。基於Qwen3-Next的模型結構,阿里訓練了Qwen3-Next-80B-A3B-Base模型,該模型擁有800億參數僅激活30億參數。該Base模型實現了與Qwen3-32B dense模型相近甚至略好的性能,而它的訓練成本(GPU hours)僅為Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐則是Qwen3-32B的十倍以上,實現了極致的訓練和推理性價比。
0
0
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與
您也可能喜歡
數據:Story 生態項目 Verio TVL 突破 5000 萬美元,創歷史新高
Chaincatcher•2025/09/12 06:09
以太坊 PoS 網絡質押准入隊列暫報 72.5 萬枚,約合 24.7 億美元
Chaincatcher•2025/09/12 05:57
RWA 板塊市值創歷史新高至 760 億美元,鏈上資產規模突破 290 億美元
Chaincatcher•2025/09/12 05:53
數據:Ethena 旗下兩大穩定幣 USDe 和 USDtb 的發行總規模已超過 150 億枚
Chaincatcher•2025/09/12 05:44
加密貨幣價格
更多
Bitcoin
BTC
$115,443.3
+1.12%

Ethereum
ETH
$4,550.71
+2.96%

XRP
XRP
$3.06
+2.03%

Tether USDt
USDT
$1
+0.01%

Solana
SOL
$238.02
+6.99%

BNB
BNB
$908.22
+1.48%

USDC
USDC
$0.9997
-0.01%

Dogecoin
DOGE
$0.2628
+4.92%

TRON
TRX
$0.3492
+1.39%

Cardano
ADA
$0.9041
+2.10%
如何出售 PI
Bitget 上架 PI:在 Bitget 上快速購買或出售 PI!
立即交易
還不是 Bitget 用戶嗎?新用戶可獲得價值 6,200 USDT 的迎新大禮包
立即註冊