聽新聞
0:00 /
0:00
DeepSeek有勁敵!阿里發布新開源模型 家用顯卡就能跑

阿里巴巴AI To C業務旗下AI應用「阿里通義」在6日正式發布最新的開源推理模型通義千問QwQ-32B,其官方介紹稱,透過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上進步飛躍,整體性能比肩DeepSeek-R1,同時大幅降低部署使用成本,在消費級顯卡上能實現本地部署。
使用者已可免費下載及商用QwQ-32B模型,或透過網頁版Qwen Chat體驗,該模型也將免費上架通義App。
阿里通義團隊表示,QwQ-32B模型針對數學和編程任務、通用能力分別進行2輪大規模強化學習,在32B的模型尺寸上獲得推理能力提升,印證了大規模強化學習(Reinforcement Learning,一種機器學習技術)可顯著提高模型性能。
該團隊指,千問QwQ-32B能提供極強的推理能力,以及滿足更低的資源消耗需求,背後關鍵在於強化學習。該團隊表示,希望能夠證明強大的基礎模型疊加大規模強化學習,也許是一條通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中還集成了與智能體(AI Agent,指的是能夠自主做出決策、完成行動,且毋需人類介入的人工智慧)相關的能力,能在使用工具的同時進行批判性思考,以及根據環境回饋調整推理過程。
受此消息影響,6日阿里巴巴集團港股早盤大幅高開漲逾6%,截至午盤漲逾7%。
延伸閱讀
贊助廣告
商品推薦
udn討論區
共 0 則留言
規範
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言