快訊

2025報稅系統啟動!快速登入搶先看所得稅 算出你的「省稅大禮包」

川普自誇治理全世界!稱不必向台日韓待遇致歉:他們「犧牲美國變繁榮」

國民法官審剴剴案 台大醫生作證「懷疑遭性虐待」旁聽民眾落淚

超越OpenAI-o1模型?阿里通義千問發布並開源Qwen3

阿里巴巴通義千問29日凌晨發布新一代Qwen3系列人工智慧(AI)模型,並稱新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降,同時,可與美國Google和OpenAI提供的最佳模型相比,在某些情況甚至優於對手。(路透)
阿里巴巴通義千問29日凌晨發布新一代Qwen3系列人工智慧(AI)模型,並稱新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降,同時,可與美國Google和OpenAI提供的最佳模型相比,在某些情況甚至優於對手。(路透)

阿里巴巴通義千問29日凌晨發布新一代Qwen3系列人工智慧(AI)模型。通義千問聲稱,新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降,同時,可與美國Google和OpenAI提供的最佳模型(如OpenAI-o1等模型)相比,在某些情況下甚至優於競爭對手。

據中國證券報,阿里巴巴開源新一代通義千問模型Qwen3是「混合推理模型」,「快思考」與「慢思考」集成進同一個模型,對簡單需求可低算力「秒回」答案,適用於對速度要求高於深度的簡單問題。而對複雜問題可多步驟「深度思考」,節省算力消耗。

港媒《信報》指出,新版Qwen3包括2個採用混合專家(MoE)模型和6個Dense模型,參數量從6億個到2,350億個。與DeepSeek-R1、OpenAI o1及o3-mini、馬斯克的Grok 3和谷歌Gemini 2.5 Pro等其他頂級模型比較,旗艦模型Qwen3-235B-A22B在編碼、數學、通用能力等基準評估中,取得具競爭力的結果。

小型MoE模型Qwen3-30B-A3B的活化參數量是QwQ-32B的10%,表現更勝一籌,甚至像Qwen3-4B這樣的小模型,也能匹敵Qwen2.5-72B-Instruct的表現。而6個Dense模型也已開源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0許可下開源。

至於性能方面,Qwen3預訓練資料量達36T ,並在後訓練階段進行多輪強化學習,在推理、指令遵循、工具調用、多語言能力等方面均有增強。在效能提升的同時,Qwen3部署成本下降,僅需4張H20即可部署Qwen3滿血版。

上述新版Qwen3系列模型採用寬鬆的Apache2.0協定開源,首次支援119種語言,全球開發者、研究機構和企業均可免費在魔搭社群、HuggingFace等平台下載模式並商用,也可以透過阿里雲百煉調用Qwen3的API服務。

通義千問並表示,Qwen3模型推理能力大幅提升,在數學、程式碼和邏輯推理等評測中,達到同規模業界SOTA水準。

此前,有消息在4月初時指出,阿里將在本(4)月第二周發布新模型Qwen3,這將是阿里在2025年上半年最重要的模型產品。知情人士指出,2024年第4季,業內已經意識到模型的推理能力很重要,但還不能說是最重要的方向,DeepSeek火爆後,推理能力已經成為繞不開的關鍵能力。DeepSeek-R1發布後,阿里雲基礎模型團隊把策略中心進一步向模型的推理能力傾斜。

DeepSeek OpenAI 推理

延伸閱讀

Gartner:2025年全球GenAI支出將達到6,440億美元

百度董事長李彥宏批DeepSeek貴又慢 網諷:酸葡萄心理

傳蘋果改組AI核心團隊 拚趕上對手Google、Meta

holoEN降臨組 x AXGRIT快閃店活動 現場展示雙子FUWAMOCO等比模型

相關新聞

「愛達花城號」建造提速30% 中第二艘國產大郵輪起浮

中國第二艘國產大型郵輪「愛達·花城號」28日在中國船舶集團上海外高橋造船公司順利完成塢內起浮,全面轉入內裝和系統完工調試...

號稱全球首次 大陸完成白天地月空間衛星雷射測距

大陸官媒央視新聞報導,「深空探測實驗室」29日指出,大陸「天都一號」通導技術試驗星成功完成白天強光干擾條件下的地月太空(...

香港5年19戲院結業 復活節票房同比跌65% 前財爺吐心聲

復活節一連4日長假期,香港戲院票房僅1267萬元(港幣,下同,約163.3萬美元)收入,較去年大跌約65%。前財政司長曾...

富邦華一行長陳峰:台商出海主要目的地為東南亞和中南美

面對大陸市場激烈競爭、銀行業淨利差不斷縮窄、出海浪潮興起的大背景,富邦華一銀行行長陳峰表示,該行整體戰略逐步由「負債先行...

提振內需 大陸宣布展開市場准入壁壘清理整治行動

美中關稅戰未歇,大陸以持續拓展國內市場作為因應。大陸國家發改委、商務部、市場監理總局發布關於「開展市場准入壁壘清理整治行...

超越OpenAI-o1模型?阿里通義千問發布並開源Qwen3

阿里巴巴通義千問29日凌晨發布新一代Qwen3系列人工智慧(AI)模型。通義千問聲稱,新版模型參數量僅DeepSeek-...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。