宣稱全面「超越DeepSeek」 阿里雲初一發表通義千問旗艦版模型

阿里雲發表通義千問旗艦版Qwen2.5-Max,宣稱全面超越DeepSeek。(量子位微信公眾號)
阿里雲發表通義千問旗艦版Qwen2.5-Max,宣稱全面超越DeepSeek。(量子位微信公眾號)

阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max,並宣稱在指令模型版本性能測試中,幾乎全面超越深度求索DeepSeek-V3等其他模型。

阿里雲1月29日凌晨在微信公眾號宣布,Qwen2.5-Max全新升級發布,並說新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源混合專家(MoE)模型以及最大的開源稠密模型。

阿里雲說,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能進行了評估測試。

在指令模型方面,Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型,幾乎全面超越了另外三個美國模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

在基座模型方面,阿里雲則說,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。

另據路透社報導,選擇大年初一發布Qwen 2.5-Max是較為特殊的時間點,也顯示了深度求索過去三週迅速崛起,給中國境內外競爭對手帶來壓力。

深度求索1月20日發布推理模型DeepSeek-R1後,字節跳動旗下豆包更新版大模型1.5-pro上星期三(22日)正式發布。

根據IT之家報導,1.5-pro模型增強了綜合能力,在知識、代碼、推理、中文等多個評測基準上,綜合得分優於GPT-4o、Claude 3.5 Sonnet 等模型。

DeepSeek 團隊 美國 阿里巴巴

延伸閱讀

美中研發AI競爭 DeepSeek智取美國 竟是靠一群菜鳥工程師

威脅美AI主導地位 DeepSeek將美國用戶資料傳回中國 恐遭審查

唐鳳出招 繞過言論審查讓DeepSeek答六四天安門

DeepSeek警鐘 白宮:美國AI領先中國僅3至6個月

相關新聞

阿里雲發表新AI 稱超越DeepSeek

阿里雲在大年初一發布了通義千問旗艦版模型Qwen2.5-Max,並宣稱在指令模型版本性能測試中,其表現幾乎全面超越深度求...

茅台第12款生肖酒推出!估「蛇茅」價格平穩 想湊齊12生肖恐要花逾30萬

中國白酒龍頭貴州茅台1月初推出蛇年生肖酒「蛇茅」,是其2014年起推出馬年生肖酒以來第12款生肖酒。市場預計,今年「蛇茅...

阿里雲發表通義千問旗艦版 宣稱全面超越DeepSeek

阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max,並宣稱在指令模型版本性能測試中,幾乎全面超越深度求索Dee...

攻擊DeepSeek數量激增 大陸資安專家:IP皆來自美國

大陸新創公司深度求索(DeepSeek)的人工智慧(AI)大模型過去幾天多次出現「當機」災情,星期二(1月28日)凌晨並...

40歲梁文鋒 招百名天才青年創DeepSeek

中國大陸AI新創企業深度求索(DeepSeek)近期推出低成本、高性能的AI模型,大陸相關概念股走強,每日互動、華金資本...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。