快訊

和7旬老父討錢不成 桃園逆子暴怒持菜刀砍殺濺血送醫

川普搶當教宗? 笑稱「自己是第一人選」 但美國史上無人當選

最成功的100天?川普執政演說喊「不再中國優先」:美國現在被所有國家尊重

阿里最強開源模型 上秀

阿里巴巴。路透
阿里巴巴。路透

阿里巴巴昨(29)日發布新一代通義千問Qwen3(千問3)系列人工智慧(AI)模型,新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降。

在LiveCodeBench大語言模型評測榜單中,千問3模型性能全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。

千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,創下所有大陸國產模型及全球開源模型的性能新高。

據中國證券報,千問3是大陸國內首個「混合推理模型」,「快思考」與「慢思考」集成進同一個模型,對簡單需求可低算力「秒回」答案,適用於對速度要求高於深度的簡單問題。而對複雜問題可多步驟「深度思考」,節省算力消耗。

至於性能方面,千問3預訓練數據量達36T ,並在後訓練階段進行多輪強化學習,在推理、指令遵循、工具調用、多語言能力等方面均有增強。

在效能提升的同時,Qwen3部署成本下降,僅需四張H20即可部署Qwen3滿血版,顯示卡記憶體占用僅為性能相近模型的三分之一。

阿里通義已開源200餘個模型,全球下載量超三億次,千問衍生模型數超10萬個,衍生模型數量已超越美國Llama,成為全球第一開源模型。

DeepSeek 推理 語言

延伸閱讀

分析師:投資人不必擔心華為新AI晶片威脅NVIDIA的地位

百度董事長李彥宏批DeepSeek貴又慢 網諷:酸葡萄心理

holoEN降臨組 x AXGRIT快閃店活動 現場展示雙子FUWAMOCO等比模型

美專家問:萬一中國沒想搶AI競賽第1名呢? 他們當第2名更有利

相關新聞

台企也受益!陸公布「民營經濟促進法」公部門不能拖帳民企

大陸十四屆全國人大常委會第15次會議,30日表決通過《民營經濟促進法》,自5月20日起施行。凱博聯合會計師事務所總監梁祥...

中阿千餘企業家 海南會商經貿

中國—阿拉伯國家合作論壇第11屆企業家大會暨第9屆投資研討會(簡稱「中阿企業家大會」)28日海南海口開幕。來自中國和阿拉...

新型百萬瓩級汽輪發電機 研發成功

記者從四川省德陽市了解到,由東方電氣集團東方電機有限公司(簡稱東方電機)自主研發的新型百萬千瓦級汽輪發電機順利完成型式試...

烏魯木齊–香港 國泰啟航

國泰航空有限公司28日開通新疆烏魯木齊至香港直航航班,通過加強兩地空中聯絡通道,為商旅交流和經貿合作提供更加便捷的服務。

陸氫能產消 去年冠全球

中國國家能源局28日召開新聞發布會介紹「中國氫能發展報告(2025)」相關情況。報告顯示,去年中國氫能全年生產消費規模逾...

中國陣前換將 前WTO代表上場!中美關稅戰攤牌時刻逼近 3種結局揭密

北京4月16日撤換2018年起在貿易戰第一階段即扮演關鍵角色的王受文,任命李成鋼接任商務部國際貿易談判代表兼副部長。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。