騰訊推AI模型 槓DeepSeek

騰訊宣布推出自研深度思考模型「混元T1」正式版,並同步在騰訊雲官網上線。輸入價格為每百萬tokens人民幣1元(新台幣4.5元),輸出價格為每百萬tokens人民幣4元(新台幣18元)。輸入價格與行業差距不大,但輸出價格為DeepSeek-R1標準時段的四分之一,顯然衝著DeepSeek而來。
每日經濟新聞報導,該模型以騰訊於3月初發布的「混元Turbo S」為基礎打造,是一款能秒回、吐字快、擅長超長文處理的強推理模型。
在體現推理模型基礎能力的常見指標方面,例如大語言模型評估增強資料集MMLU-PRO中,混元T1取得87.2分,僅次於OpenAI o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元T1的成績也達到業界領先推理模型的水準。
透過大規模強化學習並結合專項優化,混元T1正式版進一步提升了推理能力。與先前已上線騰訊元寶的「混元T1-preview」模型相比,綜合效果明顯提升。
混元T1正式版沿用混元Turbo S的創新架構,採用Hybrid-Mamba-Transformer融合模式。這是工業界首次將混合Mamba架構無損應用於超大型推理模型。
今年以來,騰訊混元大模型持續快速反覆運算,AI似乎已成為騰訊內部最大的驅動力。騰訊推出深度思考模型T1 Preview和快思考模型Turbo S,並已廣泛應用於騰訊元寶、ima、騰訊文檔、微信讀書、搜狗輸入法、QQ流覽器等多款內部產品。騰訊混元積極擁抱開源,開源模型全面覆蓋文本、圖像、影片和3D生成等多個模態。
業內認為,這一戰略選擇的背後,一方面基於騰訊長期以來堅持技術普惠的理念,另一方面也得益於騰訊在用戶與產業多端的場景與生態優勢,為AI技術的落地提供了廣闊空間。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言