陸企DeepSeek接連推出大模型 陸媒:引發Meta內部焦慮
總部位於杭州的大陸AI新創公司「深度求索」(DeepSeek),去年底、1月20日先後發布了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮,工程師開始連夜嘗試複製DeepSeek的成果。
陸媒「每日經濟新聞」26日報導,在美國總統川普宣布5000億美元的「星際之門」(Stargate)發展人工智慧基礎建設計畫之際,DeepSeek以極低的價格建立了突破性的AI模型,且未使用尖端晶片,讓人們質疑,AI行業數千億美元資本的巨額投入,是否真為最有效的方法?
報導回顧,去年12月27日,DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「聊天機器人競技場」(Chatbot Arena)顯示,「DeepSeek-V3」在所有模型中排名第7,在開源模型排第1。且「DeepSeek-V3」是全球前十中,性價比最高的模型。
不到1個月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日,「DeepSeek-R1」在聊天機器人競技場綜合榜單上排名第3,與頂尖推理模型、OpenAI推出的o1並列。同時,測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示,「DeepSeek-R1」在AI分析質量指數中取得第2高分,價格則是o1的約30之1。
「每日經濟新聞」稱,24日,一篇發布在匿名平台teamblind上的文章瘋傳,一位自稱是Meta員工稱,Meta內部因為DeepSeek模型進入恐慌模式,該文員工寫道,「DeepSeek-V3」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是,一家「僅用550萬美元訓練預算的中國公司」就做到了這一點。
該匿名文指,工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術。另外,「DeepSeek-R1」的出現,也讓情況更加嚴峻。
《金融時報》25日稱,中國的小型AI新創公司DeepSeek震驚矽谷,加州大學柏克萊分校AI政策研究員古普塔(Ritwik Gupta)表示,DeepSeek最近發布的模型,表明「AI能力沒有護城河」。古普塔也提到,中國的系統工程師人才庫比美國大得多,懂得如何充分利用計算資源,來更便宜地訓練、運行模型。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言