陸企DeepSeek接連推出大模型陸媒：引發Meta內部焦慮

2025-01-26 13:18 聯合報／記者潘維庭／即時報導

矽谷

總部位於杭州的大陸AI新創公司「深度求索」（DeepSeek），去年底、1月20日先後發布了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型，由於成本低廉，性能與OpenAI相當，陸媒指此舉引發矽谷震驚，甚至引發Meta內部焦慮。（取自DeepSeek官網）

總部位於杭州的大陸AI新創公司「深度求索」（DeepSeek），去年底、1月20日先後發布了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型，由於成本低廉，性能與OpenAI相當，陸媒指此舉引發矽谷震驚，甚至引發Meta內部焦慮，工程師開始連夜嘗試複製DeepSeek的成果。

陸媒「每日經濟新聞」26日報導，在美國總統川普宣布5000億美元的「星際之門」（Stargate）發展人工智慧基礎建設計畫之際，DeepSeek以極低的價格建立了突破性的AI模型，且未使用尖端晶片，讓人們質疑，AI行業數千億美元資本的巨額投入，是否真為最有效的方法？

報導回顧，去年12月27日，DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「聊天機器人競技場」（Chatbot Arena）顯示，「DeepSeek-V3」在所有模型中排名第7，在開源模型排第1。且「DeepSeek-V3」是全球前十中，性價比最高的模型。

不到1個月，今年1月20日，DeepSeek再推出「DeepSeek-R1」，24日，「DeepSeek-R1」在聊天機器人競技場綜合榜單上排名第3，與頂尖推理模型、OpenAI推出的o1並列。同時，測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示，「DeepSeek-R1」在AI分析質量指數中取得第2高分，價格則是o1的約30之1。

「每日經濟新聞」稱，24日，一篇發布在匿名平台teamblind上的文章瘋傳，一位自稱是Meta員工稱，Meta內部因為DeepSeek模型進入恐慌模式，該文員工寫道，「DeepSeek-V3」在基準測試中，已經讓（Meta推出的）Llama 4相形見絀，而更讓人難堪的是，一家「僅用550萬美元訓練預算的中國公司」就做到了這一點。

該匿名文指，工程師正爭分奪秒分析DeepSeek，試圖複製其中的一切可能技術。另外，「DeepSeek-R1」的出現，也讓情況更加嚴峻。

《金融時報》25日稱，中國的小型AI新創公司DeepSeek震驚矽谷，加州大學柏克萊分校AI政策研究員古普塔（Ritwik Gupta）表示，DeepSeek最近發布的模型，表明「AI能力沒有護城河」。古普塔也提到，中國的系統工程師人才庫比美國大得多，懂得如何充分利用計算資源，來更便宜地訓練、運行模型。

矽谷美國