陸AI新創大模型震撼矽谷 性能與OpenAI相當 引發Meta恐慌

大陸AI新創公司DeepSeek先後發布兩款大模型,由於成本低廉,性能與OpenAI相當,陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮。(DeepSeek官網)
大陸AI新創公司DeepSeek先後發布兩款大模型,由於成本低廉,性能與OpenAI相當,陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮。(DeepSeek官網)

總部位於杭州的大陸AI新創公司深度求索(DeepSeek)近期先後發布「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,讓矽谷震驚,甚至引發Meta內部的恐慌。分析認為DeepSeek可能將改寫AI大模型領域的遊戲規則。

財聯社報導,甚至有投資者將輝達上周五重挫3.12%的原因指向DeepSeek的一夜爆火。德國《世界報》知名市場評論員Holger Zschaepitz表示:「中國的DeepSeek可能代表對美國股市的最大威脅,因為該公司似乎以極低的成本構建了一個突破性的人工智慧模型,並且無需使用尖端晶片。這讓人質疑投入該行業的數千億美元資本支出的實際效用。」

據報導,DeepSeek僅用2,048片H800顯示卡(GPU)、耗時兩個月,就訓練出了一個6,710億參數的DeepSeek-V3。相較於Meta訓練參數量4,050億的Llama 3,用了16,384片更強的H100顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。

陸媒《每日經濟新聞》昨(26)日報導稱,在美國總統川普宣布5,000億美元的「星際之門」(Stargate)發展人工智慧基礎建設計畫之際,DeepSeek以極低的價格建立了突破性的AI模型,且未使用尖端晶片,讓人們質疑,AI行業數千億美元資本的巨額投入,是否真為最有效的方法?

報導回顧,去年12月27日,DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「聊天機器人競技場」(Chatbot Arena)顯示,「DeepSeek-V3」在所有模型中排名第七,在開源模型排第一。且「DeepSeek-V3」是全球前十中,性價比最高的模型。

不到一個月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日「DeepSeek-R1」在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型、OpenAI推出的o1並列。同時,測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示,「DeepSeek-R1」在AI分析質量指數中取得第二高分,價格則是o1的約30分之1。

《每日經濟新聞》稱,24日一篇發布在匿名平台teamblind上的文章瘋傳,一位自稱是Meta員工稱,Meta內部因為DeepSeek模型進入恐慌模式,該文員工寫道,「DeepSeek-V3」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是,一家「僅用550萬美元訓練預算的中國公司」就做到了這一點。

該匿名文指,工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術。另外,「DeepSeek-R1」的出現,也讓情況更加嚴峻。

然而,美國人工智慧數據基礎設施新創公司Scale AI執行長Alexandr Wang最近接受CNBC採訪時爆料,DeepSeek擁有大約五萬個輝達最先進的H100 GPU,並指「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有比外界想像的更多,他們未來會被晶片管制,和出口管制所限制」。

OpenAI 美國

延伸閱讀

陸爆紅DeepSeek驚傳伺服器崩了!陸網揶揄「沒問什麼敏感題」 公司回應了

科技財報周來了 美股重頭戲

Meta今年650億美元投資AI 廣達、緯穎、雙鴻等喜迎利多

產業追蹤/投資多元化 熱點全解析

相關新聞

春節前夕人事大變!萬科祝九勝「身體因素」辭總裁

農曆新年到來前夕,大陸房企萬科萬科企業於27日公布,當日收到公司部分董事、總裁、首席執行官、公司秘書、授權代表提交的書面...

開車時直播 小米雷軍、華為余承東先後被中斷畫面

繼小米集團創始人雷軍開車直播被大陸網友舉報封禁後,華為常務董事余承東星期一(1月27日)自駕直播時也被封禁。

萬科2024年凈利潤虧450億元 郁亮辭去董事會主席職務

1月27日,萬科企業股份有限公司發布業績預告,預計2024年歸屬於上市公司股東的淨利潤虧損450億元人民幣(約合2034...

中國房企萬科人事大地震 總裁祝九勝「身體因素」裸退

中國知名房地產公司萬科今天公告,日前被傳遭到中國警方帶走的總裁祝九勝因「身體原因」辭職,不再擔任公司任何職務

中國股市龍年封關收黑 全年大盤漲幅逾13%

中國股市今天農曆龍年封關,雖然一度開高,然而尾盤下挫導致3大指數收黑,上證指數跌0.06%、深證成指跌1.33%、創業板...

中AI大模型強在哪? 為何史丹福、麻省理工都想用?

中國國產大模型公司深度求索(DeepSeek)一個月內接連發布V3和R1兩款大模型,不僅物美價廉,性能與OpenAI相當...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。