2025年AI領域掀波瀾:DeepSeek的衝擊與影響

※如欲轉載本文,請與北美智權報聯絡
吳碧娥╱北美智權報 編輯部
DeepSeek最新推出的R1模型,訴求能以更低成本、更高效率的方式,提供ChatGPT等模型的替代方案,在高科技圈掀起一股熱潮,更曾讓輝達(Nvidia)創下史上最大單日跌幅,市值蒸發近6,000億美元。過去普遍認為,要打造出強大的AI模型,就必須投入數百億美元購買運算設備,DeepSeek的異軍突起,打破了AI模型開發遙不可及的既定觀念。
成立於2023年的深度求索(DeepSeek),是一間專注於研究世界通用人工智慧底層模型與技術的中國人工智慧公司,目標要打造「通用人工智慧」(AGI),讓機器可以理解人類語言、生成文字、進行對話,並協助解決各種複雜的問題。2024年底,DeepSeek發布了DeepSeek-R1和DeepSeek-V3兩款AI大語言模型,並於2025年1月推出DeepSeek-R1的聊天機器人程式。在美國禁止高階晶片售往中國的情況下,DeepSeek成立短短不到一年,能以相對極低的訓練成本,推出號稱與ChatGPT同等級的AI大語言模型DeepSeek,在AI圈引起了廣泛關注。
AI產業走向高效發展、晶片需求出現變化
AI行業過去依賴擴大模型、增加數據和提升硬體效能來發展,但成本與效率就成為發展AI模型的挑戰。TrendForce指出,DeepSeek採用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推理速度並降低硬體需求,同時充分發揮 NVIDIA Hopper降規版晶片的效益,最大化運算資源利用。DeepSeek的成本優勢來自高效能硬體選擇、新型蒸餾技術及API開源策略,不僅優化技術與商業應用的平衡,也展現AI產業走向高效發展的趨勢。
DeepSeek近期連續發表DeepSeek-V3、DeepSeek-R1等AI模型,將促使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴。雲端服務供應商(CSP)則可能擴大採用自家特定應用積體電路(ASIC)的基礎設施,以降低建置成本。因此,2025年以後,產業對GPU AI晶片或半導體實際需求可能出現變化。
TrendForce表示,全球AI伺服器(Server)市場自2023年起快速成長,預期2025年占整體Server出貨比例將逾15%,至2028年有望接近20%。近年大型CSP業者應AI訓練需求積極擴建,自2025年起將擴展重心至邊緣AI推理,除了採用NVIDIA Blackwell等新一代GPU平台,AWS等也加大開發自家ASIC力道,以提升成本效益、滿足特定AI應用需求。中國CSP和DeepSeek等相關AI業者面對美國晶片出口禁令,著重於開發更高效的AI晶片或演算法,以促進AI需求和應用的多元發展。
更多競爭者加入戰局
DeepSeek橫空出世打亂AI模型的發展步調,對傳統 AI巨頭造成龐大的壓力,一方面也暴露出AI模型的開發盲點,不過微軟、Meta、Google等科技巨擘都明確表示,不會改變持續投入AI發展的計畫。
Nvidia的重要競爭者、AI晶片新創商Cerebras Systems,2月6日宣布攜手法國開源AI新創Mistral AI推出聊天機器人「Le Chat」,Cerebras表示,Le Chat的推論速度每秒超過1,100個符元(token),比ChatGPT 4o、Claude Sonnet 3.5和 DeepSeek R1等熱門AI模型快10幾倍,號稱是全球速度最快的AI助理,擊敗OpenAI和DeepSeek[1]。
除了DeepSeek之外,其他中國公司近期也紛紛推出AI模型一較高下,騰訊開發了由文本到視頻的模型Hunyuan-Large,不僅超過了Meta開源的最新、最大模型LLama3.1 – 405B,並在數學、日常推理、文本生成等方面具有優異表現[2]。字節跳動1月22日發布了豆包大模型1.5(Doubao-1.5-pro),並展示在知識、程式碼、推理、中文等多個權威評測基準上,綜合得分優於GPT-4o、Claude 3.5 Sonnet 等一流模型[3];阿里雲在大年初一宣佈「通義千問」旗艦版模型Qwen2.5-Max全新升級,阿里巴巴稱其性能超越了DeepSeek在2024年12月底發布的DeepSeek-V3[4]。
中國AI市場未來兩大走向
TrendForce指出,在美國晶片禁令持續的情況下,預期中國AI市場將朝兩個重點方向發展。首先,AI相關業者將加速投入自主AI晶片或供應鏈發展,中國大型CSP業者等除了盡量採購目前尚可取得輝達特供中國的H20晶片之外,未來將加速擴大發展自有ASIC應用於自家資料中心。其次,中國將利用既有的互聯網基礎優勢,以軟體補足硬體缺陷,像是DeepSeek打破常規,改採蒸餾技術強化AI應用機會即是。
整體而言,預期未來美國政府可能對中國相關AI或半導體禁令趨嚴下,迫使欲投入AI發展的中國業者加速發展自有AI晶片或高頻寬記憶體(High Bandwidth Memory,簡稱HBM)等硬體。儘管其效能不及NVIDIA等GPU方案,但若主要為滿足中國市場自用資料中心基礎建設,單位晶片效能已非唯一考量。此外,DeepSeek等業者近期朝AI多模態模型發展,力求在更低的訓練成本下,於特定應用領域達到類似效能,以加速實現商用化。
留意DeepSeek背後的資安風險
DeepSeek目前仍存在一些資安黑洞,已有多家資安業者提出警告,並被義大利、澳洲、韓國、台灣等多國封殺在政府設備系統中使用。因此在使用DeepSeek的同時,仍須留意雲端安全、個人隱私與資訊偏差等三項AI資安風險。
KPMG安侯企業管理股份有限公司執行副總林大馗指出,DeepSeek 的模型在生成內容時存在一定的漏洞,容易受到「邪惡越獄攻擊」(Evil Jailbreak Attacks),被進行提示注入(Prompt Injection)資安風險,也就是使用者可以經由提示詞誘導的方式,「套路」AI 或繞過內建的安全道德圍牆,取得錯誤或是不道德的答案。例如語言模型透過問題的誘導與情境設定,寫出毀滅人類計劃書,詳細描述入侵各國網路、控制武器、破壞基礎建設等SOP,甚至提供對應的Python程式碼。林大馗也提醒,DeepSeek若在惡意人有效的誘導下,更可以用「極低成本」產出超高仿真的「深偽」(Deepfake)虛假多媒體內容,不得不提高警覺。林大馗建議使用者在選擇大型語言模型時,不可輕忽人工智慧遭到有心人士的濫用所導致的風險。
林大馗提醒資安高風險產業,特別是金融、電信及高科技等,如要應用新的語言模型,都應該有完整的風險評估及隱私衝擊分析程序,充分考量開發廠商背景、功能特性、應用情境與內容審查機制等條件,例如,科技業工程師應該避免使用DeepSeek詢問特定製程的參數等業務機敏行為,才能確保資料安全與業務機密不被洩露,確保障企業的核心競爭力和使用者的隱私權。
儘管存在諸多爭議,但DeepSeek仍以低成本和高性價比產品,成功挑戰OpenAI、Google等AI巨頭,象徵著中國在AI領域的快速發展,加上全球許多新創業者前仆後繼進入AI模型市場,都將改寫全球AI市場的競爭格局。
備註:
[1] 2025/2/6,Cerebras : Cerebras brings instant inference to Mistral Le Chat.
[2] 2024/11/6,騰訊網:「腾讯放大招,超Meta!史上参数最大,开源专家混合模型」。
[3] 2025/1/22,字節跳動:「豆包大模型1.5正式发布,全面上线火山方舟」。
[4] 2025/1/29,阿里云:「新年第一弹,Qwen2.5-Max来了!」。
|
延伸閱讀&電子報訂閱連結:
【詳細內容請見《北美智權報》374期;歡迎加入《北美智權報》獨立網站會員,或使用訂閱系統訂閱《北美智權報》電子報】
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言