快訊

本周「血型+生肖」財運TOP5!第一名「有強大運勢」:錢財滾滾入袋

58歲機師年收400萬…退休前才驚覺「長年疏失」一家四口陷財務危機

美關稅衝擊工具機恐遇「淘汰戰」 大廠老董:40年來最慘烈

降低對HBM技術依賴 傳華為12日發布AI推理領域突破性成果

大陸科技巨頭華為據報12日將發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴。(路透)
大陸科技巨頭華為據報12日將發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴。(路透)

大陸科技巨頭華為據報12日將在「2025金融AI推理應用落地與發展論壇」上發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴,提升大陸國內AI大模型推理性能,完善中國AI推理生態的關鍵部分。

綜合科創板日報、中國基金報、IT之家等陸媒報導,業內人士表示,當前AI產業已從「追求模型能力的極限」轉向「追求應用價值的最大化」,推理成為AI下一階段的發展重心。而HBM是解決「數據搬運」的關鍵。HBM不足時,用戶使用AI推理的體驗會明顯下降,導致出現任務卡頓、響應慢等問題。

美國於2024年12月初限制向中國出口先進的高帶寬記憶體晶片(HBM)。美國禁令下,包括HBM2 和 HBM3、HBM3e 等更先進 HBM 晶片,以及製造這些 HBM 晶片的設備都禁止出口中國。SK 海力士、美光和三星是三大HBM供應商,都禁止出口中國HBM2以上HBM晶片。此舉對於華為發展先進AI技術形成阻礙。

不過,華為此前在AI推理領域的技術已有部分突破。北京大學在3月聯合華為發布DeepSeek全棧開源推理方案,該方案基於北大自研SCOW算力平台系統和鶴思調度系統,整合了DeepSeek、openEuler、MindSpore 與 vLLM / RAY 等社區開源組件,實現了華為昇騰上的DeepSeek高效推理。

此外,華為昇騰也有突破,比如CloudMatrix 384超節點部署 DeepSeek V3 / R1 時,在 50ms 時延約束下單卡Decode吞吐突破每秒1920Tokens;Atlas 800I A2推理服務器在100ms時延約束下單卡吞吐達到每秒808Tokens。

據了解,8月12日召開的「2025金融AI推理應用落地與發展論壇」上,來自大陸信通院、清華大學和科大訊飛的專家,華為此次攜手中國銀聯共同發布AI推理的最新應用成果,共同探索AI推理技術在金融領域的規模化落地路徑。

華為 美國 晶片 推理 DeepSeek

延伸閱讀

華為內鬼竊密曝細節「晚上到尊湃工作」 為跳槽還改姓

FT:黃仁勳見川普後 美發輝達AI晶片銷陸許可

分批離職偷商業機密!尊湃員工成職場雙面人 「早上去華為、晚上回公司」

南亞科、鈺創 合攻AI記憶體

相關新聞

輝達重申晶片無後門 陸官媒:需進一步行動印證

美國科技巨頭輝達H20晶片被大陸官方媒體指稱不安全、不先進,「我們可以不買」後,輝達重申晶片不存在「後門」。大陸官媒周一...

DeepSeek母公司高層 傳涉及上億元返佣案被查

DeepSeek母公司、大陸量化私募機構「幻方量化」市場總監李橙,傳出因涉及一宗金額達人民幣1.18億元的返佣案件被查。

長安汽車董事長拜訪任正非 交流汽車產業競爭態勢

由原中共解放軍兵器裝備集團分立的大陸新央企長安汽車董事長朱華榮,在上任後的第11天前往深圳拜訪中國科技巨頭華為創始人任正...

科創扎根 蘇州打造人才聚集重鎮

像眾多中國大陸城市一樣,蘇州近日啟動「十五五」規畫公眾建言工作,其中人才創新創業是重要議題之一。作為經濟大省江蘇的骨幹支...

華為秀AI推理加速技術

華為將於明(12)日與中國銀聯在「2025金融AI推理應用落地與發展論壇」發布推理加速技術。據透露,該技術或能降低大陸A...

從投行看大陸/台商常見重複課稅分析

台商在兩岸間投資須注意重複課稅問題。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。