快訊

管道奇襲!俄軍躲天然氣管4天包抄攻擊 烏軍棄械竄逃

台中警共辦案件涉洩密? 彰檢指揮搜索帶回多名警員釐清調查

台股下跌116點收22,459點 台積電跌破千元、終場收998元

鴻海推出繁體中文大型語言模型!在數學與推理表現出色 將對外開源

FoxBrain模型(對比Meta Llama 3.1 70B 與 Llama-3-Taiwan-70B) 在TMMLU+ 上面幾個重要領域的得分。鴻海/提供
FoxBrain模型(對比Meta Llama 3.1 70B 與 Llama-3-Taiwan-70B) 在TMMLU+ 上面幾個重要領域的得分。鴻海/提供

鴻海(2317)旗下鴻海研究院(HHRI)10日宣布,推出首款繁體中文AI大型語言模型(LLM),內部開發代碼FoxBrain,此模型以優異的運算成本,於四周內完成訓練。FoxBrain模型原為內部應用而設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。FoxBrain作為鴻海研究院AI推理LLM模型訓練成果,不僅展現了強大的理解與推理能力,還能針對台灣使用者的語言風格進行優化,並在數學與邏輯推理測試中表現出色。

鴻海研究院人工智慧研究所栗永徽所長表示,「近幾個月,推理能力的深化以及GPU的高效運用逐漸成為AI領域發展主流。我們的FoxBrain模型採用高效訓練策略,專注於訓練過程優化而非盲目堆砌算力。通過精心設計的訓練方法和資源優化,我們成功打造出具備強大推理能力的本土AI模型。」

鴻海研究院人工智慧研究所在FoxBrain訓練過程中,使用120張NVIDIA H100 GPU,並透過NVIDIA Quantum-2 InfiniBand 網路進行擴展,僅花約四周的時間完成,相較於近期其他公司所推出的推理模型,以更高效率,更低成本的模型訓練方式為台灣AI技術發展樹立新里程碑。

FoxBrain採用Meta Llama 3.1為基礎架構,擁有70B參數,在TMMLU+測試資料集,大多數的領域優於國內相同規模的Llama-3-Taiwan-70B,尤其在數學與邏輯推理方面展現卓越能力(TMMLU+評測結果請參閱圖一)。以下是FoxBrain 的相關規格與訓練策略:

•透過自主技術,建立24類主題的資料增強方式與品質評估方法,生成98B tokens高品質中文預訓練資料。

•上下文處理長度 128 K token。

•使用120張 NVIDIA H100 GPU 訓練,總計算力花費2688 GPU days。

•採用多節點平行訓練架構,確保高效能與穩定性。

•使用獨特的Adaptive Reasoning Reflection 技術訓練模型學會自主推理。

在測試結果方面,FoxBrain於數學領域較基礎模型Meta Llama 3.1全面提升,相較於目前最好的繁體中文大模型 Taiwan Llama在數學測試中取得顯著進步,並在數學推理能力上超越Meta目前已推出的同等級模型,雖與DeepSeek的蒸餾模型仍有些微差距,但表現已相當接近世界領先水準。

FoxBrain的研發,從資料收集、資料清理與擴增、Continual Pre-Training、Supervised Finetuning、RLAIF、Adaptive Reasoning Reflection,以自主研發的方式一步一腳印,穩紮穩打把每一個環節做好,最終在運用有限的算力資源下,仍能達到接近世界頂尖AI大模型的效益。此大型語言模型的研究成果,顯示台灣科技人才在AI大模型領域也能夠與國外人才並駕齊驅。

FoxBrain模型雖然起源於鴻海研究院為集團內部應用而設計,未來,鴻海將持續與技術夥伴合作,對外開源分享,擴大FoxBrain模型運用範圍,共同推動AI在製造業、供應鏈管理與智慧決策領域的應用。

在模型訓練過程中,NVIDIA公司提供Taipei-1超級電腦的支持以及技術諮詢,使鴻海研究院透過使用NeMo順利完成模型訓練。FoxBrain不僅是鴻海AI研發的重大突破,也為台灣AI產業發展樹立了新的標竿。將在更多場景中發揮影響力,推動企業數智化轉型與全球產業升級。

鴻海未來將透過導入AI大型語言模型,優化智慧製造、智慧電動車、智慧城市等三大平台的數據分析效率,讓FoxBrain成為驅動智慧應用升級的重要引擎,進一步提升公司營運效益。

AI 鴻海

延伸閱讀

華郵:祖克柏為讓臉書進入中國 擬僱300人審查內容

華碩加州伺服器產能齊備 施崇棠首度出席輝達GTC

顛覆全球AI產業 美媒:下個DeepSeek也可能來自中國

響應國際數學日 科教館發起用愛因斯坦磚藝數拼貼挑戰

相關新聞

獨/世界先進蓋新加坡晶圓廠600億聯貸 本周完成簽約

台積電上周宣布千億美元的投資計畫,本周金融圈也將完成旗下轉投資公司世界先進的聯貸大案。據業界人士指出,去年11月由台灣銀...

帝濶攜手新竹台大分院 進軍NVIDIA GTC 2025

鈺創集團旗下帝濶智慧科技與新竹台大分院,共同研發的「AI隱私醫療照護系統」,將於3月在美國聖荷西舉行的全球人工智慧盛會N...

是德攜手亞德諾 在2025MWC展示6G FR3特性分析解決方案

是德科技(Keysight)與亞德諾半導體(ADI)攜手,於2025年世界行動通訊大會(MWC)展示6G FR3射頻前端...

2025年全球伺服器出貨將成長2.3% 鴻海成長動能突出

根據DIGITIMES最新研究報告預測,2025年全球伺服器出貨量將達1,524萬台,年增2.3%。雖然市場仍維持成長,...

高雄新創公司研發競速無人機超輕量 3D列印助攻機身僅25克

高雄新創公司「弗萊克朵」競速無人機不僅接受客製化設計,還是台灣首家採用3D列印技術,超輕量化設計,機身僅25公克,時速最...

電電公會5月28日辦「AI賦能永續高峰會」 李詩欽拋三大訴求

隨著全球邁入新時代的起點,人工智慧(AI)及新興技術正改變著各行各業、社會與經濟的發展。電電公會為協助台廠全速朝國際化邁...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。