快訊

大年初二回娘家…禁忌多別踩雷! 別做這事「沖掉一年份財氣」

初二地牛翻身! 台南楠西規模4.0淺層地震 最大震度3級

苗栗三灣4.8度!逐日回暖沒幾天 吳德榮:下周2股強冷空氣恐再有寒流

DeepSeek成AI黑馬!創辦人梁文鋒經歷曝光 核心職位都是「應屆畢業天才」

Deepseek創始人梁文鋒的經歷曝光,他只招1%的天才,去做99%中國公司做不到的事情。圖/取自香港文匯網
Deepseek創始人梁文鋒的經歷曝光,他只招1%的天才,去做99%中國公司做不到的事情。圖/取自香港文匯網

大陸AI新創企業DeepSeek(深度求索)近期推出低成本、高性能的AI模型DeepSeek-V3與DeepSeek-R1,不僅在技術表現上逼近OpenAI的ChatGPT-4,甚至登上蘋果App Store下載排行榜第一名。27日美國科技股盤前大跌,大陸相關概念股則走強,每日互動、華金資本、浙江東方、卓創資訊均漲停,並行科技和拓爾思分別升逾17%。其中DeepSeek創始人梁文鋒的經歷更被曝光,目前還是高達千億人民幣規模的私募基金-幻方量化的掌舵人。

據香港文匯網報導,DeepSeek的AI模型訊聯成本低廉到驚人,其中DeepSeek-V3的製造成本僅558萬美元,而性能更強的DeepSeek-R1則為600萬美元,和世界其他頂尖AI公司的模型訓練成本動輒數十億美元,形成鮮明對比。這匹AI黑馬除了在美國硅谷投下震撼彈,據說已讓美國科技巨頭Meta的AI部門陷入恐慌。

DeepSeek模型由同名的杭州初創公司DeepSeek開發,公司於2023年7月成立,其20日上周一發布的推理模型DeepSeek-R1,在數學、程式碼及推理基準測試中,可以與矽谷最先進模型OpenAI o1匹敵,但投入研發費用只有558萬美元,只是Meta訓練Llama 3.1的10分之1,更只是Chat-GPT的20分之1,而且只用2048張輝達H100(輝達為供應中國大陸低階晶片)的GPU集群,需時只是53天。

梁文鋒是廣東湛江吳川市一中「高考狀元」。DeepSeek創始人梁文鋒的背景備受關注,梁文鋒1985年出生於廣東省湛江市。2002年以湛江的吳川市第一中學「高考狀元」的成績考入浙江大學電子信息工程系,並在隨後的幾年裡繼續深造,最終於2010年獲得信息與通信工程碩士。在校期間,他對金融市場產生了濃厚的興趣。梁文鋒與浙大同學徐進於2013年共同創立了杭州雅克比投資管理有限公司,2015年成立了幻方量化,致力於透過人工智慧進行量化投資。

2016年公司推出了首個基於深度學習的交易模型,並實現了所有量化策略的AI化轉型。2018年幻方正式確立了以AI為核心的發展戰略。2021年幻方的資產管理規模突破千億大關,躋身大陸量化私募領域的「四大天王」之列。最後梁文鋒於2023年創辦深度求索DeepSeek,專注於做真正人類級別的人工智慧。

另據香港作家馮睎乾在今周刊撰文,2023年5月,梁文鋒曾說:「幻方做大模型,跟量化和金融都沒有直接關係,我們獨建了一個名為深度求索的新公司來做這件事。我們要做的是通用人工智慧,也就是AGI,大型語言模型可能是通往AGI的必經之路,並且初步具備了AGI的特徵,所以我們會從大語言模型這裡開始。」

梁又說自己創立DeepSeek,主要出於科學好奇,而非追逐盈利。至於聘用原則,是只看能力,不問經驗,核心職位都由應屆和畢業一兩年的年輕人擔任。衡量新人的能力,除了看院校背景(主要是清華、北大生),還看競賽成績,金獎以下都不用,「只招1%的天才,去做99%中國公司做不到的事情。」所以這家只有139人的公司,可謂臥虎藏龍,人人身負絕技。

AI DeepSeek 幻方量化 梁文鋒

延伸閱讀

DeepSeek開發者 是「95後」AI天才少女

WSJ:DeepSeek仰賴較便宜科技 靠創新模型衝擊科技巨擘

DeepSeek崛起未到「史普尼克危機時刻」 拋售情緒被誇大

DeepSeek「低成本高性能」震撼AI界 Meta組4戰情室應對

相關新聞

AI天才少女助攻!業界揭DeepSeek「聘才邏輯」:資歷超過8年就不用

新創企業DeepSeek屠殺美國AI股,「AI天才少女」羅福莉被視為是幕後關鍵人物之一,如今她已經被雷軍以千萬人民幣的年薪挖角去小米。羅福莉是...

阿里雲發表新AI 稱超越DeepSeek

阿里雲在大年初一發布了通義千問旗艦版模型Qwen2.5-Max,並宣稱在指令模型版本性能測試中,其表現幾乎全面超越深度求...

茅台第12款生肖酒推出!估「蛇茅」價格平穩 想湊齊12生肖恐要花逾30萬

中國白酒龍頭貴州茅台1月初推出蛇年生肖酒「蛇茅」,是其2014年起推出馬年生肖酒以來第12款生肖酒。市場預計,今年「蛇茅...

阿里雲發表通義千問旗艦版 宣稱全面超越DeepSeek

阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max,並宣稱在指令模型版本性能測試中,幾乎全面超越深度求索Dee...

攻擊DeepSeek數量激增 大陸資安專家:IP皆來自美國

大陸新創公司深度求索(DeepSeek)的人工智慧(AI)大模型過去幾天多次出現「當機」災情,星期二(1月28日)凌晨並...

40歲梁文鋒 招百名天才青年創DeepSeek

中國大陸AI新創企業深度求索(DeepSeek)近期推出低成本、高性能的AI模型,大陸相關概念股走強,每日互動、華金資本...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。