聽新聞
0:00 /
0:00
開發DeepSeek…95後AI天才少女 小米千萬年薪延攬
大陸AI新創公司DeepSeek近來迅速走紅,據稱令矽谷十分緊張。DeepSeek大模型的關鍵開發者之一是在大陸被稱為九五後(一九九五年後出生者)AI天才少女羅福莉。小米創始人雷軍日前才以人民幣千萬元年薪招攬羅福莉,由她領導小米AI大模型團隊。
綜合陸媒報導,去年底DeepSeek發布新一代大模型DeepSeek-V3,同時宣布開源(公開原始碼和技術細節)。今年一月廿日,DeepSeek再發布DeepSeek-R1。在多項基準測試中,V3的成績超越了主流開源模型,同時由於其極低的訓練成本,該模型也被形容為「AI界拼多多」(喻其物美價廉)。
DeepSeek模型的關鍵開發者之一,羅福莉也迅速走紅。她出生於一九九五年,畢業於北京師範大學電腦系,擁有北京大學計算語言學碩士學位。二○一九年在北大讀碩士時,就在人工智慧領域頂尖國際會議ACL發表八篇論文。畢業後第一份工作在阿里達摩院,從事預訓練語言模型相關工作,主導開發多語言預訓練模型VECO。
二○二二年,羅福莉加入幻方量化公司,從事深度學習相關策略建模與演算法研究;後來轉到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。該大模型只有GPT4價格的百分之一,被稱為性價比之王。
外界稱她為AI天才少女,但羅福莉認為自己是電腦領域的「低起點者」。她曾說自己從小城市的高中考到北京師範大學,誤打誤撞進入電腦專業。大學時期還一度考慮轉行做產品。轉折點發生在研究所階段,羅福莉被保送至北京大學計算語言學所後,開始在人工智慧領域展露天賦。
談到暴紅經歷,羅福莉並不希望自己被神化、娛樂化。「突然之間千奇百怪的機會都來了,有找我出書的、有找我錄公開課的,甚至有經紀公司找來的。」
延伸閱讀
贊助廣告
商品推薦
udn討論區
共 0 則留言
規範
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言