務實利用AI開源模型 發展軟體產業
近期中國大陸AI領域新星「深度求索」DeepSeek橫空出世,憑藉其使用低成本之低階晶片,功能卻不遜於以高資本、高電力打造出的ChatGPT,震撼了科技界,也引發全球關注。
過去AI發展以美國為首,一個大模型動輒需上億美元投入,需要很多H100等級的高階GPU晶片,這也造就輝達的炙手可熱。中美晶片戰後,美國禁止輝達出售高階AI晶片給中國,大家都認為此舉將箝制中國發展AI的咽喉。未料DS公開表示只用了兩千餘片輝達的低階晶片,就做出功能相近的模型,無疑宣告美國對中國的晶片禁令不足為懼,甚至傳出華為昇騰晶片已可取代。
過去我就常提及,美國的晶片制裁,短期內會傷害到中國半導體業,但中長期看來美國不一定是贏家。因為中國早已傾全國之力發展半導體,一旦購買不到晶片或相關設備,定會以各種方式自行研發,達成晶片自主化目標。DS的發展就是個很好的例子,用不同的設計及演算方法,用很少的錢,縮短研發時間來節省成本,最後達到和ChatGPT差不多的表現。
在這股AI浪潮下,台灣到底能做些什麼?台灣的高科技產業是以硬體代工為主,雖擁有完整的半導體產業鏈和全球供應鏈優勢,但軟體產業發展較落後,所以必須藉由AI進行軟體技術的發展與創新。但美國主導的AI產業掌握了大數據、大算力的模型,需要大量電力配合,價格昂貴,故對台灣而言,用大型AI來發展軟體較為困難。DS剛好提供另一個模型選項。這個模型不同於ChatGPT的昂貴「閉源模式」, 是一個免費的「開源模型」,也就是其「源代碼」是公開的,容許用戶根據需求對模型進行使用及修改,甚至可衍生開發出新產品。最近在巴黎召開的AI高峰會,據聞已將開源模型列為重要議題,可見這會是未來發展趨勢。
當然有人對使用DS「源代碼」有資安顧慮,且目前的確有資料儲存、數據傳輸安全性以及保密技術等問題,但我認為是可解決的,除了可限制其使用領域,就如現在公務部門禁用,現在已有很多源代碼程式的資安漏洞檢查工具,包括靜態代碼分析及動態應用安全測式,應已足解決對DS資安問題的疑慮。另外,對於保密技術等,隨著模型發展,將會更加成熟。解決了資安顧慮,所有使用者在使用或修改其結構及演算法後,利用其開源模式,建立屬於自己的AI模型,發展各式APP等各種小型AI模型應用。
台灣很多小規模軟體公司,苦於資源不足,難以和歐美大型軟體公司匹敵。現在利用開源模型可以來撰寫程式,開發應用APP,這正是台灣軟體工業起飛的契機,以台灣的創新創造能力,或許未來除了硬體代工外,還能再做軟體代工,為台灣科技產業另闢新徑。
從另一個角度來看,用很少的錢、人力及時間完成的DeepSeek,中國大陸可以做到,台灣為何不能?過去我們認為AI模型的訓練和優化需要大量數據、超強算力,但是現在DS問世打破了這個神話。我們應藉由提升STEM教育的程度與質量,培養更多優秀人才,與現有資源整合,建立自己的輕量型AI。他山之石可以借鏡,政府應務實地看待我們的AI產業,好好規畫部署,不要錯失良機,才能在AI浪潮下占有一席之地。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言