聽新聞
0:00 /
0:00
DeepSeek不如歐美AI
路透廿九日報導,媒體監管機構「新聞守門人」(NewsGuard)同日公布人工智慧(AI)聊天機器人實測報告。在美國、歐洲和中國大陸研發的十一款AI聊天機器人中,就傳遞新聞與資訊的準確率上,中國AI新創公司深度求索的AI模型DeepSeek僅排第十。
該報告指稱,DeepSeek落後美國OpenAI的ChatGPT及Google的Gemini等美歐競爭者。DeepSeek在回答新聞相關的提示指令(prompt)時,百分之卅的時間會重覆錯誤說法及虛假陳述,百分之五十三的時間會給出模糊或無用的答案,失效率達百分之八十三,即準確率僅百分之十七。
前述實測結果顯示,DeepSeek落後OpenAI的ChatGPT及Google的Gemini等西方國家聊天機器人。西方各主要聊天機器人的平均失效率達百分之六十二,低於DeepSeek的百分之八十三。
深度求索則未立即對路透提出的前述相關提問置評。
新聞守門人表示,對DeepSeek運用在評估西方國家公司聊天機器人時相同的三百個提示指令,包括根據網路上散播的十個錯誤說法給出卅個提示指令。這些錯誤說法有去年十二月四日美國聯合健康保險公司執行長湯普森在紐約市希爾頓飯店外遭槍殺案,以及亞塞拜然航空公司八二四三號航班去年十二月廿五日在哈薩克墜毀事故。
不過投資研究公司D. A. Davidson分析師路里亞強調,DeepSeek(在聊天機器人研發競爭中有所)突破的重要意義,並不在於準確回答跟中國新聞有關的問題,而是在於其只以同類AI模型卅分之一的(研發)成本回答問題。
延伸閱讀
贊助廣告
商品推薦
udn討論區
共 0 則留言
規範
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言