快訊

母親節假期防劇烈天氣吳德榮：下周一轉晴熱、520再有梅雨鋒侵擾台灣 06:07

連2震！清晨5時27分南投竹山規模4.3地震最大震度4級 05:32

聽新聞

0:00 / 0:00

閱讀數學／聳立在AI面前的數學高牆（下）

2025-05-09 14:30 聯合新聞網／賴以威（數感實驗室）

閱讀數學

AI示意圖。圖／AI生成

上週我們介紹了針對AI設計的數學題庫FrontierMath。許多數學家對FrontierMath 的評價非常高，包括了前面提到的陶哲軒。他就認為FrontierMath 中的題目「極具挑戰」，即使是該領域的數學家，也需要花費大量的時間和精力才能解決這些問題。有趣的是，除了專家親自出馬，陶哲軒指出的另一條路就是人機協作：讓相關領域的研究生與AI 系統合作。他評估在某些問題上，與目前的 AI協作解題，會比數學家花上多5倍左右的時間成本。然而，很有可能在未來幾年內，就可以下降到差不多的速度。然後，進展得好像比陶哲軒想得更快。不用人機協作，GPT-o3獨立解完了25% FrontierMath題目了。

不過，雖然GPT-o展現出語言模型前所未有的數學解題能力。但這不代表數學之壁要被攻破了。首先，FrontierMath 的設計目標是評估 AI 模型，因此題庫多是有可自動驗證的問題，例如算出一組答案或可以用軟體驗證。然而，數學研究中很大一部分工作涉及到撰寫證明和開放探索，這些方面是FrontierMath 無法反應的。

其次，雖然現在的FrontierMath一題就算會耗掉專家好幾小時、好幾天的心力。但許多數學研究更是需要數月、甚至數年的持續探索。費馬定理就是一個最好的例子，數學家們世代接力，花了300年才證明。最後一棒的懷爾斯曾這麼訴說他的心境：

「或許，我能給出關於我研究數學的歷程最貼切的描述，就是進入一棟大房子。當一個人開始探索第一個全黑的房間時，裡頭一片漆黑，他會在家具中邊跌倒邊摸索。漸漸地知道家具的位置。六個月後，你會找到開關並且打開燈。開燈的那一瞬間，整個房間被光線壟罩，你終於，能清楚地看見你站在哪裡。」

數學研究與解FrontierMath難題，兩者在「深度」上還是有很大的差異。

【文教熱話題】

▪ 整理包／114國中教育會考衝刺倒數！考試規定各科備考重點一把抓
 ▪ 「南京出生」申請國防醫遭取消資格師大附中生難接受：從未有陸籍
 ▪ 清大師出作業「宣傳大罷免」佔總成績30% 學生怒喊慎選：退到剩6人
 ▪ 教學風格大不同！陸生因老師1舉動受寵若驚陸網稱羨：在台念書好幸福
 ▪ 能考上第一志願全靠「天賦」？網看法兩極：上台大沒那麼難
 ▪ 擋不住聲浪！接連3起憾事後稱要回任行政板橋某國中校長提前離開

AI 數感實驗室閱讀數學

賴以威（數感實驗室）

追蹤

相關新聞

時事新聞／「麻疹」來襲別讓恐慌蔓延！

近期國內「麻疹」疫情寫下5年新高，臺灣中部某醫院於今年(2025年)1月發生麻疹群聚事件，包含越南入境的指標個案以及其造成的同班機旅客感染，…

2025-05-09 14:30

閱讀數學／聳立在AI面前的數學高牆（下）

上週我們介紹了針對AI設計的數學題庫FrontierMath。許多數學家對FrontierMath 的評價非常高，包括了前面提到的陶哲軒。他就認為FrontierMath 中的題目「極具挑戰」…

2025-05-09 14:30

時事新聞／從福島看見核污染的健康課題

近年來，隨著日本福島第一核電廠自2023年起開始排放核廢水，全球對核污染議題的關注迅速升溫。這不僅是一場環境危機，更是一場關乎健康的警訊…

2025-05-08 14:30

宋怡慧／萬物奏響立夏之韻！看古人從「小」捕捉初夏生機喚起對生活的熱愛

古人云：「孟夏之日，天地始交，萬物並秀。」初夏的翠綠閃爍著生機的微光，薔薇迎風綻放，幽香氤氳在立夏獨有的溫潤氣息之中。記得馬塞爾·普魯斯特（Marcel Proust）曾說：「生命只是一連串孤立的片刻‵…

2025-05-08 11:25

新聞中的公民與社會／大阪世博熱鬧開幕對日本帶來何種效果？

2025年世界博覽會昨天上午在日本大阪市的夢洲會場開幕，展期至10月13日。開幕前會場就出現排隊人潮，估計首日進場人數將超過14萬人。然而，預售票銷量僅達目標的6成…

2025-05-08 11:00

圖表看時事／台幣狂升抓緊機會換日幣！川普關稅衝擊圖解匯率、油價變化

台幣暴力升值，昨盤中升至廿九元價位，面對台幣的「升值之亂」，中央銀行總裁楊金龍昨舉行記者會對市場信心喊話，他表示，央行調...

2025-05-08 08:20

商品推薦

FB留言

udn討論區

共 0 則留言

規範

發布

張貼文章或下標籤，不得有違法或侵害他人權益之言論，違者應自負法律責任。
對於明知不實或過度情緒謾罵之言論，經網友檢舉或本網站發現，聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者，請勿張貼文章。
對於無意義、與本文無關、明知不實、謾罵之標籤，聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者，請勿下標籤。
凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利，聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者，請勿張貼文章。