選單 首頁 搜尋
東森財經新聞台 Apps
Play 商店 免費下載
下載
首頁財經新聞 > 全球 > OpenAI推新模型「像理化博士生」 數學奧林匹克答對率83%

OpenAI推新模型「像理化博士生」 數學奧林匹克答對率83%

2024/09/13 16:20
OpenAI推新模型「像理化博士生」 數學奧林匹克答對率83%

OpenAI表示,該公司開發了一系列新的AI模型OpenAI o1,即日起提供使用。這些模型能夠通過複雜的任務並解決比以往更難的問題,包括科學、程式和數學領域。

OpenAI在ChatGPT和API中推出了這個系列的第一個模型,該模型是預覽版本,OpenAI期望會有定期的更新和改進。OpenAI表示,他們訓練這些模型在回應之前花更多時間思考問題,類似於人類的思維過程。通過訓練,它們學會了精煉自己的思考過程,嘗試不同的策略並識別自己的錯誤。

★【理財達人秀】川普急轉彎 台股飆845點 底部翻多V轉股進場?美股財報亮點 抓反彈先鋒!★

在測試中,新登場的模型更新將在物理學、化學和生物學的任務中表現類似於博士生。我們還發現它在數學和編寫程式方面表現優異。在國際數學奧林匹克(IMO)的資格考試中,GPT-4o僅正確解決了13%的問題,而新的推理模型則達到了83%。它的城市能力在比賽中被評估達到Codeforces競賽的第89百分位。

作為一個早期模型,OpenAI o1-preview尚未具備ChatGPT所擁有的許多有用功能,例如網頁瀏覽和文件、圖像上傳。在許多常見情況下,GPT-4o在短期內會表現更優異。但對於複雜的推理任務,新模型展現全新高水準,表現出顯著進步,因此OpenAI將這個系列命名為OpenAI o1。

OpenAI表示,為了匹配這些模型的新能力,該公司加強了安全工作、內部治理和聯邦政府合作。這包括使用我們的準備框架進行嚴格的測試和評估,並由安全性委員會進行董事會級的審查過程。

OpenAI強調,該模型增強的推理能力對於處理科學、程式、數學等類似領域的複雜問題可能特別有用。例如,o1可以被醫療保健研究人員用來註釋細胞測序數據,物理學家用來生成量子光學所需的複雜數學公式,以及各領域的開發人員用來構建和執行多步驟工作流程。

(封面圖/翻攝自OpenAI官網/鏡週刊提供)

更多鏡週刊報導
【美總統辯論】泰勒絲表態挺賀錦麗!批川普AI造假 「抱貓照」酸爆范斯
時代雜誌公布「AI百大影響力人物」 魏哲家、黃仁勳、蘇姿丰上榜
工研院新科院士出爐! AI大咖輝達黃仁勳、超微蘇姿丰皆上榜

 

【往下看更多】
輝達進駐高雄亞灣!掀科技業南遷潮! AI慕光城 百億大案成焦點
財測不如預期+AI貢獻存疑 Adobe盤後大跌逾9%
傳基辛格找上美商務部長 抱怨美企「太過依賴台積電」

 

【熱門排行榜】
關稅戰影響! 58%勞工憂無薪假 3成企業認了「可能會縮編」
「476顆茶葉蛋」沒付錢! 陽明交大7-11不忍了:取消自助結帳
美債崩盤警告!連五週大逃殺 專家憂:不僅限於債市
Live 直播Live 直播
FB分享
字體變大
字體變小
加入Facebook粉絲團
訂閱Youtube頻道
收合
四月
一月
二月
三月
四月
五月
六月
七月
八月
九月
十月
十一月
十二月
2025
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
00:00
01:00
02:00
03:00
04:00
05:00
06:00
07:00
08:00
09:00
10:00
11:00
12:00
13:00
14:00
15:00
16:00
17:00
18:00
19:00
20:00
21:00
22:00
23:00