OpenAI推新模型「像理化博士生」 數學奧林匹克答對率83%

2024/09/13 16:20
OpenAI推新模型「像理化博士生」 數學奧林匹克答對率83%

OpenAI表示,該公司開發了一系列新的AI模型OpenAI o1,即日起提供使用。這些模型能夠通過複雜的任務並解決比以往更難的問題,包括科學、程式和數學領域。

OpenAI在ChatGPT和API中推出了這個系列的第一個模型,該模型是預覽版本,OpenAI期望會有定期的更新和改進。OpenAI表示,他們訓練這些模型在回應之前花更多時間思考問題,類似於人類的思維過程。通過訓練,它們學會了精煉自己的思考過程,嘗試不同的策略並識別自己的錯誤。

★【理財達人秀】台股中小股衝 套牢對策! 鴻海釀反彈 網通轉大人?

在測試中,新登場的模型更新將在物理學、化學和生物學的任務中表現類似於博士生。我們還發現它在數學和編寫程式方面表現優異。在國際數學奧林匹克(IMO)的資格考試中,GPT-4o僅正確解決了13%的問題,而新的推理模型則達到了83%。它的城市能力在比賽中被評估達到Codeforces競賽的第89百分位。

作為一個早期模型,OpenAI o1-preview尚未具備ChatGPT所擁有的許多有用功能,例如網頁瀏覽和文件、圖像上傳。在許多常見情況下,GPT-4o在短期內會表現更優異。但對於複雜的推理任務,新模型展現全新高水準,表現出顯著進步,因此OpenAI將這個系列命名為OpenAI o1。

OpenAI表示,為了匹配這些模型的新能力,該公司加強了安全工作、內部治理和聯邦政府合作。這包括使用我們的準備框架進行嚴格的測試和評估,並由安全性委員會進行董事會級的審查過程。

OpenAI強調,該模型增強的推理能力對於處理科學、程式、數學等類似領域的複雜問題可能特別有用。例如,o1可以被醫療保健研究人員用來註釋細胞測序數據,物理學家用來生成量子光學所需的複雜數學公式,以及各領域的開發人員用來構建和執行多步驟工作流程。

(封面圖/翻攝自OpenAI官網/鏡週刊提供)

更多鏡週刊報導
【美總統辯論】泰勒絲表態挺賀錦麗!批川普AI造假 「抱貓照」酸爆范斯
時代雜誌公布「AI百大影響力人物」 魏哲家、黃仁勳、蘇姿丰上榜
工研院新科院士出爐! AI大咖輝達黃仁勳、超微蘇姿丰皆上榜

 

【往下看更多】
輝達進駐高雄亞灣!掀科技業南遷潮! AI慕光城 百億大案成焦點
財測不如預期+AI貢獻存疑 Adobe盤後大跌逾9%
傳基辛格找上美商務部長 抱怨美企「太過依賴台積電」

 

【熱門排行榜】
台中甜點老闆夫妻走絕路 友人曝生前埋頭流淚:賣車賣房都還不了
免大學學歷!「1工作」超搶手 年薪破300萬
興建中的生鮮倉儲場釀火警!全聯回應了