OpenAI 推出第一系列推理模型:o1 Launch

OpenAI 推出第一系列推理模型:o1 Launch

在圍繞 OpenAI 預期的草莓計畫發布的熱議中,該公司推出了其最新模型 OpenAI o1。雖然沒有正式命名為“Strawberry”,但該版本具有先進的推理功能,引發了許多猜測。

除了 OpenAI o1 之外,還有一個更實惠的版本,稱為 OpenAI o1 mini。此舉延續了 OpenAI 在推出 GPT-4o mini 後發布更小模型以更好地支援開發人員的趨勢。

o1 這個名字意味著一個全新的開始,重置了先前型號中變得有些複雜的命名系統。

值得注意的是,與現有模型相比,o1 的營運成本更高,反應時間也更慢。然而,當前版本只是反映其早期開發階段的「預覽版」。

OpenAI o1 與 GPT 模型明顯不同,它擁有獨特的訓練方法,採用了新的最佳化演算法和資料集。

這種創新模型擅長透過增強推理來解決科學、編碼和數學等領域的複雜問題。 OpenAI o1 利用強化學習來解決問題,並結合獎勵和懲罰機制。與先前主要預測下一個單字的模型不同,o1 整合了「思維鏈」提示,可以有效地回應查詢。這一進步標誌著實現類人智能的重要一步,從而提高了準確性並減少了幻覺的傾向(儘管它仍然容易出現偶爾的不準確)。

當出現提示時,o1 將闡明其思考過程,與早期模型相比,展現推理能力的顯著改進。例如,o1 在國際數學奧林匹克 (IMO) 上取得了令人印象深刻的 83% 分數,而 GPT-4o 僅獲得了 13%。

儘管它能夠推理和分享其思考過程,但思考時間受到限制。使用者可能會收到類似這樣的提示:「哦,我的時間不多了;讓我盡快得到答案”,據 The Verge 報導。

雖然 o1 擅長解決需要廣泛常識的複雜問題,但 o1 mini 更適合不需要廣泛了解常識的編碼、數學和科學任務。此外,o1 mini 的價格明顯更實惠,比 o1 便宜近 80%。

目前,o1 缺乏 GPT-4o 中的功能,例如互聯網瀏覽或接受文件/圖像作為輸入,儘管 OpenAI 正在積極努力整合這些功能。 o1 模型專為需要解決複雜問題的使用者而設計,包括醫療保健研究人員、物理學家、經濟學家和軟體開發人員。

誰可以存取該模型?從今天開始,ChatGPT Plus 和 Team 用戶可以存取 o1-preview 和 o1-mini。教育和企業用戶將於下週獲得訪問權限。 ChatGPT 免費方案的用戶將無法立即訪問,但 OpenAI 的目標是在未來為免費用戶提供 o1-mini 訪問權限。

兩種型號的 o1 和 o1-mini 的使用限制分別為每週 30 條訊息和 50 條,並計劃在未來增加這些限制。

從定價上來說,o1的API比較貴; o1-preview 每百萬輸入代幣的成本為 15 美元,每百萬輸出代幣的成本為 60 美元。相比之下,GPT-4o 每百萬輸入代幣的成本為 5 美元,每百萬輸出代幣的成本為 15 美元。

如何存取模型?使用者可以從 ChatGPT 選單在 o1 和 o1-mini 之間切換。 OpenAI 未來也致力於根據使用者提示自動選擇模型。

來源:OpenAI

o1 和 o1-mini 的推出凸顯了 OpenAI 對創新的承諾,使其在競爭對手中脫穎而出。如果該模型能夠成功執行複雜的推理任務,則可能代表通用人工智慧(AGI)的重大進步。然而,一些初步回饋表明 o1 可能難以完成基本的推理任務。

新的 O1 在ChatGPT
中的 u/knowledgehacker 的瑣碎問題上仍然慘敗

隨著 OpenAI 繼續開發 o1 系列,使用者仍希望未來的更新能增強該模型的效能。此外,OpenAI 計劃繼續推出 GPT 系列中的新模型,讓人們對潛在的 GPT-5 保持期待。

來源

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *