[新聞] AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini

看板Stock作者 (sam20135)時間1天前 (2024/12/21 15:10), 編輯推噓35(5318191)
留言262則, 33人參與, 12小時前最新討論串1/1
https://news.cnyes.com/news/id/5815798 AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini 鉅亨網編譯陳又嘉 OpenAI 周五 (20 日) 宣布,目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉 顯示 AI 產業競爭日益激烈,包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處 理複雜問題的更先進模型。 OpenAI 執行長 Sam Altman 表示,公司計劃在 1 月底推出 o3 mini 模型,隨後推出完 整版本的 o3 模型。這些規模更大、更健全的語言模型預計將超越現有模型,有望吸引新 的投資與用戶。 根據 OpenAI 一篇部落格文章,該公司於 9 月推出的 o1 模型已展示出解決科學、程式 編碼與數學等複雜任務的能力。即將推出的 o3 和 o3 mini 模型目前正在進行內部安全 測試,其能力表現預計將遠超過 o1 模型。 為了讓外部研究人員參與測試過程,OpenAI 啟動了申請程序,開放有興趣的人在公開發 布前測試 o3 模型。這項申請程序將於 1 月 10 日截止。 自 2022 年 11 月推出 ChatGPT 以來,OpenAI 已成為 AI 產業的關鍵企業,引發了一場 可稱為 AI 軍備競賽的浪潮。該公司憑藉日益增長的知名度及持續推出產品,已成功吸引 了大量資金,在 10 月完成了 66 億美元的融資。 OpenAI 在 AI 領域的主要競爭對手、Alphabet 旗下的 Google,則於 12 月初推出了其 第二代 AI 模型 Gemini,盼藉此重返在 AI 科技競賽中的領先地位。 ----------------------------------------------------------------------------- 1月底將推出 o3 mini,競爭越來越激烈了,又有突破性發展。 AGI「通用人工智能」(artificial general intelligence), 看來達到人類基本水平不遠了。 https://today.line.me/hk/v2/article/BEWYRqj 這裡有進一步數據解說 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.212.34 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1734765005.A.31F.html

12/21 15:25, 1天前 , 1F
人類剩幾集?
12/21 15:25, 1F

12/21 15:26, 1天前 , 2F
圖表85%AGI覺得蠻胡蘭的
12/21 15:26, 2F

12/21 15:27, 1天前 , 3F
感覺2026就是新時代了
12/21 15:27, 3F

12/21 15:30, 1天前 , 4F
一臉正經的胡說八道
12/21 15:30, 4F

12/21 15:42, 1天前 , 5F
其實重點在於 Google 已經全面追上 OpenAI 了
12/21 15:42, 5F

12/21 15:48, 1天前 , 6F
文字描述生成影片技術 Veo 2 > Sora
12/21 15:48, 6F

12/21 15:50, 1天前 , 7F
到底什麼時候才能搞好圖表
12/21 15:50, 7F

12/21 15:50, 1天前 , 8F
GPT分析圖表都在鬼扯
12/21 15:50, 8F

12/21 16:07, 1天前 , 9F
嗚嗚,難怪昨天GG 掛190撿不到
12/21 16:07, 9F

12/21 16:16, 1天前 , 10F
200美金一個月 下次2000美金一個月 賽博窮人用不起
12/21 16:16, 10F

12/21 16:28, 1天前 , 11F
推 傳統科技業人才遲早會被人工智能的大浪淹沒
12/21 16:28, 11F

12/21 16:30, 1天前 , 12F
google有人力財源和資料支持,奧特曼人才都跑了
12/21 16:30, 12F

12/21 17:06, 1天前 , 13F
o@呢
12/21 17:06, 13F

12/21 17:06, 1天前 , 14F
o2
12/21 17:06, 14F

12/21 17:06, 1天前 , 15F
沒救了 Google花不到一年時間就已經實現全面超越 而
12/21 17:06, 15F

12/21 17:06, 1天前 , 16F
且發展方向更廣
12/21 17:06, 16F

12/21 17:18, 23小時前 , 17F
實際體感測試o1跟gemini 2.0 後者還是遠遠輸啊
12/21 17:18, 17F

12/21 17:18, 23小時前 , 18F
不管是回應品質還是正確度 都不行 Claude還比較好
12/21 17:18, 18F

12/21 17:23, 23小時前 , 19F
GPT5.0呢
12/21 17:23, 19F

12/21 17:26, 23小時前 , 20F
GG本益比還不到30真滴便宜
12/21 17:26, 20F

12/21 17:26, 23小時前 , 21F
GOOG
12/21 17:26, 21F

12/21 17:34, 23小時前 , 22F
難道沒有人覺得AI連數學都會算錯有點不聰明嗎… 只
12/21 17:34, 22F

12/21 17:34, 23小時前 , 23F
是內建計算機的事情而已
12/21 17:34, 23F

12/21 17:35, 23小時前 , 24F
雖然這跟AI背後的演算法完全無關 但很多日常AI應用
12/21 17:35, 24F

12/21 17:35, 23小時前 , 25F
場景都需要精確的數學吧
12/21 17:35, 25F

12/21 17:40, 23小時前 , 26F
很多人都不看O3展示就高談闊論
12/21 17:40, 26F

12/21 17:43, 23小時前 , 27F
O3已經是博士級系統還沒有開放,坐中間的工程師說下
12/21 17:43, 27F

12/21 17:43, 23小時前 , 28F
一步就是做自我修改程式自我進化,奧圖曼嚇到立馬說
12/21 17:43, 28F

12/21 17:43, 23小時前 , 29F
不會那麼做
12/21 17:43, 29F

12/21 17:45, 23小時前 , 30F
表示自我進化就是臨門一腳,二十四小時自我評測自我
12/21 17:45, 30F

12/21 17:45, 23小時前 , 31F
進化要怎麼輸給人類
12/21 17:45, 31F

12/21 17:46, 23小時前 , 32F
六月鴨子不知死活
12/21 17:46, 32F

12/21 17:48, 23小時前 , 33F
坐中間的工程師奧數滿分編碼競賽在人類記錄2500多分
12/21 17:48, 33F

12/21 17:48, 23小時前 , 34F
,這裡一堆人在嗆OpenAI??
12/21 17:48, 34F

12/21 17:52, 23小時前 , 35F
他說Illya3000分,天才啊
12/21 17:52, 35F

12/21 17:54, 23小時前 , 36F
樓上你在說啥= =
12/21 17:54, 36F

12/21 18:00, 23小時前 , 37F
看 sora 就知道這間公司不行了
12/21 18:00, 37F

12/21 18:13, 22小時前 , 38F
他在說OPENAI那片的內容 O3的寫程式分數已經贏中間
12/21 18:13, 38F

12/21 18:13, 22小時前 , 39F
那位穿白衣介紹的 只比首席工程師低一點
12/21 18:13, 39F
還有 183 則推文
12/21 23:16, 17小時前 , 223F
o1在Arc的測試在OPENAI提供的圖 是落在25-32%正確率
12/21 23:16, 223F

12/21 23:16, 17小時前 , 224F
區間 但從那個只貼圖沒有指示的結果看來有點懷疑
12/21 23:16, 224F

12/21 23:22, 17小時前 , 225F
所以 OpenAI 還是無法正確解答啊!而且原檔是 pdf -
12/21 23:22, 225F

12/21 23:22, 17小時前 , 226F
- 這讓 OpenAI 跳過了分辨哪部分內容是文字/符號,
12/21 23:22, 226F

12/21 23:22, 17小時前 , 227F
哪部分內容是幾乎圖案的重大挑戰耶
12/21 23:22, 227F

12/21 23:25, 17小時前 , 228F
這難度和直接請 AI 用鏡頭看題目並先能正確切割出
12/21 23:25, 228F

12/21 23:25, 17小時前 , 229F
文字敘述、符號數字、幾何圖案(並理解各種幾何特徵)
12/21 23:25, 229F

12/21 23:25, 17小時前 , 230F
相差很遠耶!
12/21 23:25, 230F

12/21 23:52, 17小時前 , 231F
從1:29:20-1:34:00
12/21 23:52, 231F

12/21 23:52, 17小時前 , 232F
他用手機鏡頭去辨識比較難的數學題 看起來影像辨識
12/21 23:52, 232F

12/21 23:53, 17小時前 , 233F
在拆特殊符號時候會認不到
12/21 23:53, 233F

12/21 23:56, 17小時前 , 234F
前面到底在爭執agi的定義完全不需要,只要能提升人
12/21 23:56, 234F

12/21 23:56, 17小時前 , 235F
類能力上限就夠了,人作為意識源,AI作為能力放大
12/21 23:56, 235F

12/21 23:56, 17小時前 , 236F
器。
12/21 23:56, 236F

12/22 00:06, 17小時前 , 237F
要被淘汰了吧 都快2025還在生成一些玩具幹什麼
12/22 00:06, 237F

12/22 00:10, 16小時前 , 238F
我在猜那些讓 o3 解答的數學題目是不是都先改寫成 L
12/22 00:10, 238F

12/22 00:10, 16小時前 , 239F
aTeX 格式,包括題目裏所有的圖表和幾何圖案?因為
12/22 00:10, 239F

12/22 00:10, 16小時前 , 240F
這是現今生成式 AI 最方便理解的格式
12/22 00:10, 240F

12/22 00:13, 16小時前 , 241F
不過拋開某些____無謂又無聊的 AGI 執著,OpenAI o3
12/22 00:13, 241F

12/22 00:13, 16小時前 , 242F
在解答數學和程式編寫上的進步讓人印象很深刻
12/22 00:13, 242F

12/22 00:14, 16小時前 , 243F
@tsubasawolfy:感謝你一直提供具參考價值的影片
12/22 00:14, 243F

12/22 00:16, 16小時前 , 244F
還好我過幾年就打算退休了,生成式 AI 這兩年進步得
12/22 00:16, 244F

12/22 00:16, 16小時前 , 245F
讓人瞠目結舌
12/22 00:16, 245F

12/22 00:53, 16小時前 , 246F
訓練超級耗電
12/22 00:53, 246F

12/22 01:29, 15小時前 , 247F
全台灣現下只有3個id 能在codecforces 拿到
12/22 01:29, 247F

12/22 01:29, 15小時前 , 248F
rating 2700, o3有2727金變態
12/22 01:29, 248F

12/22 01:51, 15小時前 , 249F
12/22 01:51, 249F

12/22 01:52, 15小時前 , 250F
之前openai本來就沒領先很多 所以之前內鬥才白癡啊
12/22 01:52, 250F

12/22 01:52, 15小時前 , 251F
他強的就是邏輯能力但是你叫他寫東西出來就是沒有
12/22 01:52, 251F

12/22 01:52, 15小時前 , 252F
好作品
12/22 01:52, 252F

12/22 01:53, 15小時前 , 253F
跟你說他們根本就是一個熔爐而已
12/22 01:53, 253F

12/22 01:53, 15小時前 , 254F
之前假道德擔心自家可能開發出危險的AI 但卻忘了
12/22 01:53, 254F

12/22 01:53, 15小時前 , 255F
自己並沒有領先Meta和google多少 這發展很正常
12/22 01:53, 255F

12/22 01:56, 15小時前 , 256F
因為台灣從來沒看過這東西所以覺得很新奇
12/22 01:56, 256F

12/22 01:58, 15小時前 , 257F

12/22 01:58, 15小時前 , 258F
不知道你們有沒有看過這個
12/22 01:58, 258F

12/22 01:59, 15小時前 , 259F
洋玩意
12/22 01:59, 259F

12/22 02:00, 15小時前 , 260F
後面代表的是西方的聖火
12/22 02:00, 260F

12/22 02:01, 15小時前 , 261F
每幾百年就會來侵襲一次
12/22 02:01, 261F

12/22 04:45, 12小時前 , 262F
文章代碼(AID): #1dPcdDCV (Stock)