1️⃣ OpenAI 正式推出 ChatGPT Images 2.0,圖像生成首度整合推理能力
OpenAI 於 4 月 21 日發布 ChatGPT Images 2.0,搭載全新 gpt-image-2 模型,首度將 O 系列推理能力融入圖像生成。支援最高 2K 解析度,能精確渲染複雜文字、多語言排版、資訊圖表、UI 元件及品牌包裝,付費用戶立即可用,開發者 API 同步開放。推理圖像生成是里程碑:AI 不再只是「看圖說話」,而是「想清楚再畫」。
📌 來源:OpenAI 官方公告
2️⃣ OpenAI 重磅擴張 Codex:從程式助手變全能 AI 工作台
OpenAI 宣布 Codex「for almost everything」重大更新,將 Codex 從純程式助手擴展為全能 AI 工作台,新增電腦使用(可直接控制 Mac 桌面)、瀏覽器操作、記憶體管理、圖像生成及自動化工作流程。支援多代理並行、跨 repo 插件與安全沙盒,並宣布 Codex Labs 企業方案。這標誌 OpenAI 的「超級應用」策略正式成形。
📌 來源:OpenAI 官方公告
3️⃣ Google 推出 Deep Research 雙層自主研究代理,Deep Research Max 正確率達 93.3%
Google 於 4 月 21 日正式發布兩款由 Gemini 3.1 Pro 驅動的自主研究代理:Deep Research(速度版)與 Deep Research Max(深度版)。Max 在 DeepSearchQA 基準達 93.3%(前版 66.1%),Humanity’s Last Exam 達 54.6%,兩者均可同時搜索公開網頁與企業私有資料,已在 Gemini API 付費方案上線。
📌 來源:Google 官方部落格