1. Anthropic 發布 Claude Opus 4.7,前沿模型競爭再度白熱化
Anthropic 正式推出 Claude Opus 4.7,在 agentic coding、知識工作與文件推理等多項基準上超越 OpenAI GPT-5.4 與 Google Gemini 3.1 Pro,但領先幅度極小,顯示前沿模型競爭已進入毫釐之爭。最大升級是高解析度多模態支援,影像處理能力提升三倍,並新增自主驗證機制,可在回報前先自行檢查結果,降低長任務 hallucination 風險。
2. OpenAI 大更新 Codex,可自主操作 macOS 應用、內建瀏覽器與記憶系統
OpenAI 發布 Codex 重大更新,新增背景電腦操控能力,讓多個 AI agent 能在 macOS 上同時操作應用程式而不干擾使用者工作。同步推出內建瀏覽器、gpt-image-1.5 圖像生成、超過 90 個新外掛、SSH 遠端連線,以及可跨天持續運作的自動化排程。這代表 AI coding agent 正從輔助工具進化為可自主運作的開發工作台。
來源:OpenAI 官方公告
3. OpenAI 推出 GPT-Rosalind,首個專為生命科學打造的前沿推理模型
OpenAI 發表 GPT-Rosalind,以 Rosalind Franklin 命名,針對生物學、藥物開發與轉譯醫學最佳化。模型可支援化學反應機制、蛋白質工程、基因體學與實驗規劃等多步推理流程,並已與 Amgen、Moderna、Allen Institute、Thermo Fisher 等客戶合作。這代表前沿模型競爭開始延伸到垂直科研領域。
來源:OpenAI 官方公告