1️⃣ OpenAI 發布 ChatGPT Images 2.0:支援多語言文字、資訊圖表、漫畫,推理能力首次導入圖像生成
OpenAI 正式推出 ChatGPT Images 2.0(gpt-image-2 模型),整合 O 系列推理能力,可生成包含長段落多語言文字、完整資訊圖表、簡報、地圖甚至漫畫的圖像。使用者上傳圖片後也可進行編輯與延伸生成。模型即日起在所有 ChatGPT 方案上線,舊版 GPT-Image-1.5 同步停用為預設。安全方面,OpenAI 強調持續標記 AI 生成中繼資料,並對政治與選舉干擾加強防護。
🔗 來源:VentureBeat
2️⃣ Google Gemini 首度氣隙部署:完整模型跑在斷網伺服器,拔電即銷毀
Cirrascale 與 Google Cloud 合作,推出全球首個 Gemini 完整模型氣隙式(air-gapped)部署方案。企業和政府機關可在 Dell 製造、Google 認證的硬體設備(8 顆 Nvidia GPU)上,於自有設施中離線運行 Gemini,資料完全不出外部。模型僅存於揮發性記憶體,斷電即消失,搭配機密運算防篡改機制。產品即日起預覽,預計 6-7 月正式上線。
🔗 來源:VentureBeat
3️⃣ Moonshot AI 開源 Kimi K2.6:代理可連續執行數天,管理 300 個子代理同步協作
中國新創 Moonshot AI 發布開源模型 Kimi K2.6,主打長時間自主執行能力。官方展示中,代理曾連續運作五天處理監控與事件應對,Agent Swarms 架構可管理 300 個子代理、4000 個協調步驟。在 Terminal-Bench 2.0、SWE-Bench Pro 等編碼基準測試中表現突出。模型已上架 Hugging Face、Kimi.com 及 API 平台,為企業級長時代理編排挑戰提供開源方案。
🔗 來源:VentureBeat