1️⃣ OpenAI 發表首款自研 AI 推論晶片「Jalapeño」,與 Broadcom 合作開發
OpenAI 與 Broadcom 共同發表首款客製化 AI 加速器「Jalapeño」,專為 LLM 推論設計,非通用 GPU。據報推論成本降低約 50%,從設計到量產僅花九個月——OpenAI 自家模型加速了晶片設計流程。初期測試已在跑 GPT-5.3-Codex-Spark,預計年底前部署至資料中心。這標誌著 OpenAI 從模型到基礎設施的「全端」策略升級。
🔗 來源:OpenAI 官方公告
2️⃣ Mistral 推出 OCR 4:文件辨識進入「結構化語意地圖」時代
Mistral AI 發布第四代 OCR 模型,不再只是把文件轉成純文字,而是回傳帶有邊界框、區塊分類和逐字信心分數的結構化表示。支援 170 種語言、可部署在單一容器上(適合有資料主權需求的企業),獨立評測者在 72% 的比較中偏好 Mistral 的輸出。定價每千頁 4 美元,批次 API 降至 2 美元。
🔗 來源:Mistral AI 官方公告
3️⃣ Liquid AI 發布 2.3 億參數超小模型 LFM2.5-230M,手機和樹莓派都能跑
Liquid AI 發布僅 230M 參數的基礎模型,在資料提取任務上擊敗 4 倍大的模型。Samsung Galaxy S25 Ultra 上解碼速度達 213 tokens/sec,樹莓派 5 上也有 42 tokens/sec。團隊還展示了部署在人形機器人 Unitree G1 上、完全 on-device 的自然語言技能選擇層。年收入 1000 萬美元以下免費使用。
🔗 來源:Liquid AI 官方部落格
4️⃣ 阿里巴巴 Qwen 團隊發表 Qwen-AgentWorld:用「世界模型」訓練 AI 代理
阿里巴巴 Qwen 團隊推出 Qwen-AgentWorld,不訓練代理「怎麼做」,而是訓練模型「預測環境會回傳什麼」。涵蓋 MCP、搜尋、終端機、軟體工程、Android、Web、OS 七大領域於單一架構。在模擬器中訓練的代理,表現超越在真實環境訓練的代理,證明「世界模型」是通用代理的關鍵缺失環節。
🔗 來源:VentureBeat 報導