1️⃣ OpenAI Codex 打造自我改善稅務 AI:六週內準確率從 25% 飆升至 86%
OpenAI 與 Thrive Holdings 合作,使用 Codex 為會計師事務所 Crete 開發「Tax AI」系統。系統透過三支柱實現自我改善:從業人員回饋、生產追蹤紀錄、以及 Codex 驅動的迭代迴圈。本報稅季已處理超過 7,000 份報稅單,為從業人員節省約三分之一的準備時間,產出準確率高達 97%。最引人注目的是自我改善速度:上線時僅 25% 報稅單達 75% 欄位正確率,六週後飆升至 86%。這是 AI 代理從實驗室走向真實生產環境、並在部署後持續進化的罕見實例。
🔗 來源:OpenAI 官方部落格
📰 OpenAI Blog
2️⃣ KPMG 全面部署 Claude 給 276,000 名員工,Big Four AI 競賽進入白熱化
KPMG 宣布將 Anthropic 的 Claude 嵌入旗下數位平台 KPMG Digital Gateway,供全球 138 個國家的 276,000 名員工使用。首波鎖定稅務與法律部門,目標九月完成全面部署。Anthropic 同時指定 KPMG 為私募股權領域首選合作夥伴,雙方將共同開發 Claude 驅動產品。加上 Deloitte(47 萬員工)與 PwC 的擴大合作,三大事務所合計讓 Anthropic 直接觸及超過 100 萬名專業服務工作者,這比基準測試排名更能形成持久護城河。
🔗 來源:AI Tools Recap / Anthropic
📰 AI Tools Recap
3️⃣ Gartner 評選 OpenAI 為企業 AI 編碼代理領導者,Codex 週用量突破 400 萬人
Gartner 發布 2026 企業 AI 編碼代理 Magic Quadrant,將 OpenAI 評為「領導者」。報告肯定 Codex 在代理式軟體開發、企業治理、沙箱隔離和靈活部署方面的優勢。Codex 週活躍用戶已突破 400 萬,客戶涵蓋 Cisco、Datadog、Dell、NVIDIA 等。Cisco 更使用 Codex 開發其 AI Defense 安全平台的大部分功能,將交付時間從數季壓縮至數週。GPT-5.5 發布後,Codex 能力進一步提升,OpenAI 同時推出兩個月免費試用促銷搶攻企業市場。
🔗 來源:OpenAI 官方部落格
📰 OpenAI Blog