🤖 AI 日報 #2/10 — 2026-04-17(10:00)

1️⃣ Anthropic 發布 Claude Opus 4.7,在 agentic 編碼與知識工作基準測試上險勝對手

Anthropic 正式發布 Claude Opus 4.7,在 SWE-bench Pro 達到 64.3% 解決率(前代 53.4%),知識工作 GDPVal-AA 以 Elo 1753 超越 GPT-5.4 的 1674 與 Gemini 3.1 Pro 的 1314。新模型支援高解析度圖像(最高 3.75 百萬像素),視覺推理測試從 54.5% 躍升至 98.5%,並新增「effort」參數與 task budget 控制推理成本。API 定價維持 $5/$25 per million tokens 不變,已在 Bedrock、Vertex AI、Microsoft Foundry 上線。前沿模型競爭已進入「差之毫釐」的階段,Opus 4.7 與 GPT-5.4 在可比基準上僅 7:4 的差距,誰能先在 agentic 可靠性與成本控制上做出差異化,誰就能搶下企業生產環境的訂單。

🔗 來源:AnthropicVentureBeat

2️⃣ Google 據報與五角大廈談判,擬讓 Gemini 進入機密環境部署

據 The Information 報導,Google 正與美國國防部談判,擬將 Gemini AI 模型擴展至機密環境使用,合約條款疑似沿用 OpenAI 與五角大廈協議中的「any lawful use」措辭。Google 現有合約僅允許 DOD 在非機密環境使用 Gemini。此舉代表 Google 正明顯逆轉過往對軍事合作的路線,同時也意味著「all lawful use」這類模糊法律語言正成為前沿 AI 公司與軍方合作的標準模板,實質上難以排除大規模監控或自主武器應用。

🔗 來源:The VergeThe Information

3️⃣ 白宮據報正準備讓聯邦機構使用 Anthropic 限制級 Mythos 模型

Bloomberg 報導,白宮管理與預算辦公室(OMB)的 CIO 已通知政府官員,正準備讓各聯邦機構使用 Anthropic 的資安專用模型 Mythos。儘管 Anthropic 目前與五角大廈的紅線爭議仍在持續,白宮卻同時推進 Mythos 在聯邦政府的導入。這反映出一個矛盾:政策層面對 AI 軍事應用的分歧,與行政部門對最強模型實際需求之間的拉扯。Mythos 此前僅限於少數企業夥伴使用(包含 Nvidia、Apple、JPMorgan),若聯邦機構全面導入,將是限制級模型首次大規模進入政府體系。

🔗 來源:BloombergThe Verge