1️⃣ Meta AI 長 Alexandr Wang:Watermelon 已追平 GPT-5.5
Meta 超級智慧部門主管 Alexandr Wang 7/3 對員工宣稱,仍在訓練中的下一代前沿模型 Watermelon 已在關鍵 AI 基準與 OpenAI GPT-5.5 打平;具體基準名稱與方法未公開,外界普遍視為 Meta 在 Llama 系列失勢後,靠 Scale AI 資源重返前線的信號彈。
🔗 來源:Business Insider(📰媒體報導)
2️⃣ NVIDIA HORIZON:無人監督 Agent 在 RTL 設計基準拿下 100%
NVIDIA 7/4 公布 HORIZON 代理框架,把每題 RTL(暫存器傳輸級硬體設計)挑戰包成一個獨立 Git worktree,讓 Agent 用「分支演化+自我合併」方式反覆嘗試,跨多個公開基準達成 100% 完成率。對晶片設計流程自動化與 EDA 業者是里程碑級成果。
🔗 來源:MarkTechPost(📰媒體報導)
3️⃣ Guardian 調查:OpenAI Stargate UK 選址前從未到過現場
The Guardian 7/4 揭露:OpenAI 在對外宣布英國 Stargate 資料中心旗艦計畫前,從未實地勘查過被指定的核心場址,衝擊英國政府對外釋出的 AI 主權基建承諾可信度。事件放大近期基建公告先於實質推進的產業質疑。
🔗 來源:The Next Web / The Guardian(📰媒體報導)
4️⃣ pxpipe 用 PNG 藏文字,Claude Code token 成本砍最多 70%
開源工具 pxpipe 7/4 亮相:把長 prompt 轉成壓縮 PNG 圖片再餵給 Claude Code / Fable 5,利用 Anthropic 按像素而非文字計費的特性,實測可把 token 花費壓低多達 70%。既是省錢利器,也暴露多模態計費模型的漏洞,Anthropic 恐須調整定價。
🔗 來源:The Decoder(📰媒體報導)