1️⃣ Fable 5 奪冠 DeepSWE 程式碼基準——最佳模型仍遭美國政府停用
Datacurve 確認 Anthropic 的 Fable 5 在 DeepSWE 獨立程式碼基準測試中以 70% PASS@1 成績排名第一,領先 GPT-5.5 三個百分點。DeepSWE 聚焦真實軟體工程任務:修 bug、寫功能程式碼、在實際專案倉庫中完成任務。然而 Fable 5 已被美國商務部出口管制停用第八天,開發者被迫使用效能較差的替代方案。這項結果讓停權的經濟成本更具體——企業從 Fable 5 切換到 GPT-5.5 等於用了可量化的劣質工具。
🔗 來源:AI Tools Recap
📰媒體報導
2️⃣ Trump 首次回應 Fable 5 禁令稱「進展順利」,但官員暗指 Anthropic「魯莽」
Trump 在 G7 高峰會首次公開談論 Fable 5 出口管制禁令,稱與 Anthropic 的談判「going fine」。但 Fox Business 報導,一位資深官員將禁令歸因於 Anthropic 的「魯莽」——指控該公司在發布前未認真對待政府要求修復越獄問題的請求。這比過去任何官方聲明都更強硬,將爭議從「出口管制合規」重新定調為「企業不當行為」。信任問題比合規問題更難解決。
🔗 來源:AI Tools Recap / Fox Business
📰媒體報導
3️⃣ Google 將 Gemini 2.5 Flash 設為所有消費端預設模型
Google 將 Gemini 2.5 Flash 設為所有消費級 Gemini 產品的預設模型,取代 Gemini 2.5 Pro。Flash 定價僅 $0.30/百萬輸入 token,內建思考模式,具備 100 萬 token 上下文視窗。在 Anthropic Fable 5 停用之際,Google 趁勢將最具競爭力的日常模型推向 20 億以上 Gemini 用戶,企業開發者也有了 Fable 5 的有力替代方案。
🔗 來源:AI Tools Recap
📰媒體報導
4️⃣ The Atlantic 建立可搜尋的 AI 音樂訓練資料庫:1200 萬首曲目曝光
The Atlantic 記者 Alex Reisner 揭露四套用於訓練 AI 模型的音樂資料集並建立完全可搜尋的公開資料庫。其中兩套分別高達 1200 萬和 900 萬首曲目,另外兩套各超過 10 萬首。Google 和 Stability 均在研究論文中確認使用過相關資料集。這些資料被下載數千次,讓音樂產業版權爭議再添新柴。
🔗 來源:The Verge
📰媒體報導