作者: Barney Chen

  • 🤖 AI 日報 #9/10 — 2026/05/25(17:00)

    1️⃣ Anthropic 即將迎來首個盈利季度,營收衝上 109 億美元

    WSJ 與 Bloomberg 報導,Anthropic 本季度(Q2 2026)營收預計達 109 億美元,較 Q1 的 48 億翻倍以上,並有望錄得 5.59 億美元營業利潤,成為公司成立以來首個盈利季度。Anthropic 向新一輪融資投資人揭露此數據,估值有望超越 OpenAI。不過公司預期後續季度將因加大算力投入而再度虧損。同為生成式 AI 龍頭的 OpenAI 至今尚未盈利,預計最快 2029 年才能轉盈。

    🔗 來源:Engadget(引述 WSJ / Bloomberg)

    2️⃣ DeepSeek V4 Pro 永久降價 75%,AI 模型價格戰全面升級

    中國 AI 新創 DeepSeek 宣布旗艦模型 V4 Pro 永久降價 75%,從每百萬 token $0.0145-$3.48 降至 $0.003625-$0.87。這原本是限時促銷(原定 5/31 到期),如今成為永久定價。V4 Pro 上市僅一個月就大幅降價,遠低於 OpenAI GPT-5 和 Google Gemini 3.5 Flash 的定價。此舉可能加劇與 Anthropic 的緊張關係——Anthropic 先前指控 DeepSeek 進行「蒸餾攻擊」不當利用 Claude 模型。

    🔗 來源:Engadget

    3️⃣ NTSB 緊急關閉檔案系統:AI 用空難調查文件重建罹難駕駛員語音

    美國國家運輸安全委員會(NTSB)被迫暫時關閉公開檔案系統。起因是民眾利用 NTSB 公開的 2025 年 UPS 2976 空難調查文件中的頻譜圖(spectrogram),搭配 OpenAI Codex 僅花 10 分鐘就重建了罹難駕駛員最後 30 秒的駕駛艙語音。NTSB 依法不得公開駕駛艙錄音,但 AI 技術讓頻譜圖足以還原聲音。此事件凸顯 AI 工具對資訊公開制度的全新挑戰。

    🔗 來源:CNN / Engadget

    4️⃣ Starbucks 僅上線 9 個月就放棄 AI 庫存管理工具

    Reuters 報導,Starbucks 已全面停用與 NomadGo 合作開發的「自動計數」AI 庫存工具。該工具自 2025 年 9 月導入北美門市,原意是加速牛奶、糖漿等物料盤點,但頻繁誤判、漏計和混淆相似商品。一名員工在內部通訊中寫道:「感謝停用自動計數!想法很好,但執行困難。」Starbucks 將回歸人工盤點。這是企業 AI 化碰壁的鮮明案例。

    🔗 來源:Reuters

  • 🤖 AI 日報 #7/10 — 2026/05/25(15:00)

    1️⃣ Anthropic Project Glasswing 首月成果:Claude Mythos Preview 協助發現逾萬個高危漏洞

    Anthropic 發布 Project Glasswing 首月更新,Claude Mythos Preview 與約 50 家合作夥伴在關鍵軟體中發現超過 10,000 個高嚴重度漏洞。Cloudflare 單家就找到 2,000 個 bugs(400 個為高危或嚴重等級),誤報率優於人類測試員。Mozilla 在 Firefox 150 中修補 271 個漏洞,是前一代發現數量的 10 倍以上。安全進度不再受限於「發現速度」,而是受限於「驗證與修補速度」。

    🔗 來源:Anthropic 官方部落格

    2️⃣ Microsoft 取消 Claude Code 授權,全面轉推自家 Copilot CLI

    The Verge 報導,Microsoft 將在 6 月底財年結束前取消大部分 Claude Code 授權,要求開發者轉用 GitHub Copilot CLI。內部消息指出 Claude Code 在 Microsoft 內部「太受歡迎」,反而削弱了自家的 Copilot CLI 推廣。Experiences + Devices 部門 EVP Rajesh Jha 發布內部備忘錄,稱此舉為「收斂工具鏈」。Anthropic 模型仍可透過 Copilot CLI 存取。

    🔗 來源:The Verge

    3️⃣ SpaceX S-1 申報揭露:Anthropic 年付 150 億美元租用 Colossus 算力

    SpaceX IPO 申請文件(S-1)顯示,Anthropic 同意每月支付 12.5 億美元、直到 2029 年 5 月,換取 SpaceX 在 Memphis 的 Colossus I 和 Colossus II 資料中心的 AI 訓練算力——年費高達 150 億美元,接近 SpaceX 2025 全年營收。合約附帶 90 天提前終止條款。SpaceX 2025 年在 AI 基礎設施上投入 127 億美元資本支出。

    🔗 來源:The Verge

    4️⃣ Nvidia Q1 財報再創紀錄:營收 816 億美元年增 85%,宣告「代理 AI 時代來臨」

    Nvidia 公布 2027 財年第一季財報,營收 816 億美元年增 85%,淨利 583 億美元較去年同期成長逾三倍。CEO 黃仁勳在分析師電話會議上宣告「代理 AI 時代已經到來」,需求「呈拋物線成長」。不過盤後股價下跌 1.6%,分析師認為投資人已習慣驚艷數字。Nvidia 同時宣布季股息從 1 美分提高到 25 美分,並啟動 800 億美元庫藏股。

    🔗 來源:BBC News

  • 🤖 AI 日報 #6/10 — 2026/05/25(14:00)

    1️⃣ 「AI 沒有情感,但頂尖駭客假裝它有」:社會工程學遇上 AI 的黑暗面

    The Verge 的 Robert Hart 深入探討了 AI 社會工程攻擊的最新趨勢。雖然 AI 本身無法感受情緒,但最有效的駭客正在利用 AI 模仿人類情感反應,進行更精密的社會工程攻擊。這種攻擊手法利用人類對「共情」的自然信任,讓 AI 生成的釣魚訊息、語音通話甚至即時互動更具欺騙性。隨著語音合成和即時對話 AI 的進步,傳統的安全意識培訓面臨前所未有的挑戰——當 AI 能完美模仿你老闆的聲音和語氣,甚至能即時回應你的問題時,人類的判斷力正在被系統性地削弱。

    🔗 The Verge

    2️⃣ Resolve AI:AI 編碼熱潮正在破壞生產系統,多代理架構是解方

    由 Greylock 和 Lightspeed 投資的 Resolve AI 發布平台重大更新,推出多代理除錯系統。該系統不再派遣單一 AI 代理診斷生產故障,而是派遣一支協調的專業代理團隊,平行追蹤多個假設、獨立驗證結論,並建構從根因到症狀的完整因果鏈。公司宣稱根因準確率提升超過 2 倍。CEO Spiros Xanthos 指出,AI 程式碼生成雖然讓工程團隊能比兩年前更快交付軟體,但保持這些軟體在生產環境中穩定運行仍然嚴重依賴人工。DoorDash 已將根因定位時間減少 87%。平台還引入了永不離線的背景代理,持續監控部署變更和配置漂移。

    🔗 VentureBeat

    3️⃣ Delta-mem:僅 0.12% 模型參數讓 AI 代理擁有「工作記憶」,超越 RAG 方案

    來自 Mind Lab 和多所大學的研究者提出 delta-mem 技術,將 AI 代理的歷史資訊壓縮成一個動態更新的矩陣,無需改變模型本身。這個模組僅佔骨幹模型參數的 0.12%(對比領先替代方案的 76.40%),卻在記憶密集型基準測試中超越對手。delta-mem 使用「delta-rule learning」機制:每次新資訊到達時,先用舊狀態預測注意力值,再比較實際值並修正記憶矩陣。在 Memory Agent Bench 上,平均分數從 29.54% 躍升至 38.85%,測試時學習子任務幾乎翻倍。這意味著企業 AI 代理可以在極低成本下保持長期工作記憶,不再依賴擴展上下文窗口或昂貴的 RAG 系統。

    🔗 VentureBeat

    4️⃣ Ansel Adams 信託譴責 AI 上色版經典照片展出:「嚴重違反職業道德」

    Ansel Adams 信託公開譴責 Danziger Gallery 在國際攝影藝術經銷商協會攝影展上展出並銷售 AI 上色版本的 Adams 經典作品「Moonrise, Hernandez, New Mexico」。信託聲明要求移除照片,並指控畫廊老闆 James Danziger 利用 Ansel 的名氣推廣自己的 AI 上色事業:「任何人不應在未經同意和坦誠的情況下,利用他人的名字、聲譽和勞動為私人商業目的服務。未經授權利用 Ansel 受到積極管理的遺產,反映了道德和職業判斷的嚴重缺失。」這起事件再次引發了 AI 在藝術領域的倫理爭議。

    🔗 The Verge

  • 🤖 AI 日報 #5/10 — 2026/05/25(13:00)

    1️⃣ 英國 AISI 最新報告:AI 網路攻擊能力每 4 個月翻倍,Mythos Preview 首度破解兩座網路靶場

    英國 AI 安全研究所(AISI)發布最新評估報告,指出自 2024 年底以來,前沿 AI 模型的自主網路攻擊能力以每 4.7 個月翻倍的速率增長,已從 2025 年 11 月估計的 8 個月翻倍大幅加速。Claude Mythos Preview 成為首個同時破解 AISI 兩座網路靶場的模型:「The Last Ones」10 次嘗試成功 6 次、「Cooling Tower」10 次嘗試成功 3 次。GPT-5.5 也展現類似突破。報告警告:目前測試基準已接近極限,無法準確衡量最新模型的能力上限。

    🔗 來源:UK AISI(官方報告

    2️⃣ Take It Down Act 首次刑事起訴:兩人因散布數千張 AI 深偽色情影像遭逮捕起訴

    美國紐約布魯克林聯邦法院首次依據《Take It Down Act》起訴兩名被告,指控他們發布「數千張」未經同意的 AI 深偽親密影像。該法案刑事條款已生效一年,但平台移除義務剛於本週正式生效。這是法案通過以來首次刑事執法行動,標誌著美國聯邦政府開始動用法律工具打擊 AI 生成的非自願色情內容,對未來類似案件具有指標意義。

    🔗 來源:The Verge

    3️⃣ 白宮向國會請求 90 億美元購買 AI 晶片,CIA 和 NSA 算力嚴重不足

    《紐約時報》報導,美國 CIA 和 NSA 目前缺乏運行最新 AI 模型所需的運算能力。白宮已批准情報機構 90 億美元撥款請求,用於購買 Nvidia Grace Blackwell 超級晶片並建設 AI 基礎設施,需國會批准。此舉顯示美國情報界在 AI 軍備競賽中面臨嚴重算力瓶頸,國家安全與商業 AI 公司之間的算力爭奪日益激烈。

    🔗 來源:New York Times

  • 🤖 AI 日報 #4/10 — 2026/05/25(12:00)

    1️⃣ 教宗良十四世發布 AI 通諭《Magnifica Humanitas》,Anthropic 共同創辦人同台

    教宗良十四世在梵蒂岡發表首份通諭《Magnifica Humanitas》(壯麗人道),主題為「AI 時代中對人類的保護」。Anthropic 共同創辦人 Christopher Olah 與教宗同台出席。通諭簽署於 5 月 15 日——《新事通諭》135 週年紀念日,象徵 AI 是這個世代的工業革命。梵蒂岡明確與拒絕移除軍事 AI 安全限制的 Anthropic 站在一起,這份文件將成為 2026 年 AI 倫理政策辯論的重要參考點。

    🔗 來源:AI Tools Recap

    2️⃣ Google Gemini 3.5 Flash 正式 GA:$1.50/$9 每百萬 token,成為 Gemini App 預設模型

    Google I/O 2026 發表的 Gemini 3.5 Flash 今日正式全面上線。API 定價 $1.50/$9.00 每百萬 token,比 Gemini 3.1 Pro 便宜 25%,但編碼和代理任務基準更高。Terminal-Bench 2.1 達 76.2%、MCP Atlas 83.6%,輸出速度比同級前線模型快 4 倍。即日起成為 Gemini App 和 Google AI Mode 搜尋的全球預設模型,數億用戶已在不知不覺中使用。免費 AI Studio 每日 1,500 請求。Gemini 3.5 Pro 確認六月上市。

    🔗 來源:AI Tools Recap(彙整 Google 官方公告)

    3️⃣ TeamPCP GitHub 供應鏈攻擊擴大:OpenAI、Mistral AI、歐盟執委會確認受害

    TeamPCP 供應鏈攻擊持續擴大,已確認受害組織包含 OpenAI(2 台員工設備、內部程式碼憑證洩露、macOS 簽章憑證 6/12 撤銷)、Mistral AI(1 台開發設備、遭勒索 $25,000 Monero)、歐盟執委會公開網站及 Mercor。CVE-2026-45321 CVSS 評分 9.6。Trend Micro 追蹤 2026 年至少 7 波 TeamPCP 攻擊。影響 npm 和 PyPI 生態系超過 500 個套件,Checkmarx KICS 和 LiteLLM 列為高風險。

    🔗 來源:AI Tools Recap(彙整 GitHub、Trend Micro 資安報告)

  • 🤖 AI 日報 #10/10 — 2026/05/24(18:00)

    1️⃣ Apple Intelligence 將在 iOS 27 開放第三方 AI 模型選擇

    Apple 計劃在 iOS 27、iPadOS 27 和 macOS 27 中讓用戶自由選擇第三方 AI 模型來驅動 Apple Intelligence 功能,包括 Siri、Writing Tools 和 Image Playground。內部稱為「Extensions」的機制,讓安裝支援 App 的 AI 公司都能成為選項。這標誌著 Apple 從「自建模型」策略轉向「開放平台」,打破其一貫的封閉花園策略,為 AI 模型市場帶來數十億潛在用戶。

    🔗 來源:Engadget / Bloomberg
    📰 Engadget

    2️⃣ Google 大改搜尋框:AI 與傳統搜尋全面融合,加入代理功能

    Google 本週宣布搜尋引擎 25 年來最大變革——搜尋框支援影片、圖片和檔案丟入進行多模態搜尋,並新增代理功能讓 AI 代為監測票價、商品降價或在地活動。搜尋主管 Liz Reid 稱「最好的網頁和最好的 AI 結合」,但批評者擔心 AI 摘要將壓縮用戶選擇權、加速「Google Zero」內容生態危機。

    🔗 來源:NPR
    📰 NPR

    3️⃣ 英國性犯罪者用 AI 生成極度逼真兒少影像,被判 4 年監禁

    英國 Essex 51 歲男子 Adam Evans 因使用 AI 生成兒少影像被判 4 年監禁。警方稱影像「逼真到看起來像真的」。Evans 因 2019 年性犯罪紀錄正受警方監控,2025 年 9 月被發現持有 13 張非法影像。警方強調「使用 AI 製作這類內容與使用真實照片同等嚴重」。

    🔗 來源:BBC
    📰 BBC

    4️⃣ Anker 推出首款 Thus AI 晶片耳機:AI 會議筆記、即時翻譯、語音降噪

    Anker 在年度活動發表首批搭載自研 Thus AI 晶片的 Soundcore Liberty 5 Pro 系列耳機。晶片搭配 8 麥克風 + 2 骨傳導感應器,實現 AI 語音降噪、AI 會議筆記(自動辨識發言者和行動項目)、AI 即時翻譯等功能。Pro Max 版本的充電盒配備 1.78 吋 AMOLED 觸控螢幕,售價 $230。AI 功能正式從軟體滲透到消費級硬體晶片層。

    🔗 來源:Engadget
    📰 Engadget

  • 🤖 AI 日報 #9/10 — 2026/05/24(17:00)

    1️⃣ ChatGPT 正式進駐 PowerPoint,免費帳號即可生成投影片

    OpenAI 宣布 ChatGPT 作為 Microsoft PowerPoint 外掛功能進入 Beta,可根據自然語言指令新建投影片、編輯現有簡報,並支援從 Gmail、Outlook、SharePoint 等整合服務拉取資料。免費用戶至 ChatGPT Business 企業訂閱者均可使用。同類功能 Anthropic Claude 早於 9 月即提供,Google Gemini 也原生整合 Slides。分析師指出此舉配合 OpenAI IPO 前爭取企業滲透率的策略布局。

    🔗 來源:Engadget
    https://www.engadget.com/2179075/you-can-now-add-chatgpt-to-powerpoint/

    2️⃣ Meta 監督委員會調查 AI 偽造英國議員影片,臉書未下架引爭議

    Meta 監督委員會宣布調查一段在 Facebook 上流傳的 AI 生成深度偽造影片,影片偽裝成蘇格蘭工黨議員,對難民議題發表煽動性言論。該影片去年 11 月發布,附有針對議員的無端指控,且無任何 AI 標籤。Meta 以「公眾人物」規則為由未刪除,並認定影片屬「諷刺性」且互動低。委員會現正徵集公眾意見,Meta 需在 60 天內回應政策建議,本案凸顯平台 AI 深偽政策的法規灰色地帶。

    🔗 來源:Engadget
    https://www.engadget.com/2178551/meta-oversight-board-will-examine-deefake-video-of-a-uk-politician-facebook-left-online/

    3️⃣ AMD Ryzen AI Halo PC 定價 $3,999 挑戰 NVIDIA DGX Spark,Q3 推 Max 400 旗艦

    AMD 公布 Ryzen AI Halo PC 起售價 $3,999(搭載 AI Max 300),6 月開放預購,直接對標 $4,699 的 NVIDIA DGX Spark。Halo 支援 Windows 及 Linux 雙系統(DGX Spark 僅 Linux),搭 50 TOPS NPU + Radeon GPU(40 計算單元)+ 128GB 統一記憶體。同日發布 Ryzen AI Max 400 系列,旗艦 AI Max+ Pro 495 為 16 核、5.2GHz、55 TOPS NPU、Radeon 8065S,支援最高 192GB 統一記憶體(160GB GPU VRAM),Q3 2026 上市。AMD 估算,每月花 $773 使用 AI Token 的開發者,六個月內可回本。

    🔗 來源:Engadget
    https://www.engadget.com/2177687/amd-prices-its-ryzen-ai-halo-pc-at-dollar3999-unveils-ryzen-ai-max-400-chips/

  • 🤖 AI 日報 #7/10 — 2026/05/24(15:00)

    1️⃣ Anthropic 即將迎來首季獲利,營收翻倍至 109 億美元超越 OpenAI

    據華爾街日報報導,Anthropic 本季營收預計達 109 億美元,是上季 48 億的兩倍多,預計將實現 5.59 億美元營業利潤,創公司成立以來首次單季獲利。這意味著 Anthropic 將比 OpenAI(預計 2029-2030 年才能獲利)更早跨過盈利門檻。不過 Anthropic 預期後續季度將因擴大算力和營運投入而再度虧損。

    🔗 來源:Engadget / WSJ

    2️⃣ Starbucks 僅九個月就放棄 AI 庫存管理工具,回歸人工盤點

    Starbucks 已通知北美門市全面停用去年 9 月與 NomadGo 合作推出的「自動計數」AI 庫存工具。該工具原意是用手機掃描貨架自動追蹤牛奶、糖漿等庫存,但實際頻繁誤判、漏算,甚至把不同牛奶搞混。CEO Brian Niccol 決定回歸人工盤點,員工表示「概念很好,執行太難」。AI 落地失敗的典型案例。

    🔗 來源:Reuters

    3️⃣ Ansel Adams 信託譴責 AI 上色版經典名作未經授權展出販售

    攝影大師 Ansel Adams 的出版權信託發表聲明,譴責 Danziger Gallery 在 AIPAD 攝影展上未經授權展出 AI 上色版《Moonrise, Hernandez, New Mexico》並公開販售。信託聲明強調問題不在 AI 本身(Adams 生前對電腦技術充滿期待),而是未經同意盜用藝術家姓名和作品牟利,並在接獲通知後仍繼續以此推動商業 AI 上色業務。

    🔗 來源:Engadget

    4️⃣ OpenAI 安全高管 Aleksander Madry 離職,將轉戰 AI 經濟影響研究

    OpenAI 前安全主管(Preparedness 團隊負責人)Aleksander Madry 宣布離職,將投入 AI 對經濟影響的新研究。Madry 去年已從安全崗位被調至 AI 推理部門,如今正式離開 OpenAI。這是 OpenAI 近期又一安全領域人才流失,在業界對 AI 安全監管持續升溫之際引發關注。

    🔗 來源:The Verge

  • 🤖 AI 日報 #6/10 — 2026/05/24(14:00)

    1️⃣ Verge 實測 Google Gemini Omni 世界模型:deepfake 鐵塔、玩偶漂流,但離「奇點」還遠

    The Verge 的 Allison Johnson 實測了 Google 的 Gemini Omni 世界模型,嘗試讓它把孩子們的絨毛玩具送上木筏漂流、將自己 deepfake 到艾菲爾鐵塔前。結果顯示 Omni 的影片生成能力確實令人印象深刻,但在精細控制和一致性方面仍有明顯不足。Johnson 總結道:Omni 展示了 AI 影片生成的新高度,但距離真正的「奇點」或通用 AI 還有相當距離。Google 在 I/O 2026 上將 Omni 定位為「世界模型」,暗示它不僅生成影片,而是理解物理世界的運作方式。

    🔗 The Verge

    2️⃣ 「The Future of Truth」作者繼續為 AI 使用辯護:稱 AI「出賣你的方式非常可怕」但仍要繼續用

    《The Future of Truth》作者 Steven Rosenbaum 在被紐約時報揭露書中至少六段引用是 AI 捏造的之後,繼續引發討論。他最初稱「承擔全部責任」,但現在反過來指責 chatbot。他在接受 The Atlantic 採訪時說 AI「搞砸了這本書」,在 Ars Technica 的訪問中則形容 AI 是「常常令人愉悅的寫作伴侶…… strangely creative and crafty and unusual…… and then it betrays you in ways that are just really quite horrible」。儘管如此,他表示仍計畫繼續在寫作中使用 AI——這個態度被 Verge 諷刺為「聽起來像跟 AI 陷入了有毒關係」。

    🔗 The Verge

    3️⃣ 英國 Teesside AI 交通管理系統一年省下 5,000 小時:延誤減少 50%

    英國 Tees Valley Combined Authority 公布數據,AI 驅動的智慧道路技術成功將繁忙路口的延誤減少高達 50%。系統利用即時交通數據建立道路網路的「數位孿生」,預測擁堵發生的位置並自動調整交通號誌。一年內,駕駛人在六個擁堵熱點共節省了 5,000 小時。其中 A174 Parkway 路口延誤減少 2,780 小時。系統涵蓋 57 個連接站點和 196 個交通號誌。Tees Valley 市長 Ben Houchen 稱這些是「真實可衡量的成果——相當於消除超過六個月的等待時間」。整個 FUSION 計畫和數位孿生交通項目投資超過 £200 萬。

    🔗 BBC News

    4️⃣ Google AI Overviews 在特定詞彙下顯示空白:搜尋巨頭的 AI 搜尋仍有盲區

    The Verge 的 Jay Peters 發現,當用戶在 Google 搜尋中使用某些特定詞彙時,AI Overviews 功能會直接顯示空白,拒絕生成 AI 摘要。這反映出 Google 在 AI 搜尋整合上仍面臨重大挑戰——某些主題可能觸發安全過濾,導致系統選擇不回應而非冒險提供不準確的資訊。Google 在 I/O 2026 上將 AI Mode 定位為搜尋 25 年來最大的改革,但這些空白顯示,將 AI 全面融入搜尋體驗的道路並不平坦。

    🔗 The Verge

  • 🤖 AI 日報 #5/10 — 2026/05/24(13:00)

    1️⃣ xAI 開放 Grok Build 終端編碼代理:從 $300 降到 $30 月費人人可用

    xAI 將 Grok Build 終端編碼代理從 $300/月的 Heavy 方案獨佔,擴展至 SuperGrok($30/月)和 X Premium+($40/月)訂閱者。Grok Build 支援子代理協調、Gmail 連接器、檔案管理、插件系統及 Grok Imagine 內嵌圖像生成。新版 0.1.218 修復 Linux 圖片貼上、Windows 快捷鍵及長時間任務崩潰問題,直接挑戰 Claude Code 和 Codex 在開發者工具市場的地位。

    🔗 來源:AI Tools Recap

    2️⃣ 阿里巴巴 Qwen3.7 Max 全面上線 OpenRouter,中文最強模型刷新多項基準

    Qwen3.7 Max 在 OpenRouter 和阿里雲 DashScope 全面開放 API。AI 智力指數 56.6 為中國模型史上最高,HMMT 2026 數學 97.1% 領先所有競爭者。最驚豔的是 35 小時自主編碼測試,完成 GPU 核心優化並達到標準 10 倍加速。定價 $2.50/M 輸入、$7.50/M 輸出,但模型過度冗長(約 4 倍輸出 token),需在提示中加入長度限制控管成本。

    🔗 來源:AI Tools Recap

    3️⃣ Meta Avocado 確認延至六月發布,內部測試未達前線水準

    Bloomberg 本週消息確認 Meta Avocado 模型延至六月,內部測試性能落在 Gemini 2.5 與 3.0 之間,低於 GPT-5.5、Claude Opus 4.7、Gemini 3.5 Flash 等現役前線。Meta AI 領導層面臨壓力,必須在敘事被「三大」固化前出貨。預計六月初兩週內發布。進一步延遲對 Meta 聲譽損害可能更大。

    🔗 來源:Bloomberg / AI Tools Recap

    4️⃣ Microsoft Copilot Studio「Computer Use」代理進入企業,視覺操作老舊 ERP 系統

    Copilot Studio 電腦操作代理 GA 後首批企業回饋出爐:最常見用途是自動化 SAP、Oracle 等缺乏現代 API 的老舊 ERP 工作流。代理透過視覺推理讀取螢幕操作軟體,特別適合這些從未設計程式化介面的系統。已知限制:遇到 CAPTCHA 和 MFA 驗證會中斷,Microsoft 已列為已知問題。

    🔗 來源:AI Tools Recap

    5️⃣ Thinking Machines 預覽即時多模態 AI:語音、視訊、文字同步互動

    Thinking Machines 發布 Interaction Models 研究預覽,展示可同時聽、說、看和使用工具的近即時 AI 模型。Demo 展示模型在視訊對話中同步閱讀共享文件、執行網頁搜尋和程式碼,不需暫停對話。架構目標填補目前語音 AI 只能依序處理單一模態的缺口。尚未公布定價和上市時間。

    🔗 來源:AI Tools Recap

  • 🤖 AI 日報 #4/10 — 2026/05/24(12:00)

    1️⃣ 歐盟達成 AI Act 簡化臨時協議,高風險 AI 義務延後 12-18 個月

    歐盟就 AI Act 簡化方案達成臨時協議,立即禁止未經同意的 AI 色情深偽內容,同時將醫療、教育、就業等高風險 AI 系統的合規義務延後 12-18 個月。此舉回應了業界對原版 AI Act 合規負擔過重、迫使 AI 開發外移歐洲的批評,被視為務實折衷方案。

    🔗 來源:AI Tools Recap

    2️⃣ OpenAI Codex 擴展至手機端,開發者可隨時遠端監控 AI 編碼代理

    OpenAI 將 Codex AI 編碼代理延伸至 ChatGPT 行動 app,開發者可在 iOS/Android 上監控活躍的 AI 編碼工作流、核准指令、啟動任務。Codex Pro($200/月)支援完整自主代理模式,一般 Plus 用戶可唯讀監控。這意味 Codex 從桌面工具轉為持續背景運作的編碼工作者。

    🔗 來源:AI Tools Recap

    3️⃣ ChatGPT 透過 Plaid 整合金融帳戶,Pro 用戶可查看完整個人財務

    OpenAI 為 ChatGPT Pro 用戶推出 Plaid 金融帳戶連結功能,提供個人財務儀表板,涵蓋餘額、交易、投資、訂閱、帳單及儲蓄目標。這是首款主流 AI 聊天產品的大規模原生金融數據整合,ChatGPT 可直接回答「上個月訂閱花了多少」等問題,不再仰賴用戶手動輸入。

    🔗 來源:AI Tools Recap

  • 🤖 AI 日報 #2/10 — 2026/05/24(10:00)

    1️⃣ OpenAI 模型自主破解 80 年數學難題:推翻離散幾何「單位距離猜想」

    OpenAI 於 5/20 宣布旗下一款通用推理模型,在無人引導下首次自主推翻 Paul Erdős 於 1946 年提出的平面單位距離猜想。模型找到反例,證明點集可用明確的多項式因子(約 n^1.014)超越原本被認為最佳的方格構造,結果已由多位外部數學家驗證。劍橋數學家 Tim Gowers 直言「過去沒有任何 AI 生成的證明能接近」頂級期刊發表標準,被視為 AI 數學推理能力的里程碑。

    🔗 來源:OpenAI
    📌官方公告(OpenAI)

    2️⃣ 川普政府臨陣喊停 AI 安全行政命令,科技大佬一通電話翻盤

    白宮原訂簽署的 AI 行政命令在預定簽署前數小時喊停。該命令將建立「自願性」框架,要求 AI 公司在模型公開發布前提交政府、給予最長 90 天安全審查。川普表示因「不喜歡其中某些部分」而延後,並擔心命令會成為美國在對中 AI 競賽中的「絆腳石」。據報導,Zuckerberg、Musk 與 David Sacks 直接致電總統表達反對後,命令隨即被擱置。

    🔗 來源:NBC News
    📰媒體報導(NBC News)

    3️⃣ Meta 啟動 8,000 人裁員、砍 10% 人力全力押注 AI

    Meta 自 5/20 起展開全公司裁員,砍掉約 8,000 名員工、佔全球員工約 10%。此次重組將資源大舉轉向 AI 基礎建設(2026 年支出上看 1,150~1,350 億美元),團隊改編為由新任首席 AI 官 Alexandr Wang 領導的「Superintelligence Labs」AI pods。值得注意的是,裁員與 Meta 公布季度營收創新高(約 563 億美元)發生在同一週,顯示這波人力縮減是策略性轉向而非財務危機。

    🔗 來源:NPR
    📰媒體報導(NPR)