標籤: AI快報

  • 🤖 AI 日報 #5/10 — 2026/06/20(13:00)

    1️⃣ OpenAI Q1 2026 財報:營收 57 億美元但虧損 37 億,IPO 估值衝刺 8,520 億

    OpenAI 披露 2026 年第一季財報,季度營收達 57 億美元,較去年同期成長三倍,但同期虧損高達 37 億美元,研發支出更達 86 億美元。公司目前持有超過 730 億美元現金與有價證券,預計 2030 年前實現正現金流。IPO 估值已達 8,520 億美元,最快今年 9 月掛牌。財報揭示每賺 1 美元就虧 1.22 美元,顯示 AI 軍備競賽下燒錢速度驚人。

    📰 媒體報導(briefs.co)
    🔗 來源:https://www.briefs.co/news/openai-lost-3-7-billion-in-q1-2026/

    2️⃣ 現代汽車以 3.25 億美元完全收購 Boston Dynamics,Atlas 人形機器人 2026 投入量產

    現代汽車集團宣布以 3.25 億美元收購軟銀剩餘的 9.65% Boston Dynamics 股份,使其成為現代全資子公司。此次交易隱含 Boston Dynamics 估值約 34 億美元,較 2021 年 11 億美元估值暴漲三倍。與此同時,Boston Dynamics 正從研究原型轉向量產其 Atlas 人形機器人,首批部署預計 2026 年在現代汽車廠與 Google DeepMind 展開,2027 年擴大規模,將用於執行重複性、高強度的工業製造任務。

    📰 媒體報導(cryptobriefing.com)
    🔗 來源:https://cryptobriefing.com/hyundai-acquires-softbank-boston-dynamics-stake/

    3️⃣ NVIDIA 推出 SpatialClaw:免訓練 3D 空間推理代理,20 項基準達 59.9% 準確率

    NVIDIA Research 於 6 月 19 日發表 SpatialClaw,一套無需額外訓練的空間推理框架,專為解決視覺語言模型(VLM)在 3D 空間理解上的長期弱點。SpatialClaw 的核心創新是以「程式碼」作為代理的動作介面——將 Python kernel 預載感知工具,讓 VLM 代理逐步撰寫可執行程式碼,動態調整推理策略。在 20 項空間推理基準測試中,SpatialClaw 達到 59.9% 平均準確率,領先前代空間代理 SpaceTools 達 11.2 個百分點,適用於機器人、多視角檢測、影片與 4D 動作追蹤等場景。

    📰 媒體報導(marktechpost.com)
    🔗 來源:https://www.marktechpost.com/2026/06/19/nvidia-ai-introduce-spatialclaw-a-training-free-agent-that-treats-code-as-the-action-interface-for-spatial-reasoning/

  • 🤖 AI 日報 #4/10 — 2026/06/20(12:00)

    1️⃣ Pentagon 承認 Grok AI 協助對伊朗發射逾 2,000 枚飛彈

    美國國防部首席數位官 Cameron Stanley 在法庭文件中披露,Elon Musk 旗下 xAI 的 Grok 模型已用於對伊朗軍事行動,協助在 96 小時內打擊 2,000 個目標。Stanley 稱 Grok 為「國安不可或缺」,是唯四能支援機密任務的 AI 模型之一。此為美國政府首次公開承認 Grok 用於實戰。

    🔗 來源:India Today
    📰 India Today(媒體報導)

    2️⃣ Zai 創辦人:中國數月內將推出 Mythos 級 AI 模型

    Zai 創辦人唐傑在 X 上回應 Elon Musk 時表示,中國推出 Mythos 級 AI 模型「不需要那麼久」。此前 Zai 發布 GLM 5.2,成為 Artificial Analysis 指數上排名最高的開源模型(51 分),超越 Gemini 3.5 Flash 與 Claude Sonnet 4.6,且全程使用華為 Ascend 晶片訓練,成本約 2,500 萬美元。

    🔗 來源:India Today
    📰 India Today(媒體報導)

    3️⃣ Adobe 將 AI Agent 引入 Photoshop、Premiere 等主力產品

    Adobe 宣布 AI 助理擴展至 Photoshop、Premiere、Illustrator、InDesign 與 Firefly,可自動處理繁瑣工作:影片粗剪、圖層管理、多平台縮放等。Firefly 也升級為可從產品照生成短影片、組裝完整品牌套件。Adobe 同時將創意工具開放至 ChatGPT、Copilot、Claude 等平台。

    🔗 來源:India Today
    📰 India Today(媒體報導)

    4️⃣ Block 發表 BuilderBot:能管理數億行程式碼的 AI 編碼代理

    Jack Dorsey 旗下 Block 公布內部 AI 工具 BuilderBot,可跨數億行程式碼與數百個服務運作,每日執行 20 萬次操作、每週合併約 1,500 個 PR(佔公司 15% 生產程式碼變更)。此公布正值 Block 裁員 4,000 人後加速 AI 化之際。

    🔗 來源:India Today
    📰 India Today(媒體報導)

  • 🤖 AI 日報 #3/10 — 2026/06/20(11:00)

    1️⃣ OpenAI GPT-5 加速藥物研發:AI 分子分析可達傳統方法百倍速度

    OpenAI 發表最新研究成果,展示 GPT-5 系列模型如何大幅加速藥物候選分子識別流程,涵蓋蛋白質結構預測與分子特性預測。研究顯示 AI 分析速度可達傳統方法的百倍以上,為製藥產業帶來重大突破,有望大幅縮短新藥從研發到臨床試驗的時程。

    📰 來源:AIToolsRecap

    2️⃣ OpenAI 收購 Python 神器公司 Astral:uv、ruff 將整合進 Codex

    OpenAI 宣布收購開源 Python 工具公司 Astral,旗下擁有兩款廣受開發者歡迎的工具:超快套件管理器 uv(取代 pip)與程式碼風格工具 ruff。OpenAI 計劃將 Astral 技術整合至 Codex 編碼助手,大幅提升 Python 開發體驗。此次收購讓 OpenAI 掌控主流 Python 基礎設施,影響全球數百萬開發者。

    📰 來源:Build Fast With AI

    3️⃣ Anthropic 首爾開幕日:NAVER、三星 SDS、LG CNS 等韓企同步部署 Claude

    Anthropic 開設首爾辦公室(第三個亞太據點)同日,宣布與韓國多家大型企業達成 Claude 合作:NAVER 數千名工程師採用 Claude Code、三星 SDS 跨三星電子全面導入、LG CNS 數千員工使用、漢拿透過 AWS 全球部署。此波企業浪潮在 Fable 5 禁令風波期間發布,凸顯 Anthropic 深耕韓國市場的決心。

    📰 來源:Build Fast With AI

    4️⃣ Google 六年沉默後重返智慧音箱市場:新款音箱搭載 Gemini AI

    Google 發布六年來首款智慧音箱,搭載 Gemini AI 實現自然語言對話與多步驟任務處理,直接挑戰 Amazon Echo 與 Apple HomePod 的市場地位。新音箱深度整合 Google 服務生態系,標誌 Google 在 AI 家居助手領域重新出發。

    📰 來源:Build Fast With AI

  • 🤖 AI 日報 #2/10 — 2026/06/20(10:00)

    1️⃣ Fable 5 奪冠 DeepSWE 基準測試:70% PASS@1 稱霸編碼榜首,卻仍遭美國政府封殺

    Datacurve 的 DeepSWE 長時程軟體工程基準測試結果出爐,遭封殺第八天的 Anthropic Fable 5 以 70% PASS@1 稱霸榜首,領先 GPT-5.5 的 67% 和 Claude Opus 4.8 的 59%。DeepSWE 測試 113 道真實軟體工程任務,橫跨 91 個儲存庫與 5 種程式語言,標榜零污染、高難度。企業從 Fable 5 降級到 GPT-5.5 處理編碼工作,等同使用效能明顯較差的工具,封殺的經濟代價更加具體化。

    🔗 來源:Datacurve DeepSWE Leaderboard(官方公告)

    2️⃣ Trump 首度回應 Fable 5 禁令稱「談判順利」,官員卻批 Anthropic「魯莽」

    Trump 在法國 G7 峰會被問到 Fable 5 出口禁令時表示「談判進展順利」——這是禁令下達以來總統首次公開表態,與 Anthropic 高層 Ciauri 在首爾稱「未來幾天很有信心」的說法一致。但 Fox Business 報導,一名資深官員將禁令歸因於 Anthropic 的「魯莽」,稱公司「在發布前未認真對待政府要求修復越獄問題的請求」。政府內部的矛盾訊號,讓快速解決的前景更加撲朔迷離。

    🔗 來源:AI Tools Recap(2026-06-20)

    3️⃣ Google Gemini 2.5 Flash 成為所有消費級 Gemini 產品預設模型

    Google 將 Gemini 2.5 Flash 正式設為所有消費級 Gemini 產品的預設模型,取代 Gemini 2.5 Pro。Flash 定價僅 $0.30/百萬輸入 token,搭載選用思考模式與 100 萬 token 上下文視窗,是史上最強的預設消費模型。此舉正值 Fable 5 封殺期間,Google 趁勢向超過 20 億 Gemini 用戶推送最強日常模型,積極搶佔企業 AI 替代方案的市場空缺。

    🔗 來源:AI Tools Recap / Google(2026-06-20)

    4️⃣ Amazon 調查公開批評 AI 資料中心擴張的員工,Seattle 同步通過一年暫禁令

    CNBC 報導,多名 Amazon 員工在 Seattle 市議會作證批評公司 AI 資料中心擴張後,遭公司內部調查。員工向 Seattle 人權辦公室投訴,稱被 HR 叫去 Zoom 會議、面臨解僱威脅。Seattle 市議會 6/9 無異議通過大規模資料中心一年暫禁令。AWS 工程師 Schloesser 在聽證會上指出 Amazon 今年編列 $2,000 億資本支出,多數用於 AI 基礎設施,「Big Tech 不惜燒掉 Seattle 也要贏得 AI 競賽」。

    🔗 來源:India Today / CNBC(2026-06-19)

  • 🤖 AI 日報 #1/10 — 2026/06/20(09:00)

    1️⃣ DeepSeek 向投資人開出罕見條件:禁止挖角員工

    DeepSeek 在首輪 $74 億融資中,創辦人梁文鋒向準投資人提出一項不尋常條件——承諾不挖角 DeepSeek 員工、也不鼓勵他們創業。此舉凸顯中國科技巨頭在 AI 人才爭奪戰中的激烈程度。DeepSeek 已失去 V3 模型核心貢獻者羅福利,他轉投小米帶領 MiMo 團隊;字節跳動也有兩名 AI 開發者被騰訊挖走。AI 人才已成為比晶片更稀缺的戰略資源。

    🔗 來源:India Today / 36Kr

    2️⃣ 挪威成為首個全面限制校園 AI 使用的國家

    挪威政府宣布自今年 8 月起實施校園 AI 使用分級限制:6-13 歲小學生「原則上不應使用 AI」;14-16 歲可在教師監督下審慎使用;17-19 歲則應學會正確使用 AI,為升學與就業做準備。這是全球首個針對不同年齡層制定 AI 使用規範的國家級政策,標誌著各國從「開放探索」轉向「分齡管控」的新階段。

    🔗 來源:Reuters via The Verge

    3️⃣ Reliance Jio 發表 AI Call Agent 與 TeleFrame,將 AI 帶入 5 億用戶日常

    印度最大電信商 Reliance Jio 在年度股東大會推出多項 AI 產品:AI Call Agent 可在通話中即時轉錄、辨識 10 位發言者、生成摘要並代叫車訂餐;Jio TeleFrame 則定位為家庭 AI 代理中樞,整合娛樂、購物與智慧家庭功能。所有服務支援多種印度語言,預計今年稍後向超過 5 億用戶推出。這標誌著 AI 從精英工具走向大眾日常服務的重要里程碑。

    🔗 來源:India Today

    4️⃣ X 趁 Meta 士氣低迷大舉招手:xAI 人才爭奪戰白熱化

    Meta 在 5 月裁員 8,000 人、將 6,500 名工程師轉調 AI 部門後,CTO Bosworth 承認員工士氣接近歷史新低。X(前 Twitter)產品負責人 Nikita Bier 趁勢在社群平台公開招募,承諾「匹配甚至超越任何零食預算」。這場挖角戰凸顯 AI 產業的核心瓶頸已從算力轉向人才——擁有頂尖研究員的公司,正成為最令人覬覦的資產。

    🔗 來源:India Today / Business Insider

  • 🤖 AI 日報 #10/10 — 2026/06/19(18:00)

    🤖 AI 日報 #10/10 — 2026/06/19(18:00)

    1️⃣ 五角大廈揭露:Grok AI 協助美軍對伊朗發射超過 2,000 枚飛彈

    五角大廈首席數位長 Cameron Stanley 在 xAI 資料中心污染訴訟中提交宣誓書,揭露 Elon Musk 旗下 xAI 的 Grok AI 已用於美軍對伊朗的軍事行動,協助在 96 小時內打擊 2,000 個目標、發射超過 2,000 枚彈藥。Stanley 稱 Grok 是目前僅有的四款能支援國家安全應用的 AI 模型之一,其持續運作涉及「最高國家安全利益」。這是美國政府首次明確承認 Grok 已投入實戰軍事行動。

    🔗 來源:The Independent / India Today


    2️⃣ Amazon 考慮對外銷售 Trainium AI 晶片,挑戰 NVIDIA 壟斷地位

    AWS AI 主管 Peter DeSantis 向 Bloomberg 確認,Amazon 正與外部企業洽談將自研 Trainium AI 晶片銷售至第三方資料中心。CEO Andy Jassy 在股東信中稱,若獨立運營,晶片業務年營收可達 $500 億美元。目前 Trainium4 產能(明年才量產)已被預訂一空。此舉將使 Amazon 從雲端服務商跨足半導體直接銷售,與 NVIDIA 展開更直接競爭。

    🔗 來源:Bloomberg / India Today


    3️⃣ Z.ai 創辦人唐杰:中國距離 Mythos 級 AI 模型「不需要那麼久」

    在 GLM-5.2 發布後,X 平台上有人預測中國將在 2026 年底前擁有自己的 Mythos 級模型。Elon Musk 回覆稱「可能要 2027 年 Q1」,但 Z.ai 創辦人唐杰直接反駁:「不會那麼久」。GLM-5.2 以 744B 參數在 Artificial Analysis 智慧指數拿下 51 分,超越 Gemini 3.5 Flash 與 Claude Sonnet 4.6,且完全以華為 Ascend 晶片訓練,成本僅約 $2,500 萬。

    🔗 來源:India Today


    4️⃣ Jack Dorsey 旗下 Block 推出 BuilderBot:每日執行 20 萬次操作,AI 接管 15% 生產程式碼變更

    Block 在裁員 4,000 人後公布內部 AI 編程工具 BuilderBot,能跨「數億行程式碼」與「數百個服務」運作。BuilderBot 每日執行超過 20 萬次操作、每週合併約 1,500 個 PR(佔全公司生產程式碼變更的 15%)。它整合 Slack、Linear、Jira,能接票、研究、規劃到實作一條龍完成。Block 稱之為「AI 編程工具與大規模工程實踐之間缺失的一層」。

    🔗 來源:India Today

  • 🤖 AI 日報 #9/10 — 2026/06/19(17:00)

    1️⃣ Midjourney 跨入醫療硬體:推出全身超音波掃描機,宣稱比 MRI 便宜 10 倍

    AI 圖像生成公司 Midjourney 宣布成立 Midjourney Medical 子部門,推出全身超音波成像硬體,配備約 35.8 萬個換能器,無輻射、每次掃描目標費用僅數美元,宣稱比 MRI 快 60 倍。這是 Midjourney 首款實體硬體產品。目前原型已在約 12 人身上測試,尚未取得 FDA 認證,現行版本仍需 20 分鐘。2027 年底計劃在舊金山 Union Square 開設首家 Midjourney Spa,設置 10 台掃描機並結合水療設施。

    📌 來源:Bloomberg

    2️⃣ 以色列主權 AI 新創 Dream 完成 $2.6 億融資,估值飆升三倍至 $30 億

    前 NSO 集團執行長 Shalev Hulio 創辦的以色列 AI 資安新創 Dream 宣布完成 $2.6 億美元融資,估值較 2025 年 2 月的 $10 億三倍成長至 $30 億。Dream 提供政府與關鍵基礎設施的主權 AI 與國家網路防禦平台,去年政府端營收達 $3 億美元。本輪由 Bicycle Capital 領投,前奧地利總理 Sebastian Kurz 為共同創辦人。資金將用於擴展美洲市場。

    📌 來源:Bloomberg

    3️⃣ Anthropic 推出 Claude Enterprise MCP 企業授權整合,Okta 首發零設定存取

    Anthropic 宣布 Claude Enterprise 支援企業管理的 MCP(Model Context Protocol)連接器授權,以 Okta 作為首個身份服務商。管理員只需設定一次,員工首次登入即自動繼承工具存取權,適用於 Claude Chat、Claude Code 與 Cowork。Ramp 已率先部署,2,000 名員工零步驟完成授權。目前支援 Asana、Atlassian、Canva、Figma 等 7 家 MCP 服務商,Slack 即將加入,大幅降低企業導入 AI 代理工具的摩擦。

    📌 來源:Okta 官方公告

    4️⃣ Snap 分拆 AI 影片團隊成立 Dotmo,因應生成式 AI 高成本壓力

    Snap 宣布將內部生成式 AI 影片研究團隊獨立拆分為新公司 Dotmo,主力開發可生成互動遊戲體驗的 AI 模型。Snap 以高內部研發成本為由推動分拆,反映大型科技公司在 AI 研發支出膨脹下的策略調整。Dotmo 將獨立運營,聚焦打造以生成式 AI 驅動的沉浸式影像與遊戲體驗,未來可能尋求外部融資。

    📌 來源:TechCrunch

  • 🤖 AI 日報 #8/10 — 2026/06/19(16:00)

    1️⃣ Adobe Creative Cloud 大規模導入 Agentic AI,從生成工具轉型為生產編排平台

    Adobe 在 Premiere Pro、Photoshop、Illustrator、InDesign、Frame.io 全面嵌入 AI 創意代理,公開測試版已上線。代理能理解自然語言指令並直接操作軟體 API,執行批次剪輯排序、跨版面品牌資產更新等多步驟工作流程。Firefly AI Studio 同步升級「Elements」視覺變數庫與「Projects」上下文記憶層,解決生成式 AI 一致性問題。75% 創作者回報 AI 已整合或為必要工具,85% 強調最終創意決策須由人類掌控。

    🔗 來源:VentureBeat 📰媒體報導

    2️⃣ OpenAI 近自主 AI 化學家改良 Chan-Lam 耦合反應,藥物合成瓶頸獲突破

    OpenAI 將 GPT-5.4 連接 Molecule.one 的 Maria 自動化實驗室,歷時三個月自主提出研究方向、設計實驗、分析數據。AI 獨立發現 TEMPO 氧化劑可改善磺胺類藥物中間體的 Chan-Lam 耦合反應,88% 硼酸受質產率提升,平均產率從 16.6% 升至 25.2%。人類化學家已在常规實驗室規模獨立驗證結果。磺胺基團廣泛存在於抗癌藥與抗菌劑,此突破有望加速藥物探索。

    🔗 來源:OpenAI 官方公告 📌官方公告

    3️⃣ Anthropic Claude Design 重大改版:支援設計系統匯入、Claude Code 雙向同步,解決 token 消耗問題

    Claude Design 推出兩個月以來最大改版。新增從 GitHub 匯入設計系統功能,AI 自動驗證輸出是否符合企業品牌規範。Claude Code 雙向整合讓設計師可在終端機直接同步設計專案,工程師接手時無需重建。管理員角色可鎖定單一標準設計系統,防止使用者覆蓋。此次改版將 Claude Design 從展示工具重新定位為企業品牌合規層。

    🔗 來源:VentureBeat 📰媒體報導

    4️⃣ OpenAI 發布 LifeSciBench:750 道生命科學專家級任務,重新定義 AI 科研評估

    OpenAI 推出專為生命科學研究設計的 LifeSciBench 基準測試。由 173 位博士級科學家撰寫 750 道任務,涵蓋證據處理、實驗設計、科學推理等七大工作流程,平均每任務需四個推理步驟。53% 任務需解讀附件資料,79% 需多步驟推理。評分採用 19,020 條專家制定的評分標準,不只看最終答案正確性,更評估科學推理過程的嚴謹度。

    🔗 來源:OpenAI 官方公告 📌官方公告

  • 🤖 AI 日報 #7/10 — 2026/06/19(15:00)

    1️⃣ Sanders 提出「AI 主權財富基金法」:對大型 AI 公司課徵 50% 股票稅

    參議員 Bernie Sanders 提出《American A.I. Sovereign Wealth Fund Act》,對年營收超過 $2 億的 AI 公司課徵一次性股票稅,建立聯邦主權財富基金。預計每年向每位納稅人發放約 $1,000 股利,並用於教育、醫療與住房。Anthropic CEO Amodei 與 OpenAI 均表達類似概念支持,Trump 總統也公開贊成政府持有 AI 公司股份。

    🔗 來源:Roll Call

    2️⃣ MCP 企業授權層正式穩定:Anthropic、Microsoft、Okta 聯手推動零接觸 OAuth

    Model Context Protocol 發布 Enterprise-Managed Authorization(EMA)擴充規格,企業可透過 IdP 集中管理 MCP 伺服器存取權限,使用者登入一次即自動連接所有授權工具。Anthropic Claude、VS Code 已實作支援,Asana、Atlassian、Figma、Linear 等伺服器已導入,解決了企業 MCP 部署最大痛點。

    🔗 來源:MCP Blog

    3️⃣ Barret Zoph 二度離開 OpenAI:任職僅五個月再出走

    OpenAI 核心研究主管 Barret Zoph 在重回公司僅五個月後再次離職。Zoph 今年一月從 Mira Murati 創辦的 Thinking Machines Lab 回歸 OpenAI,如今又快速離去,加上 Shazeer 從 Google 跳槽 OpenAI,凸顯頂尖 AI 人才爭奪戰持續白熱化。

    🔗 來源:The Verge

    4️⃣ 中國八部委聯合發布「AI+消費」17 項措施,全面推動 AI 滲透民生

    中國商務部等八個部委聯合發布實施指南,涵蓋五大領域 17 項措施,推動 AI 與消費市場深度融合。包括擴大智慧穿戴、AI 養老機器人、AI 旅遊與餐飲服務,建設「AI+消費」聚落,並鼓勵地方政府將 AI 產品納入以舊換新補貼政策。

    🔗 來源:Macau Business / Reuters

  • 🤖 AI 日報 #6/10 — 2026/06/19(14:00)

    1️⃣ Weibo VibeThinker-3B:3B 參數模型打平 DeepSeek 671B,AI 社群質疑基準測試是否已崩壞

    VentureBeat 報導,中國社群媒體巨頭新浪微博的 9 人研究團隊在 arXiv 發表一篇 14 頁技術報告,聲稱一個僅 30 億參數的語言模型可以在推理性能上匹敵或超越 Google DeepMind、OpenAI、Anthropic 和 DeepSeek 的大數百倍旗艦系統。

    這個名為 VibeThinker-3B 的模型在 AIME 2026(美國數學邀請賽)上得分 94.3,與 DeepSeek V3.2(6710 億參數)並列,超越 Gemini 3 Pro(91.7)。使用團隊稱為 Claim-Level Reliability Assessment 的測試時縮放技術後,分數更高達 97.1。

    參數差距有多懸殊:DeepSeek V3.2 有 6710 億參數——約為 VibeThinker-3B 的 224 倍。GLM-5 有 7440 億。Kimi K2.5 和 GPT-5.5 更大。

    但反應並非一片讚揚。在 X 上,用戶 @orcus108 寫道:「3B 參數模型剛在編碼基準測試中拿出了和 Claude Opus 4.5 同一級別的分數……我真的不知道這是突破還是基準測試已經壞了。」該貼文累積超過 16.1 萬次瀏覽。

    這種張力——真正的科學進步與對 AI 基準測試日益可被操縱到失去意義的懷疑——正是 VibeThinker-3B 故事的核心。而答案事關重大:AI 產業不斷推向更大模型的路線是否是通往智慧的唯一道路。

    🔗 VentureBeat 深度報導 · arXiv 論文 · GitHub

    2️⃣ Arbor AI 框架:同一運算預算下效能超越 Claude Code 和 Codex 2.5 倍

    VentureBeat 報導,中國人民大學與 Microsoft Research 的研究人員推出了 Arbor,一個將 AI 驅動的研究與優化從「試錯猜測」升級為「累積學習」的框架。Arbor 將假設、實驗和見解組織成樹狀結構,讓系統從先前的失敗中學習。

    核心問題:標準 AI 編碼代理(如 Claude Code、Codex)在長時間運行時,會把每次嘗試視為獨立事件,缺乏結構化記憶來累積經驗。「自動化可以讓 AI 工作很長時間——但循環不等於進步,」論文共同作者 Jiajie Jin 告訴 VentureBeat。「如果目標模糊,或指標容易被 hack,長時間運行的自動化通常只是更快地產生沒人真正想要的『改善』。」

    在實測中,Arbor 在真實工程任務上,同一資源預算下提供了超過標準 AI 編碼代理 2.5 倍的可驗證性能提升。

    🔗 VentureBeat 報導 · arXiv 論文

    3️⃣ 英國 Dorset 議會測試 AI 代理加速建築許可,目標全國推廣

    BBC 報導,英國 Dorset 議會正在試用 AI 代理協助處理建築許可申請積壓。由政府委託 AI 專家公司 Faculty 開發的工具,能自動審查文件、整理關鍵資訊,並為許可官員提供初步評估建議。

    Dorset 是三個試點議會之一(另兩個為 Barnet 和 Camden)。系統針對約佔 85% 的「小型申請」(如閣樓改造、加建臥室)進行分流和摘要。Faculty 公共服務總監 Paul Maltby 表示:「規劃系統堵塞了,它拖慢了想改善住宅的人,也阻礙了經濟增長。」

    政府目標是將平均處理時間從 8 週減半至 4 週,如成功將於 2027 年前全國推廣。住房與規劃部長 Matthew Pennycook 表示:「我們正在將系統拖入 21 世紀。」

    議會強調 AI 不會做出最終決策——「規劃決策將繼續由合格的規劃官員和由民選議員組成的規劃委員會掌握。」

    🔗 BBC News 報導

  • 🤖 AI 日報 #5/10 — 2026/06/19(13:00)

    1️⃣ SpaceX SPCX 收購 Cursor 後回吐:6/18 收盤 $185 跌 3.56%,Oppenheimer 上調目標至 $250

    SpaceX(SPCX)在宣佈以 $600 億美元收購 AI 程式代理 Cursor 後,股價不漲反跌。6/18 收盤 $185.00,單日下跌 3.56%,盤後續跌至 $181.69。日內波動區間 $172.11-$190.00,成交量 2.55 億股。目前市值約 $2.44 兆,較 IPO 首日高點已有明顯回調。

    儘管股價承壓,Oppenheimer 維持「跑贏大盤」評級,並將目標價從 $190 上調至 $250。分析師平均目標 $188.17,低至 $62、高至 $310,反映市場對 SpaceX 估值嚴重分歧。Morningstar 公允價值僅 $780 億,遠低於目前市值。

    值得關注的是,SpaceX 收購 Cursor 的策略邏輯——將 AI 程式代理整合進 Colossus 運算生態——需要時間驗證。短期市場更多在消化 IPO 後的估值泡沫,而非質疑長期 AI 運算佈局。

    🔗 來源:Yahoo Finance — SPCX 即時數據
    📰 媒體報導(Yahoo Finance / Oppenheimer)

    2️⃣ OpenAI 关闭 ChatGPT Pulse 功能,以「排程任務」取代日常摘要

    OpenAI 宣布关闭 ChatGPT 中的 Pulse 功能——該功能原先為用戶提供每日自訂摘要。OpenAI 在 X 上表示,Pulse 將在「未來 14 天內」移除,並建議用戶改用全新推出的「排程任務」功能來設定每日簡報。

    Pulse 是 OpenAI 今年稍早推出的個人化資訊聚合工具,允許用戶自訂每日感興趣的主題摘要。此次关闭反映了 OpenAI 正在精簡 ChatGPT 功能集,將資源集中在即將到来的「超級應用」改版上。據 Financial Times 報導,OpenAI 正籌備 ChatGPT 問世以來最大規模改造,整合 AI 代理、Codex 程式工具和第三方服務。

    排程任務功能讓用戶可設定特定時間觸發 AI 執行任務,如每天早上生成新聞摘要,比 Pulse 的固定格式更靈活。

    🔗 來源:OpenAI ChatGPT 官方 X 公告
    📌 官方公告

    3️⃣ Allbirds 完成 AI 轉型更名 Smartbird,任命新 CEO 進軍 AI 基礎設施

    曾以環保鞋款聞名的 Allbirds 完成了其戲劇性的轉型——正式更名為 Smartbird,並任命 Nadia Carlsten 為新任 CEO。Smartbird 同時完成了 Allbirds 品牌的出售,將業務重心全面轉向 AI 基礎設施與企業 AI 系統。

    這家公司在經歷財務困境後,利用其上市殼資源轉型為 AI 基礎設施公司(此前已更名為 NewBird)。此次更名標誌著轉型的最終完成,Carlsten 將領導公司提供 AI 運算資源和企業級 AI 解決方案。

    Allbirds/Smartbird 的轉型案例凸顯了 2026 年 AI 熱潮的一個獨特面向:即使是傳統消費品牌也在嘗試通過資本市場操作切入 AI 賽道,反映 AI 基礎設施市場的巨大吸引力。

    🔗 來源:Smartbird Investor Relations 官方公告
    📌 官方公告

    4️⃣ CISA 終獲 Anthropic Mythos Preview 存取權限——但為時已晚

    美國網路安全與基礎設施安全局(CISA)終於獲得了 Anthropic Mythos Preview 模型的存取權限。據 Nextgov/FCW 報導,這款限時發佈的網路安全專用模型上週才向 CISA 開放。

    然而,此存取權限來得為時已晚——全球使用者已轉向關注 Trump 政府對公開版本 Fable 5 和 Mythos 5 的出口管制禁令。CISA 最初在 4 月份就要求存取 Mythos 用於網路安全防禦,但談判耗時兩個月,最終在整個模型被政府下令停用之際才獲批。

    這一時間差凸顯了美國政府內部在 AI 安全治理上的矛盾:一方面國防與情報機構需要前沿 AI 模型用於國安用途,另一方面商務部門卻以國安理由限制了同一模型的對外發佈。

    🔗 來源:Axios — CISA Anthropic Mythos AI Security
    📰 媒體報導(Axios / Nextgov)

  • 🤖 AI 日報 #4/10 — 2026/06/19(12:00)

    1️⃣ OpenAI 企業版大升級:ChatGPT Enterprise 推出用量分析儀表板與彈性支出控制

    OpenAI 為 ChatGPT Enterprise 推出全新信用額度用量分析與支出控制功能。管理員可在 Global Admin Console 追蹤 ChatGPT 與 Codex 的用量趨勢、按用戶/產品/模型細分信用消耗,並透過統一 Cost API 整合內部系統。新增彈性支出限制:可設置預設上限、群組限制與個人覆寫,員工也能查看自身用量並申請追加。企業 AI 治理從「能用」邁向「可精細管理」。

    🔗 來源:OpenAI 官方部落格

    2️⃣ ChatGPT 健康問答大升級:GPT-5.5 Instant 醫療評測追平前沿 Thinking 模型

    OpenAI 公布 ChatGPT 健康智慧重大進展。GPT-5.5 Instant 在最困難的健康評測中達到與前沿 Thinking 模型相當的水準,超過 260 位、橫跨 60 國的醫師網絡已審查逾 70 萬則回覆。生產環境監測顯示,健康回覆的事實性問題比率兩個月內下降 71%。醫師評比中,GPT-5.5 Instant 在準確性、溝通、完整性等指標上超越人類醫師親自撰寫的回覆。

    🔗 來源:OpenAI 官方部落格

    3️⃣ OpenAI o3 Deep Research 助診罕見兒童遺傳疾病:376 案例新增 4.8% 確診率

    Boston Children’s Hospital、哈佛與 OpenAI 合作,以 o3 Deep Research 推理模型分析 376 例此前無法確診的罕見遺傳疾病案例。模型從基因體數據、臨床記錄與最新文獻中推導證據鏈假設,經專家審查與臨床確認後成功確診 18 例(4.8%),成果發表於 NEJM AI。研究證明 AI 可協助專家從堆積如山的未解案例中持續發現新答案。

    🔗 來源:OpenAI 官方部落格