作者: Barney Chen

  • 🤖 AI 日報 #7/10 — 2026/06/20(15:00)

    1️⃣ 諾貝爾獎得主、AlphaFold 核心人物 John Jumper 跳槽 Anthropic

    John Jumper 在 Google DeepMind 任職近九年後宣布離職加入 Anthropic。他與 Demis Hassabis 共同獲得 2024 年諾貝爾化學獎,主導開發 AlphaFold,成功預測科學界已知的 2 億種蛋白質結構。這是繼 Noam Shazeer 轉戰 OpenAI 後,Google 短期內再失一名頂尖 AI 人才,凸顯巨頭間的人才爭奪戰持續升溫。

    🔗 來源:India Today

    2️⃣ OpenAI 推出 ChatGPT Enterprise 支出管控工具,協助企業控制 AI 帳單

    隨著用量計價模式讓企業 AI 帳單失控(Uber 數月燒完全年預算),OpenAI 發布管理儀表板與支出上限功能。管理員可檢視各團隊的 ChatGPT 與 Codex 額度消耗、按部門設限,員工也能查看用量並申請額度。標誌 AI 產業從「模型軍備競賽」進入「成本治理」新階段。

    🔗 來源:India Today

    3️⃣ Waymo 緊急召回 3,800+ 輛自駕計程車:恐闖入封閉高速公路施工區

    Waymo 向 NHTSA 通報自願召回 3,800 餘輛 Jaguar I-Pace 無人計程車。至少 13 輛車在鳳凰城與舊金山闖入封閉施工路段,公司已限制高速公路行駛並開發修復方案。這是一個多月內第二次召回,引發對自駕安全監管的關注。

    🔗 來源:Engadget / Reuters

    4️⃣ Epic Games 大擁抱生成式 AI:Unreal Engine 5.8 內建 MCP 插件,Claude、Gemini 直接連線

    Epic Games 在 Unreal Fest 發布 UE 5.8,內建實驗性 MCP 插件,讓開發者直接將 Claude、Gemini 等 AI 模型連入引擎,自動生成場景資產、調整光照與大氣效果。不過開發商 Poncle(Vampire Survivors)因 Epic 使用生成 AI 而公開重新考慮 Fortnite 合作,業界對 AI 立場分歧加劇。

    🔗 來源:Engadget

  • 🤖 AI 日報 #6/10 — 2026/06/20(14:00)

    1️⃣ Midjourney 跨足醫療硬體:推出全身超音波掃描儀

    以 AI 圖像生成聞名的 Midjourney 宣布推出 Midjourney Scanner——一部能在 60 秒內完成全身掃描的醫療級超音波機器。這標誌著公司從軟體跨足硬體的第一步,甚至成立了 Midjourney Medical 部門。

    使用者站在平台上後,機器以每秒 2 英寸的速度將身體沒入水中。身體穿過一個由 50 萬個沙粒大小的方格組成的環狀陣列,每個方格都能發射超音波並記錄反射回來的漣漪。公司將其比喻為「被 50 萬隻小海豚從各角度包圍進行迴聲定位」。

    結果是一張「精確至毫米分數的 3D 身體地圖」,效果類似 MRI 但速度是傳統全身 MRI(60-90 分鐘)的近百倍。Midjourney 與手持超音波設備製造商 Butterfly Network 合作(2025 年 11 月簽署晶片超音波技術獨家授權),由前 Apple Vision Pro 團隊成員 Ahmad Abbas 領導。

    第一家 Scanner Spa 計劃於明年在舊金山開幕。2028 年擴展至更多城市,目標 2031 年全球部署 5 萬台。下一步需取得 FDA 診斷能力核准。

    🔗 Engadget 報導 · Midjourney Medical 官方公告

    2️⃣ The Atlantic 調查:數百萬首歌被用於 AI 音樂訓練

    The Atlantic 調查揭露,數百萬首歌曲——包括 Taylor Swift、Bad Bunny 等巨星的作品——未經授權被用於訓練 AI 音樂生成模型。調查發現,主流 AI 音樂公司透過各種管道大量取得版權音樂,將其餵入訓練資料集。

    這項調查引發了音樂產業對 AI 公司新一輪的法律行動。唱片公司和藝人團體表示,這些訓練行為構成系統性的版權侵犯。AI 公司則辯稱其行為符合合理使用原則。

    與 Warner Music 收購 Sureel AI(用「AI DNA」追蹤訓練資料來源)的舉動對比,產業正在摸索 AI 音樂的授權和歸因機制。

    🔗 Engadget 報導

    3️⃣ Anthropic 遭 Claude Max 用量限制集體訴訟

    Anthropic 被用戶提起訴訟,指控其 Claude Max 訂閱方案的用量限制具有誤導性。用戶投訴在支付高額月費後,實際可用量遠低於承諾,且 Anthropic 在使用過程中頻繁調整限制而未充分告知訂閱者。

    這起訴訟突顯了 AI 訂閱服務的一個核心問題:隨著模型運算成本高昂,AI 公司不得不限制用量,但行銷時往往以「無限」或「充足」的用詞吸引訂戶,造成期望落差。此前 PCWorld 報導 Claude Design 在 25 分鐘內耗盡 Claude Pro 80% 週用量額度,引發廣泛抱怨。

    🔗 Engadget 報導

  • 🤖 AI 日報 #5/10 — 2026/06/20(13:00)

    1️⃣ OpenAI Q1 2026 財報:營收 57 億美元但虧損 37 億,IPO 估值衝刺 8,520 億

    OpenAI 披露 2026 年第一季財報,季度營收達 57 億美元,較去年同期成長三倍,但同期虧損高達 37 億美元,研發支出更達 86 億美元。公司目前持有超過 730 億美元現金與有價證券,預計 2030 年前實現正現金流。IPO 估值已達 8,520 億美元,最快今年 9 月掛牌。財報揭示每賺 1 美元就虧 1.22 美元,顯示 AI 軍備競賽下燒錢速度驚人。

    📰 媒體報導(briefs.co)
    🔗 來源:https://www.briefs.co/news/openai-lost-3-7-billion-in-q1-2026/

    2️⃣ 現代汽車以 3.25 億美元完全收購 Boston Dynamics,Atlas 人形機器人 2026 投入量產

    現代汽車集團宣布以 3.25 億美元收購軟銀剩餘的 9.65% Boston Dynamics 股份,使其成為現代全資子公司。此次交易隱含 Boston Dynamics 估值約 34 億美元,較 2021 年 11 億美元估值暴漲三倍。與此同時,Boston Dynamics 正從研究原型轉向量產其 Atlas 人形機器人,首批部署預計 2026 年在現代汽車廠與 Google DeepMind 展開,2027 年擴大規模,將用於執行重複性、高強度的工業製造任務。

    📰 媒體報導(cryptobriefing.com)
    🔗 來源:https://cryptobriefing.com/hyundai-acquires-softbank-boston-dynamics-stake/

    3️⃣ NVIDIA 推出 SpatialClaw:免訓練 3D 空間推理代理,20 項基準達 59.9% 準確率

    NVIDIA Research 於 6 月 19 日發表 SpatialClaw,一套無需額外訓練的空間推理框架,專為解決視覺語言模型(VLM)在 3D 空間理解上的長期弱點。SpatialClaw 的核心創新是以「程式碼」作為代理的動作介面——將 Python kernel 預載感知工具,讓 VLM 代理逐步撰寫可執行程式碼,動態調整推理策略。在 20 項空間推理基準測試中,SpatialClaw 達到 59.9% 平均準確率,領先前代空間代理 SpaceTools 達 11.2 個百分點,適用於機器人、多視角檢測、影片與 4D 動作追蹤等場景。

    📰 媒體報導(marktechpost.com)
    🔗 來源:https://www.marktechpost.com/2026/06/19/nvidia-ai-introduce-spatialclaw-a-training-free-agent-that-treats-code-as-the-action-interface-for-spatial-reasoning/

  • 🤖 AI 日報 #4/10 — 2026/06/20(12:00)

    1️⃣ Pentagon 承認 Grok AI 協助對伊朗發射逾 2,000 枚飛彈

    美國國防部首席數位官 Cameron Stanley 在法庭文件中披露,Elon Musk 旗下 xAI 的 Grok 模型已用於對伊朗軍事行動,協助在 96 小時內打擊 2,000 個目標。Stanley 稱 Grok 為「國安不可或缺」,是唯四能支援機密任務的 AI 模型之一。此為美國政府首次公開承認 Grok 用於實戰。

    🔗 來源:India Today
    📰 India Today(媒體報導)

    2️⃣ Zai 創辦人:中國數月內將推出 Mythos 級 AI 模型

    Zai 創辦人唐傑在 X 上回應 Elon Musk 時表示,中國推出 Mythos 級 AI 模型「不需要那麼久」。此前 Zai 發布 GLM 5.2,成為 Artificial Analysis 指數上排名最高的開源模型(51 分),超越 Gemini 3.5 Flash 與 Claude Sonnet 4.6,且全程使用華為 Ascend 晶片訓練,成本約 2,500 萬美元。

    🔗 來源:India Today
    📰 India Today(媒體報導)

    3️⃣ Adobe 將 AI Agent 引入 Photoshop、Premiere 等主力產品

    Adobe 宣布 AI 助理擴展至 Photoshop、Premiere、Illustrator、InDesign 與 Firefly,可自動處理繁瑣工作:影片粗剪、圖層管理、多平台縮放等。Firefly 也升級為可從產品照生成短影片、組裝完整品牌套件。Adobe 同時將創意工具開放至 ChatGPT、Copilot、Claude 等平台。

    🔗 來源:India Today
    📰 India Today(媒體報導)

    4️⃣ Block 發表 BuilderBot:能管理數億行程式碼的 AI 編碼代理

    Jack Dorsey 旗下 Block 公布內部 AI 工具 BuilderBot,可跨數億行程式碼與數百個服務運作,每日執行 20 萬次操作、每週合併約 1,500 個 PR(佔公司 15% 生產程式碼變更)。此公布正值 Block 裁員 4,000 人後加速 AI 化之際。

    🔗 來源:India Today
    📰 India Today(媒體報導)

  • 🤖 AI 日報 #3/10 — 2026/06/20(11:00)

    1️⃣ OpenAI GPT-5 加速藥物研發:AI 分子分析可達傳統方法百倍速度

    OpenAI 發表最新研究成果,展示 GPT-5 系列模型如何大幅加速藥物候選分子識別流程,涵蓋蛋白質結構預測與分子特性預測。研究顯示 AI 分析速度可達傳統方法的百倍以上,為製藥產業帶來重大突破,有望大幅縮短新藥從研發到臨床試驗的時程。

    📰 來源:AIToolsRecap

    2️⃣ OpenAI 收購 Python 神器公司 Astral:uv、ruff 將整合進 Codex

    OpenAI 宣布收購開源 Python 工具公司 Astral,旗下擁有兩款廣受開發者歡迎的工具:超快套件管理器 uv(取代 pip)與程式碼風格工具 ruff。OpenAI 計劃將 Astral 技術整合至 Codex 編碼助手,大幅提升 Python 開發體驗。此次收購讓 OpenAI 掌控主流 Python 基礎設施,影響全球數百萬開發者。

    📰 來源:Build Fast With AI

    3️⃣ Anthropic 首爾開幕日:NAVER、三星 SDS、LG CNS 等韓企同步部署 Claude

    Anthropic 開設首爾辦公室(第三個亞太據點)同日,宣布與韓國多家大型企業達成 Claude 合作:NAVER 數千名工程師採用 Claude Code、三星 SDS 跨三星電子全面導入、LG CNS 數千員工使用、漢拿透過 AWS 全球部署。此波企業浪潮在 Fable 5 禁令風波期間發布,凸顯 Anthropic 深耕韓國市場的決心。

    📰 來源:Build Fast With AI

    4️⃣ Google 六年沉默後重返智慧音箱市場:新款音箱搭載 Gemini AI

    Google 發布六年來首款智慧音箱,搭載 Gemini AI 實現自然語言對話與多步驟任務處理,直接挑戰 Amazon Echo 與 Apple HomePod 的市場地位。新音箱深度整合 Google 服務生態系,標誌 Google 在 AI 家居助手領域重新出發。

    📰 來源:Build Fast With AI

  • 🤖 AI 日報 #2/10 — 2026/06/20(10:00)

    1️⃣ Fable 5 奪冠 DeepSWE 基準測試:70% PASS@1 稱霸編碼榜首,卻仍遭美國政府封殺

    Datacurve 的 DeepSWE 長時程軟體工程基準測試結果出爐,遭封殺第八天的 Anthropic Fable 5 以 70% PASS@1 稱霸榜首,領先 GPT-5.5 的 67% 和 Claude Opus 4.8 的 59%。DeepSWE 測試 113 道真實軟體工程任務,橫跨 91 個儲存庫與 5 種程式語言,標榜零污染、高難度。企業從 Fable 5 降級到 GPT-5.5 處理編碼工作,等同使用效能明顯較差的工具,封殺的經濟代價更加具體化。

    🔗 來源:Datacurve DeepSWE Leaderboard(官方公告)

    2️⃣ Trump 首度回應 Fable 5 禁令稱「談判順利」,官員卻批 Anthropic「魯莽」

    Trump 在法國 G7 峰會被問到 Fable 5 出口禁令時表示「談判進展順利」——這是禁令下達以來總統首次公開表態,與 Anthropic 高層 Ciauri 在首爾稱「未來幾天很有信心」的說法一致。但 Fox Business 報導,一名資深官員將禁令歸因於 Anthropic 的「魯莽」,稱公司「在發布前未認真對待政府要求修復越獄問題的請求」。政府內部的矛盾訊號,讓快速解決的前景更加撲朔迷離。

    🔗 來源:AI Tools Recap(2026-06-20)

    3️⃣ Google Gemini 2.5 Flash 成為所有消費級 Gemini 產品預設模型

    Google 將 Gemini 2.5 Flash 正式設為所有消費級 Gemini 產品的預設模型,取代 Gemini 2.5 Pro。Flash 定價僅 $0.30/百萬輸入 token,搭載選用思考模式與 100 萬 token 上下文視窗,是史上最強的預設消費模型。此舉正值 Fable 5 封殺期間,Google 趁勢向超過 20 億 Gemini 用戶推送最強日常模型,積極搶佔企業 AI 替代方案的市場空缺。

    🔗 來源:AI Tools Recap / Google(2026-06-20)

    4️⃣ Amazon 調查公開批評 AI 資料中心擴張的員工,Seattle 同步通過一年暫禁令

    CNBC 報導,多名 Amazon 員工在 Seattle 市議會作證批評公司 AI 資料中心擴張後,遭公司內部調查。員工向 Seattle 人權辦公室投訴,稱被 HR 叫去 Zoom 會議、面臨解僱威脅。Seattle 市議會 6/9 無異議通過大規模資料中心一年暫禁令。AWS 工程師 Schloesser 在聽證會上指出 Amazon 今年編列 $2,000 億資本支出,多數用於 AI 基礎設施,「Big Tech 不惜燒掉 Seattle 也要贏得 AI 競賽」。

    🔗 來源:India Today / CNBC(2026-06-19)

  • 🤖 AI 日報 #1/10 — 2026/06/20(09:00)

    1️⃣ DeepSeek 向投資人開出罕見條件:禁止挖角員工

    DeepSeek 在首輪 $74 億融資中,創辦人梁文鋒向準投資人提出一項不尋常條件——承諾不挖角 DeepSeek 員工、也不鼓勵他們創業。此舉凸顯中國科技巨頭在 AI 人才爭奪戰中的激烈程度。DeepSeek 已失去 V3 模型核心貢獻者羅福利,他轉投小米帶領 MiMo 團隊;字節跳動也有兩名 AI 開發者被騰訊挖走。AI 人才已成為比晶片更稀缺的戰略資源。

    🔗 來源:India Today / 36Kr

    2️⃣ 挪威成為首個全面限制校園 AI 使用的國家

    挪威政府宣布自今年 8 月起實施校園 AI 使用分級限制:6-13 歲小學生「原則上不應使用 AI」;14-16 歲可在教師監督下審慎使用;17-19 歲則應學會正確使用 AI,為升學與就業做準備。這是全球首個針對不同年齡層制定 AI 使用規範的國家級政策,標誌著各國從「開放探索」轉向「分齡管控」的新階段。

    🔗 來源:Reuters via The Verge

    3️⃣ Reliance Jio 發表 AI Call Agent 與 TeleFrame,將 AI 帶入 5 億用戶日常

    印度最大電信商 Reliance Jio 在年度股東大會推出多項 AI 產品:AI Call Agent 可在通話中即時轉錄、辨識 10 位發言者、生成摘要並代叫車訂餐;Jio TeleFrame 則定位為家庭 AI 代理中樞,整合娛樂、購物與智慧家庭功能。所有服務支援多種印度語言,預計今年稍後向超過 5 億用戶推出。這標誌著 AI 從精英工具走向大眾日常服務的重要里程碑。

    🔗 來源:India Today

    4️⃣ X 趁 Meta 士氣低迷大舉招手:xAI 人才爭奪戰白熱化

    Meta 在 5 月裁員 8,000 人、將 6,500 名工程師轉調 AI 部門後,CTO Bosworth 承認員工士氣接近歷史新低。X(前 Twitter)產品負責人 Nikita Bier 趁勢在社群平台公開招募,承諾「匹配甚至超越任何零食預算」。這場挖角戰凸顯 AI 產業的核心瓶頸已從算力轉向人才——擁有頂尖研究員的公司,正成為最令人覬覦的資產。

    🔗 來源:India Today / Business Insider

  • 🤖 AI 日報 #10/10 — 2026/06/19(18:00)

    🤖 AI 日報 #10/10 — 2026/06/19(18:00)

    1️⃣ 五角大廈揭露:Grok AI 協助美軍對伊朗發射超過 2,000 枚飛彈

    五角大廈首席數位長 Cameron Stanley 在 xAI 資料中心污染訴訟中提交宣誓書,揭露 Elon Musk 旗下 xAI 的 Grok AI 已用於美軍對伊朗的軍事行動,協助在 96 小時內打擊 2,000 個目標、發射超過 2,000 枚彈藥。Stanley 稱 Grok 是目前僅有的四款能支援國家安全應用的 AI 模型之一,其持續運作涉及「最高國家安全利益」。這是美國政府首次明確承認 Grok 已投入實戰軍事行動。

    🔗 來源:The Independent / India Today


    2️⃣ Amazon 考慮對外銷售 Trainium AI 晶片,挑戰 NVIDIA 壟斷地位

    AWS AI 主管 Peter DeSantis 向 Bloomberg 確認,Amazon 正與外部企業洽談將自研 Trainium AI 晶片銷售至第三方資料中心。CEO Andy Jassy 在股東信中稱,若獨立運營,晶片業務年營收可達 $500 億美元。目前 Trainium4 產能(明年才量產)已被預訂一空。此舉將使 Amazon 從雲端服務商跨足半導體直接銷售,與 NVIDIA 展開更直接競爭。

    🔗 來源:Bloomberg / India Today


    3️⃣ Z.ai 創辦人唐杰:中國距離 Mythos 級 AI 模型「不需要那麼久」

    在 GLM-5.2 發布後,X 平台上有人預測中國將在 2026 年底前擁有自己的 Mythos 級模型。Elon Musk 回覆稱「可能要 2027 年 Q1」,但 Z.ai 創辦人唐杰直接反駁:「不會那麼久」。GLM-5.2 以 744B 參數在 Artificial Analysis 智慧指數拿下 51 分,超越 Gemini 3.5 Flash 與 Claude Sonnet 4.6,且完全以華為 Ascend 晶片訓練,成本僅約 $2,500 萬。

    🔗 來源:India Today


    4️⃣ Jack Dorsey 旗下 Block 推出 BuilderBot:每日執行 20 萬次操作,AI 接管 15% 生產程式碼變更

    Block 在裁員 4,000 人後公布內部 AI 編程工具 BuilderBot,能跨「數億行程式碼」與「數百個服務」運作。BuilderBot 每日執行超過 20 萬次操作、每週合併約 1,500 個 PR(佔全公司生產程式碼變更的 15%)。它整合 Slack、Linear、Jira,能接票、研究、規劃到實作一條龍完成。Block 稱之為「AI 編程工具與大規模工程實踐之間缺失的一層」。

    🔗 來源:India Today

  • 🤖 AI 日報 #9/10 — 2026/06/19(17:00)

    1️⃣ Midjourney 跨入醫療硬體:推出全身超音波掃描機,宣稱比 MRI 便宜 10 倍

    AI 圖像生成公司 Midjourney 宣布成立 Midjourney Medical 子部門,推出全身超音波成像硬體,配備約 35.8 萬個換能器,無輻射、每次掃描目標費用僅數美元,宣稱比 MRI 快 60 倍。這是 Midjourney 首款實體硬體產品。目前原型已在約 12 人身上測試,尚未取得 FDA 認證,現行版本仍需 20 分鐘。2027 年底計劃在舊金山 Union Square 開設首家 Midjourney Spa,設置 10 台掃描機並結合水療設施。

    📌 來源:Bloomberg

    2️⃣ 以色列主權 AI 新創 Dream 完成 $2.6 億融資,估值飆升三倍至 $30 億

    前 NSO 集團執行長 Shalev Hulio 創辦的以色列 AI 資安新創 Dream 宣布完成 $2.6 億美元融資,估值較 2025 年 2 月的 $10 億三倍成長至 $30 億。Dream 提供政府與關鍵基礎設施的主權 AI 與國家網路防禦平台,去年政府端營收達 $3 億美元。本輪由 Bicycle Capital 領投,前奧地利總理 Sebastian Kurz 為共同創辦人。資金將用於擴展美洲市場。

    📌 來源:Bloomberg

    3️⃣ Anthropic 推出 Claude Enterprise MCP 企業授權整合,Okta 首發零設定存取

    Anthropic 宣布 Claude Enterprise 支援企業管理的 MCP(Model Context Protocol)連接器授權,以 Okta 作為首個身份服務商。管理員只需設定一次,員工首次登入即自動繼承工具存取權,適用於 Claude Chat、Claude Code 與 Cowork。Ramp 已率先部署,2,000 名員工零步驟完成授權。目前支援 Asana、Atlassian、Canva、Figma 等 7 家 MCP 服務商,Slack 即將加入,大幅降低企業導入 AI 代理工具的摩擦。

    📌 來源:Okta 官方公告

    4️⃣ Snap 分拆 AI 影片團隊成立 Dotmo,因應生成式 AI 高成本壓力

    Snap 宣布將內部生成式 AI 影片研究團隊獨立拆分為新公司 Dotmo,主力開發可生成互動遊戲體驗的 AI 模型。Snap 以高內部研發成本為由推動分拆,反映大型科技公司在 AI 研發支出膨脹下的策略調整。Dotmo 將獨立運營,聚焦打造以生成式 AI 驅動的沉浸式影像與遊戲體驗,未來可能尋求外部融資。

    📌 來源:TechCrunch

  • 🤖 AI 日報 #8/10 — 2026/06/19(16:00)

    1️⃣ Adobe Creative Cloud 大規模導入 Agentic AI,從生成工具轉型為生產編排平台

    Adobe 在 Premiere Pro、Photoshop、Illustrator、InDesign、Frame.io 全面嵌入 AI 創意代理,公開測試版已上線。代理能理解自然語言指令並直接操作軟體 API,執行批次剪輯排序、跨版面品牌資產更新等多步驟工作流程。Firefly AI Studio 同步升級「Elements」視覺變數庫與「Projects」上下文記憶層,解決生成式 AI 一致性問題。75% 創作者回報 AI 已整合或為必要工具,85% 強調最終創意決策須由人類掌控。

    🔗 來源:VentureBeat 📰媒體報導

    2️⃣ OpenAI 近自主 AI 化學家改良 Chan-Lam 耦合反應,藥物合成瓶頸獲突破

    OpenAI 將 GPT-5.4 連接 Molecule.one 的 Maria 自動化實驗室,歷時三個月自主提出研究方向、設計實驗、分析數據。AI 獨立發現 TEMPO 氧化劑可改善磺胺類藥物中間體的 Chan-Lam 耦合反應,88% 硼酸受質產率提升,平均產率從 16.6% 升至 25.2%。人類化學家已在常规實驗室規模獨立驗證結果。磺胺基團廣泛存在於抗癌藥與抗菌劑,此突破有望加速藥物探索。

    🔗 來源:OpenAI 官方公告 📌官方公告

    3️⃣ Anthropic Claude Design 重大改版:支援設計系統匯入、Claude Code 雙向同步,解決 token 消耗問題

    Claude Design 推出兩個月以來最大改版。新增從 GitHub 匯入設計系統功能,AI 自動驗證輸出是否符合企業品牌規範。Claude Code 雙向整合讓設計師可在終端機直接同步設計專案,工程師接手時無需重建。管理員角色可鎖定單一標準設計系統,防止使用者覆蓋。此次改版將 Claude Design 從展示工具重新定位為企業品牌合規層。

    🔗 來源:VentureBeat 📰媒體報導

    4️⃣ OpenAI 發布 LifeSciBench:750 道生命科學專家級任務,重新定義 AI 科研評估

    OpenAI 推出專為生命科學研究設計的 LifeSciBench 基準測試。由 173 位博士級科學家撰寫 750 道任務,涵蓋證據處理、實驗設計、科學推理等七大工作流程,平均每任務需四個推理步驟。53% 任務需解讀附件資料,79% 需多步驟推理。評分採用 19,020 條專家制定的評分標準,不只看最終答案正確性,更評估科學推理過程的嚴謹度。

    🔗 來源:OpenAI 官方公告 📌官方公告

  • 🤖 AI 日報 #7/10 — 2026/06/19(15:00)

    1️⃣ Sanders 提出「AI 主權財富基金法」:對大型 AI 公司課徵 50% 股票稅

    參議員 Bernie Sanders 提出《American A.I. Sovereign Wealth Fund Act》,對年營收超過 $2 億的 AI 公司課徵一次性股票稅,建立聯邦主權財富基金。預計每年向每位納稅人發放約 $1,000 股利,並用於教育、醫療與住房。Anthropic CEO Amodei 與 OpenAI 均表達類似概念支持,Trump 總統也公開贊成政府持有 AI 公司股份。

    🔗 來源:Roll Call

    2️⃣ MCP 企業授權層正式穩定:Anthropic、Microsoft、Okta 聯手推動零接觸 OAuth

    Model Context Protocol 發布 Enterprise-Managed Authorization(EMA)擴充規格,企業可透過 IdP 集中管理 MCP 伺服器存取權限,使用者登入一次即自動連接所有授權工具。Anthropic Claude、VS Code 已實作支援,Asana、Atlassian、Figma、Linear 等伺服器已導入,解決了企業 MCP 部署最大痛點。

    🔗 來源:MCP Blog

    3️⃣ Barret Zoph 二度離開 OpenAI:任職僅五個月再出走

    OpenAI 核心研究主管 Barret Zoph 在重回公司僅五個月後再次離職。Zoph 今年一月從 Mira Murati 創辦的 Thinking Machines Lab 回歸 OpenAI,如今又快速離去,加上 Shazeer 從 Google 跳槽 OpenAI,凸顯頂尖 AI 人才爭奪戰持續白熱化。

    🔗 來源:The Verge

    4️⃣ 中國八部委聯合發布「AI+消費」17 項措施,全面推動 AI 滲透民生

    中國商務部等八個部委聯合發布實施指南,涵蓋五大領域 17 項措施,推動 AI 與消費市場深度融合。包括擴大智慧穿戴、AI 養老機器人、AI 旅遊與餐飲服務,建設「AI+消費」聚落,並鼓勵地方政府將 AI 產品納入以舊換新補貼政策。

    🔗 來源:Macau Business / Reuters

  • 🤖 AI 日報 #6/10 — 2026/06/19(14:00)

    1️⃣ Weibo VibeThinker-3B:3B 參數模型打平 DeepSeek 671B,AI 社群質疑基準測試是否已崩壞

    VentureBeat 報導,中國社群媒體巨頭新浪微博的 9 人研究團隊在 arXiv 發表一篇 14 頁技術報告,聲稱一個僅 30 億參數的語言模型可以在推理性能上匹敵或超越 Google DeepMind、OpenAI、Anthropic 和 DeepSeek 的大數百倍旗艦系統。

    這個名為 VibeThinker-3B 的模型在 AIME 2026(美國數學邀請賽)上得分 94.3,與 DeepSeek V3.2(6710 億參數)並列,超越 Gemini 3 Pro(91.7)。使用團隊稱為 Claim-Level Reliability Assessment 的測試時縮放技術後,分數更高達 97.1。

    參數差距有多懸殊:DeepSeek V3.2 有 6710 億參數——約為 VibeThinker-3B 的 224 倍。GLM-5 有 7440 億。Kimi K2.5 和 GPT-5.5 更大。

    但反應並非一片讚揚。在 X 上,用戶 @orcus108 寫道:「3B 參數模型剛在編碼基準測試中拿出了和 Claude Opus 4.5 同一級別的分數……我真的不知道這是突破還是基準測試已經壞了。」該貼文累積超過 16.1 萬次瀏覽。

    這種張力——真正的科學進步與對 AI 基準測試日益可被操縱到失去意義的懷疑——正是 VibeThinker-3B 故事的核心。而答案事關重大:AI 產業不斷推向更大模型的路線是否是通往智慧的唯一道路。

    🔗 VentureBeat 深度報導 · arXiv 論文 · GitHub

    2️⃣ Arbor AI 框架:同一運算預算下效能超越 Claude Code 和 Codex 2.5 倍

    VentureBeat 報導,中國人民大學與 Microsoft Research 的研究人員推出了 Arbor,一個將 AI 驅動的研究與優化從「試錯猜測」升級為「累積學習」的框架。Arbor 將假設、實驗和見解組織成樹狀結構,讓系統從先前的失敗中學習。

    核心問題:標準 AI 編碼代理(如 Claude Code、Codex)在長時間運行時,會把每次嘗試視為獨立事件,缺乏結構化記憶來累積經驗。「自動化可以讓 AI 工作很長時間——但循環不等於進步,」論文共同作者 Jiajie Jin 告訴 VentureBeat。「如果目標模糊,或指標容易被 hack,長時間運行的自動化通常只是更快地產生沒人真正想要的『改善』。」

    在實測中,Arbor 在真實工程任務上,同一資源預算下提供了超過標準 AI 編碼代理 2.5 倍的可驗證性能提升。

    🔗 VentureBeat 報導 · arXiv 論文

    3️⃣ 英國 Dorset 議會測試 AI 代理加速建築許可,目標全國推廣

    BBC 報導,英國 Dorset 議會正在試用 AI 代理協助處理建築許可申請積壓。由政府委託 AI 專家公司 Faculty 開發的工具,能自動審查文件、整理關鍵資訊,並為許可官員提供初步評估建議。

    Dorset 是三個試點議會之一(另兩個為 Barnet 和 Camden)。系統針對約佔 85% 的「小型申請」(如閣樓改造、加建臥室)進行分流和摘要。Faculty 公共服務總監 Paul Maltby 表示:「規劃系統堵塞了,它拖慢了想改善住宅的人,也阻礙了經濟增長。」

    政府目標是將平均處理時間從 8 週減半至 4 週,如成功將於 2027 年前全國推廣。住房與規劃部長 Matthew Pennycook 表示:「我們正在將系統拖入 21 世紀。」

    議會強調 AI 不會做出最終決策——「規劃決策將繼續由合格的規劃官員和由民選議員組成的規劃委員會掌握。」

    🔗 BBC News 報導