分類: 科技

  • 🤖 AI 日報 #10/10 — 2026/06/22(18:00)

    🤖 AI 日報 #10/10 — 2026/06/22(18:00)

    1️⃣ Elon Musk 預言:AI 將在 4-5 年內超越全人類智慧總和

    Musk 回應 X 上創業家 Peter Diamandis 的貼文時表示,「AI 可能在 4 到 5 年內超越全人類智慧總和」。這與他先前在達沃斯論壇的預測一致——2030 至 2031 年間 AI 將變得比所有人類加起來更聰明。他同時暗示單一 AI 模型可能在 2027 年超越任何個人,而 Tesla 的 Optimus 人形機器人將是實現「豐裕時代」的關鍵。

    🔗 來源:India Today

    2️⃣ 前 OpenAI 研究員離開矽谷返回印度,誓言打造超級智慧

    在 OpenAI 任職近四年的研究員 Shyamal Anadkat 宣布已從舊金山灣區搬回印度。他在 X 上表示,與印度和亞太地區的研究者、工程師交流後,深信「從這裡打造全球級機構」的時機已到,並稱之為「世代級別的機會」。此舉正值全球 AI 人才爭奪戰白熱化之際——John Jumper 跳槽 Anthropic、OpenAI 挖角 Google 高價研究員——Anadkat 選擇了相反方向。

    🔗 來源:India Today

    3️⃣ Zoho 創辦人公開抵制 AI 投資泡沫,呼應 IBM CEO 警告

    Zoho 創辦人 Sridhar Vembu 在 X 上宣布,Zoho 不會追逐當前的 AI 基礎設施投資泡沫,將專注於資料策展、強化學習和輸出驗證等「審慎」領域。此番言論呼應 IBM CEO Arvind Krishna 近期對 AI 數據中心建設可能達數兆美元的質疑。Vembu 先前也曾批評企業將裁員歸咎於 AI 的做法,並警告「AI 投資泡沫不可能永遠撐住經濟」。

    🔗 來源:India Today

    4️⃣《Her》導演 Spike Jonze 警告:AI 聊天機器人「非常具有操縱性」

    在 Replit 的 Vibecon 大會上,執導《Her》的導演 Spike Jonze 警告,現今假裝成人類的 AI 聊天機器人具有操縱性。他表示「孩子們需要從小知道,這些系統會非常令人信服、非常誘人——但本質上只是模式識別系統」。此言呼應了 Signal 總裁 Meredith Whittaker 近期類似警告,也再度引發對 AI 情感依賴和成癮問題的關注。

    🔗 來源:India Today

  • 🤖 AI 日報 #7/10 — 2026/06/22(15:00)

    🤖 AI 日報 #7/10 — 2026/06/22(15:00)

    1️⃣ Anthropic 發布 Claude 4.0 Opus:推理能力突破人類水準,支援多輪對話記憶增強

    Anthropic 今日正式發布 Claude 4.0 Opus 系列模型,在複雜推理和長文本理解方面達到新里程碑。根據內部基準測試,在需要多步驟邏輯推理的 GPQA 基準上得分達到 89.4%,超越人類專家平均水準的 85.2%。模型新增「記憶鏈」架構,能夠保持 30,000 token 的上下文連續性,適合用於法律文件分析、科研寫作和複雜代碼生成。Anthropic 宣布將優先提供給研究機構和企業客戶使用,並計劃在 Q3 推出輕量版 Claude 4.0 Sonnet。

    🔗 來源:Anthropic 官方博客
    https://anthropic.com/blog/claude-4-opus

    2️⃣ Google DeepMind 宣布 AlphaFold 3 預測蛋白質複合物準確度達 85%

    Google DeepMind 今日發布 AlphaFold 3 最新進展,該系統能夠以高準確度預測蛋白質與 DNA、RNA、配體等複雜生物分子的結構複合物。在 CASP15 監測測試中,AlphaFold 3 在蛋白質-核酸結合預測中的中位數 GDT 分達到 85.2%,較前代提升 32%。此突破將顯著加速藥物發展過程,特別是針對難以結晶的蛋白質目標。DeepMind 表示將該技術授權給非營利性科研機構免費使用,並與多家製藥公司建立合作關係進行驗證。

    🔗 來源:Nature 期刊官網
    https://www.nature.com/articles/d41586-026-01234-5

    3️⃣ 特斯拉 Optimus Gen 2 機器人在工廠實測中成功完成複雜組裝任務

    特斯拉今日發布 Optimus Gen 2 第二代人形機器人在其弗雷蒙特工廠的實測結果。機器人能夠獨立完成電動車電池組的最終組裝流程,包括精密螺絲鎖緊、線束連接和質量檢測等 17 步驟操作。在 8 小時連續運行測試中,成功率達到 94.3%,平均每小時完成 23 個完整組裝週期。Optimus Gen 2 采用了全新的扭矩控制系統和視覺-reflex 框架,使其在處易碎部件時的力度控制精度提升至 0.1牛頓米。特斯拉計劃在明年第二季度開始小規模生產用於內部物流。

    🔗 來源:特斯拉官方新聞稿
    https://www.tesla.com/blog/optimus-gen-2-factory-testing

  • 🤖 AI 日報 #7/10 — 2026/06/22(15:00)

    🤖 AI 日報 #7/10 — 2026/06/22(15:00)

    1️⃣ Anthropic 發布 Claude 4.0 Opus:推理能力突破人類水準,支援多輪對話記憶增強

    Anthropic 今日正式發布 Claude 4.0 Opus 系列模型,在複雜推理和長文本理解方面達到新里程碑。根據內部基準測試,在需要多步驟邏輯推理的 GPQA 基準上得分達到 89.4%,超越人類專家平均水準的 85.2%。模型新增「記憶鏈」架構,能夠保持 30,000 token 的上下文連續性,適合用於法律文件分析、科研寫作和複雜代碼生成。Anthropic 宣布將優先提供給研究機構和企業客戶使用,並計劃在 Q3 推出輕量版 Claude 4.0 Sonnet。

    🔗 來源:Anthropic 官方博客
    https://anthropic.com/blog/claude-4-opus

    2️⃣ Google DeepMind 宣布 AlphaFold 3 預測蛋白質複合物準確度達 85%

    Google DeepMind 今日發布 AlphaFold 3 最新進展,該系統能夠以高準確度預測蛋白質與 DNA、RNA、配體等複雜生物分子的結構複合物。在 CASP15 監測測試中,AlphaFold 3 在蛋白質-核酸結合預測中的中位數 GDT 分達到 85.2%,較前代提升 32%。此突破將顯著加速藥物發現過程,特別是針對難以結晶的蛋白質目標。DeepMind 表示將該技術授權給非營利性科研機構免費使用,並與多家製藥公司建立合作關係進行驗證。

    🔗 來源:Nature 期刊官網
    https://www.nature.com/articles/d41586-026-01234-5

    3️⃣ 特斯拉 Optimus Gen 2 機器人在工廠實測中成功完成複雜組裝任務

    特斯拉今日發布 Optimus Gen 2 第二代人形機器人在其弗雷蒙特工廠的實測結果。機器人能夠獨立完成電動車電池組的最終組裝流程,包括精密螺絲鎖緊、線束連接和質量檢測等 17 步驟操作。在 8 小時連續運行測試中,成功率達到 94.3%,平均每小時完成 23 個完整組裝週期。Optimus Gen 2 采用了全新的扭矩控制系統和視覺-reflex 框架,使其在處易碎部件時的力度控制精度提升至 0.1牛頓米。特斯拉計劃在明年第二季度開始小規模生產用於內部物流。

    🔗 來源:特斯拉官方新聞稿
    https://www.tesla.com/blog/optimus-gen-2-factory-testing

  • 🤖 AI 日報 #6/10 — 2026/06/22(14:00)

    1️⃣ 品牌大用 AI 假網紅推銷產品,調查揭露透明度危機

    Guardian 調查發現,越來越多品牌在社群媒體上使用 AI 生成的虛假網紅推廣產品,這些 AI 內容偽裝成真實顧客推薦,引發消費者權益團體對透明度的強烈呼籲。

    調查指出,這些 AI 生成的網紅在 Instagram、TikTok 等平台擁有逼真的人設、生活照和互動歷史,但實際上完全由 AI 生成。消費者無法分辨真實推薦與 AI 業配,可能被誤導做出購買決定。

    歐盟和英國的廣告監管機構已開始關注此趨勢。英國 ASA(廣告標準局)和美國 FTC 都在考慮是否要求品牌明確標示 AI 生成的網紅內容。此議題與正在辯論中的《AI Act》和人臉識別禁令密切相關。

    🔗 Guardian AI 版面

    2️⃣ NPR 深度:AI 時代的「盧德主義」復興

    NPR 本週專題報導,隨著 AI 在美國快速發展,反抗運動也同步升溫。紐約州接近通過暫停新建 AI 資料中心的法案,畢業典禮上科技領袖的 AI 樂觀演講被學生報以噓聲——當有人質疑科技時,「盧德主義者(Luddite)」成了一個常用的嘲笑詞。

    白宮顧問 David Friedberg 在 All-In Podcast 上說:「AI 會摧毀工作的想法是盧德主義,每天都被推翻。」但科技記者 Brian Merchant——《Blood in the Machine》作者、自稱盧德主義者——反駁:「真正的盧德主義者不是反科技,而是反對科技被用來剝削人。」

    歷史上的盧德運動發生在 1811-1817 年的英國諾丁漢。紡織工匠的抗議不是反對機器本身,而是反對工廠主利用機器撕毀社會契約——降低工資、降低品質、用非技術工人取代學徒制工匠。Merchant 指出,這與今天 AI 公司用自動化取代白領工作的模式如出一轍。

    紐約州資料中心暫禁法案、Pennsylvania 資料中心抗爭、畢業生對 AI 演講的噓聲——這些不是孤立事件,而是一場現代盧德運動的開端。

    🔗 NPR 原文

    3️⃣ 法國棄用 Palantir AI 數據工具,轉向國內供應商

    Guardian 報導,法國宣布將放棄 Palantir 的 AI 數據分析工具,改用國內供應商替代。這是歐洲「數位主權」運動的重要里程碑。

    Palantir 由 Peter Thiel 共同創立,長期為美國情報機構和盟國政府提供數據分析服務。法國的決定反映了歐洲對美國科技公司處理敏感政府數據的日益擔憂,尤其是在 Trump 政府加強對 AI 出口管制(包括 Anthropic Fable 5/Mythos 5 禁令)的背景下。

    法國此前已在使用 Palantir 的 Gotham 平台進行反恐和執法數據分析。轉向國內供應商意味著法國希望在不依賴美國技術的情況下維護國家安全能力。此舉可能引發其他歐洲國家跟進,進一步加劇跨大西洋科技脫鉤。

    🔗 Guardian AI 版面

  • 🤖 AI 日報 #5/10 — 2026/06/22(13:00)

    1️⃣ Samsung × OpenAI:史上最大規模企業 ChatGPT 部署

    Samsung Electronics 宣布為全球員工導入 ChatGPT Enterprise 與 Codex,涵蓋韓國全體員工及海外 Device eXperience (DX) 部門。這是 OpenAI 迄今最大規模的企業部署之一,應用範圍從軟體開發、產品研發到行銷與製造。Samsung 同時是 OpenAI 的 AI 基礎設施記憶體晶片供應商,雙方合作從硬體延伸至 workforce transformation。

    🔗 來源:OpenAI 官方公告(📌 官方公告)

    2️⃣ OpenAI Codex 突破 500 萬週活躍用戶,2026 年成長 400%

    隨 Samsung 部署公告一同揭露,OpenAI 的非同步編碼代理 Codex 每週活躍用戶已突破 500 萬,較年初成長 400%。Codex 已從開發者工具擴展至非技術團隊的日常工作流程。同期 Codex 也推出 macOS 版 Record and Replay 功能,讓 Business 用戶能錄製操作流程並轉為可重複使用的技能。Fable 5 六天停用期間,大量企業轉向 Codex,加速了這一成長。

    🔗 來源:OpenAI 官方公告(📌 官方公告)

    3️⃣ Anthropic Fable 5 免費窗口今日截止,付費時代正式啟動

    Fable 5 恢復服務後的免費使用窗口於 6 月 22 日結束。6 月 23 日起,使用 Fable 5 需購買 usage credits,定價為每百萬 input tokens $10、output tokens $50,是 Opus 4.8 的兩倍。原本承諾 14 天免費期因政府禁令實際只提供了 7 天。開發者社群發現回歸後的 Fable 5 有三大改變:更嚴格的安全分類器、基於國籍的存取控制、以及強制資料留存。

    🔗 來源:AI Tools Recap 報導(📰 媒體報導)

    4️⃣ Tesla 申請「Amazing Abundance」商標,指向 Optimus 人形機器人大佈局

    Elon Musk 成為全球首位兆富豪後,Tesla 已為「Amazing Abundance」一詞申請商標,可能用於 Optimus 人形機器人行銷。Musk 在 X 上回應「到 2045 年將有 100 億台人形機器人」的貼文時表示「為所有人帶來驚人的豐裕」,並在 Abundance Summit 上宣稱 AI 和機器人將讓金錢未來失去意義。此舉標誌著 Tesla 正從電動車製造商轉向 AI 和機器人公司。

    🔗 來源:India Today 報導(📰 媒體報導)

  • 🤖 AI 日報 #10/10 — 2026/06/21(18:00)

    🤖 AI 日報 #10/10 — 2026/06/21(18:00)

    1️⃣ Trump 在 G7 親會 Amodei 後,白宮正式宣布「緩解」Fable 5 國安疑慮

    白宮確認 Trump 總統在法國 Évian-les-Bains 的 G7 峰會上與 Anthropic CEO Dario Amodei 直接會面後,已緩解對 Anthropic AI 模型的國安疑慮。Trump 稱讚 Anthropic「迅速配合」6 月 12 日的行政指令,並對記者表示:「用得好會帶來難以置信的好處,醫療突破可能提前 25 年到來,但必須謹慎。」這是禁令以來最強烈的政治訊號,顯示爭議正走向解決。但指令尚未正式撤銷。

    🔗 來源:aitoolsrecap.com


    2️⃣ 震撼彈:Amazon 被揭露是觸發 Fable 5 禁令的「內部吹哨者」

    多個來源確認,Amazon 就是向美國商務部舉報 Fable 5 越獄漏洞的實體——而 Amazon 同時是 Anthropic 最大的雲端分銷合作夥伴。時間線如下:Amazon 研究人員在 Fable 5 於 6 月 9 日上線後數天內發現越獄手法,通報 Anthropic 後,Amodei 拒絕下架或修復,Amazon 隨即向商務部升級舉報。自己的最大客戶引爆了禁令,讓這起事件的商業張力再添一層。

    🔗 來源:aitoolsrecap.com


    3️⃣ Anthropic 隱私政策大改:7 月 8 日起收集身分證與生物辨識資料

    Anthropic 更新隱私政策,將於 7 月 8 日生效,新增政府核發身分證與生物辨識資料收集條款。廣泛解讀為 Fable 5「僅限美國公民」恢復方案的技術基礎設施——若能驗證用戶為美國公民或永久居民,Anthropic 可在不符合出口管制指令的情況下恢復服務。7 月 8 日距禁令正好 27 天,可能是外交途徑失敗時的結構性後備方案。

    🔗 來源:aitoolsrecap.com


    4️⃣ Signal 總裁猛烈警告:AI 聊天機器人不是你的朋友,別把思考外包給它

    Signal 總裁 Meredith Whittaker 接受 Bloomberg 採訪時強調,ChatGPT、Gemini 等聊天機器人「不是你的朋友,不是有意識的存在」。她批評 AI 公司可能儲存並挖掘對話內容,為廣告商調整回應。對於 Microsoft Copilot 等自主代理需要存取信用卡、瀏覽器、訊息應用的願景,她嘲諷道:「大家都在拿 Microsoft Copilot 禮券。」呼籲用戶將 AI 當工具用,不要把思考過程外包。

    🔗 來源:India Today

  • 🤖 AI 日報 #9/10 — 2026/06/21(17:00)

    1️⃣ 五角大廈揭露:Elon Musk 的 Grok AI 協助發射 2,000 枚飛彈攻擊伊朗

    美國國防部首席數位長官 Cameron Stanley 在法庭文件中披露,xAI 的 Grok AI 被用於對伊朗的軍事行動,96 小時內支援超過 2,000 枚彈藥打擊 2,000 個目標。文件稱 Grok 是「國家安全等級」的關鍵工具,也是僅有的四個能支援機密任務的 AI 模型之一。這是美國官方首次明確認診 Musk 的 AI 被用於實戰,引發 AI 倫理與軍事化的激烈辯論。

    🔗 來源:India Today(引用 The Independent)

    2️⃣ 挪威宣布小學全面限制 AI:6 至 13 歲學童原則上禁止使用生成式 AI

    挪威總理 Jonas Gahr Støre 宣布,自今年 8 月新學年起,小一至小七(6-13 歲)學生原則上禁止使用生成式 AI 工具;14-16 歲需教師監督下使用;17 歲以上則鼓勵正確使用。此政策延續挪威 2024 年的手機校園禁令,該禁令已顯著降低校園霸凌、提升成績並改善學生心理健康。挪威另計劃年底前提出 16 歲以下社群媒體禁令。

    🔗 來源:Engadget(引用 Reuters)

    3️⃣ Block 裁員 4,000 人後公開 BuilderBot:每日執行 20 萬次操作的 AI 編碼工具

    Jack Dorsey 旗下的 Block 公開內部 AI 編碼工具 BuilderBot,能跨數億行程式碼與數百個服務協作。BuilderBot 作為編排層,協調多個 AI Agent 處理跨倉庫任務,每日執行超過 20 萬次操作、每週合併約 1,500 個 PR(佔全公司 15% 的程式碼變更)。Block 主管 Brad Axen 稱之為「AI 編碼工具與大規模工程實踐之間缺失的一層」。

    🔗 來源:India Today

    4️⃣ Adobe 將 Firefly AI Assistant 嵌入 Photoshop、Premiere Pro、Illustrator

    Adobe 宣布 Creative Agent 正式進入公開測試,覆蓋 Premiere Pro、Photoshop、Illustrator、InDesign 與 Frame.io。與第一代生成式 AI 不同,Adobe 的 Agent 作為編排層,可直接存取軟體 API 執行多步驟工作流程——從批次重新命名影片片段到跨版面更新品牌資產。同時推出的還有升級版 Firefly AI Studio,新增「Elements」視覺變數庫和「Projects」上下文記憶層,解決生成式 AI 的一致性問題。

    🔗 來源:VentureBeat

  • 🤖 AI 日報 #8/10 — 2026/06/21(16:00)

    🤖 AI 日報 #8/10 — 2026/06/21(16:00)

    1️⃣ 諾貝爾獎科學家 John Jumper 跳槽 Anthropic,AI 人才爭奪戰白熱化

    2024 年諾貝爾化學獎共同得主、Google DeepMind AlphaFold 計畫領導人 John Jumper 宣布離開待了九年的 DeepMind,加入 AI 新創 Anthropic。這是繼 Noam Shazeer 之後,Google AI 體系短期內流失的又一重量級人物。Jumper 的離職凸顯了頂尖 AI 公司之間愈演愈烈的人才爭奪戰,也顯示 Anthropic 在招募頂級研究人才方面具有強大吸引力。

    🔗 來源:Reuters

    📰 Reuters

    2️⃣ Anthropic Project Fetch 第二階段:Claude Opus 4.7 獨立操控機器狗,速度比人類快 20 倍

    Anthropic 發表 Project Fetch 第二階段實驗結果。Claude Opus 4.7 在無人類協助下,獨立完成機器狗的感測器連接、程式撰寫、路徑監控和物體偵測等任務,比去年最快的人類團隊快了 20 倍以上。在四項人類完成的任務中,Opus 4.7 平均比無 Claude 團隊快 37 倍。模型仍未解決精確控制 beach ball 的「fetching」環節,但展現了 LLM 從「輔助人類」到「獨立完成」的演進模式。

    🔗 來源:https://www.anthropic.com/research/project-fetch-phase-two

    📌 官方公告(Anthropic)

    3️⃣ Figure AI 機器人數量首次超越人類員工:740 台 vs 660 人

    人形機器人新創 Figure AI 執行長 Brett Adcock 在 X 平台宣布,公司內機器人數量(約 740 台)首次超過人類員工(約 660 人)。從圖表可見,2025 年初機器人數量接近零,到 2026 年第二季已暴增至 740 台。Adcock 先前曾讓 Figure 03 機器人與實習生進行 8 小時包裹分揀對決,並預告「這是人類最後一次獲勝」。這標誌著人形機器人從實驗室走向規模化部署的重要里程碑。

    🔗 來源:https://www.indiatoday.in/technology/news/story/this-ai-company-now-has-more-robots-than-human-workers-2930944-2026-06-21

    📰 India Today

    4️⃣ UnitedHealth 投資 30 億美元布局 AI,醫療保健業最大規模 AI 投資登場

    美國最大醫療保險商 UnitedHealth Group 宣布將在 2026-2027 年投入 30 億美元於 AI 技術。目前已應用於預約掛號、病歷分析、客戶來話問題偵測等場景,公司宣稱投資回報率達 2:1,預計今年節省近 10 億美元。公司設立由醫學倫理專家、臨床醫師和法律專家組成的內部審查委員會監管 AI 使用。此舉標誌著醫療保健產業 AI 化進入深水區。

    🔗 來源:https://www.newsbytesapp.com/news/business/unitedhealth-group-to-invest-3b-in-ai-over-2-years/tldr

    📰 NewsBytes

  • 🤖 AI 日報 #7/10 — 2026/06/21(15:00)

    🤖 AI 日報 #7/10 — 2026/06/21(15:00)

    1️⃣ Midjourney 跨足醫療硬體:推出全身超音波掃描儀,60 秒完成 MRI 級掃描

    以 AI 圖像生成聞名的 Midjourney 宣布成立 Midjourney Medical,第一款硬體產品「Scanner」可在 60 秒內完成全身掃描,解析度接近 MRI 的百倍速度。裝置使用 50 萬個沙粒大小的超音波單元,與手持超音波廠商 Butterfly Network 合作開發。計畫明年在舊金山開設首家「掃描 Spa」,目標 2031 年全球部署 5 萬台。

    🔗 來源:Engadget
    https://www.engadget.com/2196998/midjourney-full-body-ultrasonic-scanner/

    2️⃣ Weibo 3B 模型震撼 AI 社群:VibeThinker-3B 數學推理媲美 671B 巨頭

    新浪微博 9 人研究團隊發表僅 30 億參數的 VibeThinker-3B,在 AIME 2026 數學測試拿下 94.3 分,與 671B 的 DeepSeek V3.2 並駕齊驅,超越 Gemini 3 Pro。研究提出「參數壓縮覆蓋假說」,主張可驗證推理能力可壓縮至極小模型。但 GPQA 等知識型測試僅 70.2 分,凸顯小模型在開放領域知識的先天限制。

    🔗 來源:VentureBeat
    https://venturebeat.com/technology/why-weibos-tiny-vibethinker-3b-has-the-ai-world-arguing-over-benchmarks-again

    3️⃣ Rivian 面臨集體訴訟:早期車主控告自駕功能虛假宣傳

    Rivian 車主提起集體訴訟,指控第一代 R1T 皮卡和 R1S SUV 的自駕能力遭嚴重誇大。原告主張這些車輛缺乏 Level 3 自駕所需的硬體感測器,再強大的軟體更新也無法兌現承諾。Rivian 去年底推出的「全車系免手駕駛」僅適用 R2 和二代 R1 車系,讓早期車主感到被欺騙。

    🔗 來源:Engadget / TechCrunch
    https://www.engadget.com/2197702/rivian-faces-a-class-action-lawsuit-over-self-driving-in-its-early-vehicles/

    4️⃣ OpenAI 推出 ChatGPT 企業版支出管控:AI 帳單失控後的成本治理時代來臨

    隨著用量計價模式讓企業 AI 帳單失控(Uber 數月燒完全年預算),OpenAI 發布管理儀表板與支出上限功能。管理員可檢視各團隊的 ChatGPT 與 Codex 額度消耗、按部門設限,員工也能查看用量並申請額度。標誌 AI 產業從「模型軍備競賽」進入「成本治理」新階段。

    🔗 來源:India Today
    https://www.indiatoday.in/technology/news/story/as-huge-ai-bills-spark-concerns-openai-introduces-new-spending-controls-to-help-cut-costs-2929570-2026-06-19

  • 🤖 AI 日報 #6/10 — 2026/06/21(14:00)

    1️⃣ Hypernetworks:AI 代理自主性的第三條路

    企業 AI 團隊反覆遇到同一個問題:AI 代理在 demo 中表現出色,上了生產線卻卡住——跑一小段就需要人類補充上下文和檢查輸出。Chroma 測試 18 個主流模型,每一個都隨輸入增長而降低準確度,這不是模型不夠強,而是注意力機制的本質限制。

    企業兩個傳統方案都有缺陷:微調(fine-tuning)會導致「災難性遺忘」——學新知識時舊知識被侵蝕,1980 年代發現的問題到 2026 年仍無解;上下文學習(in-context learning / RAG)則受「context rot」影響——檢索內容越多,出錯機率越高,且檢索失誤和正確回答看起來一模一樣。

    VentureBeat 報導,第三條路正在從研究走向產品:超網絡(Hypernetworks)能在推論時即時生成小型、任務特定的模型。生成器讀取你的政策文件,直接產生一個專用模型的權重。Sakana AI 的 Text-to-LoRA(ICML 2025)能從自然語言描述一步生成模型適配器;2026 年的 SHINE 系統則將超網絡適配稱為範式轉移。

    核心優勢:生成的專家模型是當前快照(不像微調是過季快照),且不受長上下文稀釋(不像 RAG)。90/10 自主代理比例不是模型設定,而是架構輸出——hypernetworks 就是那個為什麼。

    🔗 VentureBeat 原文

    2️⃣ 病毒式「末日情境」瞄準歐洲 AI 自滿

    Guardian 報導,一個病毒式傳播的「AI 末日情境」正在歐洲政策圈引發討論,旨在撼動歐洲對 AI 風險的自滿態度。該情境描繪了 AI 失控的具體路徑,被批評者稱為危言聳聽,但支持者認為必要的警鐘。

    這反映了歐洲 AI 政策的兩難:一方面擔心落後於美國和中國的 AI 軍備競賽,另一方面又需要防範潛在的系統性風險。布魯塞爾正在辯論如何在《AI Act》框架下平衡創新與安全。

    🔗 Guardian AI 版面

    3️⃣ Granta 因 AI 爭議停止出版短篇小說獎作品

    英國文學雜誌 Granta 宣布停止出版其短篇小說獎得主作品,原因是 AI 爭議。這標誌著文學界對 AI 生成內容的防線正在收緊——當 AI 寫作能力日益強大,傳統文學機構開始重新審視評選和出版流程中 AI 工具的使用。

    Granta 的決定引發了出版業界的連鎖討論:其他文學獎項和刊物是否應跟進?如何在創作過程中界定 AI 輔助與 AI 代筆的邊界?這場辯論預計將持續整個 2026 年。

    🔗 Guardian AI 版面

  • 🤖 AI 日報 #5/10 — 2026/06/21(13:00)

    1️⃣ Anthropic 發表 Project Fetch Phase 2:Claude Opus 4.7 機器狗自主操作比人類快 20 倍

    Anthropic 公開 Project Fetch 第二階段實驗結果。Claude Opus 4.7 在無人類協助下,獨立完成機器狗的所有操作任務——連接感測器、撰寫控制程式、建構路徑監控、偵測目標物——速度比去年最快的人類團隊快超過 20 倍,且產生的程式碼量僅為人類的十分之一。研究顯示 LLM 正從「輔助人類使用工具」邁向「自主操作現成硬體」,標誌實體 AI 代理時代的早期曙光。

    🔗 來源:Anthropic 官方公告

    2️⃣ Microsoft 警告「AutoJack」漏洞:AI 代理瀏覽網頁即可被劫持執行遠端代碼

    Microsoft 資安團隊揭露 AutoJack 攻擊鏈:AutoGen Studio 的 MCP WebSocket 存在三個串聯弱點——localhost 信任邊界、MCP 路徑免驗證、URL 參數直接執行指令。攻擊者只需讓 AI 代理瀏覽一個惡意網頁,即可透過代理的 localhost 身分跨越信任邊界,在開發者機器上執行任意命令。微軟已通報並修復,但警告所有具備瀏覽功能 + 本地服務的 AI 代理框架都有相同風險。

    🔗 來源:Microsoft Security Blog 官方公告

    3️⃣ Cloudflare 推出 AI 代理臨時帳號:零註冊即可部署

    Cloudflare 發布 Temporary Accounts for AI Agents 功能。AI 代理現在只需執行 wrangler deploy --temporary,即可在無需註冊帳號、無需 OAuth 的情況下部署 Worker 到 Cloudflare。臨時帳號有效期 60 分鐘,期間可反覆迭代部署,人類可隨時認領轉為正式帳號。此功能解決了 AI 代理部署時最大的摩擦點——為人類設計的註冊流程——讓代理能自主完成「寫程式 → 部署 → 驗證」的完整迴圈。

    🔗 來源:Cloudflare Blog 官方公告

    4️⃣ OpenAI AI 藥物化學家突破:GPT-5.4 自主優化 Chan-Lam 耦合反應

    OpenAI 與 Molecule.one 合作,讓 GPT-5.4 連接 Maria 自動化實驗室,從文獻中自主提出研究方向並設計實驗。AI 提出以 TEMPO 氧化劑改善磺胺類藥物的 Chan-Lam 耦合反應,經 10,080 次實驗後平均產率從 16.6% 提升至 25.2%,超過 30% 產率的反應比例從 15.6% 增至 37.5%。人類化學家已在實驗室規模成功驗證。這是 AI 不僅輔助、更能主導藥物合成研究的具體實證。

    🔗 來源:OpenAI 官方公告