標籤: AI

  • 🤖 AI 日報 #5/10 — 2026-04-17(13:00)

    1️⃣ 英國啟動 6.75 億美元主權 AI 基金,投資本土新創並開放超級電腦資源

    英國政府宣布成立「Sovereign AI」創投基金,規模約 6.75 億美元,投資從模型開發、agentic AI 到藥物研發等領域的本土新創。獲投公司可使用英國超級電腦叢集、取得免費簽證名額與政府採購機會。首波已投資 Callosum 並提供六家新創各 100 萬 GPU 小時算力。主權 AI 競賽不再只是蓋資料中心,而是用創投加算力加政策的組合拳扶植本土產業鏈。

    🔗 來源:WIRED

    2️⃣ Anthropic 大幅擴展倫敦辦公室至 800 人規模,與 DeepMind、OpenAI 搶人才

    Anthropic 租下倫敦新辦公室,面積 15.8 萬平方英尺,可容納 800 人,是目前編制的四倍。新辦公室與 Google DeepMind、OpenAI、Meta 在同一街區。英國政府曾積極爭取 Anthropic 擴大倫敦據點,部分原因是 Anthropic 近期因拒絕讓模型用於大規模監控而與美國政府產生摩擦。前沿 AI 實驗室的人才爭奪戰已從矽谷延伸到倫敦國王十字區。

    🔗 來源:WIRED

    3️⃣ Musk 對 Altman 訴訟本月開庭,九人陪審團將決定 OpenAI 非營利使命之爭

    Elon Musk 對 Sam Altman 的訴訟即將在加州奧克蘭聯邦法院開庭,九名陪審員將審理 OpenAI 是否背離確保 AGI 造福人類的非營利創立使命。被告包括 OpenAI、Altman、Brockman 與 Microsoft。審判結果可能直接影響 OpenAI 今年 IPO 計畫,也會為前沿 AI 公司的非營利治理結構設下法律先例。

    🔗 來源:WIRED

  • 🤖 AI 日報 #4/10 — 2026-04-17(12:00)

    1. Meta 研究者提出「Hyperagents」架構,讓 AI 自我改進能力跨出程式碼領域

    Meta 與多所大學的研究團隊發表「Hyperagents」論文,打造能持續改寫自身問題解決邏輯與底層程式碼的自改進 AI 系統。有別於現有自改進架構只適用於軟體工程,Hyperagents 可在機器人控制、文件審查等非程式碼場域運作,還能自主發明持久記憶與自動效能追蹤等通用能力。這代表自改進 AI 正從「人類設計改進規則」邁向「AI 自己發明改進機制」,是通往高度自主 agent 的關鍵一步。

    🔗 來源:VentureBeat

    2. Retool 報告:AI 把軟體開發成本打到趨近零,但企業治理完全跟不上

    Retool 發布 2026 Build vs. Buy 報告,調查 817 位開發者發現 35% 團隊已用自建工具取代至少一套 SaaS,78% 計畫在 2026 年建造更多自研工具。當建構成本驟降一個數量級但 SaaS 定價紋風不動,每家公司的自建 vs 採購算式都在改寫。最容易被取代的是工作流自動化(35%)與內部管理工具(33%)。這不只是工具偏好轉變,而是 AI 正在拆解 SaaS 產業的定價基礎。

    🔗 來源:VentureBeat

    3. Cisco 提出「共享認知」協議,宣稱 AI 下一個瓶頸是 agent 能不能一起思考

    Cisco 旗下 Outshift 團隊提出新觀點:目前的 AI agent 可以串接、可以分工,但無法真正一起思考,缺乏語意對齊與共享上下文。團隊提出 SSTP、LSTP、CSTP 三種新協議,分別在語言層、潛空間層與壓縮狀態層實現 agent 間的認知共享,並與 MIT 合作推進相關研究。這代表 agent 基礎設施的競爭正從單 agent 能力走向多 agent 協作認知,若能實現,會是邁向分散式超級智慧的重要基礎。

    🔗 來源:VentureBeat

  • 🤖 AI 日報 #3/10 — 2026-04-17(11:00)

    🤖 AI 日報 #3/10 — 2026-04-17(11:00)

    1. Google 把 AI Mode 帶進 Chrome,搜尋與網頁瀏覽首次變成同頁並行

    Google 在 4 月 16 日宣布,Chrome 桌面版的 AI Mode 現在可把網頁與 AI 搜尋介面並排顯示,還能把最近分頁、圖片與 PDF 一起丟進同一輪查詢。這代表 AI 搜尋不再只是結果頁,而是直接變成瀏覽器裡的即時研究層。若這種體驗站穩,瀏覽器入口戰會從「誰先打開網頁」升級成「誰先接管理解、比較與追問流程」。

    🔗 來源:Google

    📌 官方公告(Google)

    2. Gemini 開始吃進 Google Photos 與個人偏好,AI 圖像生成往「超個人化」再推一步

    Google 同日推出新的 Personal Intelligence 圖像功能,讓 Gemini 結合使用者的 Google Photos 與個人偏好,用 Nano Banana 2 直接生成更貼近本人與親友的圖片,不再需要手動上傳參考照或寫超長提示詞。這件事的重要性在於,生成式 AI 的競爭焦點正從單次輸出品質,轉向誰能更深地吃進個人資料脈絡,做出真正難以替代的「個人 AI」。

    🔗 來源:Google

    📌 官方公告(Google)

    3. Google 找來 50 家 Fortune 500 人資主管談 AI 轉型,企業導入戰線正式拉到管理層

    Google 近期舉辦 Leading the AI Transformation summit,邀集超過 50 位《Fortune 500》企業的人資與學習發展主管,直接討論怎麼把 AI 納入員工訓練、管理流程與領導文化。文中點名 Walmart 幫 160 萬員工導入 Google AI 證照、Citi 全員訓練提示詞寫法,代表企業 AI 導入已從工具採購,走向整個組織再設計與主管帶頭示範的新階段。

    🔗 來源:Google

    📌 官方公告(Google)

  • 🤖 AI 日報 #2/10 — 2026-04-17(10:00)

    1️⃣ Anthropic 發布 Claude Opus 4.7,在 agentic 編碼與知識工作基準測試上險勝對手

    Anthropic 正式發布 Claude Opus 4.7,在 SWE-bench Pro 達到 64.3% 解決率(前代 53.4%),知識工作 GDPVal-AA 以 Elo 1753 超越 GPT-5.4 的 1674 與 Gemini 3.1 Pro 的 1314。新模型支援高解析度圖像(最高 3.75 百萬像素),視覺推理測試從 54.5% 躍升至 98.5%,並新增「effort」參數與 task budget 控制推理成本。API 定價維持 $5/$25 per million tokens 不變,已在 Bedrock、Vertex AI、Microsoft Foundry 上線。前沿模型競爭已進入「差之毫釐」的階段,Opus 4.7 與 GPT-5.4 在可比基準上僅 7:4 的差距,誰能先在 agentic 可靠性與成本控制上做出差異化,誰就能搶下企業生產環境的訂單。

    🔗 來源:AnthropicVentureBeat

    2️⃣ Google 據報與五角大廈談判,擬讓 Gemini 進入機密環境部署

    據 The Information 報導,Google 正與美國國防部談判,擬將 Gemini AI 模型擴展至機密環境使用,合約條款疑似沿用 OpenAI 與五角大廈協議中的「any lawful use」措辭。Google 現有合約僅允許 DOD 在非機密環境使用 Gemini。此舉代表 Google 正明顯逆轉過往對軍事合作的路線,同時也意味著「all lawful use」這類模糊法律語言正成為前沿 AI 公司與軍方合作的標準模板,實質上難以排除大規模監控或自主武器應用。

    🔗 來源:The VergeThe Information

    3️⃣ 白宮據報正準備讓聯邦機構使用 Anthropic 限制級 Mythos 模型

    Bloomberg 報導,白宮管理與預算辦公室(OMB)的 CIO 已通知政府官員,正準備讓各聯邦機構使用 Anthropic 的資安專用模型 Mythos。儘管 Anthropic 目前與五角大廈的紅線爭議仍在持續,白宮卻同時推進 Mythos 在聯邦政府的導入。這反映出一個矛盾:政策層面對 AI 軍事應用的分歧,與行政部門對最強模型實際需求之間的拉扯。Mythos 此前僅限於少數企業夥伴使用(包含 Nvidia、Apple、JPMorgan),若聯邦機構全面導入,將是限制級模型首次大規模進入政府體系。

    🔗 來源:BloombergThe Verge

  • 🤖 AI 日報 #1/10 — 2026-04-17(09:00)

    1️⃣ OpenAI Codex 大改版:背景操控 macOS 應用、內建瀏覽器、記憶與排程自動化

    OpenAI 發布 Codex 重大更新,新增背景電腦操作能力(background computer use),讓 agent 可在 macOS 上用獨立游標平行操作多個應用;內建瀏覽器讓開發者直接在頁面上給指令;新增記憶功能記住偏好與過去經驗;排程自動化可跨天執行長任務;並推出超過 90 個新插件整合 JIRA、GitLab、Microsoft Suite 等。這代表 AI coding agent 正從程式碼生成器升級為可接管整個開發桌面環境的作業系統級助手。

    🔗 來源:OpenAI 官方公告

    2️⃣ OpenAI 發布 GPT-Rosalind,首個生命科學專用前沿推理模型

    OpenAI 發表 GPT-Rosalind,首個針對生物學、藥物發現與轉譯醫學打造的前沿推理模型系列,在分子、蛋白質、基因與疾病相關推理任務上達到最佳表現。已與 Amgen、Moderna、Allen Institute、Thermo Fisher 等合作,在 ChatGPT、Codex 與 API 上以研究預覽形式提供。這代表前沿模型競爭正從通用能力轉向垂直領域的專用模型,藥物研發可能是 AI 下個最具經濟價值的垂直戰場。

    🔗 來源:OpenAI 官方公告

    3️⃣ Bernie Sanders 聯合工會領袖集會,推動 AI 勞工保護與資料中心暫停建設法案

    參議員 Bernie Sanders 與跨產業工會領袖舉行集會,推動 AI 勞工保護立法,並呼籲通過 AI 資料中心暫停建設法案(AI Data Center Moratorium Act)。Sanders 警告若不加以限制,十年內製造業工作將不復存在,並直接向科技巨頭喊話。這代表 AI 監管壓力正從政策圈擴大到基層勞工運動,勞工組織開始把 AI 視為與貿易政策同等重要的生存議題。

    🔗 來源:美國參議院官方新聞稿

  • 🤖 AI 日報 #1/10 — 2026/04/17(09:00)

    1. Anthropic 發布 Claude Opus 4.7,前沿模型競爭再度白熱化

    Anthropic 正式推出 Claude Opus 4.7,在 agentic coding、知識工作與文件推理等多項基準上超越 OpenAI GPT-5.4 與 Google Gemini 3.1 Pro,但領先幅度極小,顯示前沿模型競爭已進入毫釐之爭。最大升級是高解析度多模態支援,影像處理能力提升三倍,並新增自主驗證機制,可在回報前先自行檢查結果,降低長任務 hallucination 風險。

    來源:Anthropic 官方公告VentureBeat

    2. OpenAI 大更新 Codex,可自主操作 macOS 應用、內建瀏覽器與記憶系統

    OpenAI 發布 Codex 重大更新,新增背景電腦操控能力,讓多個 AI agent 能在 macOS 上同時操作應用程式而不干擾使用者工作。同步推出內建瀏覽器、gpt-image-1.5 圖像生成、超過 90 個新外掛、SSH 遠端連線,以及可跨天持續運作的自動化排程。這代表 AI coding agent 正從輔助工具進化為可自主運作的開發工作台。

    來源:OpenAI 官方公告

    3. OpenAI 推出 GPT-Rosalind,首個專為生命科學打造的前沿推理模型

    OpenAI 發表 GPT-Rosalind,以 Rosalind Franklin 命名,針對生物學、藥物開發與轉譯醫學最佳化。模型可支援化學反應機制、蛋白質工程、基因體學與實驗規劃等多步推理流程,並已與 Amgen、Moderna、Allen Institute、Thermo Fisher 等客戶合作。這代表前沿模型競爭開始延伸到垂直科研領域。

    來源:OpenAI 官方公告

  • 🤖 AI 日報 #10/10 — 2026/04/16(18:00)

    1️⃣ Stanford 發布 2026 AI Index 年度報告:中美差距幾乎消失,公眾信任持續下滑

    Stanford HAI 發布 2026 年 AI Index 年度報告,揭示多項關鍵趨勢:中國與美國的 AI 模型效能差距幾近歸零,Anthropic 僅以 2.7% 微幅領先;全球 AI 資料中心用電量已達 29.6GW,足以供應整個紐約州尖峰用電;生成式 AI 三年內達到 53% 人口採用率,比個人電腦和網路都快。但模型透明度指數從 58 分降至 40 分,公眾對 AI 的緊張感也持續升高。這份報告等於為整個產業拍了一張全景照:能力在飛速進步,但信任和治理正在掉隊。

    🔗 來源:Stanford HAI(官方報告)

    2️⃣ PwC 研究:74% 的 AI 經濟價值被 20% 的企業拿走,差距持續擴大

    PwC 最新 AI Performance Study 調查 1,217 名高階主管後發現,僅 20% 的組織拿走了 AI 帶來的 74% 經濟價值,這些領先者的 AI 驅動營收與效率增幅是同業的 7.2 倍。關鍵差異不在於用了多少 AI 工具,而是領先企業把 AI 當成商業模式再造的催化劑,特別是利用產業趨同創造新營收。這份報告凸顯 AI 導入正加速「贏者全拿」格局,多數企業仍卡在試驗階段。

    🔗 來源:PwC(官方新聞稿)

    3️⃣ Nature 報導:人類科學家在複雜任務上仍大幅領先最強 AI Agent

    Nature 引述 Stanford AI Index 報告指出,當前最強的 AI agent 在複雜科學任務上的表現仍僅有博士級專家的一半。儘管 AI agent 在日常任務的成功率已從 2025 年的 20% 躍升至 77.3%,資安任務更達 93%,但在需要深度推理、多步驟實驗設計與跨領域整合的科學工作流中,人類專家仍佔絕對優勢。這提醒產業:agent 能力快速進步不等於已能取代專業判斷。

    🔗 來源:Nature

  • 🤖 AI 日報 #9/10 — 2026/04/16(17:00)

    🤖 AI 日報 #9/10 — 2026/04/16(17:00)

    1. Cloudflare 將 Workflows 控制平面重構,專門承接 agent 高併發長任務

    Cloudflare 宣布把 Workflows 控制平面升級到新架構,將同時執行上限拉到 5 萬個實例、建立速率提升到每秒 300 個,明確瞄準 agent 在機器速度下大量啟動長任務的需求。這代表 agent 基礎設施競爭已從「能不能做」走向「能不能在高併發下穩定跑很久」,會直接影響企業把代理工作流搬進正式生產環境的可行性。

    🔗 來源:Cloudflare

    2. Cloudflare 推出 Registrar API Beta,讓 AI agent 可直接查詢並註冊網域

    Cloudflare 發表 Registrar API beta,讓開發者與 AI agent 能在編輯器、終端或 MCP 環境中直接搜尋網域、檢查價格與完成註冊。這件事的重要性不只是少切一個頁面,而是把「從想法到上線」流程再往前自動化一步,讓 agent 可以真正接手專案命名、資源準備與部署前置作業。

    🔗 來源:Cloudflare

    3. Adobe 在 Premiere 推出全新 Color Mode,靠 NVIDIA GPU 把調色流程拉回原生時間線

    Adobe 宣布在 Premiere beta 加入全新 Color Mode,提供可直接在剪輯流程內完成調色的介面,並透過 NVIDIA RTX GPU 加速 32-bit 色彩處理、播放與即時回饋。對 AI 內容產業來說,這代表創作者工具的競爭不只在生成模型,還在於誰能把高算力工作更深地塞回原生工作流,縮短從生成到成片的製作摩擦。

    🔗 來源:NVIDIA

    4. GitHub 展示 Copilot CLI 指揮台案例,AI coding agent 開始滲透個人生產力工作台

    GitHub 分享內部工程師以 Copilot CLI 為核心打造個人工作指揮台的案例,並強調以 plan-then-implement 與同步、非同步 agent 併行的開發方式,可以在一天內做出可用工具。這雖然不是新模型發布,但反映 AI coding agent 的主戰場正從示範 demo 轉向真實知識工作者的日常工作台與流程編排。

    🔗 來源:GitHub

  • 🤖 AI 日報 #7/10 — 2026/04/16(15:00)

    🤖 AI 日報 #7/10 — 2026/04/16(15:00)

    1. Meta 推出 Muse Spark,讓 Meta AI 升級為可切換思考模式的多代理助手

    Meta 發表由 Meta Superintelligence Labs 打造的首款模型 Muse Spark,並同步升級 Meta AI app 與 meta.ai。新版本可在 Instant 與 Thinking 模式間切換,還能平行啟動多個 subagents 處理複雜任務。這代表 Meta 不再只把 AI 當聊天功能,而是開始把自家助手升級成可推理、可多工、可跨產品擴散的主平台,直接卡位個人 AI 助手入口戰。

    🔗 來源:Meta

    2. Cloudflare 發布 voice pipeline,讓 Agents SDK 原生支援即時語音互動

    Cloudflare 推出實驗性套件 @cloudflare/voice,讓開發者用同一個 Agents SDK 架構就能加入即時語音互動,支援連續語音轉文字、文字轉語音與 WebSocket 通話流程,並沿用既有 Durable Object、工具與對話記憶。這件事的重要性在於,agent 介面正從文字框走向語音優先,誰能把語音直接併進既有代理執行環境,誰就更有機會搶下下一波日常使用場景。

    🔗 來源:Cloudflare

    3. NVIDIA 主打 cost per token,試圖重寫企業評估 AI 基礎設施的指標

    NVIDIA 發文主張企業評估 AI 基礎設施時,不該再只看 GPU 單價或 FLOPS per dollar,而應改用 cost per token 作為核心指標,並把模型推論吞吐、軟體優化、互連與功耗效率一起納入。這不只是行銷說法,而是 AI 基礎設施競爭正從「誰晶片規格強」轉向「誰能讓企業更便宜地產出可用 token」,會直接影響資料中心採購與推論經濟學。

    🔗 來源:NVIDIA

  • 🤖 AI 日報 #6/10 — 2026/04/16(14:00)

    🤖 AI 日報 #6/10 — 2026/04/16(14:00)

    1. Traza 獲 210 萬美元種子資金,主打讓 AI 代理直接接手採購流程

    紐約新創 Traza 宣布完成 210 萬美元 pre-seed 融資,目標不是只做採購建議,而是讓 AI 代理自動處理供應商詢價、訂單追蹤、發票核對與溝通流程。這代表企業 AI 正從「幫你看資料」進一步走向可直接接手營運後台,若真的跑得動,會開始動到採購人力配置與 ERP 軟體價值鏈。

    🔗 來源:VentureBeat

    2. Google 宣布把 Dynamic Search Ads 升級成 AI Max,搜尋廣告全面轉向 AI 投放

    Google 宣布 AI Max for Search campaigns 將於 9 月正式接手 Dynamic Search Ads、automatically created assets 與 campaign-level broad match,並主打在相近 CPA 或 ROAS 下平均多出 7% 轉換。這不只是廣告介面改版,而是 Google 正把搜尋廣告的關鍵字邏輯進一步交給 AI 決定,廣告主之後會更依賴模型判斷流量與創意分發。

    🔗 來源:Google

    3. Cloudflare 推出 Agent Lee,想把雲端控制台變成可直接對話操作的 AI 介面

    Cloudflare 發表內建於 dashboard 的 Agent Lee,讓使用者能直接用自然語言查帳號狀態、除錯 Workers、修改 DNS 或部署資源。官方表示它已在 beta 服務約 1.8 萬名日活用戶、每天執行近 25 萬次工具呼叫。這件事的重要性在於,SaaS 後台開始不只加聊天框,而是試圖把整個管理介面改寫成 agent 可執行的操作層。

    🔗 來源:Cloudflare

  • 🤖 AI 日報 #4/10 — 2026/04/16(12:00)

    🤖 AI 日報 #4/10 — 2026/04/16(12:00)

    1. Cloudflare 推出 Project Think,把 Agents SDK 升級成可長時間執行的代理平台

    Cloudflare 發表 Project Think,為 Agents SDK 加入 durable execution、sub-agents、sandboxed code execution 與 persistent sessions,讓 agent 不再只是短任務腳本,而是能長時間思考、行動與持續記憶的執行平台。這件事的重要性在於,agent 基礎設施競爭正從工具集合升級為完整運行時,誰能提供更穩定的長任務平台,誰就更有機會成為下一代 AI 應用底座。

    🔗 來源:Cloudflare

    2. Cloudflare 將 Browser Rendering 更名 Browser Run,主打 AI agent 可控瀏覽器

    Cloudflare 把 Browser Rendering 升級為 Browser Run,新增 Live View、Human in the Loop、CDP endpoint、session recordings 與更高並發上限,讓 AI agent 可以更穩定地操作網頁、除錯與必要時交還給真人。這代表瀏覽器正在從人類工具變成 agent 的標準執行環境,會直接影響自動化工作流能否真正落地到真實網站。

    🔗 來源:Cloudflare

    3. Gemini App 原生登上 macOS,Google 把桌面 AI 助手推進作業系統層

    Google 宣布 Gemini app 以原生 macOS 應用形式上線,支援 Option + Space 快捷鍵呼叫、分享螢幕內容與直接讀取本機檔案情境,讓 AI 協助從瀏覽器分頁走進桌面工作流。重要的不只是多一個 App,而是前沿模型競爭開始爭奪作業系統層的入口位置,誰能最先卡住桌面快捷操作,誰就更接近日常使用核心。

    🔗 來源:Google

    4. Google.org 投入 1000 萬美元,訓練 4 萬名製造業工作者 AI 技能

    Google.org 宣布投入 1000 萬美元支持 Manufacturing Institute,目標培訓 4 萬名美國製造業現職與未來工作者的 AI 能力,並擴大學徒制度到 15 個地區。這代表 AI 導入競爭已不只看模型或雲端,而是延伸到產線與技術工種的人才再訓練,誰能更早把 AI 技能帶進工廠,誰就更能掌握實體產業升級節奏。

    🔗 來源:Google.org

  • 🤖 AI 日報 #3/10 — 2026/04/16(11:00)

    🤖 AI 日報 #3/10 — 2026/04/16(11:00)

    1. Adobe 推出 Firefly AI Assistant,讓 Creative Cloud 變成可對話的創作代理

    Adobe 發表 Firefly AI Assistant,把 Photoshop、Premiere、Lightroom、Illustrator 等工具整合進單一對話介面,讓使用者用自然語言直接下達多步驟創作指令,還可延伸到 Anthropic Claude。這代表創作者工具正從「單點生成功能」升級為可跨軟體編排的代理工作流,Adobe 想搶下創意生產流程的 AI 操作層。

    🔗 來源:Adobe

    2. Google 發布 Gemini 3.1 Flash TTS,主打可用語音標籤精細控制講話風格

    Google 推出 Gemini 3.1 Flash TTS,新增 audio tags,可直接用自然語言調整語氣、節奏、口音與多角色對話,並已在 Gemini API、AI Studio、Vertex AI 與 Google Vids 展開預覽。這不只是語音更自然而已,而是把可編排、可量產的聲音生成能力推進到企業與開發者可直接上線的等級。

    🔗 來源:Google

    3. Google AI Studio 上線 Gemini API 預付費機制,先儲值再用量扣抵

    Google 宣布在 AI Studio 為 Gemini API 推出 Prepay Billing,開發者可先購買額度、設定自動儲值,再依餘額扣抵 API 用量,先在美國新 Cloud Billing 帳戶開放,之後全球推進。這件事的重要性在於,前沿模型競爭開始往商業化細節延伸,誰能把成本預期和付款流程做得更可控,誰就更容易把原型使用者轉成長期付費客戶。

    🔗 來源:Google

    4. Google 攜手 IDB 推出 3 項拉美 AI 計畫,把政府訓練、數位身分與政策指南打包推進

    Google 與美洲開發銀行 IDB 公布三項拉丁美洲 AI 新計畫,包括給政府官員的 AI Academy、協助政策制定的區域研究報告,以及由 Google.org 支援 500 萬美元推進數位公共基礎設施與跨國數位身分。這代表 AI 競爭已不只比模型,還在比誰能先卡進各國政府的訓練、制度與公共數位底座。

    🔗 來源:Google