🤖 AI 日報 #3/10 — 2026-04-03(11:00)
1️⃣ 微軟發布三款自研 AI 模型:MAI-Transcribe-1 全球轉錄最強、直接挑戰 OpenAI 與 Google
微軟於 4/2 正式推出三款完全自行研發的基礎 AI 模型——MAI-Transcribe-1(語音轉文字)、MAI-Voice-1(語音生成)、MAI-Image-2(圖像生成),即日起透過 Microsoft Foundry 與 MAI Playground 開放開發者使用。微軟 AI 執行長 Mustafa Suleyman 親自接受 VentureBeat 採訪,宣稱 MAI-Transcribe-1「不只是全球最佳轉錄系統,更只需競爭對手一半的 GPU 即可部署」——在 25 種主要語言的 FLEURS 基準測試中全數擊敗 OpenAI Whisper-large-v3 與 Google Gemini 3.1 Flash。定價:MAI-Transcribe-1 每小時 0.36 美元;MAI-Voice-1 每百萬字元 22 美元;MAI-Image-2 圖片輸出每百萬 token 33 美元。這是 Suleyman 六個月前組建微軟超智能團隊後首次對外推出的完整成果。
關鍵意義:微軟「AI 自給自足」戰略的最具體里程碑。過去微軟 AI 能力高度依賴 OpenAI,如今三款完全自研模型的登場,代表微軟正在構建平行於 OpenAI 的獨立技術棧。在微軟股票剛結束 2008 年以來最慘Q1的背景下,這是投資者等待的答案——每次 Teams 逐字稿、Copilot 圖片,都可能逐漸轉向成本更低的自研模型,對 OpenAI 的收入依賴將持續降低。
🔗 來源:微軟官方公告(4/2) | VentureBeat(4/2) | TechCrunch(4/2)
📌 官方公告 + 📰 媒體報導(Tier-1:VentureBeat、TechCrunch)
2️⃣ Google 發布 Gemma 4:首款 140+ 語言開源 Agentic 模型,直接搶 Meta Llama 的地盤
Google DeepMind 於 4/2 以 Apache 2.0 授權正式發布 Gemma 4 開源模型家族,共四款:行動端的 E2B 與 E4B、26B 混合專家(MoE)加速版、以及 31B Dense 旗艦版。Gemma 4 首度原生支援 140+ 種語言,並突破聊天機器人定位——支援多步驟規劃、自主行動、離線程式碼生成與音視覺處理,無需針對特定任務微調即可執行完整 Agentic 工作流。Android 裝置已透過 AICore Developer Preview 內建 Gemma 4,iOS/Android 版 Google AI Edge Gallery 同步推出「Agent Skills」功能,可在裝置端完全離線串接 Wikipedia 查詢、計算器等工具。
關鍵意義:Gemma 4 的戰略目標明確:在 30 億 Android 裝置上建立「預設裝置端 AI 代理」的主場優勢,搶下 Meta Llama 4 在開源開發者社群的地位。對台灣邊緣 AI 供應鏈而言,多語言、可離線的 Agentic 模型正是低功耗 AI SoC 的理想目標工作負載——這是殺手級應用終於成形的訊號。
🔗 來源:Google Developers Blog(4/2) | Engadget(4/2)
📌 官方公告 + 📰 媒體報導(Engadget)
3️⃣ 微軟宣布日本 100 億美元 AI 投資:繼新加坡後再出手,亞洲算力版圖快速成形
彭博社 4/3 今日早間獨家報導:微軟宣布在日本展開四年期 100 億美元(約台幣 3,300 億)AI 與雲端基礎建設投資計畫。這是繼 4/1 新加坡 55 億美元承諾之後,微軟在亞太地區兩天內宣布的第二筆重磅 AI 投資,合計超過 155 億美元。日本本土科技與製造業巨頭(軟銀、NTT、豐田、Sony)對 AI 算力的需求持續上升,且日本政府已將 AI 列為國家戰略產業。100 億美元的規模接近新加坡投資額的兩倍,凸顯日本在微軟亞洲戰略中的核心地位。
關鍵意義:兩天內先後宣布新加坡 55 億、日本 100 億,這不是分散的市場測試,而是微軟有意識地在亞洲構築算力防線——圍堵中國 AI 在亞太的擴張,並為美系 AI 生態系鞏固供應鏈根據地。對台灣而言,亞洲算力急速擴張直接拉動台積電先進製程與 AI 記憶體訂單;微軟選擇日本與新加坡(而非中國)集中算力,也為台灣科技出口帶來長期利多。
🔗 來源:Bloomberg(4/3)
📰 媒體報導(Tier-1:Bloomberg)