🤖 AI 日報 #10/10 — 2026/05/08(18:00)

1️⃣ OpenAI 發布 GPT-Realtime-2 等三款語音模型,Realtime API 正式 GA

OpenAI 於 5 月 7 日正式推出三款全新語音 AI 模型,並宣告 Realtime API 退出 Beta 全面正式上線。GPT-Realtime-2 是首款搭載 GPT-5 等級推理能力的語音模型,能在回覆用戶時同步呼叫工具、處理打斷與修正,並流暢推進對話;GPT-Realtime-Translate 支援 70+ 種語言的即時語音翻譯;GPT-Realtime-Whisper 則提供毫秒級即時串流轉錄。三款模型已在 OpenAI API 與 Playground 上線,正式開啟語音代理的新時代。

📌 來源:OpenAI 官方公告

2️⃣ Google Gemini 3.1 Flash-Lite 正式上線:比同級模型便宜 60%,代理延遲不到 1 秒

Google 於 5 月 8 日宣布 Gemini 3.1 Flash-Lite 正式上線(GA),部署於 Gemini Enterprise Agent Platform。新模型主打極低延遲(p95 < 1 秒)、超高吞吐與業界最低成本,比同級思考模型便宜約 60%,並具備強大的工具調用、代碼補全、分類路由能力,成功率達 99.6%。定位為高量、成本敏感 AI 代理工作流的核心推論引擎。

📌 來源:Google Cloud Blog

3️⃣ 百度崑崙芯計劃 A+H 雙重上市,估值衝 1,000 億人民幣

彭博 5 月 8 日報導,百度 AI 晶片子公司崑崙芯正計劃在上海科創板(A 股)與香港(H 股)同步掛牌,並由中金公司主承銷。崑崙芯 58% 股份由百度控股,雙重上市目標估值達 100 億美元(約 1,000 億人民幣)。此前崑崙芯已於 2026 年 1 月秘密向港交所遞表,此番升格為 A+H 雙重上市,標誌中國自主 AI 晶片業走向更大資本市場舞台。

📌 來源:Bloomberg

4️⃣ xAI 發布 Grok 4.3:100 萬 token 上下文、代理工具調用登頂、成本降 20%

xAI 於 5 月 6 日正式透過 API 推出 Grok 4.3,同步宣布 8 款舊版模型將於 5 月 15 日退役。Grok 4.3 支援 100 萬 token 上下文、原生視頻輸入、三段可調推理強度及原生 MCP 伺服器連線。在 Artificial Analysis 代理工具調用與指令遵循排行榜拿下第一,法律與企業金融基準(CaseLaw v2、CorpFin)同登榜首,定價 $1.25/$2.50 per M tokens,比前代降低約 20%。

📌 來源:Artificial Analysis