1️⃣ Google DeepMind 發布 Lyria 3 Pro:AI 音樂生成突破 3 分鐘大關,全面整合 Gemini 生態
Google DeepMind 於 3/30 在官方部落格正式宣布推出 Lyria 3 Pro——這是迄今最強大的 AI 音樂生成模型,能夠生成長達 3 分鐘、具備完整結構(前奏、主歌、副歌、橋段)的高品質歌曲,大幅超越上一代 Lyria 3 的 30 秒上限。Lyria 3 Pro 支援自然語言描述曲風、樂器、節奏與氛圍,並以 SynthID 數位浮水印標記所有生成內容。發布同步整合 Gemini 付費訂閱用戶、Google Vids(AI 影片工作流程配樂)、Google AI Studio、Vertex AI(企業大規模音訊生產),以及 ProducerAI 創作平台。
關鍵意義:AI 音樂生成正從「短片段示範工具」升級為「完整作品生產工具」。能直接插入商業影片工作流程,意味著廣告、YouTube、教學影片的配樂製作門檻即將清零;創作版權問題隨之浮上——Google 強調模型「以藝術家風格為廣義靈感,而非直接複製」,但如何界定仍是未解難題。
🔗 來源:Google 官方部落格(3/30) | Yahoo Tech
📌 官方公告
2️⃣ 韓國 AI 晶片新創 Rebellions 融資 4 億美元、估值 23.4 億:三星加持、瞄準 Nvidia 推理市場
Reuters 與 CNBC 3/30 同步報導,南韓 AI 晶片新創 Rebellions 宣布完成 4 億美元最新融資,估值升至約 23.4 億美元,由 Mirae Asset 金融集團與韓國國家成長基金領投,三星與 SK 海力士均為現有股東。Rebellions 的核心產品聚焦 AI 推理晶片(inference),在應用場景上與 Nvidia 直接競爭,同時也與 Groq、Cerebras 等推理晶片新創正面交鋒。該公司計劃將這筆資金用於加速進入美國市場,並為即將到來的 IPO 鋪路。
關鍵意義:全球 AI 晶片市場正上演「挑戰者崛起」劇本——在美國對中國晶片出口限制重塑供應鏈的背景下,韓國憑藉三星、SK 海力士的記憶體製造能力,正打造一條有別於美中兩極的第三條晶片路線。Rebellions 有三星記憶體供貨保障,解決了大多數 AI 晶片新創最頭痛的瓶頸,讓它成為後 Nvidia 時代推理算力戰場最值得關注的玩家之一。
🔗 來源:Reuters(3/30) | CNBC(3/30)
📰 媒體報導(Tier-1:Reuters、CNBC)
3️⃣ 阿里巴巴 Qwen 3.5 Omni 震撼登場:即時處理文字、圖像、語音、影片,支援 36 語言與聲音克隆
阿里巴巴 Qwen 團隊於 3/30 正式發布 Qwen 3.5 Omni,這是迄今最全面的全模態(omnimodal)AI 模型——同時原生處理文字、圖像、音訊與影片,以 234 毫秒超低延遲即時回應,並支援 36 種語言的即時語音輸出、語音克隆,以及「語意中斷」(Semantic Interruption,能在對話中途判斷用戶何時真正想打斷)。模型分 Plus、Flash、Light 三個規格,訓練資料涵蓋超過 1 億小時音視頻素材。Qwen 3.5 Omni 已在 Hugging Face 上線,開發者可直接取用。
關鍵意義:大多數 AI 助手仍是「文字進、文字出」,多模態只是縫合拼裝;Qwen 3.5 Omni 的原生全模態架構讓它在速度與連貫性上優於拼裝式競品。這是中國在前沿模型多模態競賽中最直接挑戰 GPT-4o 的一步,也讓 AI 代理(Agent)「用眼看世界、用耳聽聲音、用嘴回應」的未來離現實又近了一步。
🔗 來源:Qwen 官方部落格(3/30) | Decrypt | Yahoo Tech
📌 官方公告