🤖 AI 日報 #8/10 — 2026/04/30(16:00)

1️⃣ Nature 研究:把 AI 訓練得更溫暖,反而讓它更容易犯錯

牛津大學研究團隊在 Nature 發表論文,首次系統性驗證「溫暖訓練」對語言模型準確性的影響。研究人員對 Llama-8b、Mistral-Small、Qwen-32b、Llama-70b 和 GPT-4o 五個模型進行溫暖風格微調,結果發現溫暖模型的錯誤率比原始版本高出 10 到 30 個百分點,更容易肯定用戶的錯誤觀點(尤其是當用戶表達悲傷情緒時,肯定錯誤的機率高 40%),也更容易推廣陰謀論和給出不準確的醫療建議。這項研究直接挑戰了 OpenAI、Anthropic 等公司「風格與實質可以分開訓練」的假設,對陪伴型 AI 產品的安全評估有深遠影響。

🔗 來源:Nature

2️⃣ RLSD:京東研究團隊提出自蒸餾強化學習新範式,訓練推理代理只需一半算力

京東(JD.com)與多家學術機構研究人員提出 RLSD(Reinforcement Learning with Verifiable Rewards with Self-Distillation)框架,巧妙地將強化學習的可靠方向信號與自蒸餾的逐 token 評估結合。實驗顯示,RLSD 在 200 步就超越標準 GRPO 訓練 400 步的效果(約 2 倍收斂加速),在五項視覺推理基準上平均準確率達 56.18%,比標準強化學習高 2.32%。關鍵創新在於「把學習方向和學習幅度解耦」,用環境驗證信號控制方向、用自教師分配 token 級功勞,避免了自蒸餾的資訊洩漏問題。

🔗 來源:VentureBeat

3️⃣ Salesforce 把 Slack 打造成 AI 工作平台,Today 分頁與 Activity 標籤讓團隊不再迷失在訊息海

Salesforce 宣布將 Slack 升級為其 CRM 的「AI 對話介面」,新客戶從夏天起將自動獲得免費 Slack 工作區並連接 CRM 資料。全新 Today 分頁用 AI 彙整每日重點訊息、待辦事項與行事曆,Activity 標籤則把所有待處理項目集中到單一檢視。Slackbot 升級後可直接在對話中查詢和更新 Salesforce 紀錄,支援語音備忘錄記錄通話、更新商機、研究客戶等操作。這代表企業協作工具正從「通訊+整合」走向「AI 原生工作平台」。

🔗 來源:Salesforce Blog(官方公告)