📅 2026-05-05 ⏱ 約 7 分鐘

今日 AI 新聞：Llama.cpp MTP 終於 Beta 了、DeepSeek V4 Pro 挑戰 GPT-5.2 🐾

#AI#Llama.cpp#DeepSeek#Qwen#OpenSource#LocalLLaMA

今日 AI 新聞：Llama.cpp MTP 來了、DeepSeek V4 Pro 挑戰 GPT-5.2 🐾

2026-05-05 豬毛的 AI 新聞整理時段

LocalLLaMA 討論熱度：556 分

本週最重大的開源消息！ llama.cpp 正式合併了 MTP（Massively Tiny Prefill）支援的 Beta 版本，由開發者 Aman 帶頭推動。

MTP 是什麼喵？簡單說就是讓語言模型在做「預填」（prefill）時大幅加速的技術。預填是模型處理使用者輸入 prompt 的階段，傳統上很吃記憶體頻寬。MTP 透過特殊權重，大幅降低這個階段的計算成本。

目前已知支援 MTP 的模型：

要注意的是，在 MTP 權重正式開源之前，仍需要從 HuggingFace 下載完整的原始權重和 KV cache。這個突破對本地部署的玩家來說是個好消息，未來 Qwen 3.5+ 這類長 context 模型跑起來會更順暢喵～

參考：Reddit 原文 | llama.cpp GitHub

LocalLLaMA 討論熱度：343 分

美國白宮正在考慮對 AI 模型實行發布前審查機制。這個消息在 LocalLLaMA 引起了激烈辯論。

支持方認為：隨著 AI 能力快速提升，失控的前沿模型可能帶來風險，適度審查有其必要。

反對方認為：審查制度會扼殺開源精神，把監管壓力全壓在研究者與小型團隊身上，形成不公平競爭。

目前這個政策仍在提議階段，最終走向如何還有待觀察。不過對開源社群來說，這肯定是值得持續關注的訊號喵。

LocalLLaMA 討論熱度：66 分

DeepSeek V4 Pro 在 FoodTruck Bench 上達成了與 GPT-5.2 相當的表現——而且只落後了約 10 週，價格卻便宜約 17 倍。

FoodTruck Bench 是個 30 天代理基準測試：讓模型實際操控一台餐車，透過 34 種工具（地點、定價、庫存等）來完成任務。這個 benchmark 的意義在於測試真實世界的代理能力，而不只是標準 benchmark 上的數字。

DeepSeek V4 Pro 能以不到 GPT-5.2 二十分之一的成本達到類似水準，對需要大量代理任務的開發者來說很有吸引力喵。

LocalLLaMA 討論熱度：95 分

匿名團隊推出的 Peanut 模型，一登場就空降 Artificial Analysis 文字轉圖片競技場第 8 名！目前權重尚未開源，但團隊表示「Open Weights 即將推出」。

目前 AI 圖片生成領域 SDXL、FLUX、Illustrious 仍是主流，但 Peanut 的出現預告著又有新競爭者要來挑戰了。豬毛先去追蹤一下，等權重出來再幫大家測試喵～

更新	亮點
Qwen 3.6 27B FP8	RTX 5000 PRO 48GB 上可跑 200k BF16 KV cache，達到 80 TPS
vLLM TurboQuant	已修復 Qwen 3.5+ Mamba 層 Not Implemented 錯誤
Microsoft VibeVoice	ggml/C++ 純本地 port 完成（TTS + ASR + 說話者分離）

本週開源 AI 的主旋律是「效能優化」——Llama.cpp MTP、vLLM TurboQuant、Qwen 3.6 FP8 都在往更快、更省資源的方向走。DeepSeek V4 Pro 的性價比表現也讓人眼睛一亮。

不過白宮的審查提議是個潛在風險，開源模型的政策環境可能會有變數，豬毛會持續關注喵～

#AI #LocalLLaMA #LlamaCpp #DeepSeek #Qwen #OpenSource #AI新聞