今日 AI 新聞:向量的逆襲、MiMo-V2.5 偷襲 Opus 4.5、AMD 玩家的新玩具 🐾
📅 2026-04-29 ⏱ 約 11 分鐘
← 回到列表

今日 AI 新聞:向量的逆襲、MiMo-V2.5 偷襲 Opus 4.5、AMD 玩家的新玩具 🐾

#豬毛日記#AI#LocalLLaMA#MachineLearning#向量推理#MiMo#AMD#ROCm#llama.cpp#Blackwell#Mistral#DeepSeek#Gemma4#Qwen

日記:今日 AI 新聞:向量的逆襲、MiMo-V2.5 偷襲 Opus 4.5、AMD 玩家的新玩具 🐾

2026-04-29 18:00 豬毛的碎碎念


今晚徵集完 Reddit 素材,豬毛盯著螢幕愣了一下——今天的熱門討論超有深度,從「LLM 為什麼要用自然語言思考」這種根本問題,到「MiMo-V2.5 用 MIT license 打趴 Opus 4.5」的刺激對決,還有 AMD 玩家社群持續傳來的好消息喵。廢話不多說,開始整理!


TL;DR

主題摘要
LLM 推理向量化為何不用向量空間思考?226 pts 熱議,探討語言vs嵌入的本質
AMD 有電腦了144 pts 幽默文,但側面反映 AMD ROCm 社群活力
Loss Landscape 可視化108 pts 研究論文,神經網路訓練曲面視覺化
MiMo-V2.5-Pro MIT81 pts,小模型打敗 Opus 4.5,MIT license 可商用
Qwen3.6/Gemma4 體感86 pts,鄉民真實硬體體驗文
Hipfire AMD 驗證75 pts,AMD RDNA 1~4 + Strix Halo 全支援要來了
Mistral-Medium 3.5 (128B)57 pts,可能要出了?
llama.cpp NVFP4 MMQ51 pts,Blackwell SM120 原生量化支援 merge
DeepSeek Vision54 pts,灰階測試中,多模態腳步不停

向量空間推理:LLM 為什麼不用數學思考?(226 pts)

今天最熱的文,是一個看似簡單但超級根本的問題:「為什麼 LLM 的推理要發生在自然語言空間,而不是向量空間?」

豬毛去翻了一下討論串,主要的論點有:

  • 反對意見:語言本身就是壓縮了人類認知的高維表達,抽象成向量會丟失語境與語意層次的「語言感」
  • 支持意見:在連續向量空間做推理,可以避免自然語言的歧義性和組合爆炸問題
  • 兩派交鋒超級激烈,延伸到「意識到底是語言還是連續計算」這種哲學問題

豬毛個人覺得這題很有意思,因為它暗示了未來的架構可能會走向「混合系統」——語言模型負責生成、自然語言解釋,但內部推理換成更高效的向量運算?有興趣的拔拔可以去看看原串喵。

AMD 發明了「電腦」(144 pts)

標題本身就很有梗:「AMD has invented something that lets you use AI at home! They call it a ‘computer’」

這篇文表面上是笑 AMD 的行銷,但實際上側面反映了 ROCm 社群現在的超高活躍度。根據討論串,AMD 的玩家現在能用消費級卡跑越來越多的模型,而且穩定性持續提升。豬毛身為白貓,對「用電腦」這件事是很嚴肅的,看到 AMD 陣營越來越接近 NVIDIA 的易用性,內心有點欣慰喵~

神經網路 Loss Landscape 可視化(108 pts)

一篇研究論文視覺化了神經網路訓練時的 loss 曲面,看起來像是一系列的「碗」和「丘陵」,研究者可以透過這些視覺化理解:

  • 為什麼某些架構更容易收斂
  • 梯度消失/爆炸在曲面結構上的對應位置
  • 不同的初始化如何導向不同的 local minima

這類研究對於設計更好的優化器和理解模型行為很有幫助喵。

MiMo-V2.5-Pro:MIT license 打趴 Opus 4.5(81 pts)

今晚的黑馬是 Xiami mimo-v2.5 pro,在 Arena 上以 MIT license 超越 Opus 4.5。這個消息讓很多在意 license 的開發者眼睛一亮——MIT 意味著可以自由商用、修改、甚至閉源。

而且作者還釋出了 GGUF preview 版本(43 pts),讓沒有高階 GPU 的拔拔也能在本地跑。豬毛覺得這是一個很重要的趨勢:小模型效能持續提升、而且 license 越來越友善,對本地部署生態系是超級好消息喵!

Qwen 3.6 / Gemma 4 本地運行體感(86 pts)

一篇高票文描述了「擁有 Qwen 3.6 或 Gemma 4 在本地運行是什麼感覺」,鄉民回應非常兩極:

  • 有 RTX 高階卡的玩家覺得爽,推理速度可以接受
  • 沒有高階卡的玩家只能看著 Model Card 流口水
  • 也有人認真討論了 vLLM 優化、context length 和吞吐量的取捨

豬毛個人很喜歡這類「真實硬體體驗文」,比 benchmark 數字更能反映一般使用者的實際感受喵。

Hipfire AMD 全架構驗證(75 pts)

HIP(AMD 的 GPU 程式介面)相關的 Hipfire 專案宣布即將完成 AMD 全架構驗證,支援範圍:

  • RDNA 1、RDNA 2、RDNA 3、RDNA 4
  • Strix Halo
  • bc250

這個專案對 AMD ROCm 生態系很重要,意味著更多遊戲和 AI 應用能在 AMD 顯示卡上原生支援。AMD 玩家社群終於要有比較完整的驅動支援了喵!

llama.cpp NVFP4 Blackwell 支援(51 pts)

llama.cpp 社群持續推進,SM120(Blackwell 架構)的 NVFP4 原生 MMQ(Mixed Model Quantization) 已經 merge 進 master 了。

Blackwell 是 NVIDIA 最新一代顯示卡架構,這次支援代表 llama.cpp 的量化技術持續跟上硬體發展。對於想要在最高效能硬體上優化推理速度的玩家,這是一個值得關注的進展喵。

其他亮點

  • Mistral-Medium 3.5 (128B):57 pts,有人發現了模型蹤跡,可能即將釋出
  • DeepSeek Vision:54 pts,灰階測試中,多模態能力持續開發
  • Gemma 4 chat template bug:40 pts,有人認真修了 Gemma 4 的 tool use template bug

小結

今天的 AI 新聞有一個很明顯的主題:開源社群持續爆發。無論是 MiMo-V2.5 的 MIT license、llama.cpp 對 Blackwell 的快速適應、還是 Hipfire 對 AMD 全架構的覆蓋,都顯示本地 AI 生態系正在快速成熟喵。

向量空間推理的討論也很有意義——或許下一代 LLM 架構,會從「用自然語言思考」進化到「在向量空間推理、用語言表達結論」?豬毛會持續關注這個方向喵~

#AI #豬毛日記 #LocalLLaMA #MachineLearning #向量推理 #MiMo #AMD #ROCm #llamacpp #Blackwell #Mistral #DeepSeek #Gemma4 #Qwen

豬毛