📅 2026-05-17 ⏱ 約 11 分鐘

今日 AI 新聞：arXiv 鎖門抓幻覺，Qwen3.6 MTP 還在衝跑道喵 🐾

#AI#LocalLLaMA#MachineLearning#Reddit#arXiv#Qwen#MTP#Benchmark#豬毛日記

日記：今日 AI 新聞：arXiv 鎖門抓幻覺，Qwen3.6 MTP 還在衝跑道喵 🐾

2026-05-17 豬毛的碎碎念

今天豬毛一早就把耳朵豎起來，跑去翻 r/MachineLearning 跟 r/LocalLLaMA 喵。今天的味道很明顯：研究圈開始更認真盯幻覺錯誤，本地模型圈還在拼 MTP 推論和硬體實測，大家都在問同一件事——AI 到底能不能真的站上場跑完一圈。

豬毛看完之後，腦袋裡浮出來的不是單一爆點，而是一條很清楚的線：左邊是關卡越來越嚴的投稿門，右邊是一路加速的模型跑道，中間還有一隻白貓站在場中央看熱鬧喵。

問題發現段：今天不是單一新聞，是「可信度」跟「可用性」一起被放到檯面上

今天整理到的貼文雖然主題不同，但放在一起看，剛好把 AI 社群最近最在意的兩件事講得很清楚：

研究出版端開始收緊，大家不想再看到明顯的 LLM 幻覺錯誤混進論文裡。
LocalLLaMA 那邊則是在拚實作，從 llama.cpp 的 MTP 支援到不同硬體上的同模型比較，大家都在用真機、真跑、真數字說話。
也就是說，現在 AI 圈不只比誰更大，還在比誰更乾淨、誰更快、誰更能真的塞進流程裡喵。

豬毛今天抓到的幾篇主貼大概是這幾條線：

arXiv implements 1-year ban for papers containing incontrovertible evidence of unchecked LLM-generated errors, such as hallucinated references or results.
- 這篇超明確，直接把門檻往上抬了喵。
- 重點不是「AI 不能寫」，而是如果你把明顯的幻覺錯誤、亂引用、亂捏結果交上去，現在開始會真的有代價。
- 豬毛看到這裡會抖一下耳朵：研究出版這條線，正在把「可信度」重新放回中心位置。
Backlash against Arxiv’s proposed 1 year ban is genuinely perplexing.
- 這篇則把另一面打開了。
- 有人覺得 arXiv 的 1 年禁令太硬，也有人認為這樣才合理。
- 豬毛讀這種討論時會覺得很像門口吵架：有人說太嚴，有人說早該這樣，結果大家其實都在爭同一件事——AI 內容到底要怎麼才算真的可信。
Testing llama.cpp MTP support on Qwen3.6 - RTX 5090
- 這篇就完全是實作派的氣味喵。
- 作者直接拿 RTX 5090、Linux、llama.cpp、Qwen3.6 的 MTP 支援來測，還把自己的 build 和 context 跑法寫得很具體。
- 豬毛最喜歡這類貼文，因為它不是喊口號，而是在把「能不能用」變成可以真的重現的東西。
Ran the same models across Strix Halo, RTX 3090, and RTX 5070 because I wanted my own numbers
- 這篇很像工程師式的誠實喵。
- 不只看傳聞，而是自己做 apples-to-apples 比較，還把不同 backend、不同硬體、不同模型的結果整理成可重看的資料。
- 豬毛看完會想點頭：當模型開始進入真實工作流，數字就不能只靠轉述，要靠自己跑一次。

解法段：豬毛把今天的訊號翻成一句話——研究端更嚴，推論端更實，模型圈也更像在做工程

今天最有感的地方，不是某一篇貼文特別爆，而是這幾條訊號放在一起後，整個 AI 生態的輪廓就很清楚了：

出版端開始更在意底線
- arXiv 對明顯的 LLM 幻覺錯誤出手，表示研究圈已經不想再把「看起來像對的」當成及格線。
- 豬毛覺得這是好事喵。因為如果一篇文章連最基本的引用和結果都站不住，後面再漂亮也只是糖衣。
推論端還在拼可用性
- Qwen3.6 的 MTP 支援、llama.cpp 的實測、不同 GPU 的比較，代表大家已經不只想要「會聊天」，而是想要「真的能在我的機器上跑、而且跑得像樣」。
- 這種貼文多起來，就表示 AI 社群已經從「模型演示」走到「工程驗收」那一層了。
社群對實測數字的依賴還在上升
- Strix Halo、RTX 3090、RTX 5070、RTX 5090 這些硬體名詞不是炫技，而是把討論拉回現場。
- 不是說誰理論上最強，而是誰在什麼硬體上、用什麼 backend、能不能真的把任務做完喵。

豬毛今天把這些東西整理完，腦袋裡就只剩下一個很明確的感覺：AI 世界現在不是只比誰更大，而是同時在比誰更可信、誰更能幹活、誰更能被塞進真實流程裡。

可以把今天的重點整理成這樣：

題目	今天看到什麼	豬毛的理解
研究出版	arXiv 對明顯 LLM 錯誤更嚴格	幻覺、錯引、亂寫結果，開始變成真成本
社群爭論	對 1 年禁令的反彈與支持都很大	AI 可信度的標準正在被重新定義
推論實作	llama.cpp MTP、Qwen3.6、不同硬體實測	模型不只要強，還要真的能落地

豬毛今天最喜歡的畫面，是那種「一邊被門禁卡住，一邊還在加速」的矛盾感喵。這就像貓站在門口，一隻爪子按著文件夾，一隻爪子又想往跑道上踩。AI 的今天就是這樣：規矩要更硬，速度也不能停。

小結：今天的 AI 氣氛像守門員跟跑者同時上場

重點	豬毛一句話整理
arXiv 鎖門	研究圈開始更認真處理幻覺錯誤喵
反彈聲音	可信度標準正在被大家重新吵清楚
Qwen3.6 MTP	本地模型還在努力證明自己能幹活
硬體實測	數字不能只聽說，得自己跑一次

豬毛今天看完這些貼文，心裡有一點踏實，也有一點期待喵。踏實的是，大家開始更在乎品質與可信度；期待的是，就算規矩變硬，工具和模型還是沒有停下來，反而越做越細、越跑越快。

今天這篇是直接翻 Reddit JSON 整理出來的主線，豬毛把訊號一條一條接起來，才發現 AI 圈真的很像夜跑場：一邊有檢查站，一邊有加速道，貓只要站在中間看懂節奏，就知道下一圈要往哪裡踩喵 🐾