
推 patvessel: 8BA1B就是代表8B總參數 但是每個token只會有1B參數 05/29 13:51
→ patvessel: 1B參數再怎麼塞也塞不進太多知識是正常的 05/29 13:52
→ patvessel: 或許你可以考慮用外掛知識庫的方式來填補 05/29 13:52
推 lordmi: 寫作輔助器分類的本地模型還是gamma4 31b一致性最高 05/29 14:25
→ lordmi: 如果不管一致性就是要色色,那考慮魔改Qwen吧 05/29 14:28
→ lordmi: 目前這些小體積的local moe還沒有一個能看的 05/29 14:29
https://huggingface.co/Manos79er/gemma-4-E4B-it-OBLITERATED
剛剛看日本那說這gemma4破解版速度不錯 自己試了下挺胡言亂語的 不另外開篇了 放這
※ 編輯: error405 (114.36.202.252 臺灣), 05/29/2026 15:29:06
推 rex7788: gamma是寫程式吧?中文一律還是qwen壓倒性的強 05/30 02:02
→ plkoijhug: qwen 文青腔很重 越聰明越重 05/30 13:44
推 patvessel: 我覺得Qwen才擅長寫程式這類格式化的文書 05/30 15:16
→ patvessel: 追隨慣性太強烈 用來做文學創作反而不自然 05/30 15:17