桃子桃子 AI 快讯
返回首页
开源

MaralGPT Mythos 9B 发布:基于通义千问的无限制微调版本

社区开发者 MaralGPT 发布 9B 参数微调模型,基于通义千问底座,主打无安全限制与百万级上下文。

2026.06.29 · 周一2 分钟阅读评分 31
评分细项加权总分 31
重要性
30
新颖性
35
影响面
25
可信度
35
实质性
35

社区开发者 MaralGPT 在 HuggingFace 上发布了 MaralGPT Mythos 9B 2606 模型,这是一个基于通义千问(Qwen,原文写作「Qwen 3.5」,实际应为 Qwen 2.5 或 Qwen 3 系列)底座进行微调的 9B 参数开源模型,定位为「完全无限制」(completely heretic)的对话模型。模型已在 HuggingFace 提供原始权重与 GGUF 量化版本,但作者特别提示 2-bit 量化无法正常使用。

模型背景与动机

作者表示,由于 Fable 等闭源平台已对非美国用户关闭,且其本人因身处伊朗无法完成多数美国平台的 KYC 认证,因此转向「设备端开源模型」路线,借鉴中国社区的开源生态。该模型的核心设计目标是移除通义千问原版的诸多安全限制,覆盖 Fable 等闭源服务中受到约束的话题。

技术特性

  • 底座:基于通义千问系列微调,作者未在文中明确具体子版本(如 Qwen 2.5 还是 Qwen 3),仅以「Qwen 3.5」代称。
  • 上下文窗口:借助通义千问原生能力,上下文提升至 100 万 tokens,并支持动态上下文扩展。
  • 训练数据:作者称使用了超过 5 亿 tokens 的「最佳 SOTA 模型」输出进行微调,强调基准测试表现优异。
  • 权重格式:提供 HuggingFace 原始格式与 GGUF 量化格式,方便本地部署。

基准与局限

作者在 Reddit 帖子中附有两张基准测试截图(一张常规基准,另一张新增 MMLU STEM),但正文未给出具体分数、对比对象或测试条件,读者只能通过图片自行判断。文中也未提供完整的训练超参数、数据来源清单或可复现的评测脚本,信息透明度有限。

社区反响与待观察事项

  • 模型刚发布,作者公开征集合作者协助托管与推广。
  • 仓库目前由单一开发者维护,更新频率、社区贡献与长期维护尚不明朗。
  • 「无限制」定位在合规与平台分发层面存在不确定性,可能影响其在 HuggingFace 等平台的长期可访问性。

如需更准确的评估,建议直接查看 HuggingFace 模型卡与原始基准截图,结合本地实测再做判断。

信源