桃子桃子快讯
返回首页
开源

开发者发布 Fijik 2.0 350M 开源模型,对标 lfm2.5

社区开发者 Pinkstack 发布 350M 参数模型 Fijik 2.0,基于 Granite 4 350M 继续预…

2026.07.03 · 周五3 分钟阅读

近日,社区开发者 Pinkstack 在 Reddit r/LocalLLaMA 发布了一款参数量为 350M 的小型语言模型 Fijik 2.0,采用 Apache-2.0 协议开源,作者称其目标是对标 Liquid AI 的 lfm2.5。Fijik 2.0 并非从头训练,而是以 IBM Granite 4 350M 为基座,在约 60 亿(6B)token 上进行了持续预训练,知识截止时间为 2025 年 8 月,随后在一个混合推理强度的自定义 SFT 语料上做了后训练。

模型基座与训练流程

Fijik 2.0 的整体训练策略可概括为「持续预训练 + SFT」两阶段:

  • 基座模型:Granite 4 350M
  • 持续预训练数据量:约 6B token
  • 知识截止:2025 年 8 月
  • 后训练:自定义 SFT 语料,包含不同推理强度的样本

作者在文中特别提醒,Fijik 2.0 并不使用标准的 ChatML 聊天格式,在 LM Studio 等推理工具中使用时需要手动设置 chat format,否则模型将无法正常工作。

与 lfm2.5 的对比动机

作者表示,自己认可 Liquid AI lfm2.5 的思路和效果,但不喜欢其自定义许可证,因此选择以更宽松的 Apache-2.0 协议发布 Fijik 2.0。他在 Hugging Face 的 README 中给出了基准测试结果,并提供了与 lfm2.5 的输出对比样本。

不过作者也坦承,350M 参数量所能承载的知识非常有限,建议用户结合 Web 搜索等外部工具使用,模型本身无法独立回答需要广博世界知识的问题。

资源与注意事项

  • Safetensors 版本:huggingface.co/Pinkstack/fijik-2.0-350m-sft
  • GGUF 量化版本:huggingface.co/Pinkstack/fijik-2.0-350m-sft-GGUF
  • 许可证:Apache-2.0
  • 推理精度:建议在 bf16 及以上运行,低于该精度可能导致输出质量下降

需要指出的是,Fijik 2.0 是个人开发者的社区项目,并非主流厂商或机构发布,作者在文中也强调「请自行评估与测试」。从规模来看,350M 级别模型更接近本地实验和嵌入式场景,与面向通用任务的大模型并不在同一量级。

信源