开发者发布 Fijik 2.0 350M 开源模型,对标 lfm2.5
社区开发者 Pinkstack 发布 350M 参数模型 Fijik 2.0,基于 Granite 4 350M 继续预…
近日,社区开发者 Pinkstack 在 Reddit r/LocalLLaMA 发布了一款参数量为 350M 的小型语言模型 Fijik 2.0,采用 Apache-2.0 协议开源,作者称其目标是对标 Liquid AI 的 lfm2.5。Fijik 2.0 并非从头训练,而是以 IBM Granite 4 350M 为基座,在约 60 亿(6B)token 上进行了持续预训练,知识截止时间为 2025 年 8 月,随后在一个混合推理强度的自定义 SFT 语料上做了后训练。
模型基座与训练流程
Fijik 2.0 的整体训练策略可概括为「持续预训练 + SFT」两阶段:
- 基座模型:Granite 4 350M
- 持续预训练数据量:约 6B token
- 知识截止:2025 年 8 月
- 后训练:自定义 SFT 语料,包含不同推理强度的样本
作者在文中特别提醒,Fijik 2.0 并不使用标准的 ChatML 聊天格式,在 LM Studio 等推理工具中使用时需要手动设置 chat format,否则模型将无法正常工作。
与 lfm2.5 的对比动机
作者表示,自己认可 Liquid AI lfm2.5 的思路和效果,但不喜欢其自定义许可证,因此选择以更宽松的 Apache-2.0 协议发布 Fijik 2.0。他在 Hugging Face 的 README 中给出了基准测试结果,并提供了与 lfm2.5 的输出对比样本。
不过作者也坦承,350M 参数量所能承载的知识非常有限,建议用户结合 Web 搜索等外部工具使用,模型本身无法独立回答需要广博世界知识的问题。
资源与注意事项
- Safetensors 版本:huggingface.co/Pinkstack/fijik-2.0-350m-sft
- GGUF 量化版本:huggingface.co/Pinkstack/fijik-2.0-350m-sft-GGUF
- 许可证:Apache-2.0
- 推理精度:建议在 bf16 及以上运行,低于该精度可能导致输出质量下降
需要指出的是,Fijik 2.0 是个人开发者的社区项目,并非主流厂商或机构发布,作者在文中也强调「请自行评估与测试」。从规模来看,350M 级别模型更接近本地实验和嵌入式场景,与面向通用任务的大模型并不在同一量级。
