开发者发布 Fijik 2.0 350M 开源模型，对标 lfm2.5

近日，社区开发者 Pinkstack 在 Reddit r/LocalLLaMA 发布了一款参数量为 350M 的小型语言模型 Fijik 2.0，采用 Apache-2.0 协议开源，作者称其目标是对标 Liquid AI 的 lfm2.5。Fijik 2.0 并非从头训练，而是以 IBM Granite 4 350M 为基座，在约 60 亿（6B）token 上进行了持续预训练，知识截止时间为 2025 年 8 月，随后在一个混合推理强度的自定义 SFT 语料上做了后训练。

模型基座与训练流程

Fijik 2.0 的整体训练策略可概括为「持续预训练 + SFT」两阶段：

基座模型：Granite 4 350M
持续预训练数据量：约 6B token
知识截止：2025 年 8 月
后训练：自定义 SFT 语料，包含不同推理强度的样本

作者在文中特别提醒，Fijik 2.0 并不使用标准的 ChatML 聊天格式，在 LM Studio 等推理工具中使用时需要手动设置 chat format，否则模型将无法正常工作。

与 lfm2.5 的对比动机

作者表示，自己认可 Liquid AI lfm2.5 的思路和效果，但不喜欢其自定义许可证，因此选择以更宽松的 Apache-2.0 协议发布 Fijik 2.0。他在 Hugging Face 的 README 中给出了基准测试结果，并提供了与 lfm2.5 的输出对比样本。

不过作者也坦承，350M 参数量所能承载的知识非常有限，建议用户结合 Web 搜索等外部工具使用，模型本身无法独立回答需要广博世界知识的问题。

资源与注意事项

Safetensors 版本：huggingface.co/Pinkstack/fijik-2.0-350m-sft
GGUF 量化版本：huggingface.co/Pinkstack/fijik-2.0-350m-sft-GGUF
许可证：Apache-2.0
推理精度：建议在 bf16 及以上运行，低于该精度可能导致输出质量下降

需要指出的是，Fijik 2.0 是个人开发者的社区项目，并非主流厂商或机构发布，作者在文中也强调「请自行评估与测试」。从规模来看，350M 级别模型更接近本地实验和嵌入式场景，与面向通用任务的大模型并不在同一量级。