桃子桃子快讯
返回首页
开源

社区微调 Gemma 模型 专注直复式文案写作

Reddit 用户基于 Gemma 架构开源一款面向文案写作的 QLoRA 微调模型,在自建 30 题基准上较基座提升约…

2026.07.03 · 周五3 分钟阅读

Reddit 用户 NinjaAlaska 在 r/LocalLLaMA 板块发布了一款专为直复式文案写作(direct-response copywriting)微调的模型,宣称在自建基准上较基座提升约 290 Elo,并已在 Hugging Face 公开发布完整权重与量化版本。

动机与方法

作者表示,通用聊天模型在撰写营销文案时容易落入程式化表达,例如「在当今快节奏的时代……」式开场、模糊的卖点描述等常见模板。其目标是训练模型「开门见山、痛点先行、CTA 明确」,并整体提升情绪感知能力。

训练采用 QLoRA SFT 方式,数据为人工整理的营销 brief 与对应成品配对,包含真实投放的广告案例。最终权重合并为 bf16 全精度,不单独发布 adapter,可直接用于 vLLM 或 Transformers;上下文长度为 256K。作者提示:推理时需关闭 Gemma 4 的 thinking 模式,启用 reasoning 反而会降低文案质量。

评测方式与结果

为减少主观偏差,作者在 EQ-Bench 3 方法论基础上搭建了一个文案专项基准,包含 30 个真实场景 brief,覆盖 Facebook 广告、冷邮件、落地页、商品描述、短信、短视频脚本等体裁。基座与微调模型在相同解码参数下作答,由 DeepSeek 系列模型盲评两轮(A-vs-B、B-vs-A)控制位置偏置。

  • 微调模型 Elo:1657,30 题中胜出 24 题(80%)
  • 基座模型 Elo:1367

作者称,在「hook 强度、信息具体度、文字精炼度」这三项文案核心维度上的提升最为稳定。

发布信息与注意事项

模型卡与权重:huggingface.co/akwin123/copywriter-gemma4-31b 量化版本:huggingface.co/models 站内按 base_model 过滤可检索

需要指出几点保留意见:第一,文中的基座模型名称为 Gemma-4-31B-it,与截至公开信息中的 Google Gemma 系列命名不一致,所述基座是否真实存在需读者自行核实;第二,文中用作裁判的「DeepSeek V4 Flash」与目前已发布型号命名也不相符,评测可信度因此打折;第三,30 题样本量偏小,盲评模型的可靠性也会影响最终 Elo 数值。建议感兴趣的读者下载权重实测后再下结论。

信源