社区微调 Gemma 模型专注直复式文案写作

Reddit 用户 NinjaAlaska 在 r/LocalLLaMA 板块发布了一款专为直复式文案写作（direct-response copywriting）微调的模型，宣称在自建基准上较基座提升约 290 Elo，并已在 Hugging Face 公开发布完整权重与量化版本。

动机与方法

作者表示，通用聊天模型在撰写营销文案时容易落入程式化表达，例如「在当今快节奏的时代……」式开场、模糊的卖点描述等常见模板。其目标是训练模型「开门见山、痛点先行、CTA 明确」，并整体提升情绪感知能力。

训练采用 QLoRA SFT 方式，数据为人工整理的营销 brief 与对应成品配对，包含真实投放的广告案例。最终权重合并为 bf16 全精度，不单独发布 adapter，可直接用于 vLLM 或 Transformers；上下文长度为 256K。作者提示：推理时需关闭 Gemma 4 的 thinking 模式，启用 reasoning 反而会降低文案质量。

评测方式与结果

为减少主观偏差，作者在 EQ-Bench 3 方法论基础上搭建了一个文案专项基准，包含 30 个真实场景 brief，覆盖 Facebook 广告、冷邮件、落地页、商品描述、短信、短视频脚本等体裁。基座与微调模型在相同解码参数下作答，由 DeepSeek 系列模型盲评两轮（A-vs-B、B-vs-A）控制位置偏置。

微调模型 Elo：1657，30 题中胜出 24 题（80%）
基座模型 Elo：1367

作者称，在「hook 强度、信息具体度、文字精炼度」这三项文案核心维度上的提升最为稳定。

发布信息与注意事项

模型卡与权重：huggingface.co/akwin123/copywriter-gemma4-31b 量化版本：huggingface.co/models 站内按 base_model 过滤可检索

需要指出几点保留意见：第一，文中的基座模型名称为 Gemma-4-31B-it，与截至公开信息中的 Google Gemma 系列命名不一致，所述基座是否真实存在需读者自行核实；第二，文中用作裁判的「DeepSeek V4 Flash」与目前已发布型号命名也不相符，评测可信度因此打折；第三，30 题样本量偏小，盲评模型的可靠性也会影响最终 Elo 数值。建议感兴趣的读者下载权重实测后再下结论。