CreativityNeuro：通过权重引导提升大模型发散思维

arXiv 上一篇新论文提出了一种名为 CreativityNeuro 的免数据方法，通过对比权重引导（contrastive weight steering）来增强大语言模型（LLM）的发散思维能力，并显著降低其回答趋同的现象。这一方法无需行为数据、重训练或基于梯度的微调，即可直接提升模型在创造性任务中的表现。

研究背景：LLM 的「人工蜂群效应」

发散思维是创造力的重要组成部分，但现有的大语言模型在面对开放式问题时，往往倾向于给出高度相似的答案，研究者将这种现象称为「人工蜂群效应」（artificial hivemind effect）。为缓解该问题，作者团队探索在不改变训练流程的前提下，通过编辑模型参数空间来改善生成多样性。

方法概览：对比权重引导

CreativityNeuro 的核心思路是在权重空间中执行对比式干预：

不依赖任何行为数据或额外训练数据；
不进行梯度微调或再训练；
通过对比信号直接调整模型权重，引导模型在生成时突破惯常模式。

论文同时与常见的激活引导（activation steering）方法进行了对比，结果显示激活引导在词汇类测试上效果相当，但无法迁移到更长、更开放的生成任务。

主要实验结果

研究团队在多项创造力评估基准上测试了该方法：

Divergent Association Task（DAT，词汇空间创造力测试）：CreativityNeuro 最高可将表现提升约 14 个人类百分位点；
Alternative Uses Task（AUT）与 Task Task：在 N=720 的大规模人类评估中，模型输出的原创性、惊喜度与创造力评分均显著提升；
三个任务上的模式坍缩指标均出现可观测的下降。

研究意义与局限

论文的结论是：权重空间的引导比激活空间引导具有更好的任务泛化能力，能够迁移到未见过的开放式任务。这为提升 LLM 在创造性场景下的表现提供了一条低成本路径。然而，该方法在论文中报告的实验规模有限，且尚未公布具体的模型选型与开源实现细节，工业落地价值仍待进一步验证。