桃子桃子快讯
返回首页
研究论文

CreativityNeuro:通过权重引导提升大模型发散思维

arXiv 新论文提出 CreativityNeuro 方法,通过对比权重引导提升大语言模型的发散思维能力,无需数据或微…

2026.07.03 · 周五2 分钟阅读

arXiv 上一篇新论文提出了一种名为 CreativityNeuro 的免数据方法,通过对比权重引导(contrastive weight steering)来增强大语言模型(LLM)的发散思维能力,并显著降低其回答趋同的现象。这一方法无需行为数据、重训练或基于梯度的微调,即可直接提升模型在创造性任务中的表现。

研究背景:LLM 的「人工蜂群效应」

发散思维是创造力的重要组成部分,但现有的大语言模型在面对开放式问题时,往往倾向于给出高度相似的答案,研究者将这种现象称为「人工蜂群效应」(artificial hivemind effect)。为缓解该问题,作者团队探索在不改变训练流程的前提下,通过编辑模型参数空间来改善生成多样性。

方法概览:对比权重引导

CreativityNeuro 的核心思路是在权重空间中执行对比式干预:

  • 不依赖任何行为数据或额外训练数据;
  • 不进行梯度微调或再训练;
  • 通过对比信号直接调整模型权重,引导模型在生成时突破惯常模式。

论文同时与常见的激活引导(activation steering)方法进行了对比,结果显示激活引导在词汇类测试上效果相当,但无法迁移到更长、更开放的生成任务。

主要实验结果

研究团队在多项创造力评估基准上测试了该方法:

  • Divergent Association Task(DAT,词汇空间创造力测试):CreativityNeuro 最高可将表现提升约 14 个人类百分位点;
  • Alternative Uses Task(AUT)与 Task Task:在 N=720 的大规模人类评估中,模型输出的原创性、惊喜度与创造力评分均显著提升;
  • 三个任务上的模式坍缩指标均出现可观测的下降。

研究意义与局限

论文的结论是:权重空间的引导比激活空间引导具有更好的任务泛化能力,能够迁移到未见过的开放式任务。这为提升 LLM 在创造性场景下的表现提供了一条低成本路径。然而,该方法在论文中报告的实验规模有限,且尚未公布具体的模型选型与开源实现细节,工业落地价值仍待进一步验证。

信源