桃子桃子快讯
返回首页
模型发布

谷歌研究推出 TabFM:面向表格数据的零样本基础模型

Google Research 发布 TabFM 1.0.0,专注结构化表格数据的零样本分类与回归,无需微调。

2026.07.04 · 周六2 分钟阅读

Google Research 近日发布了 TabFM 1.0.0,这是一款面向结构化表格数据的零样本基础模型。与传统针对文本或图像的基础模型不同,TabFM 的核心目标是直接处理包含数值型与分类型混合列的表格数据,在不进行微调的前提下完成分类与回归任务。

模型核心特性

TabFM 的设计思路是把「基础模型 + 上下文学习」的范式延伸到表格领域:

  • 支持分类(classification)与回归(regression)两类主流监督学习任务。
  • 可处理混合列类型(数值型 + 分类型)的结构化数据。
  • 无需微调(fine-tuning),也无需超参数搜索(hyperparameter search)。
  • 训练样本作为上下文(context)传入模型,单次前向传播即可输出预测结果。

换言之,用户只需把若干标注样本随查询一起提交给模型,即可获得预测,部署门槛被显著降低。

潜在应用场景

表格数据广泛存在于金融风控、医疗记录、工业质检、商业分析等场景,传统上需要为每个任务单独训练模型(如 XGBoost、随机森林或小型神经网络)。TabFM 这类零样本模型的潜在价值在于:

  • 数据量较小的长尾业务场景,无需大量标注数据即可获得可用预测。
  • 快速原型验证阶段,省去模型训练与调参流程。
  • 作为统一基座,方便跨任务迁移。

信息局限与待跟进

目前原始信息仅来自社区分享的简要介绍,尚未确认以下关键细节:

  • 论文或技术报告是否同步发布。
  • 模型参数量、训练数据规模与覆盖的表格类型。
  • 在标准表格基准(如 OpenML、UCI 仓库)上的具体表现。
  • 模型权重是否开源、是否提供 API 或 Hugging Face 接入。

建议关注 Google Research 官方渠道的后续披露,以获取更完整的技术细节与基准对比数据。

信源