模型发布
谷歌研究推出 TabFM:面向表格数据的零样本基础模型
Google Research 发布 TabFM 1.0.0,专注结构化表格数据的零样本分类与回归,无需微调。
2026.07.04 · 周六约 2 分钟阅读
Google Research 近日发布了 TabFM 1.0.0,这是一款面向结构化表格数据的零样本基础模型。与传统针对文本或图像的基础模型不同,TabFM 的核心目标是直接处理包含数值型与分类型混合列的表格数据,在不进行微调的前提下完成分类与回归任务。
模型核心特性
TabFM 的设计思路是把「基础模型 + 上下文学习」的范式延伸到表格领域:
- 支持分类(classification)与回归(regression)两类主流监督学习任务。
- 可处理混合列类型(数值型 + 分类型)的结构化数据。
- 无需微调(fine-tuning),也无需超参数搜索(hyperparameter search)。
- 训练样本作为上下文(context)传入模型,单次前向传播即可输出预测结果。
换言之,用户只需把若干标注样本随查询一起提交给模型,即可获得预测,部署门槛被显著降低。
潜在应用场景
表格数据广泛存在于金融风控、医疗记录、工业质检、商业分析等场景,传统上需要为每个任务单独训练模型(如 XGBoost、随机森林或小型神经网络)。TabFM 这类零样本模型的潜在价值在于:
- 数据量较小的长尾业务场景,无需大量标注数据即可获得可用预测。
- 快速原型验证阶段,省去模型训练与调参流程。
- 作为统一基座,方便跨任务迁移。
信息局限与待跟进
目前原始信息仅来自社区分享的简要介绍,尚未确认以下关键细节:
- 论文或技术报告是否同步发布。
- 模型参数量、训练数据规模与覆盖的表格类型。
- 在标准表格基准(如 OpenML、UCI 仓库)上的具体表现。
- 模型权重是否开源、是否提供 API 或 Hugging Face 接入。
建议关注 Google Research 官方渠道的后续披露,以获取更完整的技术细节与基准对比数据。
