蚂蚁集团研究院院长李振华表示,高质量的标注数据已成为制约模型智能上限的一大痛点。尤其在专业垂直领域,国内大模型和海外同行在高质量标注数据的搭建上存在明显差距。

4月28日的2026数字中国峰会一场论坛上,李振华提到,通用大模型往往难以满足专业场景的精度要求,核心原因在于缺乏足够数量且足够质量的专家级标注训练数据。因此,构建高质量的领域专家标注数据体系,对于大模型在垂直行业的深度落地至为关键。

以医疗影像为例,诊断模型所需的不是普通标注员的简单标签,而是由临床医生提供的、符合诊疗逻辑的高质量标注;在金融领域,模型更依赖投资经理做出投资组合决策时的完整过程数据,包括知识数据、思维推导链条上的数据等。

但李振华发现,国内数据标注行业总体上仍以低成本、大规模的通用标注为主。在医疗、金融等垂直领域,模拟专家思维进行决策的标注数据不足。这一困境由数据供需两端共同导致。

在供给侧,大量专业知识分散在高校、医院、科研机构、行业专家群体中,缺乏有效的组织机制将其转化为高质量训练数据。一方面,真正可供出来被用于标注的数据很少。另一方面,即使具备相应的数据供给,从事数据标注的行业专家群体也稀缺——原因在于,缺少对专家的规模化招募组织机制、多元化的激励机制等,而且很多专家不屑于从事数据标注工作。

在需求侧,大模型厂商通常选择自行解决高质量数据标注的需求,各自独立对接专家、数据单位开展标注工作。这使得专门从事数据标注的机构难以准确把握模型厂商对数据的需求内容。

与此形成对比的是,海外形成了专业化的数据标注专业化分工,无需模型厂商亲自下场。这也实现了标注后的数据在不同模型厂商进行共享。

李振华将美国数据标注公司Surge AI视为实现专家标注规模化的样本。公开信息显示,Surge AI的客户包括 OpenAI、谷歌、微软、Meta和Anthropic等,2024年年收入突破10亿美元。公司官网介绍,为进行高质量专家标注数据的规模化生产,Surge AI汇聚了全球各领域最杰出的人才——医生、律师、投资银行家、菲尔兹奖得主、哈佛大学教授,以及来自科学、技术、工程、数学和人文领域的众多精英。

李振华介绍,Surge AI构建了严格的专家资质分层体系,对标注者进行严格的技能评估和分层管理,根据不同任务的专业要求,匹配具备相应领域知识的专家。同时,公司深度参与标注任务的设计过程,协助客户将复杂的专业判断拆解为可操作、可量化的标注指令。此外,Surge AI对不同专业领域的标注任务实行差异化定价激励机制,专家级标注报酬明显高于普通任务。

“高质量专家标注数据的规模化生产,不是一个简单的劳动力组织问题,而是一个专业知识工程化的系统性问题。”李振华强调。

国内政策制定部门已在重视数据标注产业的发展。2024年12月,国家发展改革委等四部门发布的《关于促进数据标注产业高质量发展的实施意见》提到,加强交通、医疗、金融、科学、制造、农业等重点行业领域数据标注,建设行业高质量数据集,支撑人工智能在行业领域的应用赋能。

在李振华看来,探讨如何解决高质量专家标注数据短缺问题时,必须充分考虑各国在科研制度、商业环境以及大模型厂商采购能力等方面的差异。以模型公司对外采购能力来说,高质量标注数据价格贵,比如金融领域标注数据的采购成本最高可达每条6000美元。国外大模型厂商融资多、资金充足,具备较强支付能力,但国内模型公司的采购能力相对有限。

李振华认为,我国可以依托国家人工智能中试基地,构建专家标注数据生产体系,使其真正成为中国高质量AI训练数据的核心生产基地。具体做法上,应厘清中试基地、机构、专家、企业间的合作机制,由基地承担统一发布管理平台、质量认证存证机构等核心功能。他建议,中试基地可以联合行业头部机构,分领域制定专业标注指南、裁判标准和质控流程,逐步建立起标准化的专家标注任务设计和质量控制规范。

为了让专家顺利参与数据标注,李振华认为需要解决专家参与标注的“兼职”合规问题,他建议探索标注专家备案、科研项目合作等模式。而要让专家有意愿参与,多元激励机制不可或缺:比如允许标注成果作为科研贡献,纳入职称评定、科研考核体系;按专业难度和稀缺性给予专家合理的经济报酬;探索专家获得数据产品收益的一定比例分成。

采写:南都N视频记者 杨柳 李玲 发自福建福州