7月4日,国际权威评测基准BIRD-Bench官网发布消息,在自然语言转SQL(NL2SQL)领域的“NL2SQL全球最难榜单”BIRD-Bench中,腾讯云自研的数据分析智能体TCDataAgent表现卓越,成功斩获全球第三的名次。这一成绩超越了IBM、Meta等众多国际知名厂商,同时也是目前国内在此榜单上的最高排名,极大地彰显了腾讯云在该领域的深厚技术实力。
BIRD-Bench堪称“NL2SQL全球最难榜单”,其评测要求极为严苛。系统不仅要将自然语言问题,如“找出未通过质检的订单”,精准无误地翻译成SQL语句,还需确保生成的SQL语句能够在超大容量、高度真实且充斥着各种“脏数据”的企业级数据库中快速、准确地运行。此次测评样本覆盖范围极广,包含了金融、医疗、体育等多达37个真实行业场景,总数据量高达33GB,考题数量超过1万条,对产品在理解、推理以及数据细节把控等多方面的能力提出了严峻挑战。即便在如此苛刻的条件下,腾讯云TCData Agent依旧凭借出色的表现,取得了75.74分的高分。
相较于传统方法在面对复杂结构或语义模糊情况时,容易“猜错”用户意图的问题,腾讯云TCData Agent在技术上实现了三大关键突破。其一,引入“数据库约束验证机制”,该机制如同一位严谨的“质检员”,能够自动识别并修正SQL语句中存在的结构性或语义性错误,有效提升了数据查询的准确性;其二,让模型紧密贴合数据库的真实内容,以此生成和优化SQL语句,这一举措极大地增强了对用户意图的理解程度,显著提升了结果的可信度;其三,运用后训练(post-training)技术,优先筛选并复用效果最佳的SQL样本用于训练迭代,使得每一次筛选出的有效SQL都能为模型的优化持续助力,从而提高了模型整体学习的效率与稳定性。
腾讯云TCData Agent的这项技术创新成果,在国际学术界也得到了高度认可,相关论文已被数据库领域顶尖国际会议VLDB接收发表。论文中的实验数据显示,TCData Agent的核心模块具备出色的通用性,能够集成到其他同类系统中,最高可将查询执行准确率提升18.3%。
目前,腾讯云TCData Agent已正式开启内测,有望为更多用户在数据分析领域带来更加高效、智能的全新体验,助力各行业在数据驱动的时代实现更精准、更深入的决策。