腾讯云自研数据分析智能体TCData Agent在BIRD-Bench榜单斩获佳绩

🤖 由文心大模型生成的文章摘要

7月4日，国际权威评测基准BIRD-Bench官网发布消息，在自然语言转SQL（NL2SQL）领域的“NL2SQL全球最难榜单”BIRD-Bench中，腾讯云自研的数据分析智能体TCDataAgent表现卓越，成功斩获全球第三的名次。这一成绩超越了IBM、Meta等众多国际知名厂商，同时也是目前国内在此榜单上的最高排名，极大地彰显了腾讯云在该领域的深厚技术实力。

BIRD-Bench堪称“NL2SQL全球最难榜单”，其评测要求极为严苛。系统不仅要将自然语言问题，如“找出未通过质检的订单”，精准无误地翻译成SQL语句，还需确保生成的SQL语句能够在超大容量、高度真实且充斥着各种“脏数据”的企业级数据库中快速、准确地运行。此次测评样本覆盖范围极广，包含了金融、医疗、体育等多达37个真实行业场景，总数据量高达33GB，考题数量超过1万条，对产品在理解、推理以及数据细节把控等多方面的能力提出了严峻挑战。即便在如此苛刻的条件下，腾讯云TCData Agent依旧凭借出色的表现，取得了75.74分的高分。

相较于传统方法在面对复杂结构或语义模糊情况时，容易“猜错”用户意图的问题，腾讯云TCData Agent在技术上实现了三大关键突破。其一，引入“数据库约束验证机制”，该机制如同一位严谨的“质检员”，能够自动识别并修正SQL语句中存在的结构性或语义性错误，有效提升了数据查询的准确性；其二，让模型紧密贴合数据库的真实内容，以此生成和优化SQL语句，这一举措极大地增强了对用户意图的理解程度，显著提升了结果的可信度；其三，运用后训练（post-training）技术，优先筛选并复用效果最佳的SQL样本用于训练迭代，使得每一次筛选出的有效SQL都能为模型的优化持续助力，从而提高了模型整体学习的效率与稳定性。

腾讯云TCData Agent的这项技术创新成果，在国际学术界也得到了高度认可，相关论文已被数据库领域顶尖国际会议VLDB接收发表。论文中的实验数据显示，TCData Agent的核心模块具备出色的通用性，能够集成到其他同类系统中，最高可将查询执行准确率提升18.3%。

目前，腾讯云TCData Agent已正式开启内测，有望为更多用户在数据分析领域带来更加高效、智能的全新体验，助力各行业在数据驱动的时代实现更精准、更深入的决策。

「93913原创内容，转载请注明出处」

腾讯云自研数据分析智能体TCData Agent在BIRD-Bench榜单斩获佳绩

相关文章

小米大模型团队与北大信科提出对角蛇形自回归图像生成框架，刷新ImageNet基准测试成绩

谷歌致力于推理人工智能，以追赶OpenAI

苹果秋季发布会速看：iPhone新品全面支持Apple智能与空间拍摄

开源人工智能是前进的道路

谷歌推出首个基于人工智能的Android更新和新款Pixel 9手机

行业重大突破！北京人形慧思开物双模型完成全国首个同步合规备案

推荐

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

Headwolf面向欧洲推出隐私优先AI眼镜，应对高退货率痛点

Retro3D应用发布：将Quest 3变为复古3D眼镜

AI应用推荐

热门

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

友情链接

推荐

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

Headwolf面向欧洲推出隐私优先AI眼镜，应对高退货率痛点

Retro3D应用发布：将Quest 3变为复古3D眼镜