人工智能领域传来重磅消息,云从科技自主研发的“从容多模态大模型”在权威的 OpenCompass评测中表现惊艳,以65.5分的优异成绩一举位列全球前三甲。这一成绩不仅超越了谷歌Gemini 1.5 Pro等知名模型,更是在细分领域展现出统治力,在跨模态跟踪、3D 人脸识别等关键技术方面,10 次成功刷新世界纪录,充分彰显了云从科技在人工智能技术研发上的深厚底蕴与创新实力。
OpenCompass评测体系由上海人工智能实验室推出,是业内公认的全面且权威的大模型开放评测框架。其在多模态评测维度上精心挑选了8个极具代表性的数据集,从目标检测、文字识别、动作识别,到图像理解、关系推理,乃至艺术设计、商业分析、科学研究、健康医学、人文社科、技术工程以及数学推理等多个维度,对大模型进行了全方位、无死角的严格考验,确保评估结果能够精准反映模型的真实能力与性能表现。
在此次激烈的评测竞争中,从容多模态大模型脱颖而出,在其中6个数据集上的表现独占鳌头,国内排名第一。尤为值得一提的是在OCRBench测试集中,从容大模型更是斩获了高达 827分(总分1000分)的全球最高分,力压第二名GLM-4v达13分,这一成绩无疑为其在文本识别、以文本为核心的视觉问答、面向文档的视觉问答,以及关键信息提取等实际业务场景中的应用,增添了极具说服力的背书,进一步夯实了其在相关领域的技术优势。
从容多模态大模型之所以能取得如此优异的成绩,离不开云从科技长期以来在技术研发上的坚定投入与持续创新。一方面,云从科技自主研发的高效多模态处理架构以及先进的计算技术,为模型赋予了卓越的数据处理能力。该架构能够实现视觉与语言任务间的高效融合与无缝切换,在面对大规模多模态数据时,依然能够保持高性能与快速响应,极大地提升了模型训练的效率与稳定性,确保模型能够在短时间内完成训练并达到最佳性能状态。另一方面,云从科技在视觉、语言领域深耕多年,积累了海量的数据与丰富的技术经验,这些宝贵的沉淀为从容大模型的研发与优化提供了坚实基础,使得模型能够在复杂的评测任务中准确理解并执行指令,给出高质量的输出结果。