5月6日,小米官方对外详细介绍了其自主研发的Mi – BRAG知识库问答框架。该框架凭借独特的四大核心技术体系,成功重构知识处理范式,目前已在小爱同学的个人信息问答、汽车问答助手、商品问答等多个关键场景中实现落地应用,为用户带来了全新的智能交互体验。
在当下人工智能领域,大模型(LLM)虽展现出强大的生成能力,但其知识更新成本高、对企业私有知识理解不足以及存在数据安全隐患等问题,也逐渐暴露出来。而检索增强生成(RAG)技术的出现,为这些困境提供了有效解决方案。小米正是敏锐捕捉到这一趋势,顺势推出Mi – BRAG框架。
Mi – BRAG框架的四大核心技术体系亮点十足。其搭载的智能解析引擎,具备全格式兼容能力,能够无损处理 PDF、Word、Excel 等十余种常见文档格式,这为企业构建统一知识库奠定了坚实基础,不同格式的文档无需复杂转换,即可被框架高效识别利用。在解析层面,它实现全模态解析,打破传统仅局限于文本的桎梏,能够精准解析复杂图片、表格以及图文混排等多元信息,无论是产品的设计图纸,还是包含数据的复杂表格,都能被准确理解。同时,该框架支持主流语言的文档解析与交互问答,实现多语种问答,有效打破知识流通的语种壁垒,让全球范围内不同语言背景的用户都能顺畅使用。
尤为值得一提的是,Mi – BRAG采用动态溯源定位技术,拥有细粒度溯源能力,对每个生成结果标注原始文档及引用位置,用户可一键追溯信息源头,构建起可信知识生态,确保信息的准确性与可靠性。
在RAG基础框架之上,Mi – BRAG有着诸多技术创新。在知识库创建(B)环节,实现跨模态的知识融合,并构建 “金字塔型” 动态知识体系,使知识结构更加合理高效;知识检索(R – A)阶段,对用户Query理解进行增强,实现多维语义增强,让检索结果更贴合用户需求;回复生成(G)部分,为知识注入场景定制模型,强化无关信息的拒答功能,同时具备精细化的溯源能力。
第三方评测机构SuperCLUE通过单文档问答、多文档问答及搜索问答三大典型场景对众多产品进行综合评估。在 SuperCLUE – RAG 生成能力评测中,小米Mi – BRAG凭借在抗噪声数据处理与信息整合方面创新的数据构建方法,以及突破性的模型训练范式,成功登上榜首。在ASQA长格式事实类数据集测试中,面对需综合多份文件信息回答问题的挑战,Mi – BRAG在多文档生成溯源准召率方面表现出色,展现出强大的实力。