6月13日-15日,第十七届轩辕汽车蓝皮书论坛盛大举行,行业内众多领军人物齐聚一堂,共同探讨汽车领域的前沿话题与发展趋势。魔视智能创始人、CEO虞正华也出席了此次盛会,并发表了引人深思的演讲,分享了魔视智能在自动驾驶领域的卓越进展与独特见解。
虞正华在演讲中着重介绍,魔视智能始终坚定不移地以AI模型作为驱动产品技术持续迭代的核心动力。凭借着在技术研发上的不懈投入与创新精神,截至去年,魔视智能已经成功斩获超过40个车型的量产定点,这一成绩充分彰显了其技术实力在市场上得到了广泛认可。更为瞩目的是,魔视智能交付的产品数量超过了百万台套,在量产落地方面展现出强大的执行力与交付能力,为推动自动驾驶技术的普及做出了重要贡献。展望未来,魔视智能也将继续秉持以AI模型驱动自动驾驶发展的理念,不断深耕技术,拓展市场,力求在自动驾驶领域取得更为辉煌的成就。
谈及算法模型迭代,虞正华提出了独特的“金字塔战略”。金字塔的底层,是基于结构化感知加规则构建的安全底座。这一安全底座犹如坚固基石,为整个自动驾驶系统的安全性提供了坚实保障,确保在各种复杂多变的路况下,车辆都能维持最基本的安全运行状态,成为整个算法模型的下限保证。在安全底座之上,魔视智能构建了端到端以及V模型。
端到端模型能够直接将输入的传感器数据转化为车辆的控制指令,极大地简化了传统自动驾驶系统中复杂的模块级联流程,有效提升了系统的泛化能力,使其能够更好地应对多样化的驾驶场景;V模型则通过对系统设计、开发和测试过程的结构化管理,确保了从需求分析到系统实现的各个环节都能紧密衔接,进一步优化了自动驾驶系统的性能与用户体验。而金字塔的顶端,是认知驱动的视觉语言大模型。
这一前沿技术致力于解决场景泛化难题,通过对海量视觉数据和语言信息的深度理解与学习,让自动驾驶系统能够更加智能地理解周围环境,做出更为精准合理的决策,同时减少对大规模数据的过度依赖,提升了系统的自主性与适应性。
虞正华进一步阐释,AI模型驱动的背后蕴含着数据驱动和认知驱动这两个关键底层因素。在当前的行业发展态势下,大家都对VLA(视觉语言动作)模型寄予了极高的期望。VLA模型作为一种创新性的智能体,它不仅具备强大的视觉感知能力,能够精准识别复杂环境中的各种物体与场景,还拥有丰富的常识储备,使其能够基于对世界的认知进行合理判断,并且具备一定的决策思考能力,能够根据不同的驾驶情境迅速做出恰当的决策。
这种全方位的能力整合,使得VLA模型被认为是一种更优的自动驾驶方式,它有望突破传统自动驾驶技术的局限,让车辆的驾驶表现更加接近甚至超越人类司机,为自动驾驶行业带来革命性的变革。