🤖 由 文心大模型 生成的文章摘要
xAI正积极为iOS版Grok语音模式带来创新性的视觉功能。这一举措旨在进一步提升用户与人工智能的交互体验,让Grok能更好地理解和响应用户需求。
目前,iOS版Grok已开放摄像头访问权限,用户可利用设备摄像头捕捉视觉输入,Grok则通过语音响应分析和描述所捕捉到的画面。例如,用户拍摄一张风景照片,Grok能够对照片中的景色进行描述,像 “照片中是一片广阔的蓝色海洋,海浪拍打着金色沙滩,远处有几艘白色帆船在航行”,或者用户拍摄一张物品照片,Grok能识别物品并提供相关信息。不过,完整的视觉分析功能仍在开发中,后续还将加入语速调节选项,以满足不同用户的使用习惯。
此前,Grok已具备一定的图像相关能力。去年,xAI就为Grok增添了图像理解功能,X平台付费用户可向AI助手上传图片并进行相关提问,马斯克展示过Grok不仅能理解图片内容,还能解读其中的幽默元素。通过与黑森林实验室(Black Forest Labs)的FLUX.1模型合作,Grok也已具备图像生成能力。此次在iOS版语音模式中加入视觉功能,是Grok功能的又一次重要拓展。
在模型方面,xAI已在API中上线grok – 3 – beta、grok – 3 – mini – beta及其fast版本,充值5美元并参与计划的用户可使用每月 150 美元赠金访问这些模型。这一系列动作显示出xAI 在不断推动Grok的发展,提升其在人工智能市场中的竞争力。
随着iOS版Grok语音模式视觉功能的逐步完善,未来用户有望获得更加智能、便捷且多元化的交互体验,无论是在日常生活中的信息获取,还是在工作学习中的资料分析等方面,Grok 都可能发挥更大的作用。
「93913原创内容,转载请注明出处」