xAI为iOS版Grok语音模式推出视觉功能

🤖 由文心大模型生成的文章摘要

xAI正积极为iOS版Grok语音模式带来创新性的视觉功能。这一举措旨在进一步提升用户与人工智能的交互体验，让Grok能更好地理解和响应用户需求。

目前，iOS版Grok已开放摄像头访问权限，用户可利用设备摄像头捕捉视觉输入，Grok则通过语音响应分析和描述所捕捉到的画面。例如，用户拍摄一张风景照片，Grok能够对照片中的景色进行描述，像 “照片中是一片广阔的蓝色海洋，海浪拍打着金色沙滩，远处有几艘白色帆船在航行”，或者用户拍摄一张物品照片，Grok能识别物品并提供相关信息。不过，完整的视觉分析功能仍在开发中，后续还将加入语速调节选项，以满足不同用户的使用习惯。
此前，Grok已具备一定的图像相关能力。去年，xAI就为Grok增添了图像理解功能，X平台付费用户可向AI助手上传图片并进行相关提问，马斯克展示过Grok不仅能理解图片内容，还能解读其中的幽默元素。通过与黑森林实验室（Black Forest Labs）的FLUX.1模型合作，Grok也已具备图像生成能力。此次在iOS版语音模式中加入视觉功能，是Grok功能的又一次重要拓展。

在模型方面，xAI已在API中上线grok – 3 – beta、grok – 3 – mini – beta及其fast版本，充值5美元并参与计划的用户可使用每月 150 美元赠金访问这些模型。这一系列动作显示出xAI 在不断推动Grok的发展，提升其在人工智能市场中的竞争力。

随着iOS版Grok语音模式视觉功能的逐步完善，未来用户有望获得更加智能、便捷且多元化的交互体验，无论是在日常生活中的信息获取，还是在工作学习中的资料分析等方面，Grok 都可能发挥更大的作用。

「93913原创内容，转载请注明出处」

相关文章

Mete Quest 3：计划推出上半身追踪和人工智能驱动腿部功能

Luma AI Ray2视频模型已上线Amazon Bedrock

肖像隐私争议发酵 Meta紧急下线Instagram引用账号AI生图功能

京东公布“天工”计划，人工智能3D建模领域巨头入场

昆仑万维宣布正式开源Matrix – Game大模型

中兴通讯AIR Core 2.0闪耀2025中国PT展：以AI大模型重构核心网，开启智能通信新纪元

推荐

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

Headwolf面向欧洲推出隐私优先AI眼镜，应对高退货率痛点

Retro3D应用发布：将Quest 3变为复古3D眼镜

AI应用推荐

热门

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

友情链接

推荐

国家电影局发布6月VR电影备案：25部作品集中落地，红色文化与数字技术深度融合

江苏AI眼镜赋能远程执法应用正式上线，安全生产监管迈入智能化新阶段

Headwolf面向欧洲推出隐私优先AI眼镜，应对高退货率痛点

Retro3D应用发布：将Quest 3变为复古3D眼镜