微软连发三款自研MAI模型 性能超越OpenAI且定价腰斩 打响AI战略独立关键一枪

🤖 由 文心大模型 生成的文章摘要

微软正式推出MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2三款全自研AI模型,覆盖语音转写、语音生成、图像生成三大核心商用场景。官方实测数据显示,三款模型在关键指标上对标并全面优于OpenAI同类产品,定价直降50%,同步登陆Microsoft Foundry平台开放商用,标志着微软正式走出依赖合作的AI路线,迈入技术自主、生态独立的全新阶段。

本次发布的MAI系列由微软AI超级智能团队独立研发,不依赖外部技术授权,从底层架构到工程优化均为自主可控,是微软推进AI战略自主化的里程碑产品。MAI-Transcribe-1语音转写模型支持25种主流语言,平均词错误率低至3.9%,优于OpenAI Whisper-large-v3与谷歌Gemini 3.1 Flash,批量转录速度达Azure Fast服务2.5倍,定价0.36美元/小时,较 OpenAI同类服务低约50%,目前已在Teams、Copilot 语音场景落地测试。

MAI-Voice-1语音生成模型可在单GPU环境下实现1秒生成60秒音频,长文本音色一致性表现突出,支持少量音频快速定制音色,定价22美元/百万字符,性价比显著领先行业,适配播客、智能播报、交互语音等多元场景。MAI-Image-2图像生成模型在文本渲染、复杂构图与细节还原能力上大幅升级,生成质量与效率超越上一代产品,核心能力对标OpenAI图像模型,定价较同类方案下调50%,面向设计、营销、内容创作等商用场景进行专项优化。

此次MAI系列集中发布,是微软在AI领域以全自研、全场景、商用化姿态直面行业头部玩家的重要动作,性能持平甚至超越、价格腰斩的策略,既进一步强化了Azure云服务的市场竞争力,也为Copilot、Office、Dynamics等全线产品提供自主可控的AI内核,有效降低对外部模型的长期依赖。

微软通过自研模型掌握核心技术话语权,将重构云AI服务的成本结构与市场格局,在企业级AI市场构建起技术自主、生态闭环、价格优势的三重壁垒,也意味着全球AI赛道正式从单一巨头领跑,进入多强并行、技术路线多元化的全新竞争阶段。

「93913原创内容,转载请注明出处」