微软 AI 自研模型MAI-1:语音生成与 Copilot 未来
微软AI自研模型MAI-1:语音生成与Copilot未来

微软 AI 自研模型MAI-1:语音生成与 Copilot 未来

微软AI发布两款自研模型:MAI-Voice-1(1秒生成1分钟语音)和MAI-1-preview(Copilot未来服务雏形)。旨在打造更贴近消费者的AI应用。

August 29, 2025
2 min read
85
0
0
0

由首席执行官萨利曼(Mustafa Suleyman)领导的Microsoft AI(MAI)于28日发布了两款自研模型——MAI-Voice-1 AI和MAI-1-preview。新的MAI-Voice-1语音生成模型可在单张GPU上1秒内生成1分钟音频,而公开测试的MAI-1-preview则展现了Copilot未来服务的雏形。

微软已在多项功能中采用了MAI-Voice-1,包括由AI朗读当日新闻的Copilot Daily,以及生成播客形式的讨论,辅助说明主题。用户可在Copilot Labs试用MAI-Voice-1,输入想要模型朗读的内容,并调整声音和风格。

MAI-1-preview是一款微软内部的混合专家模型(Mixture of Experts Models,MoE),在约15,000张NVIDIA H100 GPU上进行了预训练和后训练,专为需要能够遵循指令并对日常查询提供有用回应的用户而设计。

MAI计划在目前仍依赖OpenAI模型的Copilot中,对特定文本应用场景逐步推出MAI-1-preview,已在AI基准测试平台LMArena公开测试了这款模型。

“我们对未来的发展抱有宏伟愿景。”MAI在官方博客文章中写道,“我们不仅将在此领域追求进一步的突破,并相信协同一系列针对不同用户需求和场景的专用模型,将能释放巨大的价值。”

实际上,萨利曼去年接受外媒采访时曾表示,微软内部的模型并非专注于企业应用。“我的逻辑是,我们必须打造一款对消费者非常有用的产品,并为我们的使用场景进行优化。”他说,“我们在广告端、消费者遥测等方面拥有大量预测性强且非常实用的数据,我的重点是建立一个真正适合消费者的模型。”

copilot

MAI

暂无相关文章

microsoft

最多评论

最多收藏

最多点赞