AI资讯微软推出三款全新基础AI模型,挑战竞争对手
微软AI研究实验室于周四宣布推出三款基础AI模型,分别支持文本、语音和图像生成。这一发布标志着微软在构建多模态AI模型体系上的持续努力,旨在与其他AI实验室竞争,尽管微软仍与OpenAI保持合作关系。 其中,MAI-Transcribe-1支持25种语言的语音转文本,速度是微软Azure Fast的2.5倍。MAI-Voice-1是一款音频生成模型,能够在一秒内生成60秒的音频,并支持用户定制个性
按标签聚合查看文章内容。
AI资讯微软AI研究实验室于周四宣布推出三款基础AI模型,分别支持文本、语音和图像生成。这一发布标志着微软在构建多模态AI模型体系上的持续努力,旨在与其他AI实验室竞争,尽管微软仍与OpenAI保持合作关系。 其中,MAI-Transcribe-1支持25种语言的语音转文本,速度是微软Azure Fast的2.5倍。MAI-Voice-1是一款音频生成模型,能够在一秒内生成60秒的音频,并支持用户定制个性
AI资讯微软首席AI官Mustafa Suleyman发布了第二代图像生成模型MAI-Image-2,该模型在权威的LMArena排名中位列全球第三,仅次于谷歌和OpenAI,较前代产品在图像质量上有显著提升。
AI资讯微软研究团队发现,当前顶尖AI系统在处理复杂职场任务时表现不佳,错误率高达25%。这一发现对微软大力推动AI集成Windows 11的计划是个警示。