AI资讯迈入全球前三:微软发布最强文本生成图像模型MAI-Image-2
微软首席AI官Mustafa Suleyman发布了第二代图像生成模型MAI-Image-2,该模型在权威的LMArena排名中位列全球第三,仅次于谷歌和OpenAI,较前代产品在图像质量上有显著提升。
按标签聚合查看文章内容。
AI资讯微软首席AI官Mustafa Suleyman发布了第二代图像生成模型MAI-Image-2,该模型在权威的LMArena排名中位列全球第三,仅次于谷歌和OpenAI,较前代产品在图像质量上有显著提升。
AI资讯微软AI研究实验室于周四宣布推出三款基础AI模型,分别支持文本、语音和图像生成。这一发布标志着微软在构建多模态AI模型体系上的持续努力,旨在与其他AI实验室竞争,尽管微软仍与OpenAI保持合作关系。 其中,MAI-Transcribe-1支持25种语言的语音转文本,速度是微软Azure Fast的2.5倍。MAI-Voice-1是一款音频生成模型,能够在一秒内生成60秒的音频,并支持用户定制个性