谷歌逐步开放Gemini网页版,香港用户迎来图像与音乐生成全功能体验
谷歌Gemini AI助手网页版正式向香港用户开放,支持文本、图像、语音及数据多模态处理,打破此前访问限制。
按标签聚合查看文章内容。
谷歌Gemini AI助手网页版正式向香港用户开放,支持文本、图像、语音及数据多模态处理,打破此前访问限制。
AI资讯微软首席AI官Mustafa Suleyman发布了第二代图像生成模型MAI-Image-2,该模型在权威的LMArena排名中位列全球第三,仅次于谷歌和OpenAI,较前代产品在图像质量上有显著提升。
AI资讯谷歌在2026年I/O大会上推出了全新AI发展规划,发布了最新AI模型及多项创新应用,推动AI技术更好服务大众。
AI资讯美国谷歌公司于3月25日(当地时间)宣布推出全新音乐生成模型“Lyria 3 Pro”。该模型是在上个月发布的音乐生成模型“Lyria 3”的基础上开发的高级版本,支持生成最长约3分钟的完整音乐作品,并具备更强的定制和创意控制能力。用户可以通过提示词指定音乐的特定部分,如前奏、主歌、副歌和桥段等。 “Lyria 3”提供两种不同版本以满足不同需求: Lyria 3 Pro(lyria-3-pro
Mistral AI发布了全新开源模型Mistral Small4,集成三大旗舰能力,加入NVIDIA Nemotron联盟,提升效率与性能。
AI资讯字节跳动推出了支持多模态输入的AI视频生成模型Seedance 2.0,能够生成高保真1080p视频,实现音视频同步,提升运动稳定性和物理真实感,在独立盲测中表现优异。
AI资讯MiniMax(西域科技)宣布将原有的编程计划升级为全新的Token计划,打造全球首个支持全模态模型的订阅服务,覆盖编程、视频、语音、音乐及图像生成等多种专业应用场景。
AI资讯ZEALS推出的“Omakase AI头像”通过多模态AI技术,打造自然流畅的实时对话体验,广泛应用于招聘、客服、教育等多个业务场景。
AI资讯美国Google公司于4月21日(当地时间)宣布推出基于「Gemini 3.1 Pro」的新型智能调研工具——「Deep Research」和「Deep Research Max」。这两款产品已通过「Gemini API」的付费计划开始公开预览。 「Gemini Deep Research」是一款能够自主规划和执行调研任务,并汇总结果的智能代理,包含以下两种变体: Deep Research:注
AI资讯阿里巴巴通义实验室推出Fun-CineForge,这是首个开源的多模态电影级专业配音AI模型,提升了情感表达、环境音融合和唇动同步,推动影视行业自动化进程。