AI资讯Google翻译应用的实时翻译功能扩展至日本及70多个地区
2024年3月27日,日本时间,Google宣布在iOS和Android版的“Google翻译”应用中,扩大了通过耳机实时听取翻译内容的直播翻译功能的适用区域。 用户只需佩戴耳机并开启应用中的直播翻译功能,即可实时听到同步翻译的语音。该功能利用了Google最新的Gemini语音对译技术,AI能够生成包含说话者语调、重音和抑扬顿挫的合成语音,帮助用户更轻松地理解“谁说了什么”。这项技术适用于日常
按标签聚合查看文章内容。
AI资讯2024年3月27日,日本时间,Google宣布在iOS和Android版的“Google翻译”应用中,扩大了通过耳机实时听取翻译内容的直播翻译功能的适用区域。 用户只需佩戴耳机并开启应用中的直播翻译功能,即可实时听到同步翻译的语音。该功能利用了Google最新的Gemini语音对译技术,AI能够生成包含说话者语调、重音和抑扬顿挫的合成语音,帮助用户更轻松地理解“谁说了什么”。这项技术适用于日常
AI资讯RUN.EDGE对AI视频手册工具TAGURU进行了重大升级,实现了从标题生成到旁白配音的全流程自动化,极大提升制造现场的生产效率。
AI资讯更新,东部时间下午4:05: 在本文发布数小时后,谷歌联系媒体撤回了之前的消息。公司向Engadget提供了以下声明: “Search Live尚未在全球范围内向所有用户推出。目前该功能仅在美国和印度可用,且正在更多市场进行测试。对于之前的信息误传,我们深表歉意。” 鉴于公司表示正在更多市场测试,全球范围内推出Search Live的时间可能不会太远,但目前仍处于暂停状态。 以下为原文内容: 继去
AI资讯谷歌于周四为其视频编辑应用Vids推出了多项新功能,包括通过文本提示指挥和定制虚拟形象、支持Veo 3.1模型、可将视频导出至YouTube以及通过Chrome扩展进行录制。 用户现在可以使用自然语言提示来指导虚拟形象在场景中“表演”,例如让虚拟形象与产品、道具或设备互动。谷歌表示,尽管输出内容动态多变,Vids依然保证了角色的一致性。 此外,用户还能根据视频主题,通过调整虚拟形象的外观、服装以及
AI资讯Google在云端硬盘中引入了基于生成式AI“Gemini”的新功能,帮助用户快速汇总和提取所需信息,支持多达28种语言。
AI资讯法国人工智能公司Mistral于周四发布了一款全新的开源文本转语音(TTS)模型,适用于语音助手及企业场景,如客户支持等。该模型帮助企业构建销售和客户互动的语音代理,直接与ElevenLabs、Deepgram和OpenAI等公司竞争。 这款名为Voxtral TTS的新模型支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。 Mistral AI科学运营副
AI资讯谷歌于周三宣布,将在包括印度、加拿大和新西兰在内的新地区推出Gemini在Chrome浏览器中的集成。此次更新允许用户通过桌面版Chrome的侧边栏访问Gemini,用户可以向谷歌的AI聊天机器人提问屏幕上的内容,获取Gmail、Keep、Drive和YouTube中的信息,并比较多个标签页的内容。 此次推广还支持多种语言,包括英语、印地语、孟加拉语、古吉拉特语、卡纳达语、马拉雅拉姆语、马拉地语、
AI编程Fitten Code 是一个支持多语言在线运行、调试与分享代码的云端平台,适合学习编程、算法练习、面试刷题和日常代码实验。无需本地环境配置,打开浏览器即可编写、运行和分享代码片段。