#语音识别

按标签聚合查看文章内容。

谷歌在日本推出可通过手机摄像头和语音与AI互动的“Search Live”功能AI资讯

谷歌在日本推出可通过手机摄像头和语音与AI互动的“Search Live”功能

美国谷歌公司于3月27日(日本时间)宣布,Android和iOS版“Google”应用中的“Search Live”功能现已支持日语。该功能利用谷歌搜索的AI模式,能够识别摄像头所见内容,实时通过语音回答用户提问,并提供相关网站链接。此次更新使得包括日本在内的200多个国家和地区的用户都能通过谷歌AI模式进行对话。 用户只需在“Google”应用的搜索栏下方点击带有三条竖线的“直播”按钮,然后用

Deepgram 语音识别与语音理解平台AI音频

Deepgram 语音识别与语音理解平台

Deepgram 是面向开发者与企业的云端语音识别与语音理解平台,提供高精度、多语言、低延迟的语音转文字与语音分析能力,适用于客服质检、会议记录、实时字幕、语音助手等多种场景。

TurboScribe AI 智能转录与字幕生成工具AI音频

TurboScribe AI 智能转录与字幕生成工具

TurboScribe AI 是一款支持多语言的在线音视频转文字与字幕生成工具,主打高精度转录、快速处理和简单易用的网页操作界面,适合播客主、视频创作者、记者、学生和企业用户高效完成转写与字幕制作。

讯飞译制:AI视频字幕制作与翻译软件AI音频

讯飞译制:AI视频字幕制作与翻译软件

讯飞译制是一款基于科大讯飞语音识别与翻译技术的AI视频字幕制作软件,可自动识别语音生成字幕、智能时间轴对齐,并支持多语种视频翻译与SRT/ASS/XML等字幕格式导出,适用于短视频创作者、自媒体、教育培训及企业宣传等多种场景。

Cohere发布首个开源语音转录模型AI资讯

Cohere发布首个开源语音转录模型

企业级AI公司Cohere于周四推出了其首个语音模型:Transcribe。这是一款开源的自动语音识别(ASR)模型,适用于笔记记录和语音分析等任务。 该模型参数量仅为20亿,设计目标是支持使用消费级GPU的用户自托管。目前,Transcribe支持14种语言,包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、希腊语、荷兰语、波兰语、中文、日语、韩语、越南语和阿拉伯语。 Cohere表示,Tra

谷歌在日本推出“搜索 Live”功能,支持语音与摄像头的AI模式搜索AI资讯

谷歌在日本推出“搜索 Live”功能,支持语音与摄像头的AI模式搜索

美国谷歌公司于26日(美国时间)发布了进一步提升实时对话体验的“Gemini 3.1 Flash Live”。该音频模型是迄今为止质量最高的,能够实现下一代“语音优先”AI所需的速度和自然节奏。借助Gemini 3.1 Flash Live,谷歌在日本推出了支持语音和摄像头的新搜索功能“搜索 Live(Search Live)”。 Gemini 3.1 Flash Live已作为预览版通过谷歌A

讯飞译制:AI视频字幕制作与翻译软件AI音频

讯飞译制:AI视频字幕制作与翻译软件

讯飞译制是一款基于科大讯飞语音识别与翻译技术的AI视频字幕制作软件,可自动识别语音生成字幕、智能时间轴匹配,并支持多语种视频翻译与多种字幕格式导出,适合自媒体、教育培训、企业宣传等多场景使用。