#开源模型

按标签聚合查看文章内容。

Mistral发布全新开源语音生成模型AI资讯

Mistral发布全新开源语音生成模型

法国人工智能公司Mistral于周四发布了一款全新的开源文本转语音(TTS)模型,适用于语音助手及企业场景,如客户支持等。该模型帮助企业构建销售和客户互动的语音代理,直接与ElevenLabs、Deepgram和OpenAI等公司竞争。 这款名为Voxtral TTS的新模型支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。 Mistral AI科学运营副

Cohere发布首个开源语音转录模型AI资讯

Cohere发布首个开源语音转录模型

企业级AI公司Cohere于周四推出了其首个语音模型:Transcribe。这是一款开源的自动语音识别(ASR)模型,适用于笔记记录和语音分析等任务。 该模型参数量仅为20亿,设计目标是支持使用消费级GPU的用户自托管。目前,Transcribe支持14种语言,包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、希腊语、荷兰语、波兰语、中文、日语、韩语、越南语和阿拉伯语。 Cohere表示,Tra

成本降低与效率瓶颈:Cloudflare放弃专有模型,转用Kimi K2.5AI资讯

成本降低与效率瓶颈:Cloudflare放弃专有模型,转用Kimi K2.5

Cloudflare引入Moonshot AI的开源模型Kimi K2.5,旨在提升计算性能与成本效益。该模型拥有超大256k上下文窗口、卓越的视觉处理能力及稳定的多轮工具调用表现,在编程和Agent任务中表现出色,已通过严格评估并应用于核心业务。

NVIDIA发布Nemotron 3 Super,提升智能代理AI吞吐量最高5倍AI资讯

NVIDIA发布Nemotron 3 Super,提升智能代理AI吞吐量最高5倍

NVIDIA近日推出了专为大规模自主智能代理运行设计的开源模型——NVIDIA Nemotron 3 Super。 该模型拥有1200亿参数,其中活跃参数达到120亿,专注于支持复杂的智能代理AI系统的大规模执行。通过优化长上下文处理和复杂推理能力,Nemotron 3 Super能够将智能代理AI的吞吐量提升最多5倍。 NVIDIA指出,随着AI代理的广泛应用,向多代理系统转变会带来诸如上下文

Genmo Mochi 文本生成视频模型AI视频

Genmo Mochi 文本生成视频模型

Genmo 是专注视频生成的研究实验室,其开源模型 Mochi 1 能将文字创意转化为高质量视频,可本地运行、深度定制,并支持在交互式网页 playground 中体验。

Llama(Meta)开源大语言模型与开发平台AI写作

Llama(Meta)开源大语言模型与开发平台

Llama 是 Meta 推出的开源大语言模型家族与官方入口网站,提供模型介绍、许可与使用指引,帮助开发者在本地或云端进行推理、微调与应用集成。