AI资讯免费发布:仅1.8B参数的翻译用大型语言模型Hy-MT2,性能超越微软商用API
中国腾讯公司于5月21日(当地时间)发布了支持33种语言的免费翻译大型语言模型(LLM)系列——Hy-MT2。该系列模型的权重以开源形式公开,用户可通过Hugging Face等平台下载使用。 Hy-MT2系列支持33种语言的无缝翻译。包括7B参数模型以及首次采用MoE架构的30B-A3B模型,在多种翻译任务中均展现出领先的性能,甚至超越了参数数量远超自身的其他开源模型。 值得一提的是,轻量级的
按标签聚合查看文章内容。
AI资讯中国腾讯公司于5月21日(当地时间)发布了支持33种语言的免费翻译大型语言模型(LLM)系列——Hy-MT2。该系列模型的权重以开源形式公开,用户可通过Hugging Face等平台下载使用。 Hy-MT2系列支持33种语言的无缝翻译。包括7B参数模型以及首次采用MoE架构的30B-A3B模型,在多种翻译任务中均展现出领先的性能,甚至超越了参数数量远超自身的其他开源模型。 值得一提的是,轻量级的
AI教程本文系统梳理如何在 AMD ROCm GPU 与苹果 Mac Metal 环境中本地运行 DeepSeek 系列开源大模型,涵盖快速选型路径、平台与格式兼容性建议,以及常见错误的成因与解决步骤。
AI教程本文系统梳理如何在 AMD ROCm GPU 与苹果 Mac Metal 环境中本地运行 DeepSeek 系列大模型,涵盖快速选型路径、平台与格式兼容性矩阵,以及在非 CUDA 环境下最常见的报错与对应解决方案。
AI教程跑本地 DeepSeek 选 GGUF,要原始权重与训练选 Safetensors。两者不是谁替代谁,而是各管 LLM 工作流里的不同环节。