昆仑万维宣布,其天工AI大模型SkyReels V4在Artificial Analysis的文本生成视频(含音频)类别中荣获全球第一。该模型的表现远超Kling3.0、Google Veo3.1、Vidu Q3及OpenAI Sora2等主流模型,成为当今全球视频生成能力最强的AI大模型。
核心突破:全模态强化学习与逻辑推理
SkyReels V4在架构上实现了两大核心技术革新,成功解决了视频生成中的一致性和叙事逻辑问题:
- 强化学习系统(RL):构建全模态语义奖励模型,采用循序渐进的课程学习路径,赋予模型逻辑推理能力,实现商业级1080p、15秒长序列视频生成。
- 高级参考任务:新增“关键帧参考”和“网格图参考”功能。关键帧参考能准确推断节点间连贯场景,网格图参考支持上传多张故事图像,确保短片创作中角色特征和场景风格的一致性。
凭借榜首排名,SkyReels V4的API现已全面开放,覆盖所有核心功能:

- 功能全面覆盖:包括文本生成视频、图像生成视频、多模态参考生成、视频编辑修复及视听联合生成。
- 低门槛赋能:电商、教育、内容平台及开发团队可直接调用全球领先的视听生成能力,无需大量研发投入。
昆仑万维此前已发布并开源多款SkyReels系列模型。从V1的人物驱动生成,到V2的长视频生成,再到V4在视听同步与逻辑表达上的全面突破,SkyReels展现了从“能生成”到“生成优质内容”的飞跃。
目前,SkyReels V4的技术报告已同步发布,开发者可通过官方平台获取API文档并进行业务集成。这标志着中国AI在视听内容生成垂直领域已达到全球领先水平。


