更便宜、更快速、更具文化识别力，Avataar的AI视频模型专为印度市场打造

印度的人工智能模型产出速度一直落后于美国、欧洲和中国。目前，只有少数初创企业发布了模型，大多数集中在大型语言模型或语音模型领域。为了促进更多创新，印度政府启动了价值约12亿美元的“印度AI使命”计划，该计划为入选的初创企业提供补贴的GPU计算资源，条件是这些企业需公开发布其模型。Avataar AI作为12家入选企业之一，推出了名为Varya的视频生成模型，专门针对印度本地文化背景进行优化，能够识别不同的节日、美食和服饰等元素。

这家获得Peak XV支持的初创公司专注于为电商打造视频工具。Varya并非从零开始开发，而是基于阿里巴巴公开发布的视频生成模型Wan 2.2，通过“蒸馏”技术对模型进行压缩和优化，使其更轻量、更快速，且更适合Avataar的应用场景。最终，Varya只需四个步骤即可完成视频生成，而Wan 2.2则需要50步，速度提升了10倍，成本也大幅降低。

具体来说，使用NVIDIA H200 GPU时，Varya可以在45秒内生成一段5秒的720p视频，而Wan 2.2则需要1230秒。

Varya最引人注目的是其价格优势。Avataar计划在其托管服务中，每秒视频收费仅为0.48印度卢比（约0.005美元），远低于Veo、Kling、Luma和Runway等模型通常每秒0.10美元以上的收费，价格差距约为20倍。

Peak XV董事总经理Rajan Anandan表示：“印度是一个以视频为主导的市场，几乎所有大型互联网产品都显示出视频优于文本的趋势。目前的AI视频模型成本过高，难以在印度实现大规模应用。若要让学生、教师、中小企业、创作者、企业和公共服务机构都能使用视频AI，成本必须大幅降低。成本是印度AI普及的最大障碍。”

图像和视频生成模型常常忽视文化细节，产生刻板或泛化的内容。Avataar AI表示，他们通过精选数据训练Varya，使其能够识别印度的文化细节，如食物、服饰、建筑和节日。

Varya将作为开源模型发布在印度政府的AI Kosh门户网站上，该平台是印度公开AI模型和数据集的集中库。开发者可以自行托管或根据需求修改模型。Avataar还计划向企业客户提供该模型，并愿意与Higgsfield、Adobe Firefly等视频工具合作。任何人现在都可以通过其官网使用文本提示或参考图片体验Varya。

Varya的发布体现了印度AI发展中的一个核心权衡。业内人士指出，印度应通过打造应用和强大的开发者生态系统，在AI领域占据一席之地，而非单纯与全球巨头竞争基础模型。印度模型开发进展缓慢，主要因计算资源不足和高质量数据有限。

印度AI使命计划正是为缩小这一差距而设。去年，政府选定12家初创企业（包括Avataar AI）开发AI模型，并提供经济高效的计算资源。今年早些时候，印度信息技术部长Ashwini Vaishnaw表示，印度计划到2028年吸引超过2000亿美元的AI投资，并在六个月内将GPU容量翻倍。

更便宜、更快速、更具文化识别力，Avataar的AI视频模型专为印度市场打造

标签

评论

相关阅读

我们警惕这家公关公司利用大量虚假AI公关人员轰炸记者推销客户

SmartNews推出利用AI可视化读者兴趣倾向的“SmartPersona”功能

马克·扎克伯格押注人工智能却遭遇惨败