印度的人工智能模型产出速度一直落后于美国、欧洲和中国。目前,只有少数初创企业发布了模型,大多数集中在大型语言模型或语音模型领域。为了促进更多创新,印度政府启动了价值约12亿美元的“印度AI使命”计划,该计划为入选的初创企业提供补贴的GPU计算资源,条件是这些企业需公开发布其模型。Avataar AI作为12家入选企业之一,推出了名为Varya的视频生成模型,专门针对印度本地文化背景进行优化,能够识别不同的节日、美食和服饰等元素。

这家获得Peak XV支持的初创公司专注于为电商打造视频工具。Varya并非从零开始开发,而是基于阿里巴巴公开发布的视频生成模型Wan 2.2,通过“蒸馏”技术对模型进行压缩和优化,使其更轻量、更快速,且更适合Avataar的应用场景。最终,Varya只需四个步骤即可完成视频生成,而Wan 2.2则需要50步,速度提升了10倍,成本也大幅降低。

具体来说,使用NVIDIA H200 GPU时,Varya可以在45秒内生成一段5秒的720p视频,而Wan 2.2则需要1230秒。

Varya最引人注目的是其价格优势。Avataar计划在其托管服务中,每秒视频收费仅为0.48印度卢比(约0.005美元),远低于Veo、Kling、Luma和Runway等模型通常每秒0.10美元以上的收费,价格差距约为20倍。

Peak XV董事总经理Rajan Anandan表示:“印度是一个以视频为主导的市场,几乎所有大型互联网产品都显示出视频优于文本的趋势。目前的AI视频模型成本过高,难以在印度实现大规模应用。若要让学生、教师、中小企业、创作者、企业和公共服务机构都能使用视频AI,成本必须大幅降低。成本是印度AI普及的最大障碍。”

图像和视频生成模型常常忽视文化细节,产生刻板或泛化的内容。Avataar AI表示,他们通过精选数据训练Varya,使其能够识别印度的文化细节,如食物、服饰、建筑和节日。

Varya将作为开源模型发布在印度政府的AI Kosh门户网站上,该平台是印度公开AI模型和数据集的集中库。开发者可以自行托管或根据需求修改模型。Avataar还计划向企业客户提供该模型,并愿意与Higgsfield、Adobe Firefly等视频工具合作。任何人现在都可以通过其官网使用文本提示或参考图片体验Varya。

Varya的发布体现了印度AI发展中的一个核心权衡。业内人士指出,印度应通过打造应用和强大的开发者生态系统,在AI领域占据一席之地,而非单纯与全球巨头竞争基础模型。印度模型开发进展缓慢,主要因计算资源不足和高质量数据有限。

印度AI使命计划正是为缩小这一差距而设。去年,政府选定12家初创企业(包括Avataar AI)开发AI模型,并提供经济高效的计算资源。今年早些时候,印度信息技术部长Ashwini Vaishnaw表示,印度计划到2028年吸引超过2000亿美元的AI投资,并在六个月内将GPU容量翻倍。