尽管创意技术不断进步,AI视频生成器在一致性方面仍存在挑战。即使对同一提示词运行100次,生成的视频片段也会略有不同。对于电影制作人或工作室来说,如果希望AI内容呈现可识别的角色或模仿标志性设计风格,AI的随意更改显然不可接受。为此,AI公司LTX开发了名为LTX Trainer的框架,帮助用户训练符合自身风格的专属模型。

与通用的AI模型不同,LTX Trainer允许用户基于自己的素材创建专属AI模型,从而生成独具特色的内容。得益于最新发布的GitHub更新,这些定制化、微调后的模型无需复杂编码即可构建。LTX联合创始人Yaron Inger本周独家向CNET透露了这一消息。

Inger表示:“发布这款工具对我们来说非常重要,社区可以用它来微调自己的数据。”他还提到,创意公司若想尝试AI技术但又需保护知识产权,可以下载公开工具并在本地运行模型,避免将IP上传至外部网络或云服务器带来的风险。

虽然AI视频生成尚未在大众中广泛普及,且存在大量质量参差不齐的作品,但它在专业创作者和娱乐工作室中正迅速发展。许多工作室负责人称赞AI能加快工作流程,一些创作者也乐于尝试。对专业人士而言,能够定制AI模型意味着可以突破大众化生成器的限制,开辟更多创意空间。

然而,创意AI也引发争议,许多艺术家担忧AI未经许可使用他们的作品,甚至不道德地复制他们的风格和品牌。对此,LTX和Adobe等公司强调,他们不会用客户内容训练模型。LTX的开源模型和训练工具在本地运行时,确保数据始终掌握在用户手中。

LTX Trainer现已支持纯音频及音视频联合训练,扩展了此前仅限视频的功能。用户可以实现跨模态提示,如音频到视频或图像到视频。

创作者还可通过名为LoRAs和IC-LoRAs的适配器,定制符合自身风格的AI内容。这些适配器基于LTX的核心AI模型,确保风格在多次生成中保持一致。

这一流程让用户无需投入数月时间和巨额资金,即可定制AI模型,而这通常只有谷歌、Meta等大公司具备资源。新推出的智能助手简化了构建过程,用户只需用自然语言描述想要的内容。

此外,用户还能为定制模型设置特定编辑条件,例如自动降噪音频文件或提升视频分辨率。

今年初,LTX发布了与Nvidia合作打造的第二代模型LTX-2。该模型与其他AI视频模型不同,设计为可在设备端运行。由于AI视频生成计算量巨大,通常依赖云端处理,LTX-2的本地运行特性极具优势。

LTX-2还是一个开源权重模型,公开了部分构建和运行机制。专家指出,真正的开源AI还应公开训练数据,但目前尚无主要AI公司愿意披露。

Inger表示,此次更新的最终目标是打造一款让用户感到知识产权安全、能够自由探索AI创作的工具。

“这类工具让创作者能够精准定制内容,同时享受AI快速生成的优势,最重要的是,知识产权归你所有。”Inger说道。