ComfyUI是一家帮助创作者通过基于节点的工作流程控制扩散模型生成的图像、视频和音频输出的初创公司,最近完成了一轮3000万美元的融资,估值达到5亿美元。

此次融资由Craft Ventures领投,Pace Capital、Chemistry和TruArrow等投资者也参与其中。

ComfyUI最初于2023年作为一个开源项目启动,正值扩散模型刚刚兴起之时。当时,像Midjourney和OpenAI的DALL-E这样的模型功能尚不完善,常常出现诸如手上多出额外手指等重大错误。

为了解决这些问题,项目创始人开发了一个模块化框架,使创作者能够对生成过程的每一步进行细致控制。

该工具在创意专业人士中迅速获得认可,最终发展成一家正式的初创公司。2024年底,ComfyUI完成了1900万美元的A轮融资,投资方包括Chemistry Ventures、Cursor Capital以及Vercel创始人Guillermo Rauch。

尽管最新的扩散模型已经大幅改进,不再出现多余手指等问题,但对ComfyUI所提供的精细控制需求反而更加强烈。

ComfyUI联合创始人兼CEO Yoland Yan向TechCrunch表示:“如果你使用典型的基于提示的解决方案,比如Midjourney或ChatGPT,生成结果往往只能达到60%到80%的满意度。要调整剩下的20%,就像在玩老虎机一样。”

Yan将这一过程比作赌场,因为对模型进行微调可能导致完全不同的输出,甚至覆盖掉已经完美的部分。

ComfyUI的基于节点的界面允许创作者将生成过程的具体组件连接起来,从而对最终输出质量拥有完全控制权。

“你无法简单地通过基础模型的提示框传达这种细节,”Yan说。

创作者们对此表示认可,ComfyUI声称拥有超过400万用户。

该工具被视觉特效、动画、广告甚至工业设计等领域的创意专业人士广泛使用。

公司表示,ComfyUI已成为技术艺术家和其他创意人员不可或缺的工具,甚至在一些工作室的招聘信息中出现了“ComfyUI艺术家或工程师”这样的职位名称。

尽管视频和图像基础模型持续改进,Yan认为它们仍远未完美,像ComfyUI这样的工具将持续受到高度需求。

“在AI生成内容泛滥的时代,采用人机协作方式的ComfyUI版本最终将赢得大多数关注,”他说。

ComfyUI的竞争对手包括去年被Figma收购的初创公司Weavy。