UniVG是一款先进的多模态视频生成系统,能够处理包括文本和图像在内的多种视频生成任务。它通过创新的多条件交叉注意力和偏置高斯噪声技术,实现了高自由度和低自由度的视频生成。UniVG在公共学术基准MSR-VTT上取得了最低的Fr’echet视频距离,超越了现有开源方法的人类评估表现,甚至与闭源方法Gen2不相上下。这款软件特别适合影视特效制作者和视频内容创作者使用,为他们提供了强大的视频生成工具。UniVG的多模态处理能力和出色的生成质量,可以大幅提高视频制作效率,激发创意潜能,帮助用户创造出更加丰富多样的视频内容,为视频创作领域带来新的可能性。