ACT 1(Advanced Cinematic Transformer)是一个由Hotshot Research开发的直接文本到视频合成系统,它能够生成高清晰度的视频,具有多种宽高比且无水印,提供引人入胜的用户体验。该系统通过使用大规模高分辨率文本视频语料库进行训练,以实现高保真度的空间对齐、时间对齐和审美质量。
需求人群: "适用于内容创作者、视频制作人和任何希望将文本想法转化为视频的用户。" 使用场景示例: 使用Hotshot – ACT 1根据文本描述生成动画风格的视频创建描述特定场景的视频,如名人在特定环境中的活动制作具有特定动作和表情的高分辨率视频 产品特色: 直接从文本生成视频支持多种宽高比和高分辨率输出训练模型以注释视频并关注动作、常识元素和日常语言