阿里巴巴技术团队推出AtomoVideo,一种文本+图片生成高保真视频的模型。AtomoVideo通过融合多粒度图片注入和时间建模技术,使用预训练的Stable Diffusion 1.5和CLIP编码器,提高视频与原始图片的一致性。