8.4 基于文字和图像生成视频内容