此外,通义万相视频生成模型还设计了高压缩比、高质量视频VAE框架★■◆■,可有效降低视频信息冗余AG8大厅登录,并保持高质量视频重构能力■◆◆★★。同时该模型基于轻量微调框架和精选数据集优化训练,在中式传统元素、风格化视频生成上的表现更好。
据官方透露,通义万相首批已上线文生视频和图生视频功能。具体而言,文生视频功能可根据用户输入的文本提示词生成一段高清视频■■,并且不仅支持中英文多语言输入,还可通过灵感扩写来丰富视频的内容,且生成视频支持16■■◆:9◆■◆★、9★■◆◆◆:16等多种画面比例。而图生视频则支持用户将任意图片转化为动态视频,并按用户上传的图像比例或预设比例生成,同时可通过提示词来控制生成视频的内容。
在此次云栖大会上■◆■◆◆,阿里云方面对通义万相视频生成模型的运动生成和概念组合能力进行了演示。例如在模拟用户输入“穿着滑冰鞋的小兔子在冰面上灵活移动的可爱场景”这一提示词后,其仅用数分钟便能生成一段高清视频。
据了解★■,通义万相视频生成模型集成了多项创新技术◆◆★★,可有效解决画面表现力和大幅度运动等视频生成技术的难题。并针对运动生成和物理模拟等难点也优化了算法,该模型实现了大幅度主体运动和运镜控制■◆■,并能有效模拟真实世界的物理特性■◆◆◆。
随着通义万相视频生成模型的发布,目前通义系列大模型已覆盖文本生成★◆★■★、图像理解、视频理解AG8大厅登录、音频理解、图像生成■◆、视频生成等全模态场景。在此次云栖大会上■◆★,阿里云方面还宣布通义万相视觉生成模型全面升级为Diffusion Transformer框架,同时结合通义千问复杂提示词解释能力★■◆◆■,可有效提升画面表现力、语义理解能力、可控生成能力◆■◆★◆。
此前在去年7月,通义万相图像生成模型首次亮相■★◆◆◆,截止目前已累计生成7500万张图片。值得一提的是,近日阿里云百炼平台的3款通义千问主力模型再次降价。其中,Qwen-Turbo价格直降85%、低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降80%和50%◆■◆★★■,同时阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度■■◆◆◆■。
在近日举行的云栖大会上,阿里云CTO周靖人宣布通义万相全面升级AG8大厅登录,并发布了全新的视频生成模型■★。据了解,该模型不仅可以生成影视级的高清视频,还能应用于影视创作、动画设计★■★■★、广告设计等多个领域。目前,所有用户均可通过通义APP及通义万相官网免费体验■◆★◆。
相关标签: 高清动态视频