字节推出新的数字人模型!仅需一张照片和音频即可生成超长时间稳定视频【天风传媒&海外|AI应用大时代】
字节跳动智能创作数字人团队今日发的OmniHuman模型,能够生成高度真实和生动的人类运动视频,同时支持多种模态,相比过去视频生成模型,显著改善了手势生成,显著超越现有的音频条件人类视频生成方法。 人物可以在视频中生成和音频匹配的动作,包括演讲、唱歌、乐器演奏以及移动,且生成视频相对稳定且时间较长。该技术方案已落地即梦 AI,相关功能将于近期开启测试。
利好数字人+影视动画相关原有视频模型的生成稳定性和多模态问题解决,数字人和影视相关产业或迎来全新技术革命,此外我们认为,借助即梦和抖音平台,C端多模态爆款产品或功能有望落地,视频模型生成能力或成为短视频平台的重要竞争力
建议关注:【视觉中国】【华策影视】【捷成股份】【蓝色光标】【易点天下】