MusePose 生成后果
由腾讯音乐文娱的Lyra Lab团队拓荒的Muse 开源系列姿首,它的临了一个模块终于来了——MusePose !发布后却诚恳致谢阿里的姿首?
对于Muse这个姿首其实早在2023年3月就运行了,同庚7月就已毕了一个里程碑。但在本年开年Sore面世,让众东说念主恐慌的同期,腾讯也运行坐不住了,本年3月份立马开源了MuseV和MuseTalk两个Muse系列姿首,但那时Muse开源系列其实还清寒一块进犯的基石。
直到5月27号MusePose认真发布,总算是认真补王人了Muse系列数字东说念主开源框架!
1
MuseV、MuseTalk协同创作
先苟简给环球追想腾讯的前两个Muse 姿首:
MuseV:是一个基于扩散的诬捏东说念主视频生成框架,进一步推广了诬捏试验的创作领域。它粗豪左证文本态状生成视频,或者将静态图像和姿势调遣成动态视频。
MuseTalk:是一个在潜在空间中试验的及时高质地音频驱动的口型同步模子,它粗豪在潜在空间中对面部区域进行修改,以匹配输入的音频,赞助多种讲话,并已毕每秒30帧以上的及时处理速率。
MuseV➕MuseTalk协同生成后果:
掀开新闻客户端 提高3倍盛开度MuseV(图生视频)
掀开新闻客户端 提高3倍盛开度MuseV+MuseTalk(协同生成)
1
敲要点:MusePose是什么?
MusePose :是姿态驱动的图像到视频生成框架,专注于诬捏东说念主类的生成,粗豪在给定的姿态序列下,生成参考图像中的东说念主类脚色的跳舞视频。结合上MuseV和MuseTalk,p2p理财不错已毕端到端的诬捏东说念主类生成,包括全身清醒和互动才调。
掀开新闻客户端 提高3倍盛开度MusePose和MuseV有什么区别
MusePose和MuseV均不错完成图生视频,MuseV的视频作为赶紧性大,而MusePose是按给定作为生成,作为固定。
MusePose需要12G以上显存,生成时因为占用分享显存,生成的视频明晰度和踏实性略差。
MuseV需要8G以上显存,保举12G以上,股票配资唯信网若图片区别率越高、作为越小、则越踏实,生成的视频明晰度也就越高。
MusePose这个姿首侧重于Pose,即姿态招引
姿态招引是 MusePose 的关键本事之一,通过给定的姿态序列,模子粗豪生成参考图像中的东说念主物在这些姿态下的动画。
具体已毕格式包括:
姿态对王人算法(Pose Ailgnment Plgorithm):该算法将大肆跳舞视频的姿态与大肆参考图像对王人,确保生成的视频中的东说念主物作为与输入姿态序列一致。
姿态序列生成:通过姿态对王人算法,生成参考图像东说念主物在不同时代的姿态序列,这些姿态序列用作生成视频的输入。
掀开新闻客户端 提高3倍盛开度掀开新闻客户端 提高3倍盛开度MusePose Comfy UI 责任流
面前社区已有对应的ComfyUI插件赞助。
责任流展示后果如下:
掀开新闻客户端 提高3倍盛开度Muse生态方针
MusePose、MuseV和MuseTalk三个姿首,共同构建一个完整的诬捏东说念主类生成处置决议。从动态捕捉到视觉试验的生成,再到声息与形象的完竣和会,Muse系列姿首旨在为诬捏东说念主物的创建提供全倡导的本事赞助。
1
腾讯:感谢开源,感谢阿里
等等,看到腾讯Muse系列的Demo,是不是嗅觉似曾默契?🤔
以下是阿里巴巴集团智能策划究诘院发布的Animate Anyone开源姿首的Demo👇
掀开新闻客户端 提高3倍盛开度掀开新闻客户端 提高3倍盛开度Animate Anyone
案例基本全都相同?然而腾讯比阿里的视频长度更长,东说念主物的作为幅度更大。
这全都对标效法?刚运行看到时,我还惊羡不愧是大厂竞争,径直贴脸开大,在你的基础上杰出你?
但其实腾讯的MusePose姿首除了成就了几个进犯的造作除外,要点是在Moore-AnimateAnyone(阿里开源姿首)的代码基础上作念了一些篡改。另外,腾讯在发扬里也大大方方的致谢了阿里的开源姿首以过头他的开源组件。
AI大模子的开源闭源,只不外是大厂之间相爱相杀斥逐。然而我仍是相配赞助像腾讯和阿里这么的良性竞争多来点,我们国内AI的发展势必昔时可期!
虽然MusePose面前版块也存在一些局限性,比如:难以保合手细节一致性,原始脚色的一些细节莫得获得很好的保留(举例面部区域和复杂的服装);在复杂配景会出现噪声和醒目。
期待下一个勤劳开源的大厂……