OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
相关推荐
Windows 电脑装机必备,精选8个神仙级软件工具!-零度博客

Windows 电脑装机必备,精选8个神仙级软件工具!

  1.种子下载神器 qBittorrent增强版 下载地址:【点击前往】,暗黑主题下载:https://www.freedidi.com/10643.html 但是既然说它是加强版,肯定会和上面的普通版有不同之处。 它最大的区...
admin的头像-零度博客admin
2.1W+1683
无线投屏教程!支持全平台:PC、Mac、安卓、iOS、智能TV等 | 零度教程-零度博客
Google Voice绑定环聊-零度博客

Google Voice绑定环聊

当然首先你需要有一个谷歌账号和一个Google Voice账号 准备工作 您需要: Google 帐号 Google Voice 帐号           在 (环聊)Hangouts 中启用来电响铃功能 如果您...
初代iPhone发布15周年,盘点第一代所没有的15项功能!-零度博客

初代iPhone发布15周年,盘点第一代所没有的15项功能!

本周日,是史蒂夫·乔布斯在旧金山的 Macworld 博览会上介绍初代 iPhone 的 15 周年。虽然该设备彻底改变了智能手机行业,但人们很容易忘记 iPhone 从那时起有了多大的改进。为庆祝这一时刻的到...
admin的头像-零度博客admin
1.5W+2251
StableStudio: 人手一个 Midjourney,Stability AI 开源的 AI 图像生成平台-零度博客

StableStudio: 人手一个 Midjourney,Stability AI 开源的 AI 图像生成平台

 安装步骤:首先您需要安装Node.js和Yarn。然后运行以下命令安装依赖项并启动 StableStudio。安装好Node.js以后,输入下方命令进行安装Yarnnpm install --global yarn验证安装 安装完成后,运...
admin的头像-零度博客admin
2.3W+3252
流氓软件该如何彻底卸载?删除方法你都用对了吗? | 零度解说-零度博客
开心电视助手【最新版】安卓TV必备的神器!-零度博客

开心电视助手【最新版】安卓TV必备的神器!

  开心电视助手,是一款专门针对安卓设备打造的远程管理工具,可以轻松实现:管理电视/机顶盒/投影仪等设备,还可以远程安装各种电视APP,方便用户的使用和安装应用,还支持刷第三方固件等...
admin的头像-零度博客admin
7.3W+3263
7个鲜为人知,但非常有意思!而且超实用的网站!!2022 | 零度解说-零度博客
Hitomi Downloader – 开源免费、图形界面,1200+ 在线视频下载工具,支持多协议、批量下载-零度博客

Hitomi Downloader – 开源免费、图形界面,1200+ 在线视频下载工具,支持多协议、批量下载

Hitomi Downloader 是一款基于 yt-dlp(基于 youtube-dl)的在线视频下载工具,也继承了 1200+ 在线视频网站的解析支持,拥有简洁的图形界面,即开即用。甚至还支持 M3U8、BT 种子和磁力链接,...
admin的头像-零度博客admin
1.7W+2251