OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2669 分享
相关推荐
评论 抢沙发

请登录后发表评论

    暂无评论内容

真上天了!马斯克投资的飞行汽车试飞成功,Alef Model A/Z 售价低至 3.5 万美元 | 零度解说-零度博客
如何使用密钥登录您的 Google 帐户-零度博客

如何使用密钥登录您的 Google 帐户

密码一直是必不可少的罪恶,让您可以选择使用太简单的密码(这样您很容易记住它),或者使用晦涩到足以保证安全但又复杂到需要密码管理器的密码。   到目前为止,确保帐户安全的最佳方法是...
admin的头像-零度博客admin
1.3W+6539
Chrome OS Flex 是数百万无法运行 Windows 11 的 PC 的理想选择-零度博客

Chrome OS Flex 是数百万无法运行 Windows 11 的 PC 的理想选择

2025 年 10 月 14 日标志着对 Windows 10 家庭版和专业版的支持和安全更新的结束。这意味着对于不满足Windows 11 硬件要求的 Windows PC,官方保证的功能和安全更新也将结束。 从 2022 年初开始...
admin的头像-零度博客admin
01.6W+2252
微软深夜炸场!免费白嫖 GPT4、DALL·E3、GPTs!火力全开的 Copilot 预取代OpenAI,奥特曼被开除,宫斗为何?  | 零度解说-零度博客
Google Voice绑定环聊-零度博客

Google Voice绑定环聊

当然首先你需要有一个谷歌账号和一个Google Voice账号 准备工作 您需要: Google 帐号 Google Voice 帐号           在 (环聊)Hangouts 中启用来电响铃功能 如果您...
50 款全球知名的杀毒软件及其来源国家!-零度博客

50 款全球知名的杀毒软件及其来源国家!

  以下是50款全球知名的杀毒软件及其来源国家:卡巴斯基 (Kaspersky)国家:俄罗斯诺顿 (Norton)国家:美国迈克菲 (McAfee)国家:美国Bitdefender国家:罗马尼亚Avira国家:德国ESET NOD32国家...
admin的头像-零度博客admin
01.1W+3387
手把手教你制作属于自己的NFT!-零度博客

手把手教你制作属于自己的NFT!

1,以太坊钱包地址生成:https://chrome.google.com/webstore/detail/empty-title/nkbihfbeogaeaoehlefnkodbefgpgknn?utm_source=chrome-ntp-icon 2.Mintable:https://mintable.app   &nbs...
admin的头像-零度博客admin
01W+653
电脑中毒了怎么办?这几步操作很关键!| 零度解说-零度博客
MSRT- 微软官方的 Windows 恶意软件删除工具下载-零度博客

MSRT- 微软官方的 Windows 恶意软件删除工具下载

Windows 恶意软件删除工具 (MSRT) 有助于使 Windows 计算机远离流行的恶意软件。 MSRT 发现并删除威胁并逆转这些威胁所做的更改。MSRT 通常每月发布一次,作为 Windows 更新的一部分或作为可在...
admin的头像-零度博客admin
01.6W+2251