最新超长AI视频模型!一句话即可生成120秒视频,免费开源!

图片[1]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

  1. 生成时长达2分钟(1200帧),超越以往模型
  2. 视频质量优秀
  3. 与业内其他主流模型实现无缝衔接
  4. 开源免费,便于开发者使用和二次开发

图片[2]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

 

免费在线试玩:【点击进入】 目测在线人太多需要排队

自己本地搭建教程:

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载:网盘下载

3.安装必备的环境:

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

 

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

 

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

 

ModelscopeT2V作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 40秒 165秒
56帧 75秒 360秒
80帧 110秒 525秒
240帧 340秒 1610 秒(约 27 分钟)
600帧 860秒 5128 秒(约 85 分钟)
1200帧 1710 秒(约 28 分钟) 10225 秒(约 170 分钟)
AnimateDiff作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 50秒 180秒
56帧 85秒 370秒
80帧 120秒 535秒
240帧 350秒 1620 秒(约 27 分钟)
600帧 870秒 5138 秒(~85 分钟)
1200帧 1720 秒(约 28 分钟) 10235 秒(约 170 分钟)
SVD作为基本模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 80秒 210秒
56帧 115秒 400秒
80帧 150秒 565秒
240帧 380秒 1650 秒(约 27 分钟)
600帧 900秒 5168 秒(~86 分钟)
1200帧 1750 秒(约 29 分钟) 10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时,采用随机混合。对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用:【点击前往】 支持多模型自由切换!

THE END
喜欢就支持一下吧
点赞2177 分享
O&O Defrag Pro 磁盘碎片整理,强大的SSD优化算法!-零度博客

O&O Defrag Pro 磁盘碎片整理,强大的SSD优化算法!

O&O Defrag Pro 是一款磁盘碎片整理工具。通过强大的SSD优化算法,智能整理磁盘碎片,极大的提高电脑的性能,可同时整理多个磁盘,也可设定时间自动整理硬盘。 我们在使用硬盘的过程中,不...
admin的头像-零度博客admin
1.3W+1527
Windows 11 (24H2) 新版仍存痛点:VBS功能启用后仍影响系统性能-零度博客

Windows 11 (24H2) 新版仍存痛点:VBS功能启用后仍影响系统性能

在推出 Windows 11 时,微软特别强调了该系统的安全性提升,不仅要求设备必须具备可信平台模块(TPM)和安全启动,还关注内存安全问题。 为此,微软引入了内存完整性检查或基于虚拟机管理程序的...
admin的头像-零度博客admin
2.1W+3251
AHA Music 听歌识曲!识别浏览器中所播放的歌曲-零度博客

AHA Music 听歌识曲!识别浏览器中所播放的歌曲

识别浏览器中所播放的歌曲 这首歌是什么?AHA Music告诉你! 这是什么歌?你在网上浏览时可能总是有这个问题。 以令人难以置信的准确性识别歌曲,并提供你需要的所有信息,以便再次找到这首歌。 ...
admin的头像-零度博客admin
2.1W+2177
Hive OS 优惠码:code10  免费注册账户即可获得10美金!-零度博客

Hive OS 优惠码:code10 免费注册账户即可获得10美金!

  Hive OS 优惠码:code10 (注册免费赠送10美金)   HiveOS是基于Linux的挖矿专用系统,稳定性、群控、远程控制都优于windows,你可以使用一个U盘作为操作系统代替一块nvme硬盘使用...
admin的头像-零度博客admin
1.6W+2251
重大更新!Windows 11(太阳谷)22H2大版本,你准备升级吗?附最新绕过硬件限制的方法!| 零度解说-零度博客
精品网站推荐!这7个都不常见!但确实好玩、神奇又实用!!2023 | 零度解说-零度博客
DeepSeek:美国科技巨头为何冒险接入?高级玩法、本地部署全解析!| 零度解说-零度博客

DeepSeek:美国科技巨头为何冒险接入?高级玩法、本地部署全解析!| 零度解说

https://youtu.be/0e7pb_AwgK4   DeepSeek本地部署工具下载:https://www.freedidi.com/11195.html
回答大家感兴趣的:AI、软件推荐、视频去码、网络安全、语音识别、暗网、Google 搜索技巧等.... | 零度解说-零度博客

回答大家感兴趣的:AI、软件推荐、视频去码、网络安全、语音识别、暗网、Google 搜索技巧等…. | 零度解说

https://youtu.be/KqrS8JApeXg   MuseV 虚拟数字人视频生成AI工具,一键整合包:https://www.freedidi.com/12271.html Llama3 大模型本地部署:https://www.freedidi.com/12189.html Strea...
【甲骨文】云服务器免费注册地址大全!-零度博客

【甲骨文】云服务器免费注册地址大全!

不同地区注册甲骨文云服务器的页面链接是不一样的,具体注册链接如下:大陆:【链接直达】台湾:【链接直达】美国:【链接直达】澳洲:【链接直达】日本: 【链接直达】韩国: 【链接直达】更多...
admin的头像-零度博客admin
14.9W+3831