最新超长AI视频模型！一句话即可生成120秒视频，免费开源！

10月11日 22:47更新

2.5W+2177

近日，由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

生成时长达2分钟(1200帧),超越以往模型
视频质量优秀
与业内其他主流模型实现无缝衔接
开源免费,便于开发者使用和二次开发

免费在线试玩：【点击进入】目测在线人太多需要排队

自己本地搭建教程：

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境【Python 3.10 】、【Cuda 下载】

2.克隆开源项目至本地：

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载：【网盘下载】

3.安装必备的环境：

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.（可选）如果您的系统上缺少 FFmpeg，请安装 FFmpeg

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型，请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

ModelscopeT2V作为基础模型

帧数	更快预览的推理时间 (256×256)	最终结果的推理时间 (720×720)
24帧	40秒	165秒
56帧	75秒	360秒
80帧	110秒	525秒
240帧	340秒	1610 秒（约 27 分钟）
600帧	860秒	5128 秒（约 85 分钟）
1200帧	1710 秒（约 28 分钟）	10225 秒（约 170 分钟）

AnimateDiff作为基础模型

帧数	更快预览的推理时间 (256×256)	最终结果的推理时间 (720×720)
24帧	50秒	180秒
56帧	85秒	370秒
80帧	120秒	535秒
240帧	350秒	1620 秒（约 27 分钟）
600帧	870秒	5138 秒（~85 分钟）
1200帧	1720 秒（约 28 分钟）	10235 秒（约 170 分钟）

SVD作为基本模型

帧数	更快预览的推理时间 (256×256)	最终结果的推理时间 (720×720)
24帧	80秒	210秒
56帧	115秒	400秒
80帧	150秒	565秒
240帧	380秒	1650 秒（约 27 分钟）
600帧	900秒	5168 秒（~86 分钟）
1200帧	1750 秒（约 29 分钟）	10265 秒（~171 分钟）

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时，采用随机混合。对于随机混合，chunk_size和的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用：【点击前往】支持多模型自由切换！

THE END

AI 免费资源

喜欢就支持一下吧

O&O Defrag Pro 磁盘碎片整理，强大的SSD优化算法！

O&O Defrag Pro 是一款磁盘碎片整理工具。通过强大的SSD优化算法，智能整理磁盘碎片，极大的提高电脑的性能，可同时整理多个磁盘，也可设定时间自动整理硬盘。我们在使用硬盘的过程中，不...

免费资源

admin

1.3W+1527

Windows 11 (24H2) 新版仍存痛点：VBS功能启用后仍影响系统性能

在推出 Windows 11 时，微软特别强调了该系统的安全性提升，不仅要求设备必须具备可信平台模块（TPM）和安全启动，还关注内存安全问题。为此，微软引入了内存完整性检查或基于虚拟机管理程序的...

Windows 11

admin

2.1W+3251

AHA Music 听歌识曲！识别浏览器中所播放的歌曲

识别浏览器中所播放的歌曲这首歌是什么？AHA Music告诉你! 这是什么歌？你在网上浏览时可能总是有这个问题。以令人难以置信的准确性识别歌曲，并提供你需要的所有信息，以便再次找到这首歌。 ...

免费资源

admin

2.1W+2177

Hive OS 优惠码：code10 免费注册账户即可获得10美金！

Hive OS 优惠码：code10 （注册免费赠送10美金） HiveOS是基于Linux的挖矿专用系统，稳定性、群控、远程控制都优于windows，你可以使用一个U盘作为操作系统代替一块nvme硬盘使用...

数码科技

admin

1.6W+2251

重大更新！Windows 11（太阳谷）22H2大版本，你准备升级吗？附最新绕过硬件限制的方法！| 零度解说

https://youtu.be/EeK9AgqtDks

Windows 11 Youtube视频

admin

1.6W+2250

精品网站推荐！这7个都不常见！但确实好玩、神奇又实用！！2023 | 零度解说

https://youtu.be/QCl7rIvo6ME

免费资源

admin

1.7W+1682

DeepSeek：美国科技巨头为何冒险接入？高级玩法、本地部署全解析！| 零度解说

https://youtu.be/0e7pb_AwgK4 DeepSeek本地部署工具下载：https://www.freedidi.com/11195.html

AI DEEPSEEK Youtube视频

admin

14.8W+1675

回答大家感兴趣的：AI、软件推荐、视频去码、网络安全、语音识别、暗网、Google 搜索技巧等…. | 零度解说

https://youtu.be/KqrS8JApeXg MuseV 虚拟数字人视频生成AI工具，一键整合包：https://www.freedidi.com/12271.html Llama3 大模型本地部署：https://www.freedidi.com/12189.html Strea...

Youtube视频免费资源

admin

1.4W+1529

【甲骨文】云服务器免费注册地址大全！

不同地区注册甲骨文云服务器的页面链接是不一样的，具体注册链接如下：大陆：【链接直达】台湾：【链接直达】美国：【链接直达】澳洲：【链接直达】日本：【链接直达】韩国：【链接直达】更多...

免费资源

admin

14.9W+3831

最新超长AI视频模型！一句话即可生成120秒视频，免费开源！

推理时间

ModelscopeT2V作为基础模型

AnimateDiff作为基础模型

SVD作为基本模型

电脑无法安装 Windows 11 的解决方法！升级前务必开启这2个功能 | 零度解说

如何在 Mac 上安装 Windows 11 系统？这个方法完全免费又简单好用！

Lindows OS：抄袭 XP系统？25年后竟然还能安装运行！极其流畅 | 零度解说

RIME 小狼毫输入法！繁体用户非常值得推荐的输入法

批量获取免费的VPN节点，用不完真用不完….. BPB-Worker-Panel 面板BUG利用！！

Windows 11 隐藏了那些功能？微软下一代新系统不为人知的东西！| 零度解说

从 Windows 10 中的回收站恢复文件的 4 种方法

100% 由 AI 生成的《红楼梦》视频，1 分钟看完四大名著之一！

O&O Defrag Pro 磁盘碎片整理，强大的SSD优化算法！

Windows 11 (24H2) 新版仍存痛点：VBS功能启用后仍影响系统性能

AHA Music 听歌识曲！识别浏览器中所播放的歌曲

Hive OS 优惠码：code10 免费注册账户即可获得10美金！

重大更新！Windows 11（太阳谷）22H2大版本，你准备升级吗？附最新绕过硬件限制的方法！| 零度解说

精品网站推荐！这7个都不常见！但确实好玩、神奇又实用！！2023 | 零度解说

DeepSeek：美国科技巨头为何冒险接入？高级玩法、本地部署全解析！| 零度解说

回答大家感兴趣的：AI、软件推荐、视频去码、网络安全、语音识别、暗网、Google 搜索技巧等…. | 零度解说

【甲骨文】云服务器免费注册地址大全！