Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

图片[1]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

AI 圈又有大新闻啦!Stability AI 又悄悄放出一个大招,这次不再是画图,而是音乐生成!而且还是开源的!

这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

点击前往

 

图片[2]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

 

2.本地一键安装包:点击下载】,适合新手,低配的电脑也能运行,但是效果没有第3种好!
图片[3]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

3.手动安装

首先,将存储库克隆到本地机器:

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows :

python -m venv venv
venv\Scripts\activate

macOS 和 Linux:

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py

pip install stable-audio-tools
pip install .

 

Windows 用户的额外步骤

 

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新安装torch、,torchvisiontorchaudio使用正确的 CUDA 版本:

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

 

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):

{
    "model_directory": "models",
    "output_directory": "generations"
}

使用方法

 

🎚️ 运行 Gradio 界面

 

使用批处理文件或直接从命令行启动 Gradio 界面:

  • 批处理文件示例:

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行:

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

🎶 生成音频和 MIDI

 

Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json

该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。

 

THE END
喜欢就支持一下吧
点赞2176 分享
一键删除 Windows 自带的臃肿软件!只需这行代码,让你的电脑更高效运行!| 零度解说-零度博客
免激活 Windows 11 企业版虚拟机镜像 - 微软官方提供 (适用于 VMware/VirtualBox 测试环境)-零度博客

免激活 Windows 11 企业版虚拟机镜像 – 微软官方提供 (适用于 VMware/VirtualBox 测试环境)

Microsoft 为开发者们提供了一款名为'Windows 11 Development Environment'(WDE)的虚拟机映像。这个映像可以免费且免激活使用 这个虚拟机映像适用于主流虚拟机软件,包括 VMware、Hyper-V(Gen2)...
完全免费的 PDF 工具箱:PDF24,免费开源的神器!-零度博客

完全免费的 PDF 工具箱:PDF24,免费开源的神器!

  一个非常好用的 PDF 处理工具,共 27 个工具,完全免费、无广告,没有任何套路,而且支持离线使用。   官方下载:【点击前往】 网盘下载:【点击前往】   扩展工具集 PDF24为...
admin的头像-零度博客admin
2.4W+3254
ChatTTS 最强文本转语音!一键本地安装,100%成功!效果逼真如真人,完全免费开源!!| 零度解说-零度博客

ChatTTS 最强文本转语音!一键本地安装,100%成功!效果逼真如真人,完全免费开源!!| 零度解说

https://youtu.be/aUcFDNyMuVc ============= ChatTTS 一键安装包下载:https://www.freedidi.com/12621.html
全球排名前五的VPN ,上网必备的最佳软件 2020  | 零度解说-零度博客

全球排名前五的VPN ,上网必备的最佳软件 2020 | 零度解说

全球排名前五的VPN ,上网必备的最佳软件 2020 | 零度解说   1,ExpressVPN   —点击进入【7.5折优惠】   2,PureVPN — 点击进入 【6折优惠】   3,Surafshak — 点击进入...
微软 Win 11 Edge 弹窗警告,阻止用户下载 Chrome 浏览器,默认浏览器该如何设置? | 零度解说-零度博客
Windows 11 玩转安卓App,任意的APK程序都可安装!保姆级教程 | 零度解说-零度博客
速度惊人!优选CF反代ip,让垃圾VPS线路快到起飞!完全免费堪比Pro | 零度解说-零度博客

速度惊人!优选CF反代ip,让垃圾VPS线路快到起飞!完全免费堪比Pro | 零度解说

https://youtu.be/oDEwjelBT7I   1.CF反代ip的优选工具:https://www.freedidi.com/8349.html 2.Cloudflare 反代 ip 设置代码: https://www.freedidi.com/99.html
admin的头像-零度博客admin
01.3W+6539
使用 Adob​​e 的免费 AI 工具让嘈杂的录音听起来像专业音频-零度博客

使用 Adob​​e 的免费 AI 工具让嘈杂的录音听起来像专业音频

最近,Adobe 发布了一款免费的 AI 驱动的音频处理工具,可以通过消除背景噪音并使声音听起来更强劲来增强一些质量较差的录音。当它工作时,结果听起来就像是在专业的录音棚里用高质量麦克风录制...
admin的头像-零度博客admin
01.7W+1092