AI 批量工作台
RunningHub 视频
ElevenLabs 音色
MiniMax TTS
视频除噪
图片元数据
即梦下载
RunningHub API Key(每次使用手动输入)
公共 Webhook 回调地址(可选)
-
刷新状态
audio_scale
实例类型
default
plus
个人队列
否
是
UseWebhook
开启
关闭
workflowId
AI嘴型 (2016086037126189058)
Infinitetalk稳定版 (AI-App 2006270540499128322)
AI高清 (2025196503635075073)
视频除噪处理
开启(默认)
关闭
AI-App 最长边
AI-App 提示词
提示:该工作流在 1440 分辨率下运行时长≈音频时长,建议音频 ≤55 秒。
成本提示:稳定版 AI-App 默认建议使用 plus(48G),可显著降低显存不足失败概率,但 RH 币消耗更高。
长音频自动切段
关闭
开启
窗口(秒)
重叠(秒)
并发
重试
自动拼接
开启
关闭
窗口24 + 重叠1 => 0-24,23-47,46-70...
AI嘴型 分段提示词(可选,多行:每行对应一段;每个 24 秒任务从第 1 行重新开始,相当于 6 行循环)
提示:不要留空行;空行也会占一段导致错位。行数少于段数时,后续段的动作控制会变弱。
新增一组任务
提交批量任务
任务列表
每 5 秒自动刷新,可手动点「刷新状态」。
类型筛选
全部
AI嘴型
稳定版AI-App
AI高清
长音频切段/合并
只看可下载成片
隐藏长音频切段/合并任务
管理员 Token
ElevenLabs API Key(每次使用手动输入)
预置音色库(固定)
自定义音色 ID(每行一个)
模型
输出格式
mp3_44100_128
mp3_44100_192
opus_48000_96
pcm_44100
超时(秒)
重试
上传音频(可多选)
选项
去背景噪音
使用 stream 接口
按音频勾选目标音色(每个音频可选1个或多个)
提交批量音色转换
刷新音色任务
音色转换任务
每 5 秒自动刷新。成功后可下载 ZIP。
MiniMax API Key(每次使用手动输入)
支持一行输入:
api_key|group_id
(或
api_key|group_id
),提交时会自动拆分。
Group ID(group_id)
常用音色(预置下拉)
音色 ID(voice_id,可手动输入)
加入常用
模型
语速
情绪
auto
calm
happy
sad
surprised
语言增强(language_boost)
auto
Chinese
English
声道(channel)
1
2(默认)
发音字典(每行一个:原词/读法,例如 Omg/Oh my god,可选)
文本(用
---
分段:每段生成一条音频;段内可换行)
快捷插入
分段符使用单独一行:
---
。段头情绪:
[emotion=happy]
(只影响本段)。叹气/笑声等写在文本里:
(sighs)
(laughs)
…(仅部分模型支持)。
插入 --- 分段
插入段头情绪
插入 (sighs)
插入 (laughs)
插入 (coughs)
插入 (clears_throat)
插入 (breathes)
提交 TTS 批量生成
刷新 TTS 任务
TTS 任务
生成完成后在统一任务列表中显示为「MiniMax·TTS」标签,也可在这里查看 job 概览。
视频除噪(独立)
支持点击选择、批量勾选、拖拽上传多个视频。输出仅生成后处理后的 MOV。
预设
light_clean(推荐)
light
medium
heavy
none(只清痕迹)
上传视频(可多选)
将视频文件拖拽到这里(也可使用上方选择器)
提交批量除噪
清空已选
失败后可在统一任务列表里点击对应任务右侧下载/或稍后点“重试”(如果我加到任务列表操作列)。
除噪任务(独立)
刷新除噪任务
这里可直接下载除噪结果,不用切回统一任务列表。
说明:即梦下载会把任务与文件写入服务端挂载的数据盘,并按 3 天保留自动清理。若服务端开启了鉴权,请在页面内输入管理员 Token。
任务
图片文件
预置人像(可选)
不使用
未上传图片时可用预置人像替代
音频文件
视频文件
audio_scale
输出后缀(可选)
删除