**分享一个开源语音克隆工具OmniVoice-Studio

5月17日发布

1290

分享一个开源语音克隆工具OmniVoice-Studio，可以本地运行

项目地址：https://github.com/debpalash/OmniVoice-Studio

它主要能做什么？
从目前项目说明和作者整理的信息看，OmniVoice Studio 的核心能力主要有这几类。
第一，语音克隆。
官方写的是：
3-second clip → mirror any voice
也就是给一小段语音，就可以克隆相似声音。
它还强调支持 646 种语言，对多语种内容创作者很有吸引力。
第二，视频配音。
它可以把视频或 YouTube 链接拿来处理：
• 先转录；
• 再翻译；
• 再重新配音；
• 最后导出视频。
如果你经常把英文资料改成中文内容，或者做跨语言视频素材，这个流程会很实用。
第三，实时听写。
项目里提到一个全局听写组件：
⌘+⇧+Space
在任意应用里呼出，语音转文字后自动粘贴。
这个功能很适合写作、做会议纪要、整理灵感，也适合不想一直打字的人。
第四，多 TTS 引擎。
它支持多种语音引擎切换，比如 OmniVoice、CosyVoice 3、MLX-Audio 等。
这意味着你可以根据设备、语言、声音效果去选择更合适的后端。

对普通创作者有什么用？
它最适合这几类场景：
1. 把英文视频资料转成中文配音；
2. 给课程、教程、产品介绍做旁白；
3. 给短视频批量生成不同语言版本；
4. 把口述内容变成文章初稿；
5. 做播客剪辑、配音和声音设计；
6. 在本地保存自己的声音素材库。
尤其是做内容的人，会经常遇到一个问题：
资料很多，但整理、翻译、配音、剪辑都很耗时间。
如果这些步骤能在本地跑起来，就可以形成一条更稳定的内容生产链路。

网站会员联系我加入微信社群，站长每晚稳定分享，点击查看介绍

资源分享

评分

欢迎为Ta评分