Edge-tts库 命令行工具有哪些常用参数?
2025-08-01 14:17:09 358 分享链接 开发笔记 python
edge-tts 是微软推出的命令行文本转语音工具,基于 Edge 浏览器的语音合成引擎,支持多种语音、语速、语调调整,并能生成音频和字幕文件。以下是其常用参数说明:
edge-tts --file script.txt --voice zh-CN-XiaoxiaoNeural --words-in-cue 10 --write-media output.mp3 --write-subtitles output.vtt
edge-tts --text "闻星落,举目四望,此地原是下游平原。" --voice zh-CN-XiaoxiaoNeural --words-in-cue 10 --write-media output.mp3 --write-subtitles output.vtt核心参数
--text <文本内容>
指定需要转换为语音的文本。例如:--text "Hello, this is a test."
若文本较长,建议用引号包裹,支持中英文等多语言。--voice <语音ID>
指定语音合成使用的声音(音色、语言、性别)。- 示例:
--voice zh-CN-XiaoxiaoNeural(中文女声“晓晓”)、--voice en-US-AriaNeural(英文女声“Aria”)。 - 可通过
edge-tts --list-voices查看所有可用语音ID。
- 示例:
--rate <语速>
控制语音速度,默认值为0%。- 格式:支持百分比(
+20%加快20%)或绝对值(-10%减慢10%)。 - 范围通常为
-100%到+100%。
- 格式:支持百分比(
--pitch <语调>
调整语音的音调高低,默认值为0%。- 格式同语速:
+10%升高音调,-5%降低音调。
- 格式同语速:
输出控制参数
--write-media <文件路径>
将生成的语音保存为音频文件(通常为 MP3 格式)。
示例:--write-media output.mp3。--write-subtitles <文件路径>
生成字幕文件(WebVTT 格式,.vtt),包含文本片段及对应时间戳(用于同步显示)。
示例:--write-subtitles output.vtt。--volume <音量>
调整输出音频的音量,默认值为100%。- 格式:
50%表示音量减半,150%表示音量增加50%。
- 格式:
其他实用参数
--list-voices
列出所有可用的语音ID及其对应的语言、性别等信息。
用法:直接运行edge-tts --list-voices。--proxy <代理地址>
若需通过代理网络访问服务,可指定代理(如 HTTP 或 SOCKS 代理)。
示例:--proxy http://127.0.0.1:7890。--help
查看所有参数的详细说明。
用法:edge-tts --help。
示例命令
# 生成中文语音,保存音频和字幕
edge-tts --text "你好,这是 Edge TTS 的演示。" \
--voice zh-CN-YunxiNeural \
--rate +5% \
--pitch -2% \
--write-media output.mp3 \
--write-subtitles output.vtt通过这些参数,可灵活控制语音合成的效果,满足不同场景(如视频配音、语音播报)的需求。

上一篇:豆包连环画生成提示(优化版)
最近更新
- 2026-06-11 00:22
- 通过豆包完美复刻任意图片只需要两步
- 2026-06-10 17:55
- 在人物主体提示词中如何优化穿搭细节的描述?
- 2026-06-10 17:46
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.6
- 2026-06-10 17:19
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.5
- 2026-06-10 17:08
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.4
- 2026-06-10 17:01
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.3
- 2026-06-10 16:18
- 镜头焦段是什么?是不是就是平常说的远景,近景,全景?
- 2026-06-10 16:12
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.2
- 2026-06-10 16:05
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.1
- 2026-06-10 15:57
- 通过豆包生成10种不同风格的AI女装模特绘画提示词 v1.0