Edge-tts库 命令行工具有哪些常用参数?
2025-08-01 14:17:09 298 分享链接 开发笔记 python
edge-tts 是微软推出的命令行文本转语音工具,基于 Edge 浏览器的语音合成引擎,支持多种语音、语速、语调调整,并能生成音频和字幕文件。以下是其常用参数说明:
edge-tts --file script.txt --voice zh-CN-XiaoxiaoNeural --words-in-cue 10 --write-media output.mp3 --write-subtitles output.vtt
edge-tts --text "闻星落,举目四望,此地原是下游平原。" --voice zh-CN-XiaoxiaoNeural --words-in-cue 10 --write-media output.mp3 --write-subtitles output.vtt核心参数
--text <文本内容>
指定需要转换为语音的文本。例如:--text "Hello, this is a test."
若文本较长,建议用引号包裹,支持中英文等多语言。--voice <语音ID>
指定语音合成使用的声音(音色、语言、性别)。- 示例:
--voice zh-CN-XiaoxiaoNeural(中文女声“晓晓”)、--voice en-US-AriaNeural(英文女声“Aria”)。 - 可通过
edge-tts --list-voices查看所有可用语音ID。
- 示例:
--rate <语速>
控制语音速度,默认值为0%。- 格式:支持百分比(
+20%加快20%)或绝对值(-10%减慢10%)。 - 范围通常为
-100%到+100%。
- 格式:支持百分比(
--pitch <语调>
调整语音的音调高低,默认值为0%。- 格式同语速:
+10%升高音调,-5%降低音调。
- 格式同语速:
输出控制参数
--write-media <文件路径>
将生成的语音保存为音频文件(通常为 MP3 格式)。
示例:--write-media output.mp3。--write-subtitles <文件路径>
生成字幕文件(WebVTT 格式,.vtt),包含文本片段及对应时间戳(用于同步显示)。
示例:--write-subtitles output.vtt。--volume <音量>
调整输出音频的音量,默认值为100%。- 格式:
50%表示音量减半,150%表示音量增加50%。
- 格式:
其他实用参数
--list-voices
列出所有可用的语音ID及其对应的语言、性别等信息。
用法:直接运行edge-tts --list-voices。--proxy <代理地址>
若需通过代理网络访问服务,可指定代理(如 HTTP 或 SOCKS 代理)。
示例:--proxy http://127.0.0.1:7890。--help
查看所有参数的详细说明。
用法:edge-tts --help。
示例命令
# 生成中文语音,保存音频和字幕
edge-tts --text "你好,这是 Edge TTS 的演示。" \
--voice zh-CN-YunxiNeural \
--rate +5% \
--pitch -2% \
--write-media output.mp3 \
--write-subtitles output.vtt通过这些参数,可灵活控制语音合成的效果,满足不同场景(如视频配音、语音播报)的需求。

上一篇:豆包连环画生成提示(优化版)
最近更新
- 2026-04-07 12:44
- 字幕文件解析并转换时间单位为微秒,输出指定格式的时间线数据
- 2026-04-07 11:30
- 通过扣子官方语音合成开发的速推版剪映小助手时间线插件
- 2026-04-07 07:51
- 基于故事文本与新国风水墨武侠动漫风格设计唐朝人物形象提示词
- 2026-04-01 02:38
- 推荐7种古装武侠AI漫剧适配度极高的风格
- 2026-04-01 02:23
- AI漫剧新国风武侠动漫风格常搭的全局基础色调
- 2026-03-30 13:59
- 基于故事文本与国风动漫风格对所有角色进行详细定义的实例
- 2026-03-30 13:16
- 【国风武侠动漫视觉形象】常用五官长相描述
- 2026-03-25 16:58
- 学习 豆包AI 提取小说故事中的所有角色描述
- 2026-03-25 15:46
- 学习 豆包AI 影视分镜标准画面描述规则
- 2026-03-25 15:42
- 学习 豆包AI 短视频分镜脚本之画面元素编写规则