Edge-tts库 命令行工具有哪些常用参数?

2025-08-01 14:17:09 20 分享链接 开发笔记 python

edge-tts 是微软推出的命令行文本转语音工具,基于 Edge 浏览器的语音合成引擎,支持多种语音、语速、语调调整,并能生成音频和字幕文件。以下是其常用参数说明:

edge-tts --file script.txt --voice zh-CN-XiaoxiaoNeural --words-in-cue 10 --write-media output.mp3 --write-subtitles output.vtt

edge-tts --text "闻星落,举目四望,此地原是下游平原。" --voice zh-CN-XiaoxiaoNeural --words-in-cue 10 --write-media output.mp3 --write-subtitles output.vtt

核心参数

  1. --text <文本内容>
    指定需要转换为语音的文本。例如:
    --text "Hello, this is a test."
    若文本较长,建议用引号包裹,支持中英文等多语言。
  2. --voice <语音ID>
    指定语音合成使用的声音(音色、语言、性别)。

    • 示例:--voice zh-CN-XiaoxiaoNeural(中文女声“晓晓”)、--voice en-US-AriaNeural(英文女声“Aria”)。
    • 可通过 edge-tts --list-voices 查看所有可用语音ID。
  3. --rate <语速>
    控制语音速度,默认值为 0%

    • 格式:支持百分比(+20% 加快20%)或绝对值(-10% 减慢10%)。
    • 范围通常为 -100%+100%
  4. --pitch <语调>
    调整语音的音调高低,默认值为 0%

    • 格式同语速:+10% 升高音调,-5% 降低音调。

输出控制参数

  1. --write-media <文件路径>
    将生成的语音保存为音频文件(通常为 MP3 格式)。
    示例:--write-media output.mp3
  2. --write-subtitles <文件路径>
    生成字幕文件(WebVTT 格式,.vtt),包含文本片段及对应时间戳(用于同步显示)。
    示例:--write-subtitles output.vtt
  3. --volume <音量>
    调整输出音频的音量,默认值为 100%

    • 格式:50% 表示音量减半,150% 表示音量增加50%。

其他实用参数

  1. --list-voices
    列出所有可用的语音ID及其对应的语言、性别等信息。
    用法:直接运行 edge-tts --list-voices
  2. --proxy <代理地址>
    若需通过代理网络访问服务,可指定代理(如 HTTP 或 SOCKS 代理)。
    示例:--proxy http://127.0.0.1:7890
  3. --help
    查看所有参数的详细说明。
    用法:edge-tts --help

示例命令

# 生成中文语音,保存音频和字幕
edge-tts --text "你好,这是 Edge TTS 的演示。" \
         --voice zh-CN-YunxiNeural \
         --rate +5% \
         --pitch -2% \
         --write-media output.mp3 \
         --write-subtitles output.vtt

通过这些参数,可灵活控制语音合成的效果,满足不同场景(如视频配音、语音播报)的需求。

Edge-tts库 命令行工具有哪些常用参数?