GPT-SoVITS Docker Compose 设置

介绍

GPT-SoVITS是一个开源的声音克隆项目,结合了GPT (Generative Pre-trained Transformer) 模型和SoVITS (Speech-to-Video Voice Transformation System) 变声器技术。利用少量样本数据即可实现高质量的语音克隆和文本到语音转换(TTS)。适用于快速生成特定人声,帮助用户训练模型模仿目标说话人的声音、情感、音色和语速,即使缺乏目标说话人的语音样本。这一工具在需要个性化语音生成的场景下具有显著优势。

Docker Compose文件

version: '3.8'

services:
  gpt-sovits:
    image: breakstring/gpt-sovits:latest
    container_name: gpt-sovits-container
    runtime: nvidia
    network_mode: host
    environment:
      - is_half=False
      - is_share=False
    volumes:
      - /volume1/docker/gpt_sovits/output:/workspace/output
      - /volume1/docker/gpt_sovits/logs:/workspace/logs
      - /volume1/docker/gpt_sovits/SoVITS_weights:/workspace/SoVITS_weights
      - /volume1/docker/gpt_sovits/reference:/workspace/reference
    working_dir: /workspace
    ports:
      - "9880:9880"
      - "9871:9871"
      - "9872:9872"
      - "9873:9873"
      - "9874:9874"
    shm_size: 16G
    deploy:
      resources:
        reservations:
          devices:
          - driver: nvidia
            count: "all"
            capabilities: [gpu]
    stdin_open: true
    tty: true
    restart: unless-stopped

各界面端口

  • 9874: 默认界面地址

  • 9873: 人声分离去混响

  • 9872: TTS推理

  • 9871: 语音转文本校对工具

  • 检查正确的文件映射地址以访问界面(例如output/asr_opt/slicer_opt.list

结论

通过按照上述步骤操作,您可以轻松使用Docker Compose设置GPT-SoVITS。确保文件路径正确映射以访问指定端口上的各个界面。可以根据您的具体需求自定义配置。