Kokoro-FastAPI/docker-compose.cpu.yml

services:
  model-fetcher:
    image: datamachines/git-lfs:latest
    volumes:
      - ./Kokoro-82M:/app/Kokoro-82M
    working_dir: /app/Kokoro-82M
    command: >
      sh -c "
        rm -f .git/index.lock;
        if [ -z \"$(ls -A .)\" ]; then
          git clone https://huggingface.co/hexgrad/Kokoro-82M .
          touch .cloned;
        else
          rm -f .git/index.lock && \
          git checkout main && \
          git pull origin main && \
          touch .cloned;
        fi;
        tail -f /dev/null
      "
    healthcheck:
      test: ["CMD", "test", "-f", ".cloned"]
      interval: 5s
      timeout: 2s
      retries: 300
      start_period: 1s

  kokoro-tts:
    build:
      context: .
      dockerfile: Dockerfile.cpu
    volumes:
      - ./api/src:/app/api/src
      - ./Kokoro-82M:/app/Kokoro-82M
    ports:
      - "8880:8880"
    environment:
      - PYTHONPATH=/app:/app/Kokoro-82M
      # ONNX Optimization Settings for vectorized operations
      - ONNX_NUM_THREADS=8  # Maximize core usage for vectorized ops
      - ONNX_INTER_OP_THREADS=4  # Higher inter-op for parallel matrix operations
      - ONNX_EXECUTION_MODE=parallel
      - ONNX_OPTIMIZATION_LEVEL=all
      - ONNX_MEMORY_PATTERN=true
      - ONNX_ARENA_EXTEND_STRATEGY=kNextPowerOfTwo
      
    depends_on:
      model-fetcher:
        condition: service_healthy

  # Gradio UI service [Comment out everything below if you don't need it]
  gradio-ui:
    build:
      context: ./ui
    ports:
      - "7860:7860"
    volumes:
      - ./ui/data:/app/ui/data
      - ./ui/app.py:/app/app.py  # Mount app.py for hot reload
    environment:
      - GRADIO_WATCH=True  # Enable hot reloading
Add preliminary Docker support for CPU deployment 2024-12-31 04:51:21 -07:00			`services:`
			`model-fetcher:`
			`image: datamachines/git-lfs:latest`
			`volumes:`
			`- ./Kokoro-82M:/app/Kokoro-82M`
			`working_dir: /app/Kokoro-82M`
			`command: >`
			`sh -c "`
-Removed commit lock on HF repo -Warm start added to model initialization -Layer caching tweaks to dockerfile 2025-01-01 17:38:22 -07:00			`rm -f .git/index.lock;`
Add preliminary Docker support for CPU deployment 2024-12-31 04:51:21 -07:00			`if [ -z \"$(ls -A .)\" ]; then`
fix: longer timeouts, fix on hf model pull 2025-01-02 01:59:25 -07:00			`git clone https://huggingface.co/hexgrad/Kokoro-82M .`
Add preliminary Docker support for CPU deployment 2024-12-31 04:51:21 -07:00			`touch .cloned;`
			`else`
-Removed commit lock on HF repo -Warm start added to model initialization -Layer caching tweaks to dockerfile 2025-01-01 17:38:22 -07:00			`rm -f .git/index.lock && \`
			`git checkout main && \`
			`git pull origin main && \`
Add preliminary Docker support for CPU deployment 2024-12-31 04:51:21 -07:00			`touch .cloned;`
			`fi;`
			`tail -f /dev/null`
			`"`
			`healthcheck:`
			`test: ["CMD", "test", "-f", ".cloned"]`
fix: longer timeouts, fix on hf model pull 2025-01-02 01:59:25 -07:00			`interval: 5s`
			`timeout: 2s`
			`retries: 300`
Add preliminary Docker support for CPU deployment 2024-12-31 04:51:21 -07:00			`start_period: 1s`

			`kokoro-tts:`
			`build:`
			`context: .`
			`dockerfile: Dockerfile.cpu`
			`volumes:`
			`- ./api/src:/app/api/src`
			`- ./Kokoro-82M:/app/Kokoro-82M`
			`ports:`
			`- "8880:8880"`
			`environment:`
			`- PYTHONPATH=/app:/app/Kokoro-82M`
Enhance ONNX optimization settings and add validation script for TTS audio files 2025-01-04 02:14:46 -07:00			`# ONNX Optimization Settings for vectorized operations`
			`- ONNX_NUM_THREADS=8 # Maximize core usage for vectorized ops`
			`- ONNX_INTER_OP_THREADS=4 # Higher inter-op for parallel matrix operations`
			`- ONNX_EXECUTION_MODE=parallel`
			`- ONNX_OPTIMIZATION_LEVEL=all`
			`- ONNX_MEMORY_PATTERN=true`
			`- ONNX_ARENA_EXTEND_STRATEGY=kNextPowerOfTwo`
-update soundfile version -alignment with streaming standards -audio processing config settings -more comprehensive model warmup -minor model improvements -enhancing testing, benchmarking -cool ascii logo 2025-01-06 03:32:41 -07:00
Add preliminary Docker support for CPU deployment 2024-12-31 04:51:21 -07:00			`depends_on:`
			`model-fetcher:`
			`condition: service_healthy`
fix: longer timeouts, fix on hf model pull 2025-01-02 01:59:25 -07:00
Allow ONNX support optimizations for CPU inference and update benchmarking scripts; modify README for clarity on performance metrics 2025-01-04 02:46:27 -07:00			`# Gradio UI service [Comment out everything below if you don't need it]`
			`gradio-ui:`
			`build:`
			`context: ./ui`
			`ports:`
			`- "7860:7860"`
			`volumes:`
			`- ./ui/data:/app/ui/data`
			`- ./ui/app.py:/app/app.py # Mount app.py for hot reload`
			`environment:`
			`- GRADIO_WATCH=True # Enable hot reloading`