# File: specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/docker-compose.yml
# Tesseract OCR Sidecar — รันบน Desk-5439 (AI Isolation Host) ตาม ADR-023A
# Change Log:
# - 2026-05-25: Initial compose file สำหรับ PaddleOCR HTTP sidecar
# - 2026-05-25: แก้ volumes ให้ถูกต้องสำหรับ Windows + Docker Desktop
# - 2026-05-30: เพิ่ม OCR_LANG=tha+eng (Tesseract Thai + English)
# - 2026-05-30: เพิ่ม Typhoon OCR environment variables (T009b, ADR-032)
#              OLLAMA_API_URL ชี้ไปที่ http://192.168.10.100:11434 (Admin Desktop LAN IP)
# - 2026-05-30: Revert volumes กลับไปใช้ Windows Z: drive bind mount (แทน CIFS volume driver ที่พัง)
# - 2026-06-01: ลบ volumes ออกทั้งหมด — backend ส่ง file content ผ่าน multipart /ocr-upload แทน
#              ไม่ต้องการ shared storage อีกต่อไป
# - 2026-06-01: เปลี่ยน TYPHOON_OCR_MODEL เป็น scb10x/typhoon-ocr1.5-3b
# - 2026-06-02: เพิ่ม ollama-metrics (NorskHelsenett) — Prometheus sidecar สำหรับ Ollama metrics
#              expose /metrics บน port 9924; Prometheus (ASUSTOR) scrape จาก 192.168.10.100:9924
#
# วิธีรัน:
#   docker compose up -d --build
#
# ทดสอบ:
#   curl http://192.168.10.100:8765/health
#   curl http://192.168.10.100:9924/metrics

name: lcbp3-ocr

services:
  ocr-sidecar:
    build:
      context: .
      dockerfile: Dockerfile
    container_name: ocr-sidecar
    restart: unless-stopped
    ports:
      - "8765:8765"
    environment:
      OCR_CHAR_THRESHOLD: "100"
      OCR_PORT: "8765"
      OCR_MAX_PAGES: "0"
      OCR_LANG: "tha+eng"  # Tesseract language code (Thai + English)
      USE_GPU: "false"  # OCR sidecar รันบน CPU, Typhoon OCR ใช้ Ollama แยก
      # ─── Typhoon OCR via Ollama (ADR-032) ───────────────────────────────────
      # ชี้ผ่าน ollama-metrics proxy (port 9924) แทน Ollama โดยตรง (port 11434)
      # เพื่อให้ NorskHelsenett sidecar collect metrics ได้
      OLLAMA_API_URL: "http://ollama-metrics:9924"
      TYPHOON_OCR_MODEL: "scb10x/typhoon-ocr1.5-3b"
      # Timeout 120 วินาที/หน้า (budget สำหรับ 3B model บน RTX 2060 Super)
      TYPHOON_OCR_TIMEOUT: "120"
    logging:
      driver: "json-file"
      options:
        max-size: "10m"
        max-file: "3"
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8765/health"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 60s

  # ----------------------------------------------------------------
  # ollama-metrics (NorskHelsenett) — Prometheus Sidecar สำหรับ Ollama
  # ----------------------------------------------------------------
  # Transparent proxy ที่นั่งระหว่าง client กับ Ollama (port 11434)
  # เก็บ metrics แล้ว expose ที่ /metrics บน port 9924 (Prometheus format)
  #
  # Metrics ที่ได้:
  #   ollama_prompt_tokens_total       — จำนวน prompt tokens ทั้งหมด
  #   ollama_generated_tokens_total    — จำนวน generated tokens ทั้งหมด
  #   ollama_request_duration_seconds  — ระยะเวลา request (histogram)
  #   ollama_time_per_token_seconds    — เวลาต่อ token (inference speed)
  #   ollama_loaded_models             — จำนวน model ที่โหลดอยู่ใน VRAM
  #   ollama_model_loaded              — indicator 1/0 ต่อ model
  #   ollama_model_ram_mb              — VRAM usage (MB) ต่อ model
  #
  # Prometheus (ASUSTOR 192.168.10.8) scrape จาก:
  #   http://192.168.10.100:9924/metrics
  ollama-metrics:
    image: ghcr.io/norskhelsenett/ollama-metrics:latest
    container_name: ollama-metrics
    restart: unless-stopped
    environment:
      # ชี้ไปที่ Ollama ที่รันบน Desk-5439 (host network หรือ LAN IP)
      # ถ้า Ollama รันบน host (ไม่ใช่ container) ให้ใช้ host.docker.internal
      OLLAMA_HOST: "http://host.docker.internal:11434"
      PORT: "9924"
    ports:
      - "9924:9924"
    extra_hosts:
      # Windows Docker Desktop: map host.docker.internal → host IP
      - "host.docker.internal:host-gateway"
    logging:
      driver: "json-file"
      options:
        max-size: "10m"
        max-file: "3"
    healthcheck:
      test: ["CMD", "wget", "--spider", "-q", "http://localhost:9924/metrics"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 15s