Files
lcbp3/specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/docker-compose.yml
T
admin 03963fd896
CI / CD Pipeline / build (push) Has been cancelled
CI / CD Pipeline / deploy (push) Has been cancelled
690604:1203 ADR-034-134 #07.2 [skip CI]
2026-06-04 12:03:54 +07:00

102 lines
5.1 KiB
YAML

# File: specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/docker-compose.yml
# Tesseract OCR Sidecar — รันบน Desk-5439 (AI Isolation Host) ตาม ADR-023A
# Change Log:
# - 2026-05-25: Initial compose file สำหรับ PaddleOCR HTTP sidecar
# - 2026-05-25: แก้ volumes ให้ถูกต้องสำหรับ Windows + Docker Desktop
# - 2026-05-30: เพิ่ม OCR_LANG=tha+eng (Tesseract Thai + English)
# - 2026-05-30: เพิ่ม Typhoon OCR environment variables (T009b, ADR-032)
# OLLAMA_API_URL ชี้ไปที่ http://192.168.10.100:11434 (Admin Desktop LAN IP)
# - 2026-05-30: Revert volumes กลับไปใช้ Windows Z: drive bind mount (แทน CIFS volume driver ที่พัง)
# - 2026-06-01: ลบ volumes ออกทั้งหมด — backend ส่ง file content ผ่าน multipart /ocr-upload แทน
# ไม่ต้องการ shared storage อีกต่อไป
# - 2026-06-01: เปลี่ยน TYPHOON_OCR_MODEL เป็น scb10x/typhoon-ocr1.5-3b
# - 2026-06-04: ADR-034 — เปลี่ยน TYPHOON_OCR_MODEL เป็น typhoon-np-dms-ocr:latest; OLLAMA_API_URL ชี้ตรงไป Ollama (ไม่ผ่าน metrics proxy) เพื่อป้องกัน empty response
# - 2026-06-02: เพิ่ม ollama-metrics (NorskHelsenett) — Prometheus sidecar สำหรับ Ollama metrics
# expose /metrics บน port 9924; Prometheus (ASUSTOR) scrape จาก 192.168.10.100:9924
#
# วิธีรัน:
# docker compose up -d --build
#
# ทดสอบ:
# curl http://192.168.10.100:8765/health
# curl http://192.168.10.100:9924/metrics
name: lcbp3-ocr
services:
ocr-sidecar:
build:
context: .
dockerfile: Dockerfile
container_name: ocr-sidecar
restart: unless-stopped
ports:
- "8765:8765"
environment:
OCR_CHAR_THRESHOLD: "100"
OCR_PORT: "8765"
OCR_MAX_PAGES: "0"
OCR_LANG: "tha+eng" # Tesseract language code (Thai + English)
USE_GPU: "false" # OCR sidecar รันบน CPU, Typhoon OCR ใช้ Ollama แยก
# ─── Typhoon OCR via Ollama (ADR-034) ───────────────────────────────────
# ชี้ตรงไปยัง Ollama (port 11434) ไม่ผ่าน metrics proxy
# (proxy ไม่ forward /api/generate ได้ถูกต้อง — ทำให้ response ว่าง)
OLLAMA_API_URL: "http://host.docker.internal:11434"
TYPHOON_OCR_MODEL: "typhoon-np-dms-ocr:latest"
# Timeout 120 วินาที/หน้า (budget สำหรับ 3B model บน RTX 2060 Super)
TYPHOON_OCR_TIMEOUT: "120"
logging:
driver: "json-file"
options:
max-size: "10m"
max-file: "3"
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:8765/health"]
interval: 30s
timeout: 10s
retries: 3
start_period: 60s
# ----------------------------------------------------------------
# ollama-metrics (NorskHelsenett) — Prometheus Sidecar สำหรับ Ollama
# ----------------------------------------------------------------
# Transparent proxy ที่นั่งระหว่าง client กับ Ollama (port 11434)
# เก็บ metrics แล้ว expose ที่ /metrics บน port 9924 (Prometheus format)
#
# Metrics ที่ได้:
# ollama_prompt_tokens_total — จำนวน prompt tokens ทั้งหมด
# ollama_generated_tokens_total — จำนวน generated tokens ทั้งหมด
# ollama_request_duration_seconds — ระยะเวลา request (histogram)
# ollama_time_per_token_seconds — เวลาต่อ token (inference speed)
# ollama_loaded_models — จำนวน model ที่โหลดอยู่ใน VRAM
# ollama_model_loaded — indicator 1/0 ต่อ model
# ollama_model_ram_mb — VRAM usage (MB) ต่อ model
#
# Prometheus (ASUSTOR 192.168.10.8) scrape จาก:
# http://192.168.10.100:9924/metrics
ollama-metrics:
image: ghcr.io/norskhelsenett/ollama-metrics:latest
container_name: ollama-metrics
restart: unless-stopped
environment:
# ชี้ไปที่ Ollama ที่รันบน Desk-5439 (host network หรือ LAN IP)
# ถ้า Ollama รันบน host (ไม่ใช่ container) ให้ใช้ host.docker.internal
OLLAMA_HOST: "http://host.docker.internal:11434"
PORT: "9924"
ports:
- "9924:9924"
extra_hosts:
# Windows Docker Desktop: map host.docker.internal → host IP
- "host.docker.internal:host-gateway"
logging:
driver: "json-file"
options:
max-size: "10m"
max-file: "3"
healthcheck:
test: ["CMD", "wget", "--spider", "-q", "http://localhost:9924/metrics"]
interval: 30s
timeout: 10s
retries: 3
start_period: 15s