diff --git a/specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/app.py b/specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/app.py index d646249f..2238a17f 100644 --- a/specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/app.py +++ b/specs/04-Infrastructure-OPS/04-00-docker-compose/Desk-5439/ocr-sidecar/app.py @@ -238,6 +238,7 @@ def process_with_typhoon_ocr(pil_image: Image.Image, options_override: dict = {} "top_p": 0.1, "repeat_penalty": 1.1, "num_gpu": 99, # บังคับ GPU layers สูงสุด — ป้องกัน Ollama fallback ไป CPU โดยไม่จำเป็น + "num_ctx": 2048, # ลด KV cache + compute graph จาก 6.7 GiB → ~1.7 GiB เพื่อให้ model fit ใน VRAM 8GB **options_override, } payload = {