690604:1613 ADR-034-134 #09.5 [skip CI]
This commit is contained in:
@@ -238,7 +238,7 @@ def process_with_typhoon_ocr(pil_image: Image.Image, options_override: dict = {}
|
|||||||
"top_p": 0.1,
|
"top_p": 0.1,
|
||||||
"repeat_penalty": 1.1,
|
"repeat_penalty": 1.1,
|
||||||
"num_gpu": 99, # บังคับ GPU layers สูงสุด — ป้องกัน Ollama fallback ไป CPU โดยไม่จำเป็น
|
"num_gpu": 99, # บังคับ GPU layers สูงสุด — ป้องกัน Ollama fallback ไป CPU โดยไม่จำเป็น
|
||||||
"num_ctx": 2048, # ลด KV cache + compute graph จาก 6.7 GiB → ~1.7 GiB เพื่อให้ model fit ใน VRAM 8GB
|
"num_ctx": 4096, # image tokens ~2772 → ต้องการ context > 2048; 4096 รองรับ image + output โดยไม่ truncate
|
||||||
**options_override,
|
**options_override,
|
||||||
}
|
}
|
||||||
payload = {
|
payload = {
|
||||||
|
|||||||
+1
-1
@@ -1,6 +1,6 @@
|
|||||||
FROM scb10x/typhoon-ocr1.5-3b:latest
|
FROM scb10x/typhoon-ocr1.5-3b:latest
|
||||||
|
|
||||||
PARAMETER num_ctx 2048
|
PARAMETER num_ctx 4096
|
||||||
PARAMETER num_predict 2048
|
PARAMETER num_predict 2048
|
||||||
PARAMETER temperature 0.1
|
PARAMETER temperature 0.1
|
||||||
PARAMETER top_p 0.1
|
PARAMETER top_p 0.1
|
||||||
|
|||||||
Reference in New Issue
Block a user