690611:1705 ADR-035-235 #00 [skip CI]
CI / CD Pipeline / build (push) Has been skipped
CI / CD Pipeline / deploy (push) Has been skipped

This commit is contained in:
2026-06-11 17:05:17 +07:00
parent cd7d20ccd4
commit 71c5e88181
14 changed files with 1422 additions and 682 deletions
@@ -1,18 +1,18 @@
# OCR Sidecar Requirements (Tesseract-based)
# OCR Sidecar Requirements (Typhoon OCR via Ollama)
# Change Log:
# - 2026-05-30: เปลี่ยนจาก PaddleOCR เป็น Tesseract OCR เพื่อความเข้ากันได้กับ CPU เก่า (ไม่ต้องการ AVX)
# - 2026-05-30: ลบ paddlepaddle/paddleocr dependencies เนื่องจาก SIGILL บน CPU ที่ไม่รองรับ AVX
# - 2026-05-30: เพิ่ม opencv-python สำหรับ image preprocessing (threshold, denoise) เพื่อเพิ่มความแม่นยำ OCR
# - 2026-06-11: เพิ่ม typhoon-ocr สำหรับ prepare_ocr_messages (official prompt builder สำหรับ typhoon-ocr1.5-3b)
# - 2026-06-11: ตัด pytesseract, opencv-python, numpy ออก — ไม่ใช้ Tesseract อีกต่อไป
numpy<2.0
PyMuPDF==1.24.0
pytesseract==0.3.13
fastapi==0.111.0
uvicorn[standard]==0.30.1
python-multipart==0.0.9
pythainlp==5.0.4
httpx==0.27.0
Pillow==10.0.0
opencv-python==4.8.1.78
FlagEmbedding>=1.2.0
typhoon-ocr>=0.4.1