19 lines
1.0 KiB
Plaintext
19 lines
1.0 KiB
Plaintext
# OCR Sidecar Requirements (Typhoon OCR via Ollama)
|
|
# Change Log:
|
|
# - 2026-05-30: เปลี่ยนจาก PaddleOCR เป็น Tesseract OCR เพื่อความเข้ากันได้กับ CPU เก่า (ไม่ต้องการ AVX)
|
|
# - 2026-05-30: ลบ paddlepaddle/paddleocr dependencies เนื่องจาก SIGILL บน CPU ที่ไม่รองรับ AVX
|
|
# - 2026-05-30: เพิ่ม opencv-python สำหรับ image preprocessing (threshold, denoise) เพื่อเพิ่มความแม่นยำ OCR
|
|
# - 2026-06-11: เพิ่ม typhoon-ocr สำหรับ prepare_ocr_messages (official prompt builder สำหรับ typhoon-ocr1.5-3b)
|
|
# - 2026-06-11: ตัด pytesseract, opencv-python, numpy ออก — ไม่ใช้ Tesseract อีกต่อไป
|
|
|
|
PyMuPDF==1.24.0
|
|
fastapi==0.111.0
|
|
uvicorn[standard]==0.30.1
|
|
python-multipart==0.0.9
|
|
pythainlp==5.0.4
|
|
httpx==0.27.0
|
|
Pillow==10.0.0
|
|
FlagEmbedding>=1.2.0
|
|
typhoon-ocr>=0.4.1
|
|
|