# ทดสอบ typhoon2.5-np-dms โดยใช้ prompt template จริง + OCR text จาก test.md + master data context จาก DB # รันด้วย: powershell -ExecutionPolicy Bypass -File test_llm.ps1 $ErrorActionPreference = "Stop" $OLLAMA_URL = "http://192.168.10.100:11434" $MODEL = "typhoon2.5-np-dms:latest" $OCR_TEXT_FILE = Join-Path $PSScriptRoot "test.md" # --- Prompt Template (ดึงจาก DB: ai_prompts version=2, prompt_type=ocr_extraction) --- $TEMPLATE = @" คุณคือเอนจิ้นสกัดข้อมูลอัจฉริยะ (Document Intelligence Engine) วิเคราะห์ข้อความ OCR ที่ได้รับจากเอกสารของโครงการ Laem Chabang Port Phase 3 และสกัดข้อมูลเมตาดาต้าให้ออกมาเป็น JSON object ที่ถูกต้องตามโครงสร้างที่กำหนด ข้อความ OCR ที่สกัดได้: {{ocr_text}} ข้อมูลอ้างอิงของระบบ (Master Data Context): {{master_data_context}} กฎการสกัดข้อมูล: 1. วิเคราะห์และจับคู่ข้อมูลจากข้อความ OCR กับข้อมูลอ้างอิงที่ระบุใน Master Data Context เสมอ 2. สำหรับโครงการ (project) ให้ค้นหาและสกัดส่งกลับเป็น UUID ของโครงการ (projectPublicId) 3. สำหรับประเภทเอกสารโต้ตอบ (correspondence type) ให้สกัดรหัสส่งกลับมา (correspondenceTypeCode) เช่น RFA, Transmittal 4. สำหรับสาขางาน (discipline) ให้ส่งคืนรหัสส่งกลับมา (disciplineCode) เช่น GEN, STR 5. สำหรับหน่วยงานผู้ส่ง (originator) ค้นหาจาก availableOrganizations และส่งกลับมาเป็น UUID (originatorOrganizationPublicId) 6. สำหรับหน่วยงานผู้รับ (recipients) ให้ส่งกลับมาเป็นรายการ Array ของออบเจกต์ ซึ่งมี UUID ขององค์กร (organizationPublicId) และประเภทผู้รับ (recipientType: "TO" หรือ "CC") เสมอ 7. สำหรับหัวข้อเอกสาร (subject) ให้สกัดหัวข้อหรือชื่อเรื่องของเอกสารภาษาไทยหรือภาษาอังกฤษ 8. วันที่ของเอกสาร (documentDate) ให้ส่งคืนในรูปแบบ YYYY-MM-DD 9. รายการแท็ก (tags) สกัดคำสำคัญหรือคำแนะนำ Tags (สอดคล้องกับ availableTags หากมี) 10. สรุปความเนื้อหา (summary) เขียนสรุปรายละเอียดเอกสารสั้นกระชับ 4-5 ประโยคเป็นภาษาไทยอย่างสละสลวย 11. confidence: ค่าความมั่นใจในการสกัดข้อมูลนี้ (ทศนิยมระหว่าง 0.0 ถึง 1.0) ส่งคืนคำตอบเฉพาะ JSON Object ที่ถูกต้องเท่านั้น ห้ามใส่บล็อกโค้ด markdown หรือคำอธิบายเพิ่มเติมใดๆ โครงสร้าง JSON ผลลัพธ์: { "projectPublicId": "string หรือ null", "correspondenceTypeCode": "string หรือ null", "disciplineCode": "string หรือ null", "originatorOrganizationPublicId": "string หรือ null", "recipients": [ { "organizationPublicId": "string", "recipientType": "TO หรือ CC" } ], "subject": "string หรือ null", "documentDate": "string:YYYY-MM-DD หรือ null", "tags": ["string"], "summary": "string หรือ null", "confidence": 0.95 } "@ # --- Master Data Context (ดึงจาก DB จริง) --- $MASTER_DATA = @{ availableProjects = @( @{code = "LCBP3"; uuid = "c957f1e3-538b-11f1-8c7d-0242ac1d0007"; name = "โครงการพัฒนาท่าเรือแหลมฉบัง ระยะที่ 3 (ส่วนที่ 1-4)"} @{code = "LCBP3-C1"; uuid = "c957f44b-538b-11f1-8c7d-0242ac1d0007"; name = "โครงการพัฒนาท่าเรือแหลมฉบัง ระยะที่ 3 (ส่วนที่ 1) งานก่อสร้างงานทางทะเล"} @{code = "LCBP3-C2"; uuid = "c957f523-538b-11f1-8c7d-0242ac1d0007"; name = "โครงการพัฒนาท่าเรือแหลมฉบัง ระยะที่ 3 (ส่วนที่ 2) งานก่อสร้างอาคาร ท่าเทียบเรือ ระบบถนน และระบบสาธารณูปโภค"} @{code = "LCBP3-C3"; uuid = "c957f57c-538b-11f1-8c7d-0242ac1d0007"; name = "โครงการพัฒนาท่าเรือแหลมฉบัง ระยะที่ 3 (ส่วนที่ 3) งานก่อสร้าง"} @{code = "LCBP3-C4"; uuid = "c957f5cc-538b-11f1-8c7d-0242ac1d0007"; name = "โครงการพัฒนาท่าเรือแหลมฉบัง ระยะที่ 3 (ส่วนที่ 4) งานก่อสร้าง"} ) availableOrganizations = @( @{code = "กทท."; uuid = "c94cb0b4-538b-11f1-8c7d-0242ac1d0007"; name = "การท่าเรือแห่งประเทศไทย"} @{code = "สคฉ.3"; uuid = "c94cb3f6-538b-11f1-8c7d-0242ac1d0007"; name = "โครงการพัฒนาท่าเรือแหลมฉบัง ระยะที่ 3"} @{code = "สคฉ.3-01"; uuid = "c94cb532-538b-11f1-8c7d-0242ac1d0007"; name = "ตรวจรับพัสดุ ที่ปรึกษาควบคุมงาน"} @{code = "สคฉ.3-02"; uuid = "c94cb5ab-538b-11f1-8c7d-0242ac1d0007"; name = "ตรวจรับพัสดุ งานทางทะเล"} @{code = "สคฉ.3-03"; uuid = "c94cb616-538b-11f1-8c7d-0242ac1d0007"; name = "ตรวจรับพัสดุ อาคารและระบบสาธารณูปโภค"} @{code = "คคง."; uuid = "c94cb8ac-538b-11f1-8c7d-0242ac1d0007"; name = "Construction Supervision Ltd."} @{code = "ผรม.1"; uuid = "c94cb907-538b-11f1-8c7d-0242ac1d0007"; name = "Contractor งานทางทะเล"} @{code = "ผรม.2"; uuid = "c94cb95e-538b-11f1-8c7d-0242ac1d0007"; name = "Contractor งานก่อสร้าง"} @{code = "ผรม.3"; uuid = "c94cb9b3-538b-11f1-8c7d-0242ac1d0007"; name = "Contractor งานก่อสร้าง ส่วนที่ 3"} @{code = "ผรม.4"; uuid = "c94cba0c-538b-11f1-8c7d-0242ac1d0007"; name = "Contractor งานก่อสร้าง ส่วนที่ 4"} ) availableDisciplines = @( @{code = "GEN"; name = "งานบริหารโครงการ"} @{code = "COD"; name = "สัญญาและข้อโต้แย้ง"} @{code = "QSB"; name = "สำรวจปริมาณและควบคุมงบประมาณ"} @{code = "PPG"; name = "บริหารแผนและความก้าวหน้า"} @{code = "BST"; name = "งานโครงสร้างอาคาร"} @{code = "UTL"; name = "งานระบบสาธารณูปโภค"} @{code = "EPW"; name = "งานระบบไฟฟ้า"} @{code = "SRV"; name = "งานสำรวจ"} @{code = "ODC"; name = "สำนักงาน-ควบคุมเอกสาร"} ) availableCorrespondenceTypes = @( @{code = "RFA"; name = "Request for Approval"} @{code = "RFI"; name = "Request for Information"} @{code = "TRANSMITTAL"; name = "Transmittal"} @{code = "LETTER"; name = "Letter"} @{code = "MEMO"; name = "Memorandum"} @{code = "MOM"; name = "Minutes of Meeting"} @{code = "NOTICE"; name = "Notice"} @{code = "OTHER"; name = "Other"} ) availableTags = @() } function Check-Models { try { $resp = Invoke-RestMethod -Uri "$OLLAMA_URL/api/ps" -Method Get -TimeoutSec 5 if ($resp.models) { Write-Host " Models in VRAM: $($resp.models.name -join ', ')" } else { Write-Host " VRAM: ไม่มี model โหลดอยู่ (ว่าง)" } } catch { Write-Host " Error checking models: $_" } } Write-Host "=" * 60 Write-Host "🔍 ตรวจสอบ VRAM ก่อนรัน..." Check-Models $ocrText = Get-Content $OCR_TEXT_FILE -Raw -Encoding UTF8 Write-Host "`n📄 OCR text: $($ocrText.Length) chars" $masterDataJson = $MASTER_DATA | ConvertTo-Json -Depth 10 -Compress:$false $prompt = $TEMPLATE -replace "{{ocr_text}}", $ocrText -replace "{{master_data_context}}", $masterDataJson Write-Host "📝 Total prompt: $($prompt.Length) chars" Write-Host "=" * 60 Write-Host "⏳ กำลังส่งไปยัง Ollama..." $body = @{ model = $MODEL prompt = $prompt stream = $false } | ConvertTo-Json -Depth 10 $start = Get-Date try { $resp = Invoke-RestMethod -Uri "$OLLAMA_URL/api/generate" -Method Post -Body $body -ContentType "application/json" -TimeoutSec 180 $elapsed = (Get-Date - $start).TotalSeconds $rawResponse = $resp.response Write-Host "`n✅ Response ใน $([math]::Round($elapsed, 1))s" Write-Host "-" * 60 Write-Host $rawResponse Write-Host "-" * 60 $cleaned = $rawResponse -replace "```json", "" -replace "```", "" -replace "^\s+", "" -replace "\s+$", "" try { $parsed = $cleaned | ConvertFrom-Json Write-Host "`n✅ JSON parse สำเร็จ!" $parsed | ConvertTo-Json -Depth 10 } catch { Write-Host "`n❌ JSON parse ล้มเหลว: $_" Write-Host " Raw (200 chars): $($rawResponse.Substring(0, [Math]::Min(200, $rawResponse.Length)))" } } catch { Write-Host "`n❌ Error: $_" } Write-Host "`n🔍 ตรวจสอบ VRAM หลังรัน..." Check-Models