9.0 KiB
Database Indexing & Performance Strategy
Version: 1.0.0 Context: Production-scale (100k+ documents, High Concurrency) Database: MySQL 8.x (On-Premise via Docker)
1. Core Principles (หลักการสำคัญ)
ในการออกแบบ Database Index สำหรับระบบ DMS ให้ยึดหลักการตัดสินใจดังนี้:
- Data Integrity First: ใช้
UNIQUE INDEXเพื่อเป็นปราการด่านสุดท้ายป้องกันการเกิด Duplicate Document Number และ Revision ซ้ำซ้อน (แม้ Application Layer จะมี Logic ดักไว้แล้วก็ตาม) - Soft-Delete Awareness: ทุก Index ที่เกี่ยวข้องกับความถูกต้องของข้อมูล ต้องคำนึงถึงคอลัมน์
deleted_atเพื่อไม่ให้เอกสารที่ถูกลบไปแล้ว มาขัดขวางการสร้างเอกสารใหม่ที่ใช้เลขเดิม - Foreign Key Performance: สร้าง B-Tree Index ให้กับ Foreign Key (FK) ทุกตัว เพื่อรองรับการ JOIN ข้อมูลที่รวดเร็ว โดยเฉพาะการดึง Workflow และ Routing
- Write-Heavy Resilience: ตารางประเภท
audit_logsให้เน้น Index เฉพาะที่จำเป็น (created_at,user_id,action) เพื่อไม่ให้กระทบประสิทธิภาพการ Insert
2. Document Control Indexes (ป้องกัน Duplicate & Conflict)
หัวใจของ DMS คือห้ามมีเอกสารเลขซ้ำในระบบที่ Active อยู่
2.1 Unique Document Number & Revision
เพื่อรองรับระบบ Soft Delete (deleted_at) ใน MySQL การตั้ง Unique Index จำเป็นต้องมีเทคนิคเพื่อจัดการกับค่า NULL (เนื่องจาก MySQL มองว่า NULL ไม่เท่ากับ NULL จึงอาจทำให้เกิด Duplicate ได้ถ้าตั้งค่าไม่รัดกุม)
SQL Recommendation (Functional Index - MySQL 8.0+):
-- ป้องกันการสร้าง Document No และ Revision ซ้ำ สำหรับเอกสารที่ยังไม่ถูกลบ (Active)
ALTER TABLE `documents`
ADD UNIQUE INDEX `idx_unique_active_doc_rev` (
`document_no`,
`revision`,
(IF(`deleted_at` IS NULL, 1, NULL))
);
เหตุผล: โครงสร้างนี้รับประกันว่าจะมี document_no + revision ที่ Active ได้เพียง 1 รายการเท่านั้น แต่สามารถมีรายการที่ถูกลบ (deleted_at มีค่า) ซ้ำกันได้
2.2 Current/Superseded Flag Index
การค้นหาว่าเอกสารไหนเป็น "Latest Revision" จะเกิดขึ้นบ่อยมาก
-- ใช้สำหรับ Filter เอกสารที่เป็นเวอร์ชันล่าสุดอย่างรวดเร็ว
ALTER TABLE `documents`
ADD INDEX `idx_doc_status_is_current` (`is_current`, `status`, `project_id`);
3. High-Concurrency Search Indexes (รองรับ 100k+ Docs)
สำหรับการทำ Filter และ Search บนหน้า Dashboard หรือรายการเอกสาร
3.1 Pagination & Sorting
การ Query ข้อมูลแบบแบ่งหน้า (Pagination) พร้อมเรียงลำดับวันที่ มักเกิดปัญหา "Filesort" ที่ทำให้ CPU โหลดหนัก
-- สำหรับหน้า Dashboard ที่เรียงตามวันที่อัปเดตล่าสุด
ALTER TABLE `documents`
ADD INDEX `idx_project_updated` (`project_id`, `updated_at` DESC);
-- สำหรับ Inbox / Pending Tasks ของ User
ALTER TABLE `workflow_instances`
ADD INDEX `idx_assignee_status` (`assignee_id`, `status`, `created_at` DESC);
3.2 Full-Text Search (ทางเลือกเบื้องต้นก่อนใช้ Elasticsearch)
หากผู้ใช้ต้องการค้นหาจากชื่อเอกสาร (title) หรือเนื้อหาบางส่วน
-- สร้าง Full-Text Index สำหรับคำค้นหา
ALTER TABLE `documents`
ADD FULLTEXT INDEX `ft_idx_doc_title` (`title`, `subject`);
(หมายเหตุ: หากอนาคตมีระบบ OCR หรือค้นหาในเนื้อหาไฟล์ PDF ให้พิจารณาขยับไปใช้ Elasticsearch แยกต่างหาก ไม่ควรเก็บ Full-Text ขนาดใหญ่ไว้ใน MySQL)
4. RBAC & Security Indexes
เพื่อป้องกันปัญหาคอขวด (Bottleneck) ตอนเช็คสิทธิ์ (RBAC validation) ก่อนให้เข้าถึงเอกสาร
-- ตาราง user_permissions
ALTER TABLE `user_permissions`
ADD UNIQUE INDEX `idx_user_role_project` (`user_id`, `role_id`, `project_id`);
-- ตาราง document_access_logs (Audit)
ALTER TABLE `audit_logs`
ADD INDEX `idx_audit_user_action` (`user_id`, `action`, `created_at`);
5. Audit Log Strategy (การจัดการตารางประวัติ)
ตาราง audit_logs จะโตเร็วมาก (Insert-only) คาดว่าจะมีหลักล้าน Record อย่างรวดเร็ว
คำแนะนำสำหรับ On-Premise:
- Partitioning: แนะนำให้ทำ Table Partitioning ตามเดือน (Monthly) หรือปี (Yearly) บนคอลัมน์
created_at - Minimal Indexing: ห้ามสร้าง Index เยอะเกินความจำเป็นในตารางนี้ แนะนำแค่:
INDEX(document_id, created_at)สำหรับดู History ของเอกสารนั้นๆINDEX(user_id, created_at)สำหรับตรวจสอบพฤติกรรมผู้ใช้ต้องสงสัย (Security Audit)
-- ตัวอย่างการ Index สำหรับดูกระแสของเอกสาร
ALTER TABLE `audit_logs`
ADD INDEX `idx_entity_history` (`entity_type`, `entity_id`, `created_at` DESC);
6. Maintenance & Optimization (DevOps/Admin)
เนื่องจากระบบอยู่บน On-Prem NAS (QNAP/ASUSTOR) ทรัพยากร I/O ของดิสก์มีจำกัด (Disk IOPS)
- Index Defragmentation: ให้กำหนด Scheduled Task (ผ่าน Cronjob หรือ MySQL Event) มารัน
OPTIMIZE TABLEทุกๆ ไตรมาส สำหรับตารางที่มีการ Delete/Update บ่อย (ช่วยคืนพื้นที่ดิสก์และลด I/O) - Slow Query Monitoring: ใน
04-infrastructure-ops/04-01-docker-compose.mdต้องเปิดใช้งานslow_query_log=1และตั้งlong_query_time=2เพื่อตรวจสอบว่ามี Query ใดทำงานแบบ Full Table Scan (ไม่ใช้ Index) หรือไม่
💡 คำแนะนำเพิ่มเติมจาก Architect (Architect's Notes):
- เรื่อง Soft Delete กับ Unique Constraint: เป็นจุดที่นักพัฒนาพลาดกันบ่อยที่สุด ถ้าระบบอนุญาตให้ลบ
DOC-001 Rev.0แล้วสร้างDOC-001 Rev.0ใหม่ได้ การจัดการ Unique Constraint บน MySQL ต้องใช้ Functional Index (ตามตัวอย่างในข้อ 2.1) เพื่อป้องกันการตีกันของค่าNULLในฐานข้อมูล - ลดภาระ QNAP/ASUSTOR: อุปกรณ์จำพวก NAS On-Premise มักจะมีปัญหาเรื่อง Random Read/Write Disk I/O การใช้ Composite Index แบบครบคลุม (Covering Index) จะช่วยให้ MySQL คืนค่าได้จาก Index Tree โดยตรง ไม่ต้องกระโดดไปอ่าน Data File จริง ซึ่งจะช่วยรีด Performance ของ NAS ได้สูงสุดครับ