DocAI Processor

Akilli Belge Isleme ve Veri Cikarimi

Document AILayoutLMv3OCRComputer VisionPython

Bir sigorta sirketinin hasar dosyasi islemleri icin gelistirilen belge siniflandirma ve veri cikarim sistemi. Firma gunluk ortalama 2.800 hasar basvurusu aliyordu ve her dosya eksper raporu, fatura, police fotokopisi gibi 5-8 farkli belge iceriyordu. Operasyon ekibi bu belgeleri elle siniflandirip, ilgili alanlari sisteme tek tek giriyordu; hata orani %12'nin ustundeydi.

Uc asamali bir pipeline tasarladik: Ilk asamada belge goruntuleri on isleme ve duzeltme (deskew, noise reduction) isleminden geciriliyor. Ikinci asamada fine-tune edilmis bir LayoutLMv3 modeli belgeyi siniflandirip, anahtar alanlari (tarih, tutar, police numarasi vb.) cikartiyor. Ucuncu asamada is kurallari motoru cikarilan verileri dogruluyor ve ERP sistemine aktariyor. Dusuk guvenilirlik skorlu belgeler insan incelemesine yonlendiriliyor.

Sistem Mimarisi

IngestionProcessingIntelligenceOutputJobsProcessTextStoreEntitiesTypedVerifiedStatusFilesUpload ServiceJob QueueOCR EngineNLP PipelineObject StorageClassifierValidationExport APIDashboard

Öne Çıkanlar

  • LayoutLMv3 tabanli belge siniflandirma ve alan cikarimi
  • Goruntu on isleme pipeline (deskew, noise reduction, binarization)
  • Is kurallari motoru ile otomatik veri dogrulama
  • Human-in-the-loop: dusuk skor belgelerde manuel inceleme
  • ERP sistemi ile cift yonlu entegrasyon

Sonuçlar

Belge siniflandirma dogrulugu %94.8 (insan incelemesi dahil %99.2)
Dosya isleme suresi 22 dakikadan 90 saniyeye dustu
Manuel veri giris hatasi %12'den %1.4'e geriledi
Operasyon ekibinde 6 kisilik is gucunu serbest birakti