DocAI Processor

معالجة المستندات الذكية واستخراج البيانات

Document AILayoutLMv3OCRComputer VisionPython

نظام تصنيف مستندات واستخراج بيانات طُوِّر لمعالجة مطالبات شركة تأمين. كانت الشركة تتلقى 2,800 مطالبة يومياً، كل منها يحتوي على 5-8 مستندات مختلفة. كان فريق العمليات يصنف المستندات يدوياً ويدخل البيانات واحدة تلو الأخرى؛ وتجاوز معدل الخطأ 12%.

صممنا خط أنابيب من ثلاث مراحل: أولاً، تمر صور المستندات بمعالجة أولية وتصحيح. ثانياً، يقوم نموذج LayoutLMv3 المضبوط بتصنيف المستند واستخراج الحقول الرئيسية. ثالثاً، يتحقق محرك قواعد الأعمال من البيانات المستخرجة ويرسلها لنظام ERP. المستندات ذات درجات الثقة المنخفضة تُوجَّه للمراجعة البشرية.

هندسة النظام

IngestionProcessingIntelligenceOutputJobsProcessTextStoreEntitiesTypedVerifiedStatusFilesUpload ServiceJob QueueOCR EngineNLP PipelineObject StorageClassifierValidationExport APIDashboard

أبرز النقاط

  • تصنيف المستندات واستخراج الحقول بناءً على LayoutLMv3
  • خط معالجة أولية للصور (تصحيح الميل، تقليل الضوضاء)
  • محرك قواعد أعمال للتحقق الآلي من البيانات
  • مراجعة بشرية للمستندات منخفضة الثقة
  • تكامل ثنائي الاتجاه مع نظام ERP

النتائج

دقة التصنيف 94.8% (99.2% مع المراجعة البشرية)
انخفض وقت المعالجة من 22 دقيقة إلى 90 ثانية
انخفضت أخطاء الإدخال من 12% إلى 1.4%
تحرير 6 موظفين في فريق العمليات