Система классификации документов и извлечения данных, разработанная для обработки страховых претензий. Компания получала в среднем 2 800 претензий ежедневно, каждая содержала 5-8 различных документов. Операционная группа вручную классифицировала документы и вводила данные по одному; уровень ошибок превышал 12%.
Мы спроектировали трёхэтапный конвейер: на первом этапе изображения документов проходят предобработку и коррекцию. На втором — дообученная модель LayoutLMv3 классифицирует документ и извлекает ключевые поля. На третьем — движок бизнес-правил валидирует извлечённые данные и передаёт их в ERP-систему. Документы с низкой уверенностью направляются на ручную проверку.