Metinvest Digital розробив та впровадив новий програмний продукт MyOCR
Нещодавно спеціалісти R&D Центру Metinvest Digital запустили першу версію чергового програмного продукту MyOCR. Про продукт та його реалізацію розповів Віктор Маліченко, Technology manager R&D Центру Metinvest Digital.
Що таке MyOCR та які його переваги?
MyOCR – це програмний продукт, що забезпечує централізоване адміністрування, управління та роботу з фінансовими документами при взаємодії. Це можливо як в середині компаній, що входять до Групи Метінвест, так і з третіми сторонами. Технології ML, AI, OCR дозволяють працювати не тільки з електронними документами, але і з фото копіями документів.
Переваги такого продукту полягають в тому, що він націлений на оптимізацію, централізацію та підвищення якості роботи при адмініструванні фінансових процесів шляхом спрощення роботи з фінансовими документами. Прозорість роботи системи та додаткові інтеграції допоможуть ідентифікувати, уникати помилок та забезпечувати якість й актуальність даних в облікових системах. В майбутньому планується інтеграція у рішення елементів штучного інтелекту та інших когнітивних рішень, які дозволять вийти на новий рівень автоматизації даного бізнес-процесу.
Як довго працювали над продуктом?
Продукт було реалізовано «з нуля» фахівцями Metinvest Digital. Прототип продукту розробили в кінці 2022 року, а з початку 2023 року команда вже працювала над його створенням. Наразі перша версія вийшла в продуктив, але роботи плануються й на наступний рік.
Що було складним на шляху реалізації і які ви знайшли рішення?
На шляху реалізації виникли певні труднощі. Складність полягала і в якості отриманих даних (скановані документи), і в складній та різноманітній структурі, і в мові інформаційного наповнення (кирилиця). Для подолання цих труднощів були розроблені наступні стратегії:
1. Підготовка даних. Декомпозиція пакету документів на сторінки, вирівнювання, ефективне видалення надлишкових елементів, що залишаються після друку чи сканування, обробка зображень для покращення контрастності, усунення шумів і виправлення спотворень, класифікація за різними типами документів та виявлення зайвих даних (порожні аркуші, аркуші з непотрібною для нас інформацією) покращили якість вхідних матеріалів, готуючи їх у формат, оптимальний для нейронних мереж.
2. Опрацювання. Підбір оптимальних наборів алгоритмів та інструментів, які забезпечили розробку універсальної моделі розпізнавання даних в залежності від типу документів, дозволило створити єдиний алгоритм, який автоматично обирає необхідну модель для обробки. Інтеграція з системами OpenText та SAP дозволила мінімізувати необхідність використання даних систем на рівні користувача та об’єднати все в одній платформі. Покращення UI/UX елементів стало важливою частиною розробки завдяки безпосередньому впливу на ефективність використання продукту.
3. Безпека та надійність. Випустити не просто працездатний продукт, а безпечний та надійний продукт – завжди є пріоритетом для нас. Пошук оптимальних компонентів інфраструктури під кожен з мікро сервісів нашої системи забезпечує ефективне використання ресурсів, просте масштабування та швидкість роботи продукту загалом. Регулярне оновлення компонентів та бібліотек, дотримання вимог інформаційної безпеки – робить рішення не лише якіснішим, але й безпечним.
4. Розвиток. Постійний розвиток технологічного стеку з використанням новітніх алгоритмів, регулярне донавчання нейронних мереж новими форматами та структурами документів, а також їхній розвиток у взаємодії з кирилицею, таблицями та іншими елементами – забезпечує постійне вдосконалення точності розпізнавання та класифікації.
Роботи в рамках розвитку та удосконалення системи продовжуються. В найближчій перспективі користувачам будуть доступні додаткові модулі й процеси, які дозволять об'єднати більшу частину роботи в одній системі, мінімізувати ручну роботу та суттєво підвищити продуктивність команди.