Metinvest Digital розробив та впровадив новий програмний продукт MyOCR

Нещодавно спеціалісти R&D Центру Metinvest Digital запустили першу версію чергового програмного продукту MyOCR. Про продукт та його реалізацію розповів Віктор Маліченко, Technology manager R&D Центру Metinvest Digital.

Що таке MyOCR та які його переваги?

MyOCR – це програмний продукт, що забезпечує централізоване адміністрування, управління та роботу з фінансовими документами при взаємодії. Це можливо як в середині компаній, що входять до Групи Метінвест, так і з третіми сторонами. Технології ML, AI, OCR дозволяють працювати не тільки з електронними документами, але і з фото копіями документів.

Переваги такого продукту полягають в тому, що він націлений на оптимізацію, централізацію та підвищення якості роботи при адмініструванні фінансових процесів шляхом спрощення роботи з фінансовими документами. Прозорість роботи системи та додаткові інтеграції допоможуть ідентифікувати, уникати помилок та забезпечувати якість й актуальність даних в облікових системах. В майбутньому планується інтеграція у рішення елементів штучного інтелекту та інших когнітивних рішень, які дозволять вийти на новий рівень автоматизації даного бізнес-процесу.

Як довго працювали над продуктом?

Продукт було реалізовано «з нуля» фахівцями Metinvest Digital. Прототип продукту розробили в кінці 2022 року, а з початку 2023 року команда вже працювала над його створенням. Наразі перша версія вийшла в продуктив, але роботи плануються й на наступний рік.

Що було складним на шляху реалізації і які ви знайшли рішення?

На шляху реалізації виникли певні труднощі. Складність полягала і в якості отриманих даних (скановані документи), і в складній та різноманітній структурі, і в мові інформаційного наповнення (кирилиця). Для подолання цих труднощів були розроблені наступні стратегії:

1. Підготовка даних. Декомпозиція пакету документів на сторінки, вирівнювання, ефективне видалення надлишкових елементів, що залишаються після друку чи сканування, обробка зображень для покращення контрастності, усунення шумів і виправлення спотворень, класифікація за різними типами документів та виявлення зайвих даних (порожні аркуші, аркуші з непотрібною для нас інформацією) покращили якість вхідних матеріалів, готуючи їх у формат, оптимальний для нейронних мереж.

2. Опрацювання. Підбір оптимальних наборів алгоритмів та інструментів, які забезпечили розробку універсальної моделі розпізнавання даних в залежності від типу документів, дозволило створити єдиний алгоритм, який автоматично обирає необхідну модель для обробки. Інтеграція з системами OpenText та SAP дозволила мінімізувати необхідність використання даних систем на рівні користувача та об’єднати все в одній платформі. Покращення UI/UX елементів стало важливою частиною розробки завдяки безпосередньому впливу на ефективність використання продукту.

3. Безпека та надійність. Випустити не просто працездатний продукт, а безпечний та надійний продукт – завжди є пріоритетом для нас. Пошук оптимальних компонентів інфраструктури під кожен з мікро сервісів нашої системи забезпечує ефективне використання ресурсів, просте масштабування та швидкість роботи продукту загалом. Регулярне оновлення компонентів та бібліотек, дотримання вимог інформаційної безпеки – робить рішення не лише якіснішим, але й безпечним.

4. Розвиток. Постійний розвиток технологічного стеку з використанням новітніх алгоритмів, регулярне донавчання нейронних мереж новими форматами та структурами документів, а також їхній розвиток у взаємодії з кирилицею, таблицями та іншими елементами – забезпечує постійне вдосконалення точності розпізнавання та класифікації.

Роботи в рамках розвитку та удосконалення системи продовжуються. В найближчій перспективі користувачам будуть доступні додаткові модулі й процеси, які дозволять об'єднати більшу частину роботи в одній системі, мінімізувати ручну роботу та суттєво підвищити продуктивність команди.

Metinvest Digital розробив та впровадив новий програмний продукт MyOCR

Що таке MyOCR та які його переваги?

Як довго працювали над продуктом?

Що було складним на шляху реалізації і які ви знайшли рішення?

On this topic

How to ensure high-quality and safe remote work: important steps

Metinvest Digital receives a Micro Focus Gold Partner status