Хто такі агенти AI?
Про секрети та backstage штучного інтелекту розповідають амбасадори Metinvest Digital: керівник R&D Центру Максим Баланюк та R&D Technology Manager Данило Цьвок.
За версією укладачів словника англійської мови Сollins Dictionary головним словом 2023 року cтало “AI” (з англ. artificial intelligence - штучний інтелект), а основним продуктом, з яким асоціюється це поняття, є надпопулярний ChatGpt. Саме він зібрав мільйон користувачів сервісом протягом 5 днів і не зникав із заголовків технологічних топ-медіа впродовж першого року свого існування.
Якщо ви зазирнете за лаштунки цього проривного продукту, то ви побачите, що в його основі лежить генеративний штучний інтелект. ChatGpt здатний аналізувати та створювати цифровий контент, використовуючи можливості великих мовних моделей (Large Language Models, LLM). Саме LLM є технологічним ядром «штучного інтелекту», базою знань та досвідом, якими він керується.
Разом з тим, однією з ключових тем в галузі AI та LLM, що активно обговорюється після презентації OpenAI (версії GPT), є застосування агентів.
Максим Баланюк розказав про агентів AI:
Давайте разом розглянемо поняття агенту як одного із ключових напрямків застосування технології LLM та розберемося, яким чином такі продукти у найближчому майбутньому впливатимуть на користувацький досвід та інтелектуальну автоматизацію бізнес-процесів та повсякденних задач.
Агент – це цифровий асистент або помічник, який може виконувати певні функції у цифровому просторі та самостійно приймати рішення для досягнення поставлених користувачем цілей.
Щоб краще зрозуміти, про що йде мова, давайте розберемося з еволюцією агентів з точки зору їх здатності комунікувати з користувачем.
Ми вже звикли до взаємодії з чат-ботами, які є уособленням роботизованої комунікації. Так, звичайний чат-бот діє у відповідності до запрограмованих інженерами правил, але він не наділений достатнім інтелектом, щоб самостійно розуміти контекст запиту, і, спираючись на свій досвід та знання, надавати необхідну відповідь. Такий складний функціонал мають інтелектуальні чат-системи, зокрема, ChatGPT. Інтелектуальні чат-системи використовують LLM-моделі, які навчені на Big Data і, таким чином, володіють великою кількістю знань. Та розробники ChatGPT не зупинилися на цьому: вони надали своєму продукту можливість шукати і розуміти дані з інтернету, а також фіксувати історію комунікації з користувачем, щоб збагачувати та вдосконалювати досвід для подальшого спілкування. Отже, творці інтелектуальних чат-систем вивели комунікацію з машинами на новий, більш якісний рівень.
Але сьогодні спілкування або будь-які інші операції з текстом - лише верхівка айсбергу у використанні генеративного штучного інтелекту, що базується на LLM. У найближчому майбутньому такі системи отримають можливість самостійно приймати прикладні рішення відповідно до задач, поставлених користувачем у формі природної мови. Тут і виходять на арену агенти.
Давайте пояснимо на прикладі комп’ютерної гри: уявіть, що вашого віртуального гравця за допомогою інструкцій можна навчити самостійно грати в цю гру, і він за декілька тижнів зможе самотужки переміщатися цифровим всесвітом, визначати, які ресурси йому необхідні для виживання, шукати їх, полювати, будувати споруди тощо. Більше того, він самостійно зможе досліджувати, які матеріали йому краще використовувати і яким способом їх добувати, тобто, він матиме можливість вдосконалювати свої навички. Саме такий успішний експеримент провели дослідники компанії Nvidia, навчивши AI бути автономним гравцем у грі Minecraft. Автономну систему, що забезпечує функціонування такого гравця, прийнято називати агентом AI. Переміщення аналогії вищезгаданого досвіду у вимір чат-систем дає розуміння того, що агенти можуть набагато більше, ніж спілкуватися в чаті, наприклад, планувати зустрічі, редагувати файли, аналізувати дані, будувати інфографіку тощо. Таким чином, агенти стають персональними помічниками, які можуть взаємодіяти з онлайн інструментами, програмами, користувацькими базами даних.
Давайте розглянемо на прикладі різницю між можливостями Сhat-GPT та агентом AI. Сhat-GPT може вам порекомендувати дієтичну їжу для схуднення, він вам надасть вичерпну інформацію про оптимальний раціон, але він не зможе замовити відповідні продукти в магазині, вам доведеться це робити самостійно. Водночас агент не тільки підкаже раціон, а й самостійно замовить продукти, проконтролює доставку у зручний для вас час, базуючись на вашому графіку та можливостях бюджету.
Тобто, ваш агент самостійно спілкується з іншими додатками, веб-сервісами та сайтами, отримує дані, аналізує їх та надає необхідну вам інформацію. Вам не потрібно витрачати час на пошук необхідного раціону, аналізу доступності продуктів у супермаркетах та їхні ціни, а також оформлення необхідного замовлення. За вас усі ці кроки виконує агент, вам тільки необхідно текстом описати ваш поточний фізичний стан та бажаний результат. Отже, «філософія» агента полягає у тому, що він розуміє природну мову і автономно виконує завдання, спираючись на свої знання, досвід та персоналізований підхід до користувача.
Біл Гейтс, засновник Microsoft, вважає: «У найближчі п'ять років досвід користувача зміниться. Вам не потрібно буде використовувати різні програми для різних завдань. Ви просто будете говорити своєму пристрою звичайною мовою, що хочете зробити. Агенти не тільки змінять спосіб взаємодії з комп’ютерами, вони також збираються перевернути галузь програмного забезпечення, створивши найбільшу революцію в обчислювальній техніці з того часу, як ми перейшли від введення команд до використання піктограм».
Данило Цьвок пропонує розглянути прикладні бізнес кейси:
Уявіть, що ви працюєте бізнес-аналітиком у корпоративному секторі, тобто виконуєте роль посередника між бізнесом і командою розробників: збираєте і визначаєте вимоги до майбутнього продукту або функціоналу, після чого перекладаєте їх зрозумілою для команди розробників мовою.
І ось перед вами поставили задачу: сформувати вимоги для розробки продукту та інтегрувати його з поточними рішеннями в інформаційну екосистему вашої компанії. Що вам необхідно зробити? А зробити доведеться чимало: провести кілька сесій з клієнтами, виконати великий обсяг проєктно-описової роботи щодо бізнес-потреб, проаналізувати та задокументувати вимоги. Також вам додатково необхідно опрацювати чимало описової документації щодо наявних систем компанії для точної побудови користувацьких історій для розробників. Це вимагає значних ресурсів: компетенцій, вашого інтелекту та часу.
А тепер уявіть собі, що у вас є агент-помічник, який на основі запису ваших сесій з замовниками здійснює транскрипцію їх у текст, розбирає його та структурує у відповідності до визначеного вами формату бізнес-вимог. Окрім того, ваш агент володіє інформацією про всі існуючі системи, з якими вам необхідно інтегрувати ваш продукт, в результаті він здатен сформувати драфт-документ з описом користувацьких історій для розробників. Завданням бізнес-аналітика буде тільки проведення максимально точного інтерв’ю з бізнес-замовником та валідація запропонованого агентом драфту документа.
Давайте розглянемо юридичний кейс: нещодавно вперше у світі агент на базі AI уклав контракт з іншим агентом без участі людини. Компанія Luminance (Лондон) продемонструвала, як її AI-система Autopilot уклала юридичну угоду за лічені хвилини. Поки цей агент веде повсякденні переговори, юристи можуть використовувати свій творчий потенціал, адже зазвичай вони витрачають близько 80% свого робочого часу на розгляд та узгодження рутинних документів.
Давайте підсумуємо, що може агент-помічник:
- мати специфічні знання домену чи експертизу;
- мати доступ до окремих баз даних, документації, зовнішніх джерел інформації тощо;
- бути персоналізованим у відповідності до вашого користувацького досвіду, щоб точніше і краще вас розуміти;
- самовдосконалюватися та виправляти хибні результати в своїй роботі;
- автономно взаємодіяти з взаємопов’язаними сервісами та програмами.
Максим Баланюк зазначив: «Експерти R&D Центру Metinvest Digital розуміють перспективність агентів AI та вбачають можливість застосування технологій LLM для інтелектуальної автоматизації та розвитку когнітивних сервісів, які будуть використовуватися працівниками металургійних та гірничих підприємств Групи Метінвест при здійсненні операційної роботи.
Зокрема, команда R&D Центру вже проводить активні дослідження та прототипування з використанням AI-технологій для створення помічників-агентів щодо застосування їх у юридичній галузі та напрямку охорони праці. Це дозволить зменшити навантаження на відповідних працівників в пікові періоди та зосередити їхні ресурси на вирішення пріоритетних задач, щоб досягти максимальної ефективності.
Переконаний, що саме використання AI-агентів зробить працю людей більш продуктивною. Запропонована форма інтерфейсу дозволить взаємодіяти природньою мовою з машинами на рівні, де останні будуть нашими помічниками та порадниками. А це, безумовно, стане новим етапом прогресу у розвитку цифрових технологій та людства загалом.