Нова версія GPT-4 є найдосконалішою моделлю штучного інтелекту на сьогоднішній день, яка була широко доступна для тестування. Редакція tvn24.pl однією з перших у Польщі мала до нього доступ і перевірила, на що насправді здатний цей інструмент. Результати виявилися несподіваними.
14 березня OpenAI випустив нову версію штучного інтелекту, яка генерує текстові відповіді, тобто доступну у вигляді чату GPT-4. Інструменти такого типу, особливо загальнодоступна версія GPT-3.5, викликали світовий резонанс, і, на думку експертів, незабаром штучний інтелект може стати причиною справжньої технологічної революції.
Нова версія, випущена зараз, є ще більш креативною, краще працює з користувачем, а відповіді, які вона надає, на кілька десятків відсотків більш правдиві. Це загальні терміни, але скільки насправді може зробити GPT-4 і як цей ШІ працює на практиці? Невдовзі після прем’єри нового інструменту редакція tvn24.pl випробувала його однією з перших у Польщі.
Нові здібності GPT-4
Суть маленької революції, яку представляє нова версія GPT-4, полягає в можливості аналізувати різноманітний вміст. – Основна новинка, яку вона впроваджує – це так звана мультимодальність, мультисенсорика. Завдяки цьому він може працювати не лише з текстом, а й із зображеннями, а потім використовувати проаналізований контент, як це роблять люди, – каже Міхал Яронь, старший науковець з обробки даних у групі TVN. Що це означає на практиці? – Нова версія GPT-4 може розпізнавати та описувати речі на фотографіях, проводити податковий аналіз на основі вказаних норм або запропонувати рецепт обіду, коли дізнається, що у нас є в холодильнику, – пояснює він.
Ми перевірили ці нові навички GPT-4 на практиці. Однією з найважливіших новинок є його здатність аналізувати великі бази даних і довгі тексти. Інструмент тепер може прочитати, наприклад, кілька десятків сторінок законодавчих положень і кількома реченнями описати те, що з них випливає. Таким чином його можна попросити коротко викласти або пояснити положення того чи іншого акта. GPT-4 не мав проблем із, наприклад, коротким викладом положень Закону про вітряні електростанції та переліком його найважливіших положень.
У той же час GPT-4 може відповідати на запитання відповідно до тієї ролі, яку йому відводить людина. Тож він може говорити спеціальною мовою квантового фізика або наслідувати стиль розмови відомого політика, наприклад Дональда Трампа чи Леха Валенси. Інструмент також може працювати навпаки та адаптуватися до очікуваного одержувача. Наприклад, поясніть положення Закону про вітряки мовою, зрозумілою для 5-річної дитини.
Цей навик можна використовувати різними способами. Не тільки для пояснення довгих і складних юридичних документів, а й, наприклад, у лікуванні. Як перевірили журналісти “Нью-Йорк Таймс”, новий інструмент може сформулювати раціональний спосіб лікування пацієнта при конкретному захворюванні. Вони описали випадок, коли один із американських кардіологів представив штучному інтелекту історію хвороби чоловіка, який напередодні потрапив до лікарні, і, використовуючи складні медичні терміни, запитав про можливі методи лікування. GPT-4 дав відповідь, яка повністю відповідала тим, які кроки лікарі вживали насправді.
GPT-4 розраховує і радить
Нова версія штучного інтелекту також може порахувати дуже добре – прогрес у цій галузі порівняно з попередньою версією GPT майже колосальний. Спершу ми попросили його пояснити нам на підставі нормативних документів, як у Польщі працює спільне врегулювання ПДФО подружжям – максимально просто, бажано на рівні 5-річної дитини.
Потім ми попросили його використати ці знання і порадити нам, що вигідніше в конкретних випадках. Наприклад, ситуація, коли дружина за рік заробила 133 тис. злотих брутто, а чоловік 90 тис. злотих брутто. GPT-4 не тільки бездоганно виконав розрахунки, а й правильно застосував усі податкові норми. Він навіть не помилився щодо деталей. про необхідність застосування неоподатковуваної суми окремо для кожного з подружжя.
Ми провели більше таких тестів підрахунку та аналізу податкових норм і, на наш подив, GPT-4 виявився бездоганним у всіх. Єдині помилки, які він зробив, були пов’язані з помилками або двозначностями в запитаннях, які ми задавали. Це величезне покращення в порівнянні з попередньою версією GPT-3.5, яка, хоча й намагалася, могла допускати майже тривіальні помилки.
ДИВІТЬСЯ ТАКОЖ: ЗМІ: штучний інтелект порівнює журналіста з Гітлером, а також пише, що у нього хворі зуби
GPT-4 та аналіз зображень
Ще однією з абсолютно нових функцій GPT-4 є можливість «переглядати» та аналізувати зображення. Надіславши йому обрану фотографію, ви можете попросити його не тільки описати те, що на ній зображено, а й проаналізувати її. Мало того, GPT-4 також може використовувати знання з аналізованого зображення самостійно.
Однак перевірити це самостійно поки що не вдалося. Початкова «альфа» версія GPT-4, яку оприлюднили для журналістів, ще не містить цієї функції. Приклади його роботи наводили лише самі розробники програмного забезпечення. Наприклад, надіславши фото продуктів у нашому холодильнику, GPT-4 може використати їх, щоб запропонувати рецепти вечері, яку можна з них приготувати.
Цікаво, що в багатьох випадках загальнодоступна версія GPT-3.5 тепер може досить добре імітувати цю функцію. Надіславши їй адресу онлайн-фотографії продуктів усередині холодильника, чат запропонував цілком розумний і добре пояснений рецепт. На жаль, насправді цей інструмент не зміг «переглянути» надіслане фото, і він згенерував рецепт лише на основі метаданих, якими було описано фото. Іншими словами, стара версія GPT склала свою відповідь, і вона не посилалася безпосередньо на продукти на фотографії.
Однак широке поширення можливостей аналізу зображень GPT-4 стане величезною зміною, яка принесе незліченну кількість нових застосувань. Наприклад, це допоможе ідентифікувати дивний металевий елемент, який ми знайшли на горищі, знайти чи порахувати об’єкти на фотографії та навіть пояснити значення інтернет-мемів. У новій версії можна не тільки створити жарт на задану тему, але й зрозуміти існуючі жарти.
Завдяки цьому його можна використовувати, наприклад, щоб пояснити, про що даний мем і що робить його смішним. Перші приклади такого використання вже можна знайти в мережі. Такий, як GPT-4, наприклад, пояснює цікавість мема, який показує карту світу, зроблену зі шматочків курки, і підписує «Землю видно з космосу». «Текст викликає очікування величного зображення Землі, в той час як зображення виходить буденним і безглуздим», — пояснили в ШІ.
ДИВІТЬСЯ ТАКОЖ: Хто написав текст: людина чи Чат GPT? Новий інструмент має це перевіряти, але він часто помиляється
Іспити, тести, ігри та заходи
GPT-4 також дуже добре розв’язує головоломки та пише тести, також дуже спеціалізовані. За словами його творців, американський іспит на адвоката він складає на 10 відсотків. найкращі юристи. Він також може перевершити 90 відсотків. люди, які складають тести, які використовуються для вступу до університетів США – Scholastic Assessment Test і Graduate Record Examination.
Однак інструмент може не тільки вирішувати готові завдання та тести, а й створювати їх самостійно. GPT-4 легко створить власний тест на певну тему або навіть вікторину. Редакція tvn24.pl попросила його, наприклад, створити просту вікторину про тварин. Цей вийшов бездоганним. Штучний інтелект не тільки розставляв цікаві, різноманітні запитання та підбирав правильні відповіді, але й доповнював усе гарними картинками тварин. Звісно, теж породжені алгоритмом.
GPT-4 також може писати вихідний код для створення цілих програм або комп’ютерних ігор. Під час наших тестів у нього не виникло особливих проблем із написанням коду для простої, але повністю функціональної арканоїдної гри в найкоротші терміни.
Проблема в цьому випадку виявилася єдиним обмеженням інструменту щодо масштабу завдання, яке від нього вимагається. На такі прості запитання, як «створити тест» або «створити гру», GPT-4 часто відповідає як надто складне завдання. Однак якщо він розділить завдання на більш дрібні, логічні частини, а потім об’єднає їх у єдине ціле, то досягне очікуваного результату. GPT-4 зміг належним чином розділити надто велике завдання, а частини програмного коду, написані ним пізніше, ідеально поєднувалися. Однак це обмеження, безсумнівно, впливає на зручність використання GPT-4.
GPT-4 – слабкі місця
GPT-4 виявився великим якісним стрибком і інструментом, який у багатьох відношеннях потенційно став дуже близьким до практичного використання. Однак він все одно не позбавлений недоліків. Ми не змогли перевірити, наскільки він ефективний в аналізі зображень, і він досі не має можливості аналізувати звук. Він як і раніше працює помірно добре в типово творчих завданнях, де доступу до фактів і величезних баз даних недостатньо для виконання роботи. Тому він не буде формулювати власних гіпотез щодо майбутнього світу, але добре використає вже створені. Тим не менш, GPT-4 іноді вигадує відповідь, не знаючи правильної, і, наприклад, дає неправдиві адреси веб-сайтів. Тому ви не можете повністю довіряти йому при його використанні.
Ще одним серйозним недоліком є спосіб використання GPT-4. По-перше, він ще не є загальнодоступним на веб-сайті, як була доступна попередня версія GPT-3.5. Доступ до нього поки що надається лише за спеціальним запитом. По-друге, він не є безкоштовним для використання, як GPT-3.5, і ви платите за кожне слово, яке ви в ньому пишете.
По-третє, проблема полягає в способі спілкування з самим інструментом, який не такий інтуїтивно зрозумілий, як ми могли б очікувати. У складніших завданнях те, як ви пояснюєте йому свої інструкції, є вирішальним і просто складним. Наприклад, коли просять прочитати певний акт, недостатньо надіслати їм посилання на його онлайн-версію. GPT, крім вмісту документа, також «завантажить» багато непотрібних даних про сам веб-сайт і може почати губитися. Тому для нього необхідно підготувати чистий текст.
У деяких випадках також необхідно розділити з ним завдання, наприклад, попросити його проаналізувати дуже довгий контент або написати складні програмні коди. Тож GPT-4 не лише навчається самостійно, але й вимагає від користувачів навчитися ним користуватися. – Люди повинні навчитися правильно формулювати завдання для штучного інтелекту, щоб отримати очікувані результати. Це може бути одна з найбажаніших професій майбутнього – зазначає Міхал Яронь. Як би фантастично це не звучало, але настав час для людей і машин навчитися працювати разом.
ДИВІТЬСЯ ТАКОЖ: Популярність жодної іншої програми не зростала так швидко. 100 мільйонів користувачів за рекордний час
tvn24.pl, OpenAI, New York Times
Основне джерело фото: Shutterstock