Компанія OpenAI представила останню модель чат-бота — GPT-4o. Нейромережа стала «більш людяною» і навчилася сприймати візуальні дані.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
ШІ-інструмент «особливо краще розуміє відео і звук порівняно з наявними моделями». Функція включає в себе розпізнавання емоцій і ритму дихання.
У чат-бот також додали повноцінний Voice Mode для голосової взаємодії.
Згідно з презентацією, продукт може допомагати користувачам у різних побутових питаннях, наприклад у підготовці до співбесіди. В OpenAI також показали, як GPT-4o дзвонить у службу підтримки для заміни iPhone.
Інші приклади продемонстрували, що нейромережа вміє розповідати «батьківські жарти», перекладати розмову двома мовами в реальному часі, судити гру в «камінь-ножиці-папір» і відповідати сарказмом.
В одному з відео показали, як ChatGPT реагує на перше знайомство з цуценям користувача.
«Привіт, Баузер! Хіба ти не найчарівніше створіння?» — вигукнув чат-бот.
В OpenAI заявили, що буква «o» в GPT-4o означає слово «omni», яке символізує крок до більш природної взаємодії людини з комп’ютером.
GPT-4o «набагато швидший і «на 50% дешевший», ніж GPT-4 Turbo. Нейромережа відповідає на аудіозапит за 2,3 с. Середній час генерації чат-бота становить 3,2 с, що можна порівняти з часом реакції людини у звичайній розмові, підкреслили в OpenAI.
Версію нейромережі для введення тільки тексту і зображень запустили 13 травня. Повний варіант із підтримкою відео з’явиться «найближчими тижнями».
«Це схоже на ШІ з фільмів. Мене досі трохи дивує, що це реально. Перехід до часу відгуку і виразності на людському рівні виявився великою зміною», — заявив CEO OpenAI Сем Альтман.
За його словами, розмови з нейромережею тепер здаються «по-справжньому природними».
Раніше Альтман зазначив, що майбутнє штучного інтелекту ознаменується появою і зростанням популярності персональних помічників. Вони стануть невід’ємною частиною повсякденного життя і навіть замінять смартфони.
Нагадаємо, у квітні на платформі LMSYS з’явилася мовна модель gpt2-chatbot, яку пов’язують з OpenAI.