OpenAI представила новейшую версию ChatGPT / Photo: Reuters

В понедельник во время прямой трансляции из штаб-квартиры компании OpenAI в Сан-Франциско технический директор Мира Мурати объявила о запуске новой, более мощной модели искусственного интеллекта (ИИ) под названием GPT-4o.

«GPT-4o — это шаг к гораздо более естественному взаимодействию человека с компьютером: он принимает в качестве входных данных любую комбинацию текста, звука и изображения и генерирует любую комбинацию выходных текста, аудио и изображений», — говорится на сайте OpenAI.

Во время презентации ChatGPT использовал разные эмоциональные тона и иногда реагировал так, как будто испытывал собственные чувства. Во время демонстрации GPT-4o исследователь попросил чат-бота посмотреть на его селфи и определить, какие эмоции он испытывает, ИИ ответил шуткой: «Я надеваю шляпу счастливого детектива» и добавил: «Похоже, ты чувствуешь себя довольно счастливым и веселым. Что бы ни происходило, похоже, у тебя отличное настроение».

«Это похоже на ИИ из фильмов; и меня до сих пор немного удивляет, что это реально», — написал в своем блоге генеральный директор OpenAI Сэм Альтман.

Модель GPT-4o объединяет множество функций, которые ранее были доступны по отдельности в различных других разработках OpenAI. Это позволяет ИИ более эффективно обрабатывать комбинации текстовых, аудио- и визуальных данных.

ChatGPT-4o способен реагировать на аудиовход всего за 232 миллисекунды, что аналогично времени реакции человека в разговоре. GPT-4o также превосходит другие существующие модели в восприятии изображений и звуков.

Пользователи смогут использовать визуальные данные разными способами, например, с помощью камеры телефона, загружать документы или делиться экраном с собеседниками, общаясь с ИИ-моделью, как при видеозвонке.

Модель поддерживает более 50 языков, включая русский, казахский, грузинский, китайский, арабский, турецкий и сербский. Кроме того, GPT-4o может запоминать диалоги.

TRT Russian
Выбор редактора