ChatGPT от OpenAI: теперь слушает, говорит и реагирует на изображения

сентябрь 25, 2023

Популярный чат-бот на основе искусственного интеллекта ChatGPT от OpenAI научился общаться, используя устную речь, во многом похожую на Siri и Alexa, что знаменует собой значительный скачок в сфере ИИ-коммуникаций.

Благодаря этой новой разработке пользователи могут взаимодействовать с ChatGPT посредством голосового взаимодействия, что делает его более доступным и универсальным. Базирующийся в Сан-Франциско стартап в области искусственного интеллекта OpenAI недавно запустил эту версию чат-бота, раздвинув границы общения с помощью искусственного интеллекта.

В другом нововведении ChatGPT теперь может реагировать на изображения. Например, пользователи могут загрузить фотографию внутренностей своего холодильника, а чат-бот может предложить потенциальные блюда на основе доступных ингредиентов. Эта инновационная функция направлена ​​на то, чтобы сделать ChatGPT более удобным и полезным.

OpenAI стремительно расширяет свои инструменты ИИ. Недавно компания представила версию своего генератора изображений DALL-E и включила его в ChatGPT. С момента запуска в ноябре ChatGPT привлек сотни миллионов пользователей и вдохновил другие компании на создание подобных сервисов.

Новый бот превосходит своих конкурентов, таких как Google Bard, а также бросает вызов таким давно существующим технологиям, как Alexa и Siri. Эти цифровые помощники традиционно облегчали взаимодействие с устройствами посредством голоса. Однако более новые чат-боты, такие как ChatGPT и Google Bard, могут похвастаться превосходными языковыми навыками, что позволяет им создавать электронные письма, писать стихи и мгновенно обсуждать практически любую тему.

Последнее предложение OpenAI эффективно объединяет эти два метода общения. Компания рассматривает речь как более интуитивный способ взаимодействия с чат-ботом. Она утверждает, что синтетические голоса ChatGPT, доступные в пяти различных вариантах, превосходят те, которые используются в популярных цифровых помощниках.

Новый чат-бот будет доступен всем подписчикам ChatGPT Plus, сервиса стоимостью $20 в месяц, в течение следующих двух недель. Однако бот может отвечать голосом только при использовании на iPhone, iPad и устройствах Android.

Хотя голосовой интерфейс ChatGPT может напоминать пользователям более ранних помощников, технология, на которой он работает, принципиально иная. Он в первую очередь управляется большой языковой моделью (LLM), которая генерирует язык, анализируя огромные объемы текста со всего интернета.

ChatGPT может ответить практически на любой вопрос за считанные секунды, в отличие от старых цифровых помощников, таких как Alexa и Siri, которые могли выполнять только ограниченное количество задач или отвечать на конечный список запрограммированных вопросов.

В то время как OpenAI развивает ChatGPT в нечто похожее на Alexa или Siri, такие компании, как Amazon и Apple, преобразуют своих цифровых помощников, чтобы они напоминали ChatGPT.

Amazon недавно анонсировал обновленную систему Alexa, призванную обеспечить более плавный разговор «на любую тему», частично благодаря новому LLM. Тем временем, по словам инсайдеров, Apple тестирует прототип своего LLM для будущих продуктов.

Новый ChatGPT также может реагировать на изображения при использовании через веб, а также на устройствах iPhone, iPad и Android. Эта функция может оказаться бесценной для пользователей с нарушениями зрения.

OpenAI изначально продемонстрировала этот инструмент для обработки изображений весной, но отложила его публичный выпуск, пока не поняла его потенциальное злоупотребление. Например, были опасения, что он может служить сервисом распознавания лиц, используемым для быстрой идентификации людей на фотографиях.

Несмотря на эти успехи, у бота все еще есть области для улучшения. Например, он может справляться с омонимами, но может и исправлять себя, демонстрируя расширенные возможности обучения бота.

В заключение, последняя версия ChatGPT от OpenAI знаменует собой значительный скачок в коммуникации ИИ, предлагая улучшенное взаимодействие с пользователем и универсальность. Поскольку ИИ продолжает развиваться, будет интересно посмотреть, как такие гиганты, как Amazon и Apple, отреагируют на эти достижения.