OpenAI работает над улучшением голосового режима ChatGPT – теперь он может стать частью обычного окна чата, а не отдельного полноэкранного интерфейса. Это позволит пользователям видеть различный контент во время разговора: погоду, карты, ссылки и другие визуальные элементы, которые ранее были недоступны в голосовом режиме.
В настоящее время при активации голосового общения ChatGPT открывает отдельный экран с анимацией. Можно включить субтитры, чтобы увидеть расшифровку диалога, но дополнительный контент, такой как карты или изображения, не отображается. Чтобы получить дополнительные данные, пользователю приходится завершать голосовую сессию и возвращаться к обычному чату.
В коде новой версии ChatGPT v1.2025. 294 энтузиаста заметили изменения, указывающие на новую концепцию. Голосовое общение теперь запускается непосредственно из интерфейса чата, без перехода на отдельный экран. Появятся кнопки управления микрофоном и завершения беседы, а в самом чате параллельно с голосом будет отображаться динамический контент.
Стоит отметить, что подобное уже реализовала Google с Gemini Live, интегрировав общение с ИИ в единый интерфейс.

