Почему ChatGPT запретили упоминать о гоблинах и гремлинах?

Разработчик ChatGPT, OpenAI, был вынужден приказать некоторым своим инструментам искусственного интеллекта прекратить упоминать гоблинов после того, как было обнаружено, что этот термин начал случайным образом появляться в ответах.

В четверг компания сообщила в своем блоге, что заметила увеличение количества упоминаний мифологических существ, таких как гремлины, в метафорах, используемых ChatGPT и другими инструментами, работающими на ее последней флагманской модели GPT-5.

После того, как пользователи и сотрудники сообщили о проблемах, описанных как «маленькие гоблины», OpenAI заявила, что предприняла шаги для ее решения, в том числе поручила своему агенту кодирования Кодекса не упоминать этих существ, если это не уместно.

«Ботанная личность», разработанная для ChatGPT, оказалась бессознательно стимулированной вознаграждать упоминания о гоблинах.

Это показывает, с какими трудностями сталкиваются компании, занимающиеся искусственным интеллектом, при раскрытии потенциала систем и их обучении в контексте лингвистических особенностей.

OpenAI заявила, что впервые заметила рост упоминаний гоблинов, гремлинов и других существ после запуска GPT-5. 1 в ноябре.

«Пользователи жаловались, что модель странно знакома в разговоре, что побудило провести расследование конкретных речевых особенностей», — написала компания в своем блоге в четверг.

Она добавила, что после того, как исследователь, видевший несколько упоминаний о «гоблине», попросил проверить это, разработчики обнаружили, что появление термина в ответах ChatGPT выросло на 175% с момента запуска GPT-5. 1.

Также они обнаружили, что упоминания о «гремлине» выросли на 52%.

Увеличение, хотя и значительное, может объясняться небольшим количеством ответов в целом.

По данным OpenAI, «один» маленький гоблин «в ответе может быть безвредным, даже волшебным», но стремительный рост их появления требовал расследования.

«Еноты, огры, тролли, голуби»

Автор фото, Getty Images

Перед публикацией сообщения в блоге OpenAI, в котором описывалась проблема, некоторые пользователи социальных сетей заметили странную деталь Codex, как вести себя при взаимодействии с пользователями.

Кроме рекомендации избегать банальностей, в нем также отмечалось, что Codex «никогда не должен говорить о гоблинах, гремлинах, енотах, троллах, обогревах, голубях или других животных или существах, если это не является абсолютно и однозначно релевантным запросу пользователя».

Пользователь Reddit, опубликовавший сообщение, назвал это «действительно сумасшедшим».

Хотя некоторые пользователи в других социальных сетях предполагали, что это может быть разработано для создания ажиотажа вокруг инструментов искусственного интеллекта, исследователь компании отрицал это, написав в ответ пользователю на X: «это действительно не маркетинговый трюк».

В своем блоге OpenAI объявила, что добавила руководство по ограничению «странной склонности » Кодекса и его базовой модели к гоблинам.

Основная проблема, как объяснила компания, очевидно, возникла из-за обучения моделей общаться в стиле определенных личностей – в данном случае, их «скучной личности».

Компания обнаружила, что эта система поощряет упоминания гоблинов, гремлинов и других существ в метафорах.

Тестирование показало, что на эту личность приходится 66,7% всех упоминаний «гоблинов» в ChatGPT.

Этот трюк может способствовать более широкому обучению модели, если он вознаграждается в одном случае и подкрепляется в другом.

Режим гоблина

Этот шаг происходит на фоне более широкого сдвига в отрасли в сторону того, чтобы сделать чат-ботов с искусственным интеллектом более представительными и болтливыми. Это должно повысить вовлеченность пользователей.

Однако эксперты предупреждают, что вероятность того, что личности ИИ будут выдумывать разные вещи – или «галлюцинировать», как это описывает индустрия – может возрастать.

Недавнее исследование Оксфордского института Интернета показало, что точная настройка моделей для более теплого и дружелюбного характера может привести к «компромиссу точности», когда системы совершают больше ошибок или подтверждают ложные убеждения пользователя.

Эксперты также предостерегают пользователей от принятия часто обыденных заявлений чат-ботов за чистую монету, особенно когда речь идет о здоровье и медицинских советах.

Но, как и в случае с гоблинами в OpenAI, ошибки генеративного ИИ иногда могут быть более странными и безобидными.

В мае 2024 года чат-бот Google с искусственным интеллектом был широко высмеян за то, что говорил пользователям, что можно есть камни и «клеить пиццу».

Почему ChatGPT запретили упоминать о гоблинах и гремлинах?

«Четкий сигнал в поддержку мира». Украина призвала Совбез ООН рассмотреть резолюцию о немедленном прекращении огня

Конституционный суд Молдовы признал незаконным право Гагаузии самой проводить выборы в регионе

Глава МИД Нидерландов о перехватчиках для Украины: нужно давить на других

Литва выразила протест представителю РФ из-за ударов по Украине и дезинформации относительно стран Балтии

«Еноты, огры, тролли, голуби»

Режим гоблина

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Европейская легкая атлетика пытается остановить сексуализацию спортсменок на экране

Польша введет реестр жилья для краткосрочной аренды

Финал ЧМ Ламин Ямал: что нужно знать о юном испанском вундеркинде

Коди Беллинджер участвует в матче всех звезд MLB и получает награду MVP

Сикорский: Польша подозревает Россию в подготовке провокации с украинскими дронами