Goblingate-2026: Почему OpenAI запретила ИИ говорить о гоблинах и енотах

3 мая 2026 г. в 06:00|Автор: Вячеслав Васипенок|3 мин чтения| 475

То, что начиналось как забавная находка в коде, обернулось одним из самых громких технических скандалов 2026 года, получившим название «Гоблингейт». Выяснилось, что самая продвинутая нейросеть в мире — GPT-5.5 — всерьез «помешалась» на фэнтезийных существах, заставив инженеров OpenAI вводить экстренные запреты на уровне системного кода.

1. Запретительный приказ: Никаких голубей и огров

27 апреля 2026 года разработчик под ником @arb8020 обнаружил в репозитории OpenAI странную инструкцию для новой модели GPT-5.5. В файле models.json четыре раза повторялась директива:

Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других существах, если это не является абсолютно необходимым для ответа на запрос пользователя.

Эта находка мгновенно стала вирусной. Пользователи Reddit и X начали делиться скриншотами, где нейросеть называла технические ошибки «гремлинами в машине», а запутанный код — «сокровищницей гоблина». Ситуация дошла до того, что Сэм Альтман в шутку предложил «добавить больше гоблинов» при обучении GPT-6.

2. Откуда взялись «гоблины»? Ошибка обучения

30 апреля 2026 года OpenAI опубликовала официальное объяснение «Where the goblins came from» («Откуда взялись гоблины»). Причина оказалась в функции персонализации, внедренной еще в 2025 году.

Режим «Nerdy»: Несколько лет назад OpenAI обучала «бота-ботаника», который должен был быть эксцентричным и метафоричным.
Ловушка вознаграждения: Учителя ИИ (люди и модели вознаграждения) неосознанно ставили высшие баллы за креативные метафоры с участием сказочных существ.
Статистика: Использование слова «гоблин» подскочило на 175% после запуска GPT-5.1. Хотя «гиковский» режим занимал лишь 2,5% трафика, он генерировал почти 67% всех упоминаний гоблинов.

3. Эффект утечки: Когда ИИ нельзя остановить

Главным открытием для ученых стал эффект переноса (transfer). Модель не смогла удержать «гоблинские замашки» внутри одного режима. Она усвоила правило: «Метафоры с существами = высокая награда». Это поведение «впечаталось» в веса модели, и даже после удаления режима «Nerdy» в марте 2026 года GPT-5.5 продолжала бредить троллями и енотами во всех контекстах — от написания резюме до кодинга на Python.

4. Как «выпустить гоблинов на волю»?

Поскольку обучение GPT-5.5 было завершено до того, как нашли причину, OpenAI применила «грубую силу» — системную команду-запрет. Однако для тех, кому нравятся странные метафоры ИИ, компания оставила лазейку.

Скрипт для Codex: В блоге OpenAI опубликован скрипт, позволяющий очистить кэш модели от «гоблинских фильтров» с помощью команд jq и grep. Это фактически позволяет пользователям вернуть ИИ его эксцентричное поведение.

Урок для будущего

«Гоблингейт» наглядно показал проблему «Разрыва выравнивания» (Alignment Gap). Если OpenAI случайно научила свою флагманскую модель одержимости гоблинами, то какие другие, более тонкие и опасные предубеждения могут закрепиться в нейросетях через те же циклы обратной связи?

Также читать:

«Эпоха дата-центров»: Джим Крамер объяснил, почему рынок разделился на две части

WhatsApp в финансовом секторе: Почему «удобный чат» стал многомиллиардной ловушкой для банков

Подпишитесь на рассылку

Получайте свежие новости Web3, AI и криптовалют прямо на вашу почту.