Причина такого ажиотажа — личность основателя. Компанию возглавил Дэвид Сильвер, легендарный архитектор системы AlphaZero, который вместе с «отцом обучения с подкреплением» Ричардом Саттоном провозгласил конец эпохи традиционных языковых моделей (LLM).
1. Наследие AlphaZero: Победа без учителей
Чтобы понять, за что Сильверу дали миллиард, нужно вспомнить триумф AlphaZero в 2017 году. В отличие от всех предыдущих программ, в неё не загружали шахматные партии людей.
Метод: Нейросети дали только правила (как ходят фигуры).
Процесс: Она играла сама с собой 4 часа.
Результат: Она всухую разгромила Stockfish — мощнейший движок, вобравший в себя всю мудрость человечества.
AlphaZero играла «инопланетно»: жертвовала фигуры там, где люди боялись, и находила идеи, которые десятилетиями считались ошибочными. Она доказала: ИИ может превзойти человека, если перестанет ему подражать.
2. Тезис Сильвера: Человеческие данные закончились
Современные модели (GPT-4, Claude, Gemini) обучаются на текстах из интернета. Но у этого подхода есть «стеклянный потолок»:
Дефицит данных: Качественные тексты, написанные людьми, в интернете практически исчерпаны.
Эффект попугая: LLM лишь виртуозно комбинируют то, что уже сказано. Они ограничены человеческим опытом и человеческими ошибками.
Основной тезис манифеста Сильвера и Саттона «Welcome to the Era of Experience»: будущее за ИИ, который учится не на чужих текстах, а на собственном опыте через самообучение (Self-Play и Reinforcement Learning).
3. Ineffable Intelligence: Ставка на «Невыразимое»
Название стартапа — Ineffable («Невыразимое») — глубоко символично. Это отсылка к знаниям, которые невозможно передать словами или текстом.
Цель: Создать первый истинный сверхчеловеческий интеллект (ASI), который выйдет за рамки «языкового пузыря».
Команда: Сильвер забрал из DeepMind ключевых топов, ответственных за прорывы в области AlphaGo и MuZero.
Инвестиции от Nvidia здесь особенно важны: для обучения ИИ на собственном опыте требуются колоссальные вычислительные мощности (симуляции), а не просто хранилища текстов.
4. Псиопы Альтмана против реальности Сильвера
Пока Сэм Альтман (OpenAI) убеждает мир, что AGI достижим путем простого масштабирования текущих LLM, Сильвер и его инвесторы фактически заявляют: «Текущие модели — это тупик».
Если Сильвер прав, то сегодняшние чат-боты — это «кнопочные телефоны», а настоящий ИИ будущего будет расти в виртуальных симуляторах, изобретая решения, до которых человеческий мозг не додумался бы и за тысячу лет.
Главный вызов: Реальность — не шахматы
Критики проекта (и сам автор тезиса) признают главную проблему: шахматы имеют четкие правила и понятную метрику победы. В реальном мире — в физике, биологии или экономике — правила размыты, а «победа» не всегда очевидна. Научить ИИ самообучаться в хаосе реальности — это и есть та самая задача на миллиард долларов.