Новости

Anthropic и функция Dreaming: Как ИИ-агенты научились учиться во сне

|Автор: Вячеслав Васипенок|4 мин чтения| 13
Anthropic и функция Dreaming: Как ИИ-агенты научились учиться во сне

Пока большинство компаний только мечтают о надёжных автономных агентах, Anthropic уже дала им возможность «спать и учиться». На конференции Code with Claude в Сан-Франциско компания представила функцию Dreaming — систему, которая позволяет AI-агентам анализировать свои прошлые сессии, находить ошибки и самостоятельно улучшаться со временем.

1. Что такое «мечтание» и зачем оно нужноAnthropic и функция Dreaming

Dreaming — это не просто память. Это запланированный процесс, во время которого агент просматривает все свои предыдущие сессии, извлекает повторяющиеся ошибки, успешные паттерны и общие предпочтения.

  • Создание инструкций: Вместо того чтобы каждый раз начинать с нуля, агент создаёт «playbooks» — готовые инструкции для будущих задач.
  • Механика процесса: При этом сами веса модели не меняются — всё происходит на уровне заметок и структурированных воспоминаний.

2. Реальные результаты уже есть

Ранние пользователи уже показывают впечатляющие цифры:

  • Harvey (юридический ИИ): Увеличила процент успешно выполненных задач примерно в 6 раз.
  • Wisedocs (анализ медицинских документов): Сократила время обработки на 50 %.
  • Netflix: Использует multi-agent orchestration для одновременной обработки логов сотен сборок.

3. Как это работает на практикеAnthropic и функция Dreaming

Anthropic показала живое демо с вымышленной космической компанией Lumara, которая сажает дроны на Луну.

После первой серии неудачных посадок агент включил «мечтание». За ночь он проанализировал все предыдущие попытки и создал подробный playbook спуска. На следующее утро результаты на сложных участках заметно улучшились — и всё это без участия человека.

4. Дополнительные инструменты в публичной бете

Одновременно Anthropic перевела в публичный бета две другие важные функции:

  • Outcomes: Система рубрик и отдельного «grader-агента», который проверяет результат и заставляет основной агент переделывать работу до тех пор, пока она не будет соответствовать заданным критериям.
  • Multi-agent orchestration: Возможность разбивать сложную задачу на несколько специализированных агентов, каждый из которых работает в своём контексте.

 Anthropic не просто добавила новые фичи — она сделала важный шаг к по-настоящему самообучающимся агентам, которые могут работать долго и надёжно без постоянного контроля человека.

Также читать:

Индийский кино эксперимент: ИИ-революция без правил и профсоюзов

Взлом высокоскоростной железной дороги: как 19 лет без смены ключей привели к остановке поездов

Поделиться:
0